Tesi Robotica Un coprocessore per Stereo-Matching: Profiling ... | Page 88
i
i
“MF_Tesi” — 2011/9/12 — 11:39 — page 88 — #88
i
i
88
Un’altra possibile ottimizzazione da apportare che riduce l’occupazione di spazio
in memoria necessario durante l’elaborazione è la suddivisione della matrice dei
punteggi in chunk e di procedere alla costruzione della stessa per pezzi. In questo
modo il processo viene eseguito per step e l’intera matrice risiede in una memoria
RAM esterno all’FPGA. Nel primo step viene processato il primo chunk in alto
a sinistra. Nel secondo step possono essere processati in parallelo il secondo
chunk della prima riga e il primo chunk della seconda riga, questo perché per
processare un chunk si ha bisogno dei valori a confine del chunk precedente e
del chunk a nord. La figura mostra come dovrebbe avvenire il processo.
Figura 8.0.1: Suddivisione in chunk della scoring matrix.
i
i
i
i