Tesi Robotica Un coprocessore per Stereo-Matching: Profiling ... | Page 88

i i “MF_Tesi” — 2011/9/12 — 11:39 — page 88 — #88 i i 88 Un’altra possibile ottimizzazione da apportare che riduce l’occupazione di spazio in memoria necessario durante l’elaborazione è la suddivisione della matrice dei punteggi in chunk e di procedere alla costruzione della stessa per pezzi. In questo modo il processo viene eseguito per step e l’intera matrice risiede in una memoria RAM esterno all’FPGA. Nel primo step viene processato il primo chunk in alto a sinistra. Nel secondo step possono essere processati in parallelo il secondo chunk della prima riga e il primo chunk della seconda riga, questo perché per processare un chunk si ha bisogno dei valori a confine del chunk precedente e del chunk a nord. La figura mostra come dovrebbe avvenire il processo. Figura 8.0.1: Suddivisione in chunk della scoring matrix. i i i i