Tesi Robotica Analisi, progettazione e implementazione... | Page 28
i
i
“LP_Tesi” — 2013/10/17 — 18:27 — page 28 — #28
i
28
i
1. APPROCCIO CLASSICO
Si inizia osservando che la distanza focale è unitaria, ma non vi è alcuna particolare ragione per cui lo sia. In aggiunta, la posizione dei punti 3D sul piano
dell’immagine deve essere misurata in pixel. Per questi motivi le coordinate x
e y devono essere scalate di una opportuna costante φ che tiene conto sia della
distanza focale, sia della geometria del sensore (conversione da unità fisica in
px
pixel, ad es. mm ). Non è detto, inoltre, che il sensore debba essere necessariamente quadrato, quindi la densità di pixel per unità fisica può anche differire
nelle due direzioni, ottenendo di conseguenza due fattori di scala φx e φy che
tengono conto di quanto appena detto, ottenendo il modello
φx u
w
φy v
y=
w
x=
Si ha inoltre assunto che l’origine del sistema di riferimento del piano dell’immagine sia collocata al centro del piano, mentre di norma il punto x = [0, 0]
è posizionato nell’angolo in alto a sinistra. Si considerano dunque due valori
di offset δx e δy che spostano l’origine dell’immagine in alto a sinistra e sono
misurate in pixel. In teoria questi due valori dovrebbero corrispondere alla semilarghezza e semi-altezza dell’immagine cambiate di segno, nella pratica è difficile
realizzare sensori perfettamente centrati, quindi consideriamo δx e δy delle variabili (possiamo considerare [δx , δy ] anche come la posizione in pixel dell’origine
del piano dell’immagine). Il modello generale prevede anche un coefficiente di
disallineamento (skew) che contribuisce al valore di x in funzione dell’altezza nel
mondo fisico v. Sebbene tale parametro non abbia una chiara interpretazione
fisica, aiuta a descrivere il processo di proiezione. Il modello aggiornato diventa
dunque
φx u + γv
+ δx
w
φy v
+ δy
y=
w
x=
Infine è stata fatta l’assunzione che la camera sia collocata nell’origine del sistema di riferimento del mondo con l’asse w allineato con l’asse ottico, mentre
si potrebbe avere la necessità di definire un sistema di coordinate del mondo
di convenienza, per esempio comune a più di una camera. Per superare questa
assunzione basta convertire i punti w nel sistema di riferimento della camera
i
i
i
i