Tesi Robotica Algoritmi ed architetture per la risoluzione di... | Page 38

2.1. SIFT 38 Lowe, si riescono a scartare i punti candidati che si trovano in zone di basso contrasto e quelli che vengono mantenuti, sono scelti in base alla loro stabilità. 3. Orientation assignment: uno o più orientamenti sono assegnati a ogni keypoint in base alle direzioni locali del gradiente dell’immagine. Tutte le future operazioni sono e ettuate sui dati dell’immagine, i quali sono stati trasformati relativamente all’orientamento assegnato, scalatura e locazione per ciascun descrittore in modo da garantire invarianza rispetto a queste trasformazioni. 4. Keypoint descriptor: I gradienti locali dell’immagine sono misurati ad una particolare scala nella regione che circonda i keypoint. Questi vengono poi trasformati in una rappresentazione che fornisce una certa stabilità alle distorsioni dovute al rumore e ai cambiamenti di luce. Ora possiamo comprendere la scelta del nome, l’algoritmo trasforma i dati dell’immagine in coordinate invarianti alla scalatura relativi ai descrittori locali. Un importante aspetto di questo approccio è che esso genera una quantità considerevole di descrittori (features) che coprono densamente l’immagine in tutto l’intorno. Una tipica immagine di taglia 500 ◊ 500 pixel darà origine a circa 2000 descrittori stabili (anche se tale numero può subire variazioni in base al contenuto dell’immagine e altri parametri). Siccome abbiamo già ampiamente trattato l’algoritmo DoG nella precedente sezione, passiamo a descrivere i restanti passi, in modo da fornire una panoramica completa del suo funzionamento. 2.1.1 Accurate keypoint localization Eseguito il DoG sull’immagine e ottenuti i punti candidati, essi devono essere ulteriormente filtrati prima di ottenere il key descriptor ed essere utilizzati in un’applicazione di matching. Il primo filtraggio punta ad eliminare tra i punti candidati, quelli che presentano basso contrasto o sono localizati lontano dai contorni di un oggetto della scena. Alcuni algoritmi (Brown 2002) sviluppano un metodo appropriato per interpolare una funzione quadratica in 3D ai punti campione locali, la quale una volta applicata, essa determina la locazione del massimo; con questo procedimento si ha un sostanziale miglioramento per quanto riguarda il matching e la stabilità.