Tesi Robotica Algoritmi ed architetture per la risoluzione di... | Page 38
2.1. SIFT
38
Lowe, si riescono a scartare i punti candidati che si trovano in zone di
basso contrasto e quelli che vengono mantenuti, sono scelti in base alla
loro stabilità.
3. Orientation assignment: uno o più orientamenti sono assegnati a ogni
keypoint in base alle direzioni locali del gradiente dell’immagine. Tutte
le future operazioni sono e ettuate sui dati dell’immagine, i quali sono
stati trasformati relativamente all’orientamento assegnato, scalatura e locazione per ciascun descrittore in modo da garantire invarianza rispetto a
queste trasformazioni.
4. Keypoint descriptor: I gradienti locali dell’immagine sono misurati ad
una particolare scala nella regione che circonda i keypoint. Questi vengono
poi trasformati in una rappresentazione che fornisce una certa stabilità alle
distorsioni dovute al rumore e ai cambiamenti di luce.
Ora possiamo comprendere la scelta del nome, l’algoritmo trasforma i dati dell’immagine in coordinate invarianti alla scalatura relativi ai descrittori locali.
Un importante aspetto di questo approccio è che esso genera una quantità considerevole di descrittori (features) che coprono densamente l’immagine in tutto
l’intorno. Una tipica immagine di taglia 500 ◊ 500 pixel darà origine a circa
2000 descrittori stabili (anche se tale numero può subire variazioni in base al
contenuto dell’immagine e altri parametri).
Siccome abbiamo già ampiamente trattato l’algoritmo DoG nella precedente sezione, passiamo a descrivere i restanti passi, in modo da fornire una panoramica
completa del suo funzionamento.
2.1.1
Accurate keypoint localization
Eseguito il DoG sull’immagine e ottenuti i punti candidati, essi devono essere
ulteriormente filtrati prima di ottenere il key descriptor ed essere utilizzati in
un’applicazione di matching. Il primo filtraggio punta ad eliminare tra i punti
candidati, quelli che presentano basso contrasto o sono localizati lontano dai
contorni di un oggetto della scena.
Alcuni algoritmi (Brown 2002) sviluppano un metodo appropriato per interpolare una funzione quadratica in 3D ai punti campione locali, la quale una volta
applicata, essa determina la locazione del massimo; con questo procedimento si
ha un sostanziale miglioramento per quanto riguarda il matching e la stabilità.