Come funziona
la visione artificiale
ACQUISIZIONE, PREPROCESSING E PROCESSING
SONO I TRE BLOCCHI CHE COMPONGONO UN SISTEMA
DI VISIONE ARTIFICIALE. SCOPRIAMO INSIEME PER
CIASCUNO I COMPITI, LE SPECIFICHE E I DISPOSITIVI
TECNOLOGICI.
di Vittorio Mazzia, Roberto Cappellaro e Francesco Salvetti, Politecnico di Torino
L
a vista è forse il senso più importante che
un essere umano abbia per percepire l’am-
biente circostante. La visione artificiale
(computer vision) è quel campo scientifico che si
pone come obiettivo di riprodurre digitalmente
e automaticamente le funzionalità della visio-
ne umana costruendo un modello artificiale
dell’ambiente circostante.
Un sistema di visione artificiale si compone pre-
valentemente di tre blocchi:
1. acquisizione (acquisition): questo primo bloc-
co ha il compito di ottenere una rappresen-
tazione digitale dell’ambiente di interesse.
Questo processo viene effettuato acquisendo
i dati prodotti da un apposito sensore (la tele-
camera) e digitalizzandoli. L’output di questo
primo blocco è tipicamente un flusso video
composto da una serie di immagini, ognuna
delle quali organizzata come una matrice di
pixel. Il valore associato a ogni pixel rappre-
senta la luminosità corrispondente rilevata
dal sensore;
2. preprocessamento (preprocessing): l’immagi-
ne digitale viene modificata per semplificare
l’estrazione delle informazioni di interesse.
L’entità e la tipologia di queste modifiche di-
pendono dall’applicazione specifica e dal tipo
di algoritmo che verrà successivamente ap-
plicato. Classiche operazioni di preprocessa-
mento sono il riscalamento, la normalizzazio-
ne, l’attenuazione del rumore e l’enhancement;
3. elaborazione (processing): una serie di algorit-
mi estrae le proprietà di interesse dall’imma-
gine (feature extraction) e le elabora per otte-
nere informazioni di alto livello che vengono
utilizzate per l’applicazione desiderata (per
LE TELECAMERE PRODUCONO
UN FLUSSO DI DATI DIGITALE
E LO TRASMETTONO CON
PROTOCOLLI STANDARD
24
www.thenextfactory.it
esempio il monitoraggio di processi, il con-
trollo automatico oppure il riconoscimento di
oggetti).
DISPOSITIVI DI ACQUISIZIONE
Le telecamere utilizzate per la visione artificiale
producono un flusso di dati digitale e lo trasmet-
tono con protocolli standard tramite USB, Ether-
net, Camera Link o CSI (Camera Serial Interface).
In base allo spettro rilevato dal sensore si posso-
no suddividere in:
• telecamere RGB: dalle svariate applicazioni,
come il riconoscimento di oggetti;
• telecamere a infrarossi: utilizzate principal-
mente per il monitoraggio della temperatura
di un pezzo;
• telecamere multispettrali e iperspettrali: en-
trambe permettono di registrare nello spettro
infrarosso e visibile, ma il secondo tipo ha una
| Industria 4.0 | Tecnologie Innovative | Automazione |