SPECIALE SISTEMI DI VISIONE
LA TECNOLOGIA
INDUSTRIA
Una telecamera stereoscopica e a luce
strutturata (Intel Real Sense D435i)
maggiore risoluzione spettrale. Sono utiliz-
zate per il riconoscimento e la distinzione di
materiali diversi.
Costruendo un sistema di due telecamere ge-
neralmente a colori, poste a distanza nota, si
ottiene invece una telecamera stereoscopica.
Queste permettono di percepire la profondità
della scena inquadrata e sono fondamentali per
la navigazione in ambienti chiusi. La percezione
di profondità può essere migliorata, integrando
nel sistema un proiettore di luce infrarossa e una
telecamera infrarossa e misurando la distorsio-
ne del pattern proiettato (una tecnologia analoga
è utilizzata da alcuni smartphone moderni per lo
sblocco facciale).
Per quanto riguarda il sensore, la maggior parte
delle telecamere ne monta uno di tipo CMOS,
che ormai come qualità dell’immagine prodotta
è comparabile con la tipologia CCD, e può anche
produrre un numero di fotogrammi al secondo
maggiore. I sensori CCD sono utilizzati solo in ap-
plicazioni molto specifiche, come alcune teleca-
mere iperspettrali, ma nel futuro scompariranno.
Anche se la maggioranza delle telecamere ha
solo i componenti necessari a produrre un’im-
magine di buona qualità, esistono telecamere
più complete che comprendono un micropro-
cessore, memoria RAM e memoria allo stato
solido, in modo da analizzare le immagini già in
loco. Questo permette, per esempio, di trasmet-
tere una mappa di profondità da una telecamera
stereoscopica, o i dati letti in un codice a barre.
PROCESSAMENTO
E ANALISI DEI FLUSSI VIDEO
Una volta acquisito un flusso video il successivo
processamento, che può essere eseguito in real
time o in post processing, dipende dalla funzio-
| Industria 4.0 | Tecnologie Innovative | Automazione |
nalità specifica del sistema che vuole essere im-
plementato. Nel dominio della computer vision
la maggior parte delle problematiche, in ambito
industriale e non, è suddivisa in quattro macro-
aree: classificazione, segmentazione semantica,
riconoscimento di oggetti e segmentazione di
oggetti.
- Classificazione (classification): in questa area
si raggruppano tutte quelle problematiche
che richiedono di identificare/classificare cosa
è presente in ogni singolo frame del dato flus-
so video. Quindi, l’output tipico di un algoritmo
di classificazione è costituito da una serie di
stringhe (labels) che identificano cosa è pre-
sente nel frame di input. I labels codificano
in modo discreto i diversi output voluti. Per
esempio, se per la determinata applicazione
si richiede di rilevare che le norme di sicurezza
siano rispettate e che l’operaio, prima di en-
trare in un certo ambiente, sia munito di un
elmetto di protezione, l’output del sistema
può essere “pass”, “fail”. Nel caso semplice di
classificazione binaria (binary classification),
come nell’esempio precedente, viene richie-
sto all’algoritmo di “scegliere” tra due sole
opzioni/classi. Invece, in un caso di classifica-
zione multiclasse (multiclass, multilabel and
multioutput classifications) l’uscita ha uno
spettro molto più vario e generalmente risulta
essere la selezione di uno o più classi presenti
in una lista definita a priori.
- Segmentazione semantica (semantic seg-
mentation): in questa tematica classica del-
www.thenextfactory.it
25