Speciale TNF Sistemi di visione | Page 3

SPECIALE SISTEMI DI VISIONE LA TECNOLOGIA INDUSTRIA Una telecamera stereoscopica e a luce strutturata (Intel Real Sense D435i) maggiore risoluzione spettrale. Sono utiliz- zate per il riconoscimento e la distinzione di materiali diversi. Costruendo un sistema di due telecamere ge- neralmente a colori, poste a distanza nota, si ottiene invece una telecamera stereoscopica. Queste permettono di percepire la profondità della scena inquadrata e sono fondamentali per la navigazione in ambienti chiusi. La percezione di profondità può essere migliorata, integrando nel sistema un proiettore di luce infrarossa e una telecamera infrarossa e misurando la distorsio- ne del pattern proiettato (una tecnologia analoga è utilizzata da alcuni smartphone moderni per lo sblocco facciale). Per quanto riguarda il sensore, la maggior parte delle telecamere ne monta uno di tipo CMOS, che ormai come qualità dell’immagine prodotta è comparabile con la tipologia CCD, e può anche produrre un numero di fotogrammi al secondo maggiore. I sensori CCD sono utilizzati solo in ap- plicazioni molto specifiche, come alcune teleca- mere iperspettrali, ma nel futuro scompariranno. Anche se la maggioranza delle telecamere ha solo i componenti necessari a produrre un’im- magine di buona qualità, esistono telecamere più complete che comprendono un micropro- cessore, memoria RAM e memoria allo stato solido, in modo da analizzare le immagini già in loco. Questo permette, per esempio, di trasmet- tere una mappa di profondità da una telecamera stereoscopica, o i dati letti in un codice a barre. PROCESSAMENTO E ANALISI DEI FLUSSI VIDEO Una volta acquisito un flusso video il successivo processamento, che può essere eseguito in real time o in post processing, dipende dalla funzio- | Industria 4.0 | Tecnologie Innovative | Automazione | nalità specifica del sistema che vuole essere im- plementato. Nel dominio della computer vision la maggior parte delle problematiche, in ambito industriale e non, è suddivisa in quattro macro- aree: classificazione, segmentazione semantica, riconoscimento di oggetti e segmentazione di oggetti. - Classificazione (classification): in questa area si raggruppano tutte quelle problematiche che richiedono di identificare/classificare cosa è presente in ogni singolo frame del dato flus- so video. Quindi, l’output tipico di un algoritmo di classificazione è costituito da una serie di stringhe (labels) che identificano cosa è pre- sente nel frame di input. I labels codificano in modo discreto i diversi output voluti. Per esempio, se per la determinata applicazione si richiede di rilevare che le norme di sicurezza siano rispettate e che l’operaio, prima di en- trare in un certo ambiente, sia munito di un elmetto di protezione, l’output del sistema può essere “pass”, “fail”. Nel caso semplice di classificazione binaria (binary classification), come nell’esempio precedente, viene richie- sto all’algoritmo di “scegliere” tra due sole opzioni/classi. Invece, in un caso di classifica- zione multiclasse (multiclass, multilabel and multioutput classifications) l’uscita ha uno spettro molto più vario e generalmente risulta essere la selezione di uno o più classi presenti in una lista definita a priori. - Segmentazione semantica (semantic seg- mentation): in questa tematica classica del- www.thenextfactory.it 25