Speciale TNF Sistemi di visione | Page 4

NELL’ULTIMO DECENNIO SI È VISTA UN’IMPENNATA VERTIGINOSA DELLA RICERCA SULLE RETI NEURALI A sinistra: distinzione tra le quattro classiche macroaree di algoritmi per la Computer Vision il cui scopo è quello di riconoscere e individuare la posizione dei vari oggetti presenti in un’im- magine. A differenza della segmentazione se- mantica, i vari oggetti appartenenti a un certa classe vengono distinti e localizzati all’interno della scena tramite un bounding box, ovvero un rettangolo che racchiude la porzione di im- magine in cui compaiono. L’output di un algo- ritmo di object detection sarà dunque l’elenco dei rettangoli che individuano tutti gli oggetti presenti nella scena insieme a una classe di appartenenza per ognuno di essi. Questo tipo di conoscenza dell’ambiente permette, dun- que, di sapere cosa si sta inquadrando, in che numero e in che posizione. Quattro diverse piattaforme per l’Edge Computing. In alto a sinistra, un Raspberry Pi 3 B+ con l’acceleratore Neural Compute Stick 2 (Intel); in alto a destra, una Jetson AGX Xavier (Nvidia); in basso a sinistra, una Jetson Nano (Nvidia); in basso a destra un Raspberry Pi 3 B+ con l’acceleratore Movidius Neural Compute Stick (Intel) la visione artificiale si richiede di suddividere un’immagine in classi o aree semantiche. Le classi, nel caso della semantic segmentation, a differenza della classificazione in cui pos- sono assumere significati astratti sono inve- ce oggetti, raggruppati in categorie, presenti 26 www.thenextfactory.it nella scena presa in esame. Dunque, l’output di un algoritmo di segmentazione risulta es- sere un’immagine suddivisa nelle sue com- ponenti semantiche. Nel caso ipotetico di un sistema di visione a supporto di un veicolo a guida automatizzata (AGV), algoritmi di seg- mentazione semantica possono fornire una mappa tematica di quello che viene osser- vato dalla piattaforma mobile. Questa infor- mazione può essere sfruttata da altri sistemi per navigare autonomamente, manipolare oggetti o ispezionare l’ambiente circostante. - Riconoscimento di oggetti (object detection): in questa categoria si inseriscono gli algoritmi - Segmentazione di oggetti (instance seg- mentation): questo gruppo di algoritmi si pone l’obiettivo di attribuire con precisione i pixel dell’immagine ai vari oggetti individuati. L’output di un algoritmo di instance segmen- tation consiste nell’immagine suddivisa nelle aree appartenenti ai vari oggetti a cui viene associata una classe. Questo processo può quindi essere visto come l’unione di segmen- tazione semantica e object detection e per- mette la massima estrazione di informazioni dalla scena in esame, ovvero la lista di oggetti inquadrati, la loro posizione e la loro forma. Algoritmi di questo tipo sono alla base di inte- razioni complesse con gli oggetti come la ma- nipolazione e la movimentazione automatica. Fin dagli albori della visione computerizza- ta, soluzioni open source e proprietarie sono state proposte per fare fronte a queste pro- | Industria 4.0 | Tecnologie Innovative | Automazione |