Computer Vision
Sviluppo di una applicazione
come strumento di supporto per
utenti tetraplegici
Laureando:
Roberto Valenti
Relatore:
prof. Massimo Ferri
Correlatore:
prof. Fabio Vitali
La situazione
• Società e tecnologia
– L’informazione alla
base della società
• Disabilità e tecnologia
– Aumento del divario tra
normodotati e disabili.
Cosa si vuole realizzare?
• Integrazione di utenti tetraplegici nella
“Società dell’informazione”
– Un sistema di puntamento innovativo
– Un metodo di scrittura che non implichi la
pressione di tasti (attraverso OSK)
Cosa ci serve?
• Gestione di stream video dalla webcam
• Un veloce riconoscitore di volti
• Creazione di eventi sul sistema
operativo target
Diagramma di Funzionamento
Init
Detection
Realtime
Stream
Processing
Controls
Events
Render
Fast Face Detection
• Componenti necessarie:
– Immagini Integrali
– Adaboost
– Classificatori a Cascata
Classificatori
• Sono alberi decisionali con almeno due
foglie
• “BUY NOW”, un esempio di
classificatore per spam.
• Classificatori deboli e forti
• Classificatori basati sulle caratteristiche
“Haar-Like”.
Caratteristiche “Haar-Like”
Problema:
• Ripetuti calcoli di somme di pixel
compresi in aree rettangolari
• Aumento del costo computazionale
Soluzione: Immagini Integrali
Immagini Integrali
•
•
•
•
A=1
B = 2-1
C = 3-1
D = 4-A-B-C
• D = 4+1-(2+3)
Problema:
• Più di 180000 caratteristiche in ogni
immagine
• Classificatori troppo complessi
Soluzione: AdaBoost
AdaBoost
• “BUY NOW”: una estensione
• Adaboost applicato ad immagini
Risultati Adaboost
Le prime due caratteristiche selezionate dall’
Adaboost mostrate in sovrapposizione ad
un’immagine “positiva”
Problema:
• Ricerca in immagini più grandi di quelle
di addestramento
• Ricerca in diverse scale
• Costo proibitivo della procedura
Soluzione: Classificatori a Cascata
Classificatori a cascata
All Sub-windows
T
T
1
2
F
3
F
T
T
4
F
Reject Sub-window
F
Dimostrazione e Conclusioni
Scarica

Computer Vision