Progetto di Visione e Percezione
Parte I
“Riconoscimento di Facce”
Studentessa: Piera Salvatore
Docente: Fiora Pirri
Anno Accademico 2007/2008
METODO
Il metodo di riconoscimento utilizzato è quello
proposto da Viola & Jones.
Tre contributi chiave sono alla base del progetto:
• Immagini Integrali
• Algoritmo di apprendimento AdaBoost
• Cascata di classificatori
Features
L’analisi dell’immagine viene eseguita utilizzando un
set ristretto di features“Haar-Like” in grado di
codificare ad-hoc il dominio della conoscenza:
Tipo 0
Tipo 2
Tipo 4
Tipo 1
Tipo 3
Classificatori
Tra le tantissime features a disposizione, il compito
di selezionare quelle che genererebbero un errore
minore, è affidato all’algoritmo AdaBoost che al termine
dell’elelaborazione ci fornisce il classificatore robusto,
costituito dai diversi classificatori deboli scelti.
Cascata di classificatori
Ottimizzare la ricerca indirizzandola verso quelle che si
possono definire le regioni più promettenti, è lo scopo
dell’utilizzo di una cascata di classificatori.
Idea base:
Le regioni dove occorrono facce si possono individuare molto
facilmente ed il parametro di valutazione è il numero di falsi positivi,
cioè il numero di sottofinestre identificate come potenziali facce.
Struttura della cascata
L’algoritmo AdaBoost non si preoccupa di ottenere
un elevato tasso di riconoscimento e per ottenere
anche questa prestazione sono state effettuate le
seguenti modifiche:


Il valore della soglia è stato modificato
adattatamente per ottenere un tasso di
riconoscimento accettabile
Il numero delle iterazioni non è definito a priori ma
ad ogni iterazione l’algoritmo decide se è necessaria
una nuova iterazione oppure no
RISULTATI
La fase di addestramento dell’algoritmo AdaBoost è durata più
di due settimane e si sono ottenuti 4 livelli della cascata.
Una delle prime caratteristiche selezionata come classificatore
è quella che si concentra sulla proprietà che la regione degli
occhi è spesso più scura della regione della fronte.
La fase di test è stata eseguita su un campione di 10 immagini contenenti gruppi
di persone. Per ognuna di esse sono stati memorizzati i centri dei volti all’interno di
una struttura. Le regioni di interesse (ROI) clacolate dal detector sono state
valutate come successi o insuccessi attraverso la stima della distanza euclidea tra i
centri dei volti e quelli delle ROI
La figura mostra una
parte delle ROI ottenute
dal detector e tra di esse
è possibile notare come
alcune riescono ad
individualizzare meglio il
volto mentre altre si
allontanano troppo dal
centro.
Detection rate
La seguente curva ROC mostra le effettive prestazioni dell’applicazione:
False positive rate
Scarica

Studentessa