Tecniche di annotazione per contenuti
multimediali
Tecniche di annotazione per contenuti multimediali
Sommario
Introduzione
Annotazioni Audio
Annotazioni di Immagini
Annotazioni di Video
Applicazioni Informatiche
2
Tecniche di annotazione per contenuti multimediali
Sommario
Introduzione
Annotazioni Audio
Annotazioni di Immagini
Annotazioni di Video
Applicazioni Informatiche
3
Introduzione
Librerie Digitali
4
Una libreria digitale è
• Un collezione di oggetti informativi
• Una collezione di servizi che supportano
– gli utenti nella gestione di oggetti informativi
– le organizzazioni nella presentazione di questi
oggetti
direttamente o indirettamente attraverso canali
elettronici/digitali
DLib Working Group on Digital Library
Applicazioni Informatiche
Introduzione
Dati delle librerie musicali
5
Dati: i file digitali memorizzati
• Testo (e-book, documenti Word, pagine Web,
PDF, Blog, etc.)
• Audio
– Parlato (broadcasting, podcasting, registrazioni,
etc.)
– Musica (CD, MP3, etc.)
• Immagini/Photo: collezioni di pixel
• Video: sequenze di immagini + audio (musica
e/o parlato)
Applicazioni Informatiche
Introduzione
Attività associate a una libreria digitale
Memorizzazione e “conservazione” dei dati in
formato elettronico
• Trasformazioni (digitalizzazione di libri, foto,
etc.)
• Cambi di formato
Reperimento dei contenuti e creazione di
interfacce per la ricerca dei dati
Estrazione e/o generazione dei metadati
(o annotazioni)
Gestione copyright, etc.
Applicazioni Informatiche
6
Introduzione
Cose’è un metadato?
I metadati sono dati relativi ai dati
• Descrivono in modo strutturato
proprietà dei dati
– Esempio: creatore, proprietario, data di
creazione, modifica, descrizione
Alcuni metadati sono presenti in modo
esplicito nei dati
• Esempio: dimensione file, nome, etc.
Altri sono impliciti e sono estratti
tramite algoritmi di analisi dei dati
Applicazioni Informatiche
7
Introduzione
Utilità dei metadati
8
I metadati servono per
• Migliorare le ricerche interrogando non
solo i dati ma anche i metadati
– I metadati spesso contengono delle
informazioni che sono contenute in
forma implicita nei dati
• Facilitare lo scambio di informazioni tra
sistemi diversi
– Se si utilizzano gli stessi metadati o
metadati “compatibili”
- Esempio: formati XML (MPEG7, Dublin
Core, etc.)
Applicazioni Informatiche
Introduzione
Perché annotare contenuti multimediali?
I computer non sono in grado di
comprendere il significato di un
contenuto multimediale
• Un calcolatore, a differenza di un
essere umano, non può
comprendere che questa immagine
rappresenta un tramonto
• Pixel e campioni audio non portano
semantica, ma solo informazione
binaria
E’ necessario produrre
rappresentazioni trattabili
da un calcolatore
• Esempio: testo o numeri
Applicazioni Informatiche
9
Introduzione
Perché annotare automaticamente contenuti multimediali?
10
L’annotazione manuale di oggetti multimediali è
un processo
• Costoso
– Esempio: la segmentazione manuale di un video
richiede circa 10 ore di lavoro per 1 ora di video
– Le collezioni multimediali possono anche contenere
milioni di oggetti
• Incompleto o inaccurato
– un utente può non essere in grado di cogliere tutti i
significati associati ad un oggetto multimediale
– “una immagine vale più di mille parole!”
• Difficoltoso
– Alcuni contenuti sono difficili da descrivere a parole
-
Esempio: una melodia senza accompagnamento vocale
e con una struttura irregolare
Le tecniche di annotazione automatica consentono
di creare annotazioni di buona qualità e a
“basso” costo
Applicazioni Informatiche
Introduzione
Esempi di utilizzo di annotazioni multimediali
11
Archiviazione
• Gestione efficiente di grosse collezioni di dati
multimediali
• Aggregazione di contenuti in insiemi coerenti
per significato
– Esempio: insieme delle canzoni di genere “Indie”
Ricerca
• Trovare tutti i contenuti aventi la stessa
annotazione
– Esempio: cercare tutte le puntate dei Simpson in
cui viene pronunciata la parola “ciambella”
Applicazioni Informatiche
Introduzione
Esempi di utilizzo di annotazioni multimediali
12
Comparazione
• Identificazione di contenuti MM equivalenti
– Esempio: Protezione del brand e della
proprietà intellettuale
• Individuazione di contenuti simili
– Esempio: trovare abiti aventi lo stesso tipo di
tessuto e colore
Applicazioni Informatiche
Tecniche di annotazione per contenuti multimediali
Sommario
Introduzione
Annotazioni Audio
Annotazioni di Immagini
Annotazioni di Video
Applicazioni Informatiche
13
Audio
Segmentazione
14
OBIETTIVO: dividere una traccia audio in
segmenti omogenei al fine di determinare il
loro tipo
•
•
•
•
•
Musica
Parlato
Rumore
Musica e parlato
…
Possibili utilizzi
• Miglioramento performance di altre
tecnonologie di annotazione (es. parlato,
musica)
• Meccanismi di accesso al contenuto di un video
• Rimozione o identificazione pubblicità
Applicazioni Informatiche
Audio
Segmentazione - Esempio
CREDITS: Thorsten Hermes@SSMT2006
Applicazioni Informatiche
15
Audio
Identificazione dello speaker
16
OBIETTIVO: identificare automaticamente gli
individui che prendono parte ad una
conversazione
ERIC
DAVID
JOHN
UTILIZZI:
• Meccanismi di ricerca e catalogazione
– Esempio: trova tutte le registrazioni in cui viene
intervistato X
• Individuazione di un parlatore in videoconferenze
• Esecuzione di comandi vocali
Applicazioni Informatiche
Audio
Word spotting
17
OBIETTIVO: riconoscere automaticamente dal
parlato parole appartenenti a un vocabolario
chiuso
Call
Open
Bomb
UTILIZZI:
• Riconoscere parole specifiche nel parlato
spontaneo
– Esempio: blacklist words (attack, bomb,…)
• Esecuzione di comandi vocali
• Controlli di accesso (password vocali),
possibilmente combinato con il riconoscimento
del parlatore
Applicazioni Informatiche
Audio
Speech to text
18
OBIETTIVO: riconoscere automaticamente dal
parlato parole appartenenti ad un dizionario
completo
UTILIZZI:
• Trascrizione automatica
• Meccanismi di ricerca e catalogazione
– Esempio: trova tutti i video in cui qualcuno
pronuncia la parola “ciambelle”
Applicazioni Informatiche
Audio
Trascrizione automatica del parlato - Esempio
CREDITS: Thorsten Hermes@SSMT2006
Applicazioni Informatiche
19
Audio
Identificazione di eventi sonori
OBIETTIVO: identificare automaticamente
nell’audio la presenza di eventi sonori
significativi
• Esempio: spari, urla
UTILIZZI:
• Meccanismi di ricerca e catalogazione
• Creazione di sommari automatici
CREDITS: Thorsten Hermes@SSMT2006
Applicazioni Informatiche
20
Audio
Identificazione di eventi sonori
CREDITS: Thorsten Hermes@SSMT2006
Applicazioni Informatiche
21
Audio
Classificazione di generi musicali
22
OBIETTIVO: identificazione automatica del
genere musicale di una data canzone
• Rock, pop, Jazz, Blues, etc.
Rock
Dance!
UTILIZZO:
• Meccanismi di ricerca e catalogazione
– Esempio: trova tutte le canzoni Pop nella
collezione musicale
• Selezione automatica di canzoni in una playlist
Applicazioni Informatiche
Audio
Individuazione di strumenti
23
OBIETTIVO: identificazione automatica degli
strumenti utilizzati per l’esecuzione di una
canzone
• Batteria, chitarra elettrica, chitarra acustica,
pianoforte, etc.
UTILIZZO:
• Meccanismi di ricerca e catalogazione
• Input per algoritimi di identificazione del genere
Applicazioni Informatiche
Audio
Caratteristiche ritmiche
OBIETTIVO: identificazione automatica delle
caratteristiche ritmiche di una data canzone
• Esempio: BPM
UTILIZZO:
• Ricerca e catalogazione
• Nike+ per iPod
• Composizione automatica di playlist
Applicazioni Informatiche
24
Audio
Caratteristiche di struttura
25
OBIETTIVO: segmentare automaticamente una
canzone nelle sue componenti strutturali
•
•
•
•
Intro
Chorus
Outro
Etc..
UTILIZZO:
• Ricerca e catalogazione
• Composizione automatica di playlist
• Tecniche avanzate di navigazione nel file
musicale
Applicazioni Informatiche
Tecniche di annotazione per contenuti multimediali
Sommario
Introduzione
Annotazioni Audio
Annotazioni di Immagini
Annotazioni di Video
Applicazioni Informatiche
26
Immagini
Estrazione feature di basso livello
OBIETTIVO: estrarre caratteristiche implicite
di una immagine
Luminosità
Colore dominante
Orientamento dell’immagine
Presenza di tessiture
UTILIZZO:
Classificazione e ricerca (anche per
similarità)
Input per successivi algoritmi di analisi
Applicazioni Informatiche
27
Immagini
Segmentazione testo/immagine di documenti
OBIETTIVO: identificare la tipologia di
contenuto di una immagine
testo/immagine
Sezioni di una immagine
UTILIZZO:
Classificazione e ricerca
Input per successivi algoritmi di analisi
delle immagini
Applicazioni Informatiche
28
Immagini
Optical character recognition (OCR)
OBIETTIVO: convertire le
parole contenute all’interno di
una immagine nel
corrispondente testo
• Digitializzazione di testi
cartacei
• Estrazione di testo da
fotografie
– Targhe, sottotitoli, etc.
UTILIZZO:
• Meccanismi di ricerca e
catalogazione
– Esempio: trova tutte le
immagini in cui appare la targa
X
• Meccanismi di archiviazione
digitale
Applicazioni Informatiche
29
Immagini
Riconoscimentoedidentificazionedivolti
OBIETTIVO: riconoscere e
identificare I volti presenti
all’interno di una immagine
UTILIZZO:
• Conteggio di persone
• Applicazioni di sicurezza
• Ricerca e catalogazione
CREDITS: Thorsten
Hermes@SSMT2006
Applicazioni Informatiche
30
Immagini
Riconoscimento ed identificazione di volti
Applicazioni Informatiche
31
Immagini
Riconoscimento ed identificazione di volti
CREDITS: Thorsten Hermes@SSMT2006
Applicazioni Informatiche
32
Tecniche di annotazione per contenuti multimediali
Sommario
Introduzione
Annotazioni Audio
Annotazioni di Immagini
Annotazioni di Video
Applicazioni Informatiche
33
Immagini
Riconoscimento di persone
OBIETTIVO: riconoscimento di
persone all’interno di una
immagine
UTILIZZO:
• Conteggio di persone
• Applicazioni di sicurezza
(riconoscimento di situazioni
potenzialmente “critiche”)
• Ricerca e catalogazione
– Trova tutte le immagini che
contengono folle dipersone
Applicazioni Informatiche
34
Immagini
Riconoscimento di oggetti
Obiettivo: identificare e registrare gli oggetti
che compaiono in una immagine
• Palleda tennis, calcio, basket, etc.
• Automobili
Possibili utilizzi
• Archiviazione e ricerca
• Sicurezza
• Aiuti visuali per gli spettatori
Applicazioni Informatiche
35
Immagini
Riconoscimento di oggetti attraverso esempi
Obiettivo: identificare degli
oggetti in una immagine
dato un esempio
• Riconoscimento indipendente da
posizione dello scatto,distanza
etc.
Possibili utilizzi
• Archiviazione e ricerca
• Identificazione di contenuti MM
equivalenti
– Esempio: Protezione del brand
e della proprietà intellettuale
Applicazioni Informatiche
36
Video
Motion identification
37
Obiettivo: identificare
movimenti della camera
durante la registrazione
di una scena
• Zoom
• Rotazione
• Panoramica (orizzontale o
verticale)
Possibili utilizzi
• Identificazione automatica
di tecniche di regia
• Riconoscimento di registi
• Input per algoritmi di
segmentazione
CREDITS: Thorsten Hermes@SSMT2006
Applicazioni Informatiche
Video
Motion identification
38
CREDITS: Thorsten Hermes@SSMT2006
Applicazioni Informatiche
Immagini
Inseguimento di oggetti
OBIETTIVO: riconoscimento di un
oggetto all’interno di un video
• Persone
• Palle da tennis, calcio, basket,
etc.
• Automobili
UTILIZZO:
• Riconoscimento del movimento
delle persone
• Applicazioni di sicurezza
(riconoscimento di
comportamenti “sospetti”)
• Ricerca e catalogazione
– Trova tutte le immagini che contengono
folle di persone
• Aiuti visuali per gli spettatori
• On-line gaming
• Tactics analysis
Applicazioni Informatiche
39
Immagini
Riconoscimento del movimentodellepersone
Obiettivo:riconoscere il tipo di movimento
effettuato da una persona
• Camminare
• Correre
• Cadere
Possibili utilizzi
• Applicazioni di sicurezza (riconoscimento di
comportamenti “sospetti”)
• Ricerca e catalogazione
Applicazioni Informatiche
40
Video
Segmentazione – Fotogrammi chiave
OBIETTIVO: dividere una traccia video in
funzione dei suoi fotogrammi chiave
• Compressione
• Temporalmente equidistanti
Possibili utilizzi
• Sommario del video
• Analisi dei fotogrammi chiave per annotazioni
su immagini
Applicazioni Informatiche
41
Video
Segmentazione – Riprese
OBIETTIVO: dividere una traccia video in segmenti
dove la ripresa della camera è ininterrotta
•
•
•
•
Transizioni instantanee
Fades
Uno shot ha lunghezza minore o
uguale ad una scena
Una scena può contenere più shot
Possibili utilizzi
• Sommario del video
• Estrazione di keyframe
• Composizione “semantica” di video (manuale o
automatica)
Applicazioni Informatiche
42
Video
Esempi di segmentazione – Riprese
DISSOLVE
FADE-IN
Applicazioni Informatiche
43
HARD CUT
FADE-OUT
CREDITS: Thorsten Hermes@SSMT2006
Video
Segmentazione - Scene
44
Obiettivo: dividere una traccia video in
segmenti che riguardano una azione coerente
•
•
•
•
Master scene
Flashback scenes
Introduction scenes
…
Possibili utilizzi
• Sommario del video
• Composizione “semantica” di video (manuale o
automatica)
Applicazioni Informatiche
Video
Video OCR
Obiettivo: estrarre testo da filmati
•
•
•
•
•
Titoli introduttivi
Titoli di coda (attori, registi etc.)
Sottotitoli
Nome di luoghi, persone, fatti etc.
Data/ora registrazione
Possibili utilizzi
• Indicizzazione per ricerca testuale
Applicazioni Informatiche
45
Video
Video Summarization
46
Obiettivo: creare automaticamente una
versione compatta di un filmato, capace di
trasmetterne sintenticamente il suo contenuto
• Composizione “intelligente” di segmenti eterogenei
Come?
• Segmentazione
– Video
– Audio
Possibili utilizzi
• Trailers di film
• Preview
• Pubblicità
CREDITS: Thorsten Hermes@SSMT2006
Applicazioni Informatiche
Tecniche di annotazione per contenuti multimediali
References
47
Slides del corso di “Archivi Multimediali e Data Mining”,
Politecnico di Torino, Prof. Silvia Chiusano
Slides e video delle lezione tenute dal Prof. Thorsten Hermes
presso la summer school SSMS 2006
Applicazioni Informatiche
Scarica

Tecniche di annotazione per contenuti multimediali