Capitolo VIII.
La comunicazione multimediale:
l’elaborazione audio-video
tra tecnologia e applicazioni
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Che cosa si comunica?
Informazione
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
2
La trasmissione
S
Mezzo Trasmissivo
D
Figura 1 – La trasmissione
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
3
Informazione e segnali
Introduciamo un concetto molto importante per
l’informatica delle comunicazioni:
il concetto di segnale
Il segnale come ciò che percorre il mezzo
trasmissivo trasportando con sé
l’informazione
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
4
I segnali e la matematica
•
Un segnale può essere descritto come una funzione matematica che si evolve,
ovvero varia, nel tempo.
•
Formalmente:
•
X=X(t)
Rappresentazione di un segnale
Grandezza misurata
Tempo
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
5
Il teorema di Shannon e
l’approssimazione
la natura dell’informazione è
inerentemente discreta
Claude Elwood Shannon (1916 -2001)
approssimare significa
“rendere vicino”
Approssimare è un’operazione che facciamo quotidianamente
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
6
Granularità o passo
È la dimensione della approssimazione
e rappresenta la grandezza sotto la quale
non distinguiamo le differenze in una
valutazione.
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
7
Il campionamento
Si estraggono parti di informazione,
che si definiscono campioni
e che sono “esponenti rappresentativi”
dell’informazione nel suo complesso,
e che attraverso il teorema di Shannon
possono condurre a ricostruire precisamente
l’informazione complessiva
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
8
Caratteristiche del suono
Il suono è caratterizzato da tre elementi o
caratteristiche fisiche:
• altezza
• intensità
• timbro
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
9
Il trasduttore
Il trasduttore, come fa intuire la parola, è qualcosa che
trasforma.
S
T
Mezzo
trasmissivo
T
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
D
10
La rappresentazione del suono
X=X(t) ci descrive com’è fatto il suono e come varia nel tempo,
rendendo ragione delle tre caratteristiche: altezza, intensità e timbro.
Ma non solo, ci permette perfino di riportare in un grafico la “forma”
del suono
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
11
Il campionamento dell’audio
Il campionamento consiste nell’estrarre valori della funzione
di “tanto in tanto”
I valori estratti si definiscono campioni
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
12
La quantizzazione
• Le onde sonore possono assumere infiniti valori
• Dobbiamo trattare con insiemi infiniti di variabilità dei valori
• Questa cosa non è “buona”
• La quantizzazione è il procedimento per trasformare l’insieme infinito
di valori, che possono assumere i campioni, in un insieme finito, ma
sempre rappresentativo
• La quantizzazione è in sostanza un’approssimazione
• Il procedimento di quantizzazione consiste nel definire in anticipo un
insieme di valori accettabili
• Il procedimendo del campionamento consiste nell’associare al valore
reale della funzione il valore più vicino definito nella quantizzazione
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
13
Quantizzazioni e audio digitale
• Il numero dei livelli dell’audio digitale è
espresso con un numero di bit.
• Si hanno quantizzazioni a 8, 16, 24, 32 bit.
– 8 bit Campionamento poco accurato
– 16 bit Fornisce la qualità tipica dei CD
– 24 bit È lo stato dell’arte
Ad esempio, la quantizzazione a 8 bit possiede 256 livelli possibili.
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
14
Elementi tecnici del campionamento
Chi effettua tecnologicamente queste operazioni?
I convertitori
Convertitori analogico digitali o ADC (Analogic to Digital Coverter)
I nostri ADC sono “scatole nere” che ricevono in ingresso un segnale
analogico e danno in uscita un flusso di bit.
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
15
Il formato
Nello schema della digitalizzazione abbiamo un flusso di bit in uscita da un
ADC.
Il flusso dev’essere:
• elaborato
• memorizzato
• trasmesso
dal sistema che lo riceve.
Per fare questo il sistema deve dare una struttura logica ordinata a questo
flusso.
Questa struttura si chiama formato
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
16
I formati applicativi comuni
I formati più comuni sono:
• il formato Wave (estensione dei file .wav), tipico degli ambienti Windows
• il formato Aiff tipico degli ambienti Apple
• il formato au tipico degli ambienti Unix o multipiattaforma.
L’operazione che trasforma il flusso di bit in uscita dall’ADC
in un formato è detta codifica.
La codifica è responsabile delle caratteristiche:
• fisiche
• acustiche
• tecnologiche
del segnale audio.
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
17
La compressione – Perché?
• Il grande problema dell’audio digitale è la dimensione del
segnale digitale
• I formati che abbiamo appena visto non si preoccupano
della dimensione del segnale, ma si occupano
solamente di come rappresentarlo
• Per questa ragione sono state studiate delle tecniche
mirate a ridurre le dimensioni dell’audio codificato.
• Un brano in formato CD Audio di 5 minuti di musica
occupa uno spazio spropositato sull’hard disk: oltre 423
Mb (MegaByte).
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
18
Le tre fasi della compressione
•
Attraverso considerazioni di psico-acustica, si eliminano tutte le
componenti presenti nel suono che l’orecchio umano non percepisce.
•
Attraverso considerazioni di fisica acustica, si applicano dei filtri che
ripuliscono il segnale da tutto quello che c’è “in più”.
•
Attraverso il procedimento detto codifica di Huffman, si eliminano le
altre frequenze non udibili.
•
Questi tre passaggi sono noti come codifica audio MPEG e
definiscono i tre livelli di compressione crescenti noti con il nome di
– MPEG1 Layer-1
– MPEG1 Layer-2
– MPEG1 Layer-3 o MP3
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
19
La forza dell’MP3
Con un codificatore MP3 si arriva ad avere una
compressione in grado di far risparmiare fino a
13 volte in termini di dimensione in bit.
5 minuti di suono digitale stereofonico compresso in MP3
occupano “solamente” da 4.1 a 4.4 MByte
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
20
Da video analogico a video digitale
• Campionamento
• Quantizzazzione
• Codifica
• Compressione
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
21
Campionamento
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
22
Parole chiave
• La dimensione della griglia si definisce
risoluzione
• I quadratini della griglia sono detti pixel,
ovvero picture elements
• DPI = Dot Per Inch
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
23
Quantizzazione
L’insieme dei colori dei singoli pixel e delle
rispettive tonalità è un insieme teoricamente
infinito.
• L’occhio umano non è in grado di percepire tutte
le possibili sfumature di colore
• Ogni singolo colore è rappresentato da tre numeri:
{r,g,b}
• Le terne variano da {0,0,0} (nero) a {255,255,255}
(bianco)
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
24
Codifica di immagini statiche
• È molto diverso elaborare un’informazione statica
(immagini, foto) o una dinamica
(filmati o animazioni).
• La codifica di un’immagine statica, realizzata
effettuando la memorizzazione dei valori delle
componenti cromatiche che rappresentano i singoli
pixel, è chiamata bitmap o raster
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
25
Compressione
• Compressione senza perdita
• Compressione con perdita
– Nella compressione con perdita è necessaria
l’approssimazione
• Esempi di formati di compressione
–
–
–
–
–
Gif (Graphic Interchange Format)
Jpeg (Joint Photographic Expert Group )
Png (Portable Network Graphics)
Tiff (Tagged Image File Format)
Bmp (Basic Multilingual Plane)
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
26
La codifica di immagini dinamiche
• L’evoluzione nel tempo dell’immagine
televisiva è una sequenza frame
• Ogni frame è suddiviso in linee
• Il frame è costituito da due field:
– field pari
– field dispari
• Si parla di video interallacciato
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
27
Sistemi di codifica
• YUV (o YCbCr) nel sistema PAL
• YIQ nel sistema NTSC
Si codificano i singoli field
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
28
Flusso dati
• un segnale televisivo PAL richiede un
flusso dati di 200 Mbps
• un segnale televisivo NTSC richiede un
flusso dati di 165 Mbps
• un segnale televisivo ad alta definizione
richiede circa 1 Gbps
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
29
Compressione
di immagini dinamiche
• Nel video è presente informazione non percepibile
• Si procede a eliminare informazioni senza perdere
in qualità, sfruttando il fatto che l’occhio umano è
più sensibile alla luminanza che alla crominanza.
• La tecnica usata è la decimazione: viene
memorizzata una informazione di crominanza ogni
due pixel, oppure ogni quattro oppure ogni otto ecc.
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
30
La compressione MPEG
• Il Motion Picture Export Group fu inventato da
Leonardo Chiariglione, ingegnere nato a Borgionera
di Villar Dora
• Definisce standard per:
– la compressione dati video
– la compressione dati audio
– la sincronizzazione audio-video
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
31
Tipi di MPEG
•
•
•
•
MPEG-1: bitrate massimo 1.5 Mbit/s
MPEG-2: bitrate massimo 16 Mbps
MPEG-3: Rollback in MPEG-2
MPEG-4: progettato per la trasmissione video
su rete
• MPEG-7: progettato per la codifica audiovisiva
in relazione al contenuto semantico
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
32
La compressione DivX
• capacità di trasmettere informazioni con
basso bitrate, ma con qualità elevata
Normalmente un film su DVD utilizza lo
standard MPEG-2 e occupa fino a 7
Gbyte (normalmente)
Utilizzando il formato DivX occupa circa
1 Gbyte al massimo
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
33
Formato DV
• Digital video
• Panasonic, Sony, Jvc e Philips
• È uno standard per la registrazione di video
digitale di alta qualità.
• Bitrate 25mbps
• Formato dv50 con bitrate 50 mbps.
• È utilizzato nel campo del video professionale
e le moderne telecamere funzionano con
questo standard
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
34
Codifica e decodifica: il CODEC
• È il cuore della compressione
• COmpressor/DECompressor
• È l’algoritmo con cui si selezionano le
informazioni da scartare e quelle da tenere
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
35
Caratteristiche applicative
dei processi di codifica
• Il processo di codifica richiede molto tempo a
disposizione e sistemi di elaborazione molto
potente.
– Hardware dedicato
– Lunghi tempi di elaborazione
– Poco adatto alle operazioni “a casa”
N.B. Bisogna aggiungere che quest’ultima
affermazione si sta leggermente
modificando, grazie all’introduzione di
processori sempre più veloci.
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
36
Scarica

codifica