Tesi di Laurea - Aprile 2005
Strumenti automatici di elaborazione del
segnale audio per sistemi di riversamento
massivo di materiale radiofonico
Relatore:
Prof. Angelo Raffaele MEO
Co-relatori:
Dott. Daniele AIROLA - RAI CRIT
Ing. Giorgio DIMINO - RAI CRIT
Prof. Juan Carlos DE MARTIN
Candidato:
Tommaso DEPALMA
Politecnico di Torino
Argomenti presentati
 Sviluppo della tesi
 parte teorica
 parte sperimentale
 Il processo di riversamento massivo
 Ambiente di sviluppo e test
 Selezione dei parametri audio e sviluppo degli strumenti di
analisi
 Valutazione della qualità dei riversamenti
 casi particolari
 situazioni anomale
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Sviluppo della Tesi
Obiettivo: fornire strumenti automatici di elaborazione del segnale audio
per sistemi di riversamento massivo di materiale radiofonico.
Parte teorica:
 Studio delle problematiche presenti nella digitalizzazione di un archivio
considerando:
 i supporti di registrazione (nastri magnetici, dischi in vinile)
e le loro caratteristiche
 i limiti intrinseci che caratterizzano il segnale audio
memorizzato sui supporti
 i problemi relativi alla fase di riproduzione
 le tecnologie necessarie ed i dispositivi utilizzati nella catena
 le tarature dei dispositivi utilizzati
 file format adeguati alle esigenze del mondo professionale
(ambito broadcasting) in termini di qualità ed
interoperabilità tra differenti sistemi/ambienti
Il tutto al fine di ottenere una catena di riproduzione e digitalizzazione
allo stato dell’arte.
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Sviluppo della Tesi
Obiettivo: fornire strumenti automatici di elaborazione del segnale audio
per sistemi di riversamento massivo di materiale radiofonico.
Parte teorica:
 Selezione di parametri rappresentativi del segnale audio
che consentano il monitoraggio di ogni singolo processo
di riversamento
 Metodi di calcolo utilizzati per l’estrazione dei parametri
dal file audio prodotto dal processo di digitalizzazione.
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Sviluppo della Tesi
Obiettivo: fornire strumenti automatici di elaborazione del segnale audio
per sistemi di riversamento massivo di materiale radiofonico.
Parte sperimentale:
 Sviluppo di strumenti software necessari all’elaborazione
automatica del materiale audio radiofonico digitalizzato dalla
nastroteca RAI – Torino





adeguati alle caratteristiche (24bit@48kHz) ed al formato file
(Broadcast Wave Format - BWF) prodotto dal riversamento
appropriati all’infrastruttura hardware/software attualmente
utilizzata in RAI
in grado di monitorare la qualità di ciascun riversamento
tramite misure, file di dati e grafici relativi, in modo da
agevolare la fase di certificazione manuale (che può richiedere
eventuali ripetizioni del processo di digitalizzazione)
in grado di evidenziare eventuali problematiche riguardanti i
supporti e i dispositivi utilizzati nella catena
che consentano l’individuazione su base temporale di
fenomeni
di
degradamento
o
deriva
altrimenti
difficilmente identificabili
Aprile 2005
Tesi di Laurea
Tommaso Depalma
Politecnico di Torino
Il processo di riversamento massivo
Da dove nasce l’esigenza di un processo massivo di riversamento e
digitalizzazione?
 L’invecchiamento e il conseguente degrado dei supporti analogici è
inevitabile
 Data l’enorme quantità di supporti presenti negli archivi
 Il processo di riversamento tra supporti analogici comporta
sempre una perdita di informazione che la digitalizzazione
consente di evitare
 Disponibilità ridotta e costi di manutenzione elevata degli apparati
necessari alla riproduzione di supporti analogici
 L’applicazione di strumenti e tecnologie informatiche che
consentano sia l’utilizzo di processi e strumenti più efficienti che la
creazione di nuovi modelli di business
Tesi di Laurea
Aprile 2005
Tommaso Depalma
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Stazione di digitalizzazione
A/D
Tape drive
Tape drive
Tape drive
Tape drive
Minicomputer
Segnale audio analogico
Segnale audio numerico
Flusso file audio
Flusso file analisi
Tesi di Laurea
Tommaso Depalma
Strumenti sw di analisi
automatica
Aprile 2005
Politecnico di Torino
Ambiente di sviluppo e test
Per lo sviluppo e la verifica degli strumenti di analisi sono state
esaminate oltre 600 sessioni di digitalizzazione. Ogni sessione
rappresenta il contenuto di un nastro ed ha una durata temporale che
può variare da poco più di cinque minuti ad un’ora e mezza, con una
media di circa mezz’ora per file.
Codice lettore
Date riversamento
N. acquisizioni
RAI-TC3042456
08.04.2004 - 22.09.2004
100
RAI-TC3042515
08.11.2004 - 23.11.2004
51
RAI-TC3042528
05.04.2004 - 22.09.2004
97
RAI-TC3042544
05.04.2004 - 22.09.2004
100
RAI-TC3042560
08.11.2004 - 23.11.2004
53
RAI-TC3042573
08.11.2004 - 23.11.2004
49
RAI-TC3069190
04.08.2004 - 22.09.2004
106
RAI-TC3072154
08.11.2004 - 23.11.2004
50
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Ambiente di sviluppo e test
Piattaforma di sviluppo e analisi
Sistema operativo: Unix (Linux)
Performance: 4x (1h di materiale viene analizzata in 15')
su biprocessore Intel@1GHz
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Elenco parametri audio analizzati e relativo utilizzo
Misure
Obiettivi
Livello di Picco
- errata taratura apparati (livelli di acquisizione)
RMS
- anomalie apparati della catena di digitalizzazione
DC Offset
- segnalare anomalie nel contenuto del nastro
___________________________________________________________________________
Percentuale di silenzio
- identificazione di anomalie (drop out)
- fornire una segmentazione temporale
(verifiche con documentazione associata)
- efficienza (produttività) del processo di digitalizzazione
___________________________________________________________________________
Dinamica analogica
- taratura degli apparati
SNR
- stato manutenzione degli apparati
Azimuth
Larghezza di banda
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Parametri audio e strumenti di analisi
Livello di Picco
Rappresenta la misura del massimo livello in valore assoluto raggiunto dal
segnale nel tempo.
max_ value
peak (dB)  20 Log10 n _ bits_ sample1
2
max_ value
peak (%)  100  n _ bits_ sample1
2
Conoscere il livello di picco è necessario per monitorare il corretto utilizzo della
gamma dinamica digitale del convertitore A/D ed evidenziare eventuali fenomeni
di prossimità o raggiungimento del massimo livello in ingresso al convertitore
A/D ( 2 n_bits_sample-1-1, o 0 dB, o 100 %) per un breve tratto di tempo, indice di un
elevato livello di registrazione nell’acquisizione.
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Parametri audio e strumenti di analisi
RMS
Il livello RMS (Root Mean Square) esprime il valore efficace del
segnale. Senza ricorrere a complesse valutazioni psicoacustiche
è un indicatore (medio) dell’energia del suono, se calcolata su
un piccolo intervallo di tempo, o l’indice del livello di volume
globale di un intero brano.
n


2


xi



i 1


n
RMS (dB)  20 Log10  n _ bits_ sample1 
2







Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Parametri audio e strumenti di analisi
DC Offset
Direct Current Offset è la misura della componente continua del segnale
analizzato che indica lo spostamento medio dell’onda rispetto all’asse
(rispetto quindi al valor 0, o -∞ dB).
Tale componente continua può essere solamente indotta dagli apparati
elettronici presenti nella catena di digitalizzazione.
Il DC Offset quindi è un indicatore della possibile comparsa di un
malfunzionamento.
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Parametri audio e strumenti di analisi
Soglia del silenzio
Silenzio: in assenza di segnale utile si è in presenza di rumore
introdotto dagli apparati elettronici impiegati durante l’acquisizione
(dal giradischi, magnetofono al convertitore analogico/digitale il cui
livello RMS dovrebbe tipicamente essere inferiore a -60 dB) a cui si
somma il rumore di fondo del supporto (provocato dall’attrito tra la
testina di lettura e il nastro o da polvere atmosferica, particelle
elettrostatiche, particelle di fumo, impronte digitali o degrado dei
dischi)
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Parametri audio e strumenti di analisi
Calcolo soglia del silenzio (1° metodo)
La soglia del silenzio è calcolata statisticamente in modo che la probabilità
dell’energia del segnale utile (non-silenzio) sia del 95%.
Calcolato lo scarto quadratico medio (o deviazione standard) dei diversi
valori in dB dell’energia con la formula:
n

 (x  x)
i 1
2
i
n 1
la soglia del silenzio è calcolata con la formula:
threshold = RMS (dB) – 1,95 ∙ σ
dove il fattore 1,95 è il valore corrispondente al 95% della probabilità (cioè
l’area compresa tra l’asse delle ascisse da –1,95σ a +1,95σ e la curva normale
standard centrata in 0 è 0,95)
x
1
1,95  2  erf (0,95)
Tesi di Laurea
Tommaso Depalma
2 t 2
erf ( x) 
e dt

 0 Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Parametri audio e strumenti di analisi
Calcolo soglia del silenzio (2° metodo)
Silenzio: porzione di segnale audio non percepibile dall’orecchio umano.
SW = EW  ZCRW
EW: STE (Short Time Energy) di una finestra temporale “W” di 10ms
1 40 2
Ew   X f (t )
40 f 1
ZCRW: Zero Crossing Rate – Numero di attraversamenti per lo zero
L’utilizzo combinato delle misure di STE e ZCR consente una più accurata
individuazione di porzioni di silenzio
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Parametri audio e strumenti di analisi
Segmentazione
Si è scelto di fornire una segmentazione “cruda”, cioè senza imporre
un minimo temporale alla segmentazione del silenzio, in quanto
potrebbe essere utile, ad esempio, nel caso si vogliano tracciare eventi
di dropout del nastro; ovviamente tale ricerca potrebbe “annegare”
tra le pause musicali o le pause presenti in un parlato.
Questa scelta non influisce molto sul valore della percentuale di
silenzio calcolata, in quanto queste particolari segmentazioni di
silenzio rilevate occupano brevissimi intervalli temporali.
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Parametri audio e strumenti di analisi
Percentuale di silenzio
Lo scopo del calcolo della percentuale di silenzio è rivelare:
per acquisizioni da nastro:
• ha considerevoli parti vuote;
• ha subito una degradazione del legante  allungamento del nastro
 perdita del segnale;
• ha subito una diminuzione nel tempo della magnetic remanence delle
particelle  abbassamento del livello di uscita del segnale  perdita
delle informazioni in esso contenute;
• i dipoli del supporto magnetico sono caratterizzati da una bassa
coercitivity  è possibile che si sia smagnetizzato  perdita del segnale;
• l’acquisizione è continuata, nonostante il nastro sia terminato.
per acquisizioni da dischi:
• cartuccia o puntina del giradischi non montata in modo corretto;
• l’acquisizione è continuata, nonostante la puntina abbia raggiunto il solco
di parcheggio.
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Parametri audio e strumenti di analisi
SNR e Gamma dinamica analogica
Il rapporto segnale rumore (SNR) e la gamma dinamica analogica sono due
tipici parametri che misurano la bontà di un supporto audio analogico.
SNR: calcolato come differenza tra l’energia del non-silenzio e del silenzio
(dB).
Gamma dinamica analogica: differenza tra il picco dell’energia del segnale e
l’energia del silenzio (dB).
Nastri: la gamma dinamica che può essere incisa su di essi è legata
essenzialmente anche alla velocità di trascinamento del nastro.
TIPO DI
NASTRO
N°
TRACCE
1/4
2
30
76,2
GAMMA
DINAMICA
dB
66
1/4
2
15
38,1
60
1/4
2
7,5
19
54
1/4
2
3,75
9,53
48
1/4
2
1+7/8
4,76
42
Tesi di Laurea
1/4
Tommaso Depalma
2
15/16
2,38
36
VELOCITÀ
IPS
cm/s
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Parametri audio e strumenti di analisi
Larghezza di banda
Anche la larghezza di banda è un parametro che caratterizza la
qualità del segnale registrato su di un supporto.
Per stabilire la larghezza di banda massima in un nastro, si devono
considerare la velocità di trascinamento e le dimensioni del traferro
della testina di lettura.
F

L
v = velocità trascinamento
L = larghezza traferro della testina
F = massima frequenza registrabile
Già alla velocità di 7,5 ips (19 cm/s), con un traferro di 9,5 µm, si
ottiene una banda estesa fino ai 20 kHz.
Per ottenere la larghezza di banda si è calcolato la misura
dell’intervallo di frequenze in cui è contenuta il 99,68% dell’energia del
segnale.
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Parametri audio e strumenti di analisi
Azimuth
Importante parametro indice dell’allineamento tra le testine del
lettore rispetto alle tracce incise sul supporto magnetico.
Il disallineamento delle testine di un magnetofono comporta un
fenomeno di interferenza tra il contenuto delle tracce registrate sul
supporto. Tale l’interferenza consiste in una contributo additivo
temporalmente ritardato il cui effetto si manifesta inoltre in una
riduzione della banda del segnale.
Il calcolo dell’azimuth si basa sul calcolo di questo sfasamento.
Come unità di misura dell’azimuth si utilizzano i gradi che si
riferiscono allo sfasamento tra il canale sinistro e il canale destro di
un segnale di test composto da un tono puro a 10 kHz (azimuth
@10khz).
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Conclusioni
Lo sviluppo di strumenti di analisi automatica del segnale audio ha
dimostrato potenzialità ed efficacia nell'individuazione di
problematiche (sia puntuali che generali) che si possono presentare in
un processo di riversamento massivo.
Possibili sviluppi futuri
Integrazione con la piattaforma di acquisizione:
 sviluppo di interfacce che agevolino l'accesso e il monitoraggio
all'analisi delle singole acquisizioni
 sviluppo di modelli statistici che, individuando situazioni e trend
anomali, forniscano al controllo di qualità un affidabile e sintetico
strumento di decisione
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
FINE
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Politecnico di Torino
Tesi di Laurea
Tommaso Depalma
Aprile 2005
Scarica

Slides