Tesi di Laurea - Aprile 2005 Strumenti automatici di elaborazione del segnale audio per sistemi di riversamento massivo di materiale radiofonico Relatore: Prof. Angelo Raffaele MEO Co-relatori: Dott. Daniele AIROLA - RAI CRIT Ing. Giorgio DIMINO - RAI CRIT Prof. Juan Carlos DE MARTIN Candidato: Tommaso DEPALMA Politecnico di Torino Argomenti presentati Sviluppo della tesi parte teorica parte sperimentale Il processo di riversamento massivo Ambiente di sviluppo e test Selezione dei parametri audio e sviluppo degli strumenti di analisi Valutazione della qualità dei riversamenti casi particolari situazioni anomale Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Sviluppo della Tesi Obiettivo: fornire strumenti automatici di elaborazione del segnale audio per sistemi di riversamento massivo di materiale radiofonico. Parte teorica: Studio delle problematiche presenti nella digitalizzazione di un archivio considerando: i supporti di registrazione (nastri magnetici, dischi in vinile) e le loro caratteristiche i limiti intrinseci che caratterizzano il segnale audio memorizzato sui supporti i problemi relativi alla fase di riproduzione le tecnologie necessarie ed i dispositivi utilizzati nella catena le tarature dei dispositivi utilizzati file format adeguati alle esigenze del mondo professionale (ambito broadcasting) in termini di qualità ed interoperabilità tra differenti sistemi/ambienti Il tutto al fine di ottenere una catena di riproduzione e digitalizzazione allo stato dell’arte. Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Sviluppo della Tesi Obiettivo: fornire strumenti automatici di elaborazione del segnale audio per sistemi di riversamento massivo di materiale radiofonico. Parte teorica: Selezione di parametri rappresentativi del segnale audio che consentano il monitoraggio di ogni singolo processo di riversamento Metodi di calcolo utilizzati per l’estrazione dei parametri dal file audio prodotto dal processo di digitalizzazione. Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Sviluppo della Tesi Obiettivo: fornire strumenti automatici di elaborazione del segnale audio per sistemi di riversamento massivo di materiale radiofonico. Parte sperimentale: Sviluppo di strumenti software necessari all’elaborazione automatica del materiale audio radiofonico digitalizzato dalla nastroteca RAI – Torino adeguati alle caratteristiche (24bit@48kHz) ed al formato file (Broadcast Wave Format - BWF) prodotto dal riversamento appropriati all’infrastruttura hardware/software attualmente utilizzata in RAI in grado di monitorare la qualità di ciascun riversamento tramite misure, file di dati e grafici relativi, in modo da agevolare la fase di certificazione manuale (che può richiedere eventuali ripetizioni del processo di digitalizzazione) in grado di evidenziare eventuali problematiche riguardanti i supporti e i dispositivi utilizzati nella catena che consentano l’individuazione su base temporale di fenomeni di degradamento o deriva altrimenti difficilmente identificabili Aprile 2005 Tesi di Laurea Tommaso Depalma Politecnico di Torino Il processo di riversamento massivo Da dove nasce l’esigenza di un processo massivo di riversamento e digitalizzazione? L’invecchiamento e il conseguente degrado dei supporti analogici è inevitabile Data l’enorme quantità di supporti presenti negli archivi Il processo di riversamento tra supporti analogici comporta sempre una perdita di informazione che la digitalizzazione consente di evitare Disponibilità ridotta e costi di manutenzione elevata degli apparati necessari alla riproduzione di supporti analogici L’applicazione di strumenti e tecnologie informatiche che consentano sia l’utilizzo di processi e strumenti più efficienti che la creazione di nuovi modelli di business Tesi di Laurea Aprile 2005 Tommaso Depalma Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Stazione di digitalizzazione A/D Tape drive Tape drive Tape drive Tape drive Minicomputer Segnale audio analogico Segnale audio numerico Flusso file audio Flusso file analisi Tesi di Laurea Tommaso Depalma Strumenti sw di analisi automatica Aprile 2005 Politecnico di Torino Ambiente di sviluppo e test Per lo sviluppo e la verifica degli strumenti di analisi sono state esaminate oltre 600 sessioni di digitalizzazione. Ogni sessione rappresenta il contenuto di un nastro ed ha una durata temporale che può variare da poco più di cinque minuti ad un’ora e mezza, con una media di circa mezz’ora per file. Codice lettore Date riversamento N. acquisizioni RAI-TC3042456 08.04.2004 - 22.09.2004 100 RAI-TC3042515 08.11.2004 - 23.11.2004 51 RAI-TC3042528 05.04.2004 - 22.09.2004 97 RAI-TC3042544 05.04.2004 - 22.09.2004 100 RAI-TC3042560 08.11.2004 - 23.11.2004 53 RAI-TC3042573 08.11.2004 - 23.11.2004 49 RAI-TC3069190 04.08.2004 - 22.09.2004 106 RAI-TC3072154 08.11.2004 - 23.11.2004 50 Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Ambiente di sviluppo e test Piattaforma di sviluppo e analisi Sistema operativo: Unix (Linux) Performance: 4x (1h di materiale viene analizzata in 15') su biprocessore Intel@1GHz Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Elenco parametri audio analizzati e relativo utilizzo Misure Obiettivi Livello di Picco - errata taratura apparati (livelli di acquisizione) RMS - anomalie apparati della catena di digitalizzazione DC Offset - segnalare anomalie nel contenuto del nastro ___________________________________________________________________________ Percentuale di silenzio - identificazione di anomalie (drop out) - fornire una segmentazione temporale (verifiche con documentazione associata) - efficienza (produttività) del processo di digitalizzazione ___________________________________________________________________________ Dinamica analogica - taratura degli apparati SNR - stato manutenzione degli apparati Azimuth Larghezza di banda Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Parametri audio e strumenti di analisi Livello di Picco Rappresenta la misura del massimo livello in valore assoluto raggiunto dal segnale nel tempo. max_ value peak (dB) 20 Log10 n _ bits_ sample1 2 max_ value peak (%) 100 n _ bits_ sample1 2 Conoscere il livello di picco è necessario per monitorare il corretto utilizzo della gamma dinamica digitale del convertitore A/D ed evidenziare eventuali fenomeni di prossimità o raggiungimento del massimo livello in ingresso al convertitore A/D ( 2 n_bits_sample-1-1, o 0 dB, o 100 %) per un breve tratto di tempo, indice di un elevato livello di registrazione nell’acquisizione. Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Parametri audio e strumenti di analisi RMS Il livello RMS (Root Mean Square) esprime il valore efficace del segnale. Senza ricorrere a complesse valutazioni psicoacustiche è un indicatore (medio) dell’energia del suono, se calcolata su un piccolo intervallo di tempo, o l’indice del livello di volume globale di un intero brano. n 2 xi i 1 n RMS (dB) 20 Log10 n _ bits_ sample1 2 Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Parametri audio e strumenti di analisi DC Offset Direct Current Offset è la misura della componente continua del segnale analizzato che indica lo spostamento medio dell’onda rispetto all’asse (rispetto quindi al valor 0, o -∞ dB). Tale componente continua può essere solamente indotta dagli apparati elettronici presenti nella catena di digitalizzazione. Il DC Offset quindi è un indicatore della possibile comparsa di un malfunzionamento. Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Parametri audio e strumenti di analisi Soglia del silenzio Silenzio: in assenza di segnale utile si è in presenza di rumore introdotto dagli apparati elettronici impiegati durante l’acquisizione (dal giradischi, magnetofono al convertitore analogico/digitale il cui livello RMS dovrebbe tipicamente essere inferiore a -60 dB) a cui si somma il rumore di fondo del supporto (provocato dall’attrito tra la testina di lettura e il nastro o da polvere atmosferica, particelle elettrostatiche, particelle di fumo, impronte digitali o degrado dei dischi) Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Parametri audio e strumenti di analisi Calcolo soglia del silenzio (1° metodo) La soglia del silenzio è calcolata statisticamente in modo che la probabilità dell’energia del segnale utile (non-silenzio) sia del 95%. Calcolato lo scarto quadratico medio (o deviazione standard) dei diversi valori in dB dell’energia con la formula: n (x x) i 1 2 i n 1 la soglia del silenzio è calcolata con la formula: threshold = RMS (dB) – 1,95 ∙ σ dove il fattore 1,95 è il valore corrispondente al 95% della probabilità (cioè l’area compresa tra l’asse delle ascisse da –1,95σ a +1,95σ e la curva normale standard centrata in 0 è 0,95) x 1 1,95 2 erf (0,95) Tesi di Laurea Tommaso Depalma 2 t 2 erf ( x) e dt 0 Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Parametri audio e strumenti di analisi Calcolo soglia del silenzio (2° metodo) Silenzio: porzione di segnale audio non percepibile dall’orecchio umano. SW = EW ZCRW EW: STE (Short Time Energy) di una finestra temporale “W” di 10ms 1 40 2 Ew X f (t ) 40 f 1 ZCRW: Zero Crossing Rate – Numero di attraversamenti per lo zero L’utilizzo combinato delle misure di STE e ZCR consente una più accurata individuazione di porzioni di silenzio Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Parametri audio e strumenti di analisi Segmentazione Si è scelto di fornire una segmentazione “cruda”, cioè senza imporre un minimo temporale alla segmentazione del silenzio, in quanto potrebbe essere utile, ad esempio, nel caso si vogliano tracciare eventi di dropout del nastro; ovviamente tale ricerca potrebbe “annegare” tra le pause musicali o le pause presenti in un parlato. Questa scelta non influisce molto sul valore della percentuale di silenzio calcolata, in quanto queste particolari segmentazioni di silenzio rilevate occupano brevissimi intervalli temporali. Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Parametri audio e strumenti di analisi Percentuale di silenzio Lo scopo del calcolo della percentuale di silenzio è rivelare: per acquisizioni da nastro: • ha considerevoli parti vuote; • ha subito una degradazione del legante allungamento del nastro perdita del segnale; • ha subito una diminuzione nel tempo della magnetic remanence delle particelle abbassamento del livello di uscita del segnale perdita delle informazioni in esso contenute; • i dipoli del supporto magnetico sono caratterizzati da una bassa coercitivity è possibile che si sia smagnetizzato perdita del segnale; • l’acquisizione è continuata, nonostante il nastro sia terminato. per acquisizioni da dischi: • cartuccia o puntina del giradischi non montata in modo corretto; • l’acquisizione è continuata, nonostante la puntina abbia raggiunto il solco di parcheggio. Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Parametri audio e strumenti di analisi SNR e Gamma dinamica analogica Il rapporto segnale rumore (SNR) e la gamma dinamica analogica sono due tipici parametri che misurano la bontà di un supporto audio analogico. SNR: calcolato come differenza tra l’energia del non-silenzio e del silenzio (dB). Gamma dinamica analogica: differenza tra il picco dell’energia del segnale e l’energia del silenzio (dB). Nastri: la gamma dinamica che può essere incisa su di essi è legata essenzialmente anche alla velocità di trascinamento del nastro. TIPO DI NASTRO N° TRACCE 1/4 2 30 76,2 GAMMA DINAMICA dB 66 1/4 2 15 38,1 60 1/4 2 7,5 19 54 1/4 2 3,75 9,53 48 1/4 2 1+7/8 4,76 42 Tesi di Laurea 1/4 Tommaso Depalma 2 15/16 2,38 36 VELOCITÀ IPS cm/s Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Parametri audio e strumenti di analisi Larghezza di banda Anche la larghezza di banda è un parametro che caratterizza la qualità del segnale registrato su di un supporto. Per stabilire la larghezza di banda massima in un nastro, si devono considerare la velocità di trascinamento e le dimensioni del traferro della testina di lettura. F L v = velocità trascinamento L = larghezza traferro della testina F = massima frequenza registrabile Già alla velocità di 7,5 ips (19 cm/s), con un traferro di 9,5 µm, si ottiene una banda estesa fino ai 20 kHz. Per ottenere la larghezza di banda si è calcolato la misura dell’intervallo di frequenze in cui è contenuta il 99,68% dell’energia del segnale. Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Parametri audio e strumenti di analisi Azimuth Importante parametro indice dell’allineamento tra le testine del lettore rispetto alle tracce incise sul supporto magnetico. Il disallineamento delle testine di un magnetofono comporta un fenomeno di interferenza tra il contenuto delle tracce registrate sul supporto. Tale l’interferenza consiste in una contributo additivo temporalmente ritardato il cui effetto si manifesta inoltre in una riduzione della banda del segnale. Il calcolo dell’azimuth si basa sul calcolo di questo sfasamento. Come unità di misura dell’azimuth si utilizzano i gradi che si riferiscono allo sfasamento tra il canale sinistro e il canale destro di un segnale di test composto da un tono puro a 10 kHz (azimuth @10khz). Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Conclusioni Lo sviluppo di strumenti di analisi automatica del segnale audio ha dimostrato potenzialità ed efficacia nell'individuazione di problematiche (sia puntuali che generali) che si possono presentare in un processo di riversamento massivo. Possibili sviluppi futuri Integrazione con la piattaforma di acquisizione: sviluppo di interfacce che agevolino l'accesso e il monitoraggio all'analisi delle singole acquisizioni sviluppo di modelli statistici che, individuando situazioni e trend anomali, forniscano al controllo di qualità un affidabile e sintetico strumento di decisione Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino FINE Tesi di Laurea Tommaso Depalma Aprile 2005 Politecnico di Torino Tesi di Laurea Tommaso Depalma Aprile 2005