Università degli Studi di Siena Corso di formazione in “Utilizzo di strumentazioni Audio-Video” Il Suono Docente: Dott. Ing. Gambini Simone [email protected] IL Suono: Il suono viene prodotto dalle vibrazioni di un corpo elastico Fenomeno fisico di carattere ondulatorio che stimola il senso dell’udito Questo messo in vibrazione, crea le onde sonore: una serie di compressioni e rarefazioni delle molecole dell'aria Le onde sonore propagandosi, arrivano al padiglione auricolare il quale le converge tramite il condotto uditivo sul timpano, questo entra in vibrazione e trasmette tramite staffa, incudine e martelletto i dati alla coclea che trasforma le vibrazioni in impulsi celebrali. Dipendenza tra cosa percepisce il sistema uditivo (caratteristiche percettive) e caratteristiche fisiche dell’onda acustica Rappresentazione di un onda sonora nel dominio del tempo 1) Altezza Frequenza L’orecchio percepisce differenze tra suoni acuti e suoni bassi La frequenza è il numero di vibrazioni prodotte in un secondo e si misura in Hertz (Hz) più alta è la frequenza dell'onda e più acuto è il suono suoni gravi -decine di Hz suoni acuti -migliaia di Hz Il sitema uditivo umano riesce a distinguere suoni con frequenze che vanno dai 15 ai 20.000Hz 2) Intensità Ampiezza L’intensità descrive quanto forte sentiamo un suono, dipende da quanta pressione viene esercitata sul timpano L’ampiezza è il massimo spostamento che le molecole del mezzo di propagazione compiono al passaggio dell’onda t t Uno strumento matematico che ci permette di rappresentare qualsiasi segnale periodico nel dominio della frequenza è la Trasformata di Fourier queste formule mostrano il passaggio dal dominio del tempo, x(t) appunto, al dominio della frequenza X(f), e viceversa. Se partiamo per esempio da un segnale sonoro, che è descritto istante per istante da una forma d'onda che abbia funzione x(t), grazie alla Trasformata di Fourier possiamo scomporre il segnale in tutte le sue armoniche ed ottenerne la cosiddetta "trasformata", ovvero una funzione X(f) che rappresenta lo stesso segnale di partenza descritto in un altro modo. x(t) X(f) 1 1 t 0 2 Hz f 1 x(t) 1 t 0 10 Hz f Il teorema di fourier dice che un qualsiasi segnale può essere visto come combinazione lineare di infinite armoniche 1 sen(1000t) f 1K Hz t 1 sen(500t) 0 t 500 Hz f 1 sen(1000t)+sen(500t) 0 t 500 Hz 1K Hz f x(t) f t Segnale audio nel dominio del tempo 3) Spettro Timbro Il timbro è la qualità che ci permette di distinguere i suoni emessi da sorgenti diverse, anche se essi hanno la stessa intensità e la stessa altezza. Una stessa nota suonata con la stessa intensità da un pianoforte, un violino e un diapason, produce una sensazione uditiva diversa perché, pur avendo frequenza identica, ha nei tre casi un timbro diverso Spettro: indica il numero di frequenze che costituiscono un segnale Questa caratteristica dipende dallo spettro di frequenze di cui è composta l’onda acustica il la emesso dal diapason, con buona approssimazione, ha frequenza pari a 440 Hz, quello prodotto dal violino o dal pianoforte ha come componente di frequenza dominante quella fondamentale (di 440 Hz), ma contiene suoni di frequenze multiple: 880, 1320, 1760Hz. L'intensità relativa di queste altre componenti determina il timbro della nota. Il microfono è un dispositivo che permette di raccogliere i suoni e trasformarli in segnali elettrici Questo sfrutta le variazioni di pressione che le oscillazioni delle onde sonore producono nel mezzo di propagazione, attivando un sistema opportuno che generi un segnale elettrico. Microfono a carbone: capsula metallica riempita di granuli di carbone attraversata da corrente elettrica, Microfono piezoelettrico: Sfruttano l’effetto di alcuni cristalli quando vengono sottoposti a sollecitazioni meccaniche (quali variazioni di pressione) Microfono elettrodinamico: Microfono elettrostatico: A nastro o a bobina mobile. Ambedue sfruttano le variazioni di campo elettromagnetico detto a condensatore Amplificatore Il segnale audio è per sua natura un segnale analogico, ovvero un segnale che varia in modo continuo nel tempo e in ampiezza Strumenti di registrazione ? Come fare a trasformare un segnale con andamento morbido (analogico) in uno spigoloso a scalini (digitale) Campionamento T Ad ogni istante multiplo di un valore fondamentale, detto passo di campionamento T, costruisco il rettangolino che approssima la funzione in quel punto Ipotizzando che la durata del suono sia di 1 sec. In questo caso abbiamo suddiviso in 10 intervalli quindi T=0.1 sec la FREQUENZA di campionamento è Fc=1/T=10Hz N.B. Se l'insieme dei rettangolini è sufficientemente fitto, la funzione di partenza è ben approssimata Campionamento nel dominio della frequenza. -Fmax Fmax nel dominio della frequenza a causa del campionamento si ottengono delle repliche dello spettro in corrispondenza della frequenza di campionamento fc Teorema di campionamento di Shannon Se f c< 2Fmax parte delle repliche sovrasterebbero lo spettro originale rendendo il segnale corrotto. Tale fenomeno è detto “Aliasing da sotto-campionamento” fc > 2Fmax Quantizzazione Il valore del segnale analogico nell’istante di campionamento può assumere infiniti valori Si suddivide l’ampiezza max che il segnale può assumere in intervalli finiti 0.1 sec Meno fitta è la quantizzazione e più il suono è meno fedele Supponiamo di quantizzare l'ampiezza con 16 livelli (2 elevato alla 4): dunque essa potrà assumere solo valori compresi fra 0 e 15. Sono quindi necessari 4 bit bit 2 elevato alla 2 elevato alla 2 elevato alla 2 elevato alla 2 elevato alla 4 8 16 32 64 5 in decimale 1010 in binario Livelli = = = = = 16 256 65.536 4.294.967.296 1,8 *10^19 0.1 sec Lo standard PCM Il meccanismo di campionamento e quantizzazione costituiscono la conversione di un segnale da analogico a digitale. Nelle tracce audio digitali di un CD in ogni secondo vengono prelevati ben 44100 campioni e ogni campione è quantizzato con 16 bit. Considerando che ho due canali, avrò un bit- rate complessivo pari a : 44100 * 16 *2 = 1411200 bit/sec = 176400 Bytes/secondo valore che corrisponde alla velocità di lettura '1x' dei normali lettori CD audio I formati audio non compressi: .Wav .Aiff .Au Microsoft Apple Sun System un brano di 5 minuti trattato in questo modo produce un file .Wav di una cinquantina di Megabyte (10MBytes/minuto) 5*60*176.400 = 10.584.000 (troppi!! Su internet non sono gestibili) Tecniche di compressione L'obiettivo è quello di ridurre lo spazio necessario ad immagazzinare determinati dati o la banda necessaria per trasmetterli - lossless cioè senza perdita - lossy prevedono un certo degrado delle informazioni codifiche nel dominio della frequenza MP3, WMA, ATRAC-3 e AAC , real player codifiche nel dominio del tempo - LogPCM o PCM telefonico consiste nell'applicare una scala logaritmica in fase di campionamento e ricostruzione del segnale richiede una banda "canonica" di 64Kbit/s (guarda caso la banda di una canale telefonico ISDN) - Differential PCM e Adaptive differential PCM si Trasmette solamente la differenza tra il campione precedente e quello attuale utilizzato nelle trasmissioni GSM