POLITECNICO DI MILANO
Localizzazione di sorgenti audio
tramite tecniche multimicrofono
realizzate con architettura Atmel D740
Fabio Arlati: [email protected]
Francesco Caponio: [email protected]
Relatore: Prof.ssa Anna Maria Antola
Correlatore: Ing. Marco Domenico Santambrogio
Motivazioni
Studio dell'architettura Atmel Diopsis 740
Realizzazione di un sistema di eliminazione del rumore
tramite estensione dell'algoritmo di Sottrazione
Spettrale:
VAD (Voice Activity Detector)
Riduzione del Rumore Residuo
Array di Microfoni (con Beamforming)
Array di Microfoni (con Localizzazione e post-filtraggio)
2
Obiettivi
Studio di tecniche per la localizzazione sul piano di una
sorgente audio impulsiva:
Multilaterazione
Algoritmo di Bancroft
Implementazione di tale tecnica su Diopsis 740
3
Indice
Panoramica sul materiale a disposizione:
Atmel Diopsis 740 su scheda JTST
Amplificatore
Sottrazione Spettrale
Studio della tecnica di multilaterazione
Analisi dell'algoritmo
Verifica della validità dell’algoritmo
Implementazione su scheda
Verifica del funzionamento dell’applicazione
Conclusione e Sviluppi Futuri
4
Diopsis 740
32kB ARM
Memory
ARM7TDMI
Dual-core:
ASB / APB Bridge
SPI0
SPI1
ASB
USART0
Program Bus
Shared
Data Bus
Memory
Mux / Demux
Mux / Demux
TIMER
Data Mem
8kx128 bit
Program
Mem
USART1
mAgic VLIW
DSP core
2 x 6k x 40 bit
Double Bank
Double Port
Master
RISC
Gestione
Periferiche
Watchdog
PIO
mAgic DSP
PDC
Slave
ADDA
VLIW
Clock Gen
Data Buffer 2 x2k word
Double Bank, Double Port
ARM7TDMI
IRQ Ctrl
Calcoli
Complessi
Float 40 bit
Data / Program Bus Mux
5
1 GFLOPS
JTST – JigTeST for Diopsis 740
Oscillatore 25 Mhz
Display a 7 segmenti
RS-232-0
RS-232-1
DB-9 CONN
DB-9 CONN
LED
7-SEG DISPLAY
•USAR
T
PIO CONN
RST
Interfacce:
STABILIZZ
•USAR
T
5-3.3 V
IRQ
JP8
JP9
STAB
5-1.8 V
DIP SWITCH
M-ICE JTAG CONN
JP5
FLASH
SSRAM MAGIC
ARM PRG
25
SRAM
MHz
JP7
OSC
ARM DATA L
JP10
JP3
JP2
128kx8
JP11
6
•ARMA
•ADDA
•XMD[39:32]
•SPIs •XMD[79:72]
128kx36
SSRAM MAGIC
SPI-1 CONN
DATA E
ADDA
USB
LED
CODEC
SSRAM MAGIC
DATA H
•CNTRLs
•XMD[71:56]
BUFFER
128kx36
SPI-0 CONN
CODEC
CONN
USB
Ambiente di sviluppo MADE
USB
CTRL
•ICE
•ARMC
CLK
DIV
128kx36
•XMD[55:40]
•XMD[31:16]
CLK
DIV
6 MHz
DATA L
•XMA
•XMD[15:0]
Diopsis 740 •CLKs
JP1
SRAM
Sistema operativo eCos
•RST
•PLL
ARM DATA H
Bootloader RedBoot
•ARMD
128kx8
USB (Emulazione Seriale)
•USARTs
•PIO
JP6
CODEC
Seriali SPI
1Mx16
CODEC
JP4
Seriali RS-232
AUDIO
AUDIO
AUDIO
AUDIO
AUDIO
AUDIO
AUDIO
AUDIO
OUT 1
IN 1
OUT 2
IN 2
OUT 3
IN 3
OUT 4
IN 4
EXT PSU
CONN
4 CODEC Stereo 20 bit
Amplificatore
Line-In: -10 : +4 dbmA
Mic-Out: -60 dbmA
35 dB amplificazione
7
Nessuna distorsione da 20 Hz a 20 kHz
Sottrazione Spettrale
y(t) = x(t) + n(t)
FFT
X(f) = Y(f) - N(f)
IFFT
x(t)
Campionamenti a 8 KHz
FFT (Fast Fourier Transform) su finestra di 128 campioni
Riduzione del rumore di 12 dB
Ma:
Richiede SNR (Signal to Noise Ratio) alto
Elimina solo rumori statici, incorrelati col parlato
Miglioramenti:
VAD (Voice Activity Detector)
Riduzione del Rumore Residuo
Array di Microfoni (con Beamforming / Localizzazione)
8
Localizzazione della Sorgente
Triangolazione
Trilaterazione
Multilaterazione
9
Soluzione delle equazioni di Multilaterazione
Algoritmo di Bancroft1
1 Stephen
10
Bancroft – An algebraic Solution of the GPS Equations
Michael Geyer, Anastasios Daskalakis – Solving Passive Multilateration Equations using Bancroft’s Algorithm
Verifica della validità dell’algoritmo
Configurazione di prova
11
Validazione dei risultati ottenuti
Struttura dell’applicazione
Divisione dei compiti tra i due processori
12
Verifica del funzionamento dell’applicazione
Simulazione con doppia scheda:
Risultati corretti
Ambiente reale:
Efficace
ma
Strumentazione non all'altezza
Presenza di eco
13
Conclusioni e Sviluppi Futuri
Utilizzo di microfoni omnidirezionali
Implementazione di una funzione di eliminazione dell’eco
Individuazione di una sorgente audio nello spazio (3D)
Aggregazione del sistema completo su FPGA con modulo mAgic
14
Domande
?
15
Scarica

ThesisArlatiCaponio_2007_IT