UNIVERSITA’ DEGLI STUDI DI MILANO
Dipartimento di Informatica e Comunicazione
Laboratorio di Informatica Musicale
OMR - Optical Music Recognition
problemi e soluzioni
Riconoscimento automatico di
partiture
Processo di acquisizione automatica
dell’informazione musicale stampata o manoscritta
Scanner
Sistema
OMR
• archiviazione
• modifica
• riproduzione
• analisi
Problemi nel riconoscimento

Qualità grafica del materiale digitalizzato

Complessità del brano musicale

Formato di conversione dell’immagine

Efficienza dei programmi applicativi
Problemi nella superficie visiva
Rotazione dei pentagrammi
Curvatura dei pentagrammi
Variazioni di spessore nelle linee del pentagramma
Frammentazione delle linee del pentagramma
Incompletezza degli oggetti
Posizione scorretta dei simboli
Macchie
Utilizzo di una regione di
riconoscimento rettangolare
selezione di un’area rettangolare
 errata collocazione di note su un
pentagramma diverso da quello di
appartenenza

Incapacità di gestire accollature con
numero variabile di pentagrammi
In origine
Incapacità di gestire accollature con
numero variabile di pentagrammi
Dopo l’errato riconoscimento
Scarsa efficacia nel riconoscimento
dei simboli musicali

Un programma di elaborazione di
immagini elimina, o limita, alcuni
problemi:
inclinazione e curvatura dei pentagrammi
 rumore
 frammentazione
 zone equivoche
 accollature variabili

Raddrizzamento
Viene applicato ad un’area
 Corregge sia inclinazioni che curvature
 Il miglioramento è progressivo

Riconoscimento dei
pentagrammi

Indifferente alle variazioni dello spessore
della linea del rigo

Ricerca n righe parallele
Inserimento di pentagrammi
vuoti

Esempio di accollatura variabile
Inserimento di pentagrammi
vuoti

Regolarizza la struttura di un’accollatura
Allontanamento
Zona non equivoca:
Area contenente un pentagramma e tutti e soli i simboli
ad esso appartenenti.
Elementi nella zona equivoca:
Allontanamento
Altri problemi da risolvere

Variazione del formato della pagina

Eliminazione del rumore

Restauro di linee

Zoom
Test 1
Test 1
Test 1 prima
Simboli Simboli Simboli
errati mancanti aggiunti
Test 1 dopo
Simboli Simboli Simboli
errati mancanti aggiunti
Midiscan
2
6
7
Midiscan
1
5
6
Capella Scan
1
17
1
Capella Scan
0
9
0
Riepilogo
Prima
Dopo
Diff.
Perc.
progresso
Midiscan
145
(15*)
12
133
(3*)
92%
(20%*)
19
9
10
53%
Capella Scan
* Tralasciando la struttura del brano
Test 2
Test 2
Test 2 prima
Simboli Simboli Simboli
errati mancanti aggiunti
Simboli Simboli Simboli
errati mancanti aggiunti
Test 2 dopo
Midiscan
39
266
80
Midiscan
46
153
22
Capella Scan
40
351
19
Capella Scan
28
322
15
Riepilogo
Prima
Dopo
Diff.
Perc.
Progresso
Midiscan
702
(385*)
221
481
(164*)
68%
(43%*)
410
365
45
11%
Capella Scan
* Tralasciando la struttura del brano
Scarica

OMR