Ministerial NEtwoRk for Valorising Activities in digitisation
MINERVA: il WP3 Inventari, scoperta di
contenuti digitali, multilinguismo
Giuliana De Francesco
Saint Vincent, 29 aprile 2004
Il quadro di riferimento di MINERVA: eEurope
L’iniziativa e-Europe
• varata nel dicembre 1999 per incentivare lo sviluppo
di Internet e della nuova economia in Europa e
permettere a tutti i cittadini di partecipare alla società
dell'informazione.
• Consiglio europeo di Lisbona (marzo 2000): i capi
di Stato e di governo dell'Unione si prefiggono
l'ambizioso obiettivo di promuovere in Europa
un'economia concorrenziale e dinamica basata
sullo sviluppo della conoscenza.
Il quadro di riferimento di MINERVA: eEurope
•
Consiglio Europeo di Feira (giugno 2000): viene
adottato il Piano d’azione eEurope 2002, che
definisce le misure necessarie per conseguire gli
obiettivi di eEurope:
1. Accesso più economico, più rapido e più sicuro ad Internet
2. Investire nelle risorse umane e nella formazione
3. Promuovere l'utilizzo di Internet, e in particolare:
d) Contenuti europei digitali per reti globali
•
Gli Stati membri e la Commissione europea vengono
invitati a creare congiuntamente un meccanismo di
coordinamento per le politiche e i programmi di
digitalizzazione.
Il quadro di riferimento di MINERVA:
Principi di Lund
La Commissione europea organizza a Lund (4 aprile
2001) un incontro fra rappresentanti ed esperti degli
Stati membri per mettere in atto un meccanismo di
coordinamento di politiche e programmi di digitalizzazione
negli Stati membri e incentivare i contenuti culturali
europei sulle reti globali.
A conclusione del meeting di esperti vengono redatti i
Principi di Lund, a partire dai quali è stato poi sviluppato
il Piano d’azione di Lund.
Il quadro di riferimento di MINERVA:
Principi di Lund
“Le conoscenze culturali e scientifiche europee formano un
patrimonio esclusivo di pubblico valore che riflette la
memoria collettiva in perenne evoluzione delle diverse
società d’Europa, fornendo una solida piattaforma per lo
sviluppo dell’industria europea dei contenuti digitali in una
società della conoscenza di portata sostenibile”
A questo patrimonio deve essere dato pubblico accesso
attraverso la digitalizzazione dei contenuti culturali
europei, essenziale anche per sostenere e promuovere la
diversità culturale in un ambiente globalizzato.
Il quadro di riferimento di MINERVA:
Principi di Lund
Alcuni ostacoli rischiano però di limitare le possibilità
di valorizzazione del potenziale racchiuso nelle risorse
culturali digitalizzate:
• Approccio frammentato delle attività di digitalizzazione.
• Obsolescenza delle tecnologie e di standard inadeguati.
• La mancanza di modalità di accesso semplici e universali per tutti i
cittadini. Mancanza di strutture e sistemi che consentano l’
accesso multilingue.
• I diritti di proprietà intellettuale (DPI).
• Mancanza di sinergie tra i programmi culturali e quelli basati sulle nuove
tecnologie.
• Necessità di investimenti e di un impegno da parte delle istituzioni.
Il quadro di riferimento di MINERVA: NRG
La Commissione Europea ha chiesto agli Stati
membri di nominare ufficialmente dei
rappresentanti nazionali per la digitalizzazione.
L’insieme di tali rappresentanti costituisce il
Gruppo dei Rappresentanti Nazionali (NRG National Representatives Group).
Il quadro di riferimento di MINERVA: NRG
Il NRG si riunisce ogni 6 mesi, ospite della Presidenza
di turno dell’Unione.
•
•
•
•
Compiti del NRG:
garantire una stretta collaborazione tra i Ministeri e le
istituzioni governative e la Commissione Europea;
essere portavoce delle politiche e dei programmi nazionali
e assicurare la diffusione delle politiche e dei programmi
comunitari a livello nazionale e locale;
dare visibilità alle iniziative nazionali;
promuovere e monitorare l’attuazione dei principi di Lund
Il quadro di riferimento di MINERVA: NRG
In occasione dell’ultima riunione del NRG
(Parma, 19 novembre 2003) è stata approvata
la Carta di Parma, documento strategico
riprende e sviluppa i Principi di Lund.
Il Progress Report del NRG ha l’obiettivo di
diffondere i risultati del coordinamento di
politiche, programmi, progetti di digitalizzazione
del patrimonio culturale condotti negli Stati
membri.
MINERVA
MINERVA è lo strumento operativo del NRG.
• progetto finanziato dalla Commissione Europea
nell’ambito del programma IST (5° PQ)
• supporta l’attuazione del Piano di azione di Lund
MINERVA ha costituito una rete dei ministeri della
cultura europei.
Ne sono membri tutti e 15 gli Stati dell’Unione. L’Italia
coordina il progetto.
MINERVA
Obiettivi:
 Discutere, comparare e armonizzare le attività condotte
nell’ambito della digitalizzazione del patrimonio culturale
 Creare una piattaforma comune europea e sviluppare
raccomandazioni e linee guida condivise su
digitalizzazione, standard e interoperabilità, accessibilità e
conservazione a lungo termine dei contenuti, qualità dei siti
web
 Coordinare i relativi programmi nazionali
 Allargare la rete (contatti con altri Paesi, organismi
internazionali, associazioni, imprese)
 Cooperare con altri progetti nel settore della digitalizzazione
 Rendere stabile la rete
MINERVA: i WPs
WP1
WP7
WP8
WP2
Gestione del progetto e coordinamento rete.
Impatto strategico e allargamento della rete.
Diffusione dei risultati
WP3
Inventari e scoperta di contenuti
digitali, multilinguismo
Francia
WP4
Interoperabilità e fornitura di servizi
UK
WP5
Identificazione dei bisogni degli utenti,
criteri di qualità per i punti di accesso
comuni
Belgio
WP6
Buone pratiche e centri di competenza
Svezia
Benchmarking
Italia
Finlandia
MINERVA: prodotti del WP5
• Handbook for quality in cultural Web sites: improving
quality for citizens (Draft 1.2 novembre 2003)
www.minervaeurope.org/publications/qualitycriteria1_2draft.htm
• Manuale per la qualità dei siti Web pubblici culturali
Edizione italiana (2004)
www.minervaeurope.org/publications/qualitycriteria-i.htm
• Principi per la qualità di un sito web culturale
“Un sito Web culturale di qualità celebra la diversità culturale
europea fornendo l'accesso a tutti i contenuti culturali digitali.
Un sito Web di qualità deve essere:
trasparente - efficace - mantenuto - accessibile - centrato
sull'utente - reattivo - multilingue - interoperabile - gestito –
conservato”
MINERVA: estensione della rete
• Nominati i NR dei Paesi di nuova
accessione.
La Presidenza Italiana (secondo semestre 2003) ha chiesto
ai rappresentanti NAS presso il CAC di nominare i loro
rappresentanti; l’azione è andata a buon fine.
• Avvio del progetto MINERVA Plus (febbraio
2004)
MINERVA Plus
MINERVA Plus rappresenta l’estensione del progetto
MINERVA ai Paesi che entrano ufficialmente a far
parte dell’Unione Europea il 1° maggio 2004, più
Russia e Israele.
Partner: Austria, Estonia, Germania,
Grecia, Irlanda, Israele, Italia, Malta,
Polonia, Portogallo, Repubblica Ceca,
Russia, Slovenia, Ungheria.
MINERVA Plus WPs: specific topics
WP
WP3, Inventari e
scoperta di contenuti
digitali, multilinguismo
Specific topic
Thesauri
multilingue
Coordinatore
Ungheria
WP4, Interoperabilità e
fornitura di servizi
Modelli di business per i
programmi di
digitalizzazione
Grecia
WP5, Identificazione dei
bisogni degli utenti e dei
criteri di qualità per i
punti di accesso comuni
Esigenze delle istituzioni
culturali di piccole
dimensioni
Germania
WP6 Buone pratiche e
centri di competenza
Abbattimento dei costi
della digitalizzazione
Irlanda
Il WP 3 Inventari e scoperta di contenuti
digitali, multilinguismo
Obiettivi: identificare e condividere esperienze, agevolare
l’attuazione di azioni comuni rivolte a:
• messa a punto di inventari di collezioni e progetti di
digitalizzazione per dare visibilità e accessibilità ai
contenuti scientifici e culturali digitali europei
• definizione di una infrastruttura tecnica per il
recupero dei contenuti e di un set di metadati per la
loro descrizione
• analisi delle possibili soluzioni alle problematiche
multilinguistiche
• proposta di una piattaforma XML e Open source
comune a livello europeo per l’accesso all’informazione
Attività del WP3
• Sviluppo di una piattaforma comune per la descrizione
delle attività di digitalizzazione.
A partire dal modello adottato per il censimento francese
dei fondi culturali, è stato sviluppato un modello per la
raccolta di dati che si articola in quattro moduli
indipendenti e collegati fra loro: Istituzione, Progetto,
Collezione digitale, Servizio/Prodotto
Attività del WP3
Il modello è stato implementato su una piattaforma
open source sviluppata adattando quella alla base del
Catalogue des fonds culturels numérisés, e vi è stato
sperimentato l’inserimento dei dati.
Prototipo di portale delle collezioni digitali di Italia e
Francia, base del sistema che sarà sviluppato da
MICHAEL
Attività del WP3
Il coordinamento delle politiche di digitalizzazione in Europa
condurrà alla realizzazione di servizi comuni di accesso alle
risorse culturali per i cittadini europei.
La sfida sarà rendere accessibili a livello transnazionale le
informazioni raccolte rispettando le diversità culturali e
linguistiche dei cittadini europei.
Strumenti:
• descrizione multilingue di collezioni e servizi
• produzione di risorse multilingue
• tecnologie del linguaggio e per il recupero translinguistico
dell’informazione
Attività del WP3
Il WP 3 ha svolto una indagine preliminare sulle
soluzioni attualmente in uso nel campo
dell’accesso multilingue alle risorse culturali
digitali.
Obiettivi:
• delineare lo stato dell’arte della ricerca nel campo
del recupero multilingue dell’informazione
• individuare le soluzioni più idonee a facilitare il
raggiungimento
Indagine WP3 - Thesauri
Norma di riferimento per lo sviluppo di thesauri
multilingue:
ISO 5964:1985 Guidelines for the establishment
and development of multilingual thesauri
(insieme a ISO 2788:1986)
3 Definitions
3.12 multilingual thesaurus: a thesaurus containing
terms selected from more than one natural language. It
displays not only the interrelationships between terms,
but also equivalent terms in each of the languages
covered
Indagine WP3 - Thesauri
E’ possibile costruire un thesaurus ex novo,
traducendo i concetti comuni o una terminologia
esistente:
• HEREIN - European Information Network on Cultural
Heritage Policies
thesaurus sulle politiche per il patrimonio culturale, in inglese,
francese e spagnolo (http://www.european-heritage.net )
• NARCISSE, Network of Art Research Computer Image
SystemS in Europe
thesaurus multilingue sul restauro di dipinti
Indagine WP3 - Thesauri
Creare interoperabilità fra sistemi esistenti
rappresenta una grande sfida: fra i concetti può
non sussistere una perfetta equivalenza
• MACS (Multilingual ACcess to Subjects) vuole
consentire l’accesso multilingue per soggetto al
catalogo delle biblioteche partner (SNL, BNF,
BL, DDB) stabilendo legami di equivalenza fra i
linguaggi di indicizzazione in uso (LCSH,
RAMEAU, SWD)
Indagine WP3 – Thesauri. MACS
Il risultato non è una traduzione, né un nuovo
thesaurus, ma una “mappatura” di linguaggi di
indicizzazione esistenti e di ampio uso, ciascuno
dei quali ha lo stesso rilievo.
(http://infolab.kub.nl/prj/macs/).
Adottato dal progetto TEL per la ricerca multilingue
(www.europeanlibrary.org)
Indagine WP3 - Ontologie
Un approccio differente prevede l’adozione, in
luogo delle terminologie, di ontologie.
Una ontologia, basandosi su una rappresentazione
formale di un dato dominio concettuale, correla i
termini ai concetti attraverso definizioni e i concetti fra
loro attraverso relazioni.
• Il progetto Harmonise ha costruito una
ontologia sul turismo (www.harmonise.org ).
Indagine WP3 - Ontologie
Le ontologie possono essere usate non solo in
luogo dei thesauri, ma anche per la ricerca full
text o di immagini, se si collegano ai concetti
locuzioni verbali o immagini.
• La fraseologia esprime i surrogati lessicali dei
concetti.
Indagine WP3 - Ricerca full text e
impiego del linguaggio naturale
Le tecniche di elaborazione del linguaggio (language
processing technologies), meno usate nel settore
culturale, possono essere di ausilio nella scoperta di
contenuti culturali digitali in un ambiente multilingue.
Non adoperano sempre gli schemi strutturati di
metadati in uso nel settore culturale, ma possono
essere utilizzate insieme alle terminologie.
Indagine WP3 - Ricerca full text e
impiego del linguaggio naturale
Le tecniche di elaborazione del linguaggio
consentono:
• lo sviluppo di interfacce intelligenti per il
recupero dell’informazione in linguaggio
naturale e in modalità multilingue
• l’analisi dei testi per traduzione automatica e
sunti automatici
• la generazione multilingue di testi
Indagine WP3 - Cross Language
Information Retrieval
Una diversa strategia punta sullo sviluppo di sistemi di
recupero translinguistico dell’informazione testuale
non strutturata.
• CLEF - Cross Language Evaluation Forum
(http://clef.iei.pi.cnr.it), sostenuto da DELOS, ha
constatato, attraverso il confronto dei risultati delle
interrogazioni in una lingua rispetto a corpora di
documenti in una o più altre lingue, che gli algoritmi
sviluppati possono raggiungere il 90% dei risultati
ottenibili con una interrogazione monolingue.
Indagine WP3 - Cross Language
Information Retrieval
Ma: se l’utente non è in grado di ricercare il contenuto in
un’altra lingua, non sarà probabilmente neanche in
grado di comprendere i risultati della ricerca.
La difficoltà non si presenta però per le immagini:
• il progetto EUROVISION – Multi-lingual image retrieval
(http://retrieve.shef.ac.uk/~mark/eurovision/) ha applicato
algoritmi per il recupero multilingue dell’informazione non
solo alle didascalie, ma all’intero set di metadati,
considerati nel loro insieme. I risultati raggiungono il 7078% della interrogazioni monolingue.
Multilinguismo come principio di qualità
Che l’utente sia posto in grado di comprendere la
risorsa reperita rimane un problema non trascurabile.
I principi Minerva per la qualità di un sito Web
culturale propongono un livello minimo di accesso
multilingue.
Almeno una pagina di presentazione, i metadati e una
guida al sito Web dovrebbero essere redatti in almeno
un’altra lingua diversa da quella principale usata nel
sito.
Indagine WP3 - Contestualizzazione dei
contenuti culturali
La mera traduzione non è sufficiente a garantire la
fruibilità dello stesso servizio in un Paese diverso: è
importante identificare le specificità dei cittadini europei
delle diverse nazionalità che svolgono ricerche nei siti
Web culturali.
• Il progetto MUDICU - Multilingual Digital Culture, finanziato
dal programma eContent (www.mudicu.org) intende dimostrare
come i contenuti multimediali culturali possano essere adattati
secondo la lingua scelta dall’utente: colori, musica, suoni,
icone, simboli, sfondi, immagini fisse e in movimento e
anche la distribuzione degli elementi nello spazio vanno
contestualizzate.
MINERVA Plus WP3 – Piano di lavoro
Coordinatore: Ungheria
Specific topic: “Multilingual thesauri”
Indagine su tesauri, vocabolari controllati e altri
strumenti in uso per l’accesso multilingue al
patrimonio culturale, con particolare riferimento ai
tesauri che prevedano fra le lingue una di quelle più
diffuse nell’Unione (ENG, FRE, SPA, GER, ITA).
Piano di lavoro adottato a Firenze il 2 aprile 2004, in
occasione della riunione dei coordinatori dei WP di
MINERVA e dei corrispondenti WP MINERVA Plus
MINERVA Plus WP3 – Attività in corso
Questionario sviluppato adeguando alle esigenze
dell’inchiesta di Minerva quello adottato da Israele per
una indagine simile.
• Messa a punto una prima bozza del questionario, che
verrà testata all’interno di due Paesi MINERVA Plus,
uno dei quali l’Ungheria, e quindi raffinata (entro
metà maggio 2004)
• Frattanto gli NRG nominano gli esperti di riferimento
che identificheranno il target cui sottoporre la
versione definitiva del questionario.
MINERVA Plus WP3 – Attività in corso
Strategia: sottoporre il questionario a chi per le
proprie competenze sia effettivamente in grado di
compilarlo.
• Circolazione del questionario tradotto all’interno dei
Paesi membri di MINERVA Plus
• Raccolta dei dati (entro la terza settimana di
giugno 2004)
• Presentazione della raccolta dati in occasione della
riunione NRG a Dublino il 29 giugno.
MINERVA Plus WP3 – Attività in corso
• Costituzione di un comitato editoriale
• Analisi dei risultati (entro il 10 settembre 2004)
• Presentazione dei primi risultati in occasione
dell’incontro NRG all’Aia il 15 settembre 2004
• Redazione di un testo di conclusioni e
raccomandazioni
• Diffusione dei risultati finali nel corso del 2005
MICHAEL
Il Piano di azione eEurope 2005 mira a incentivare servizi sicuri, e
la disponibilità di applicazioni e contenuti su una infrastruttura a larga
banda.
Il progetto MICHAEL- Multilingual Inventory of Cultural
Heritage in Europe, presentato dal MiBAC e finanziato
nell’ambito del programma comunitario eTEN, mira a sviluppare
un repertorio trans-europeo del patrimonio culturale di
Italia, Francia e Regno Unito.
Il repertorio sviluppato sarà pubblicamente accessibile via
Internet, utilizzerà una piattaforma Open Source che ne
permetterà l’estensione anche ad altri Paesi, proponendosi così
come il riferimento del settore a livello europeo.
MICHAEL e il WP3 MINERVA
• La piattaforma di MICHAEL riprenderà e
svilupperà il prototipo messo a punto dal WP3 di
Minerva.
• MICHAEL inoltre riprenderà la ricerca di Minerva
nel campo delle soluzioni per l’accesso
multilingue affrontando fin dalla fase iniziale il
problema della contestualizzazione, poiché i
Partner rappresentano tre lingue diverse.
I materiali prodotti da MINERVA sono disponibili sul
sito:
www.minervaeurope.org
Contatti:
[email protected]
[email protected]
[email protected]
Scarica

ppt - Minerva eEurope