La biblioteca ibrida: verso un servizio informativo integrato Milano, Palazzo delle Stelline, 14 -15 marzo 2002 SBA Università di Padova 1. Come si esprimono i metadati? 2. Perché usare sistemi di metadati? 3. Cosa si dice sui metadati? 4. Quando sono nati i metadati? 5. Che cosa significa metadato? 6. Dove sono collocati i metadati? 7. Quanti sono i formati di metadati? 8. Come sono strutturati i metadati? 9. Qual è la funzione dei metadati? 10. Quali sono i domini di appartenenza dei metadati? 11. Chi produce i metadati? 12. I metadati sono sempre ad accesso libero? 13. Qual è la relazione tra metadati e interoperabilità? 14. Quali prospettive per i metadati? 15. Quando un modello per la rappresentazione dei metadati? 16. Metadati perché? 1. La biblioteca ibrida presenta le sue risorse 2. Biblioteca ibrida: servizio di accesso all'informazione 3. Metadati e confusione semantica 4. Origini e nascita dei metadati 5. Definizione di metadato 6. Metadati interni e metadati esterni 7. Popolazioni di metadati e infodiversità 8. Suddivisione dei metadati per tipologia strutturale 9. Suddivisione dei metadati per tipologia funzionale 10. Suddivisione dei metadati per domini di appartenenza 11. Metadati nelle comunità di utenti 12. Formati proprietari e formati standard 13. Interoperabilità tra formati di metadati 14. XML il linguaggio flessibile 15. RDF la terra di mezzo 16. Metadati chiave di accesso alla biblioteca ibrida 1. Come si esprimono i metadati? 1. La biblioteca ibrida presenta le sue risorse • Documenti e collezioni di documenti, nella biblioteca tradizionale e in quella digitale, hanno in associazione ai loro contenuti qualcosa che è noto come metadato • La rappresentazione di forme e contenuti avviene attraverso i metadati • Un'efficace gestione dell'informazione digitale deve necessariamente includere la presentazione delle risorse 2. Perché usare sistemi di metadati? 2. Biblioteca ibrida: servizio di accesso all'informazione • Il sistema di metadati è la componente logica di qualsiasi biblioteca, digitale o tradizionale • l’organizzazione informativa è fondamentale • I metadati possono essere usati per molti scopi non solo catalografici: – – – – – diritti di proprietà intellettuale, firma digitale, e-commerce tariffazione servizi, PICS livelli di riservatezza di un documento, metadescrizioni di oggetti non testuali MMIR A cosa servono i metadati? In relazione al contesto • • • • Documentare Contestualizzare Conservare Gestire – date, persone, strutture … • Gestire profili e accessi In relazione alle risorse • Presentazione • Localizzazione • Selezione – adeguata all’uso • Acquisizione – termini • Manipolazione • Utilizzazione Numerosi sono i progetti o le biblioteche ibride che utilizzano metadati 3. Cosa si dice sui metadati? You call it corn as we call it maize "Poi c'è il problema della catalogazione dei metadati. "I metadati sono nulla di più che dati suie dati: Su questidei il mio punto sono di vista è che siano i record cataloghi metadati: un una sorta di terza via tra cosìtentativo come unsconsiderato header TEI,diotrovare qualsiasi altra forma di descrizione. il deserto dei motori dicatalogazione, ricerca e della ricerca a testo libero Potremmo chiamarla ema la per grande architettura delporta controllo alcuni tale termine in sébibliografico un bagaglio eccessivo, che i bibliotecari hanno sviluppato negli ultimi centocinquant'anni. come le Anglo-American Cataloging Rules e USMARC. Penso che i lo metadati siano prodotto di quelli Così alcuni estendono adiluna situazione del che, tipo senza alcuna conoscenza della "Voi chiamatelo granturco, noicatalogazione, lo chiamiamo mais", né essa, bibliografi mariguardo i metadatiper sono uncome buonalchimisti termine neutrale cercano la pietra per coprire tutte lefilosofale basi” che ci offrirà una catalogazione efficace senza spese e accesso efficace senza vocabolari controllati. [Priscilla Caplan, 1995] Non esiste nessuna cosa del genere e prima si abbandona meglio è". [Michael Gorman, Roma novembre 2001] La nuova terminologia ci aiuta Martin Dillon differenzia i metadati per: • Presentazione delle risorse (resource discovery) • Descrizione delle risorse (resource description). • Nella lingua inglese il termine "discovery" ha un significato duplice, di scoperta, ma anche di "presentazione". Immagine tratta dal poster di P. Doherty e R. Zinkernagel. Premio Nobel 1996 Nobel in Fisiologia. Poster pubblicato dall’Australian Academy of Science Presentazione della risorsa La "presentazione" dei metadati di una risorsa avviene, più o meno, nello stesso modo in cui, in medicina, avviene la presentazione di uno o più antigeni da parte di una cellula. In entrambi i casi si presentano informazioni Descrizione della risorsa identificatori • Tradizionali: ISBN; ISSN, SICI, BICI – ampliamento e revisione delle strutture per ospitare le RER • Emergenti: International Standard Work Codes ISWC 1. riferiscono International Standard Textualintese Work Code (ISTC) – si alle "opere" come FRBR 2. International Standard Audiovisual Number – riuniscono, sotto un unico identificatore, le (ISAN) differenti manifestazioni cui un'opera manifestarsi. 3. International in Standard Musicalpuò Work Code (ISWC) La gestione di questi identificatori è demandata ai "resolvers" o "risolutori" 4. Quando sono nati i metadati? 4. Origini e nascita dei metadati • origine e primi usi del termine trovano radici nell'ambiente basi di dati. • Metadata Workshop 1995 Stu Weibel OCLC: nascita del Dublin Core nella comunità dei bibliotecari • mancanza del termine nei testi sulle biblioteche digitali fino a dopo il 1997 • il termine "metadata" è un marchio registrato dal 1986 di proprietà di The Metadata Company La legge del metadato • iogni cataloghi di biblioteca, i servizi di utente Ad formato di metadato il suo indicizzazione, gli archivi e la i propri A ciascuna comunità di utenti documentazione dei musei possono metadati essere tutti interpretati come contenitori ;-) di metadati • Non esiste solo il Dublin Core • Anche il MARC è un metadato 5. Che cosa significa metadato? 5. Definizione di metadato • letteralmente definito come "dato sul dato” • inteso nel significato di "dato strutturato sulle risorse • Tim Berners-Lee lo definisce "informazione comprensibile alla macchina su risorse Web o altri oggetti". – l'assioma è questo: il metadato è un dato – un metadato può descrivere un metadato 6. Dove sono collocati i metadati? 6. Dove sono collocati i metadati? Dentro al documento Interni alla risorsa: utili ai motori di ricerca metadato risorsa Fuori dal documento Esterni alla risorsa: •entro collezioni di metadati metadato •esposizione di metadati risorsacon •in basidati integrate altri contenitori •collezioni a modello distribuito (OA) •servizi di accesso ai contenuti 7. Quanti sono i formati di metadati? 7. Popolazioni di metadati e infodiversità. • L’indagine DESIRE del 1996 identificava e descriveva oltre 20 "popolazioni" diverse • I metadati sono numerosi e diversi per – natura tipologica, – implementazione, – ambiti di provenienza – descrivono oggetti di natura/specie diverse – scopo – tipologia – funzione Popolazioni di metadati e infodiversità come in biologia ... Il termine "metadiversità”coniato da Clifford Lynch con significato di "metadato in un contesto di biodiversità che può relazionarsi con un'ampia gamma di tipi di informazione che includono dati bibliografici, dati su modellizzazioni di oggetti di musei, tassonomie sviluppate da biologi, prodotti della ricerca e indagini geospaziali [Michael Day] •la diversità intraspecifica genetica, •la diversità a livello di specie •la diversità a livello di comunità. 8. Come sono strutturati i metadati? In analogia al concetto di biodiversità anche per i metadati si riscontrano tre livelli di distinzione: 1. tipologico strutturale, o intraspecifico al record 2. funzionale, correlato alla funzione stessa del metadato in relazione all'ambiente 3. di comunità, in una suddivisione in domini sulla base delle specifiche attività di comunità di utenti. 1. Suddivisione dei metadati per tipologia strutturale 9. Qual è la funzione dei metadati? 2. Suddivisione dei metadati per tipologia funzionale Amministrativi utilizzati nella gestione e amministrazione delle risorse informative Descrittivi utilizzati per descrivere o identificare risorse informative Di conservazione riferiti alla gestione della conservazione delle risorse informative Tecnici riferiti al funzionamento di un sistema e al comportamento dei metadati Di utilizzo riferiti al livello e al tipo di utilizzo delle risorse informative Amministrativi: metadati utilizzati nella gestione e nell'amministrazione delle risorse informative Informazioni sull'acquisizione Tracciato storico dei diritti di proprietà intellettuale, cessione e passaggi ai fini della riproduzione Documentazione dei requisiti di accesso legale Informazioni sulla reperibilità Criteri di selezione per la digitalizzazione [= formato, set di caratteri] Controllo della versione e distinguibilità fra oggetti informativi simili Tracce di controllo create da sistemi di gestione di metadati [recordkeeping] Descrittivi: metadati utilizzati per descrivere o identificare risorse informative Registrazioni catalografiche Indicazioni di aiuto per il reperimento Indicizzazione su database specialistici Connessioni fra risorse tramite link Web Annotazioni di utenti Metadati per sistemi di gestione [recordkeeping] generati dai programmi di creazione delle registrazioni Conservazione: metadati riferiti alla gestione della conservazione delle risorse informative Documentazione della condizione fisica delle risorse Documentazione delle azioni intraprese per conservare le versioni fisiche e digitali delle risorse, per esempio ripristino [refreshing] e migrazione dei dati Tecnici: metadati riferiti al funzionamento di un sistema e al comportamento dei metadati Documentazione sull'hardware e il software Informazioni sulla digitalizzazione, per esempio formati, rapporti di compressione, procedure di graduazione [scaling routines] Tracciato storico dei tempi di risposta di sistema Dati di autenticazione e sicurezza, per esempio chiavi crittografiche, password Di utilizzo: metadati riferiti al livello e al tipo di utilizzo delle risorse informative Registrazioni di visualizzazione [exhibit records] Tracciato storico dell'uso e gestione dei profili utenti Informazioni sulla riutilizzazione del contenuto e sull'esistenza di una pluralità di versioni [multi-versioning information 10. Quali sono i domini di appartenenza dei metadati? 3. Suddivisione dei metadati per domini di appartenenza Categoria di dominio Industria Editoria Audio-video Beni culturali Attività di dominio Categoria di dominio Manufatti Venditori di software Venditori di hardware Telecomunicazioni Internet Service Providers Servizi dei motori di ricerca Banche e assicurazioni Pubblicità Dettaglio Distribuzioni Musica/video/multimedia distr Industria registrazioni musica Riviste scientifiche Agenzie stampa Quotidiani Gestione dei diritti Industria filmografica Produzioni broadcast e archiviazione delle produzioni multimediali Biblioteche Servizi bibliotecari Musei Portali di musei Archivi Accademico Attività di dominio Educazione e insegnamento Ricerca Progetti universitari e accademici Subject Gateways Iniziative W3C Corsi interattivi Educazione permanente e continua durante l'arco della vita Insegnamento a distanza Scuola Curricula Laboratori di ricerca Compagnie di ricerca Società professionali Informazioni geografiche Fornitori di informazioni geospaziali Altri domini Trasporti Servizi di spedizione posta elettronica Sanità Servizi governativi Ambiente Possono essere creati •manualmente •automaticamente 11. Chi produce i metadati? Publisher side autori webmaster istituzioni Agenzie catalografiche nazionali Repository/site manager Archivi Autori, creatori risorse. Biblioteche metadati Musei. Editori. Terze parti: servizi di risoluzione URN agenzie identificatori: ISBN, ISSN, BICI, SICI, ... Service side servizi di ricerca creatori: terze parti Comunità di metadati ... • I metadati riflettono le esigenze delle comunità dai quali provengono • Differenti comunità producono documenti intellettuali peculiari all’utenza specifica che vi afferisce (matematici, fisici, chimici, …) • Comunità diverse parlano e necessitano di linguaggi specifici con i quali formulano la propria produzione intellettuale • I metadati prodotti da queste comunità riflettono necessariamente la struttura e la forma dei documenti da esse prodotti conseguenza dell’ampia gamma di comunità con interesse nei metadati è lo sconcertante numero di standard e formati esistenti o sotto sviluppo 12. I metadati sono sempre ad accesso libero? 7. Formati proprietari e formati standard • molte comunità di soggetti, in numerosi settori di mercato, sono fortemente attaccati ai loro formati – sui formati proprietari vi sono stati investimenti: in termini di documentazione, conoscenza e apprendimento, – sono stati sviluppati entro i sistemi creati per manipolare i dati e offrire servizi ad utenze specifiche. • Esiste tensione tra questo continuo progredire di formati specialisti e qualsiasi requisito per un livello di interoperabilità 13. Qual è la relazione tra metadati e interoperabilità? Il problema della diversità • L'interoperabilità è l'abilità dei sistemi di fornire/accettare servizi in termini di comunicazione comprensione reciproca attuata attraverso un colloquio reso possibile nonostante le differenze. • ai fini dell’interoperabilità è necessario – individuare uno schema di riferimento semplice – utilizzare terminologia controllata per una corretta corrispondenza semantica tra elementi – implementare servizi cross-domain per l’accesso a risorse provenienti da domini differenti La mappatura: i crosswalk • da un confronto tra popolazioni diverse emergono basse aree di sovrapposizione • una risposta al problema della diversità è la produzione di crosswalk o mapping di metadati tra uno o più formati – ai fini della comparazione tra formati – al fine di stabilire il loro potenziale di interoperabilità – come base per la produzione di uno specifico programma di conversione di formati – per la produzione di sistemi di ricerca, i quali dovrebbero permettere l'interrogazione di formati di metadati eterogenei. • centralità del Dublin Core – formato strutturato semplice – facilità di creazione direttamente dai creatori di risorse 14. Quali prospettive per i metadati? 14. XML ...il linguaggio flessibile • • • • • XML = eXtensible Markup Language XML può essere definito in molti modi diversi XML è una sintassi per marcare i documenti XML è una famiglia di tecnologie correlate XML consente di – aggiungere metadati (semantica) ai propri dati – separare il contenuto dalla presentazione – definire in maniera rigorosa il linguaggio di markup utilizzato – utilizzare un formato neutrale e testuale <?xlm version=1.0”?> <libro> <autore>Antonella De Robbio</autore> <titolo>Diritto d’autore</titolo> </libro> <XML permetterà non solo di scambiare informazioni <?xlm version=1.0”?> tra differenti sistemi operativi, <libro> ma anche si superare confini <titolo>Antonella De Robbio</titolo> nazionali e culturali./> <autore>Diritto d’autore</autore> </libro> <XML e XSL permetteranno agli editori di scrivere <?xlm version=1.0”?> una sola volta <libro autore=“Antonella De Robbio”> e pubblicare ovunque, <titolo>Diritto d’autore</titolo> su carta </libro> o in forma elettronica./> … ma da solo XML non è sufficiente ... • XML è troppo flessibile mentre è necessario un modello estremamente semplice per esprimere delle conoscenze elaborabili automaticamente • HTML è estremamente semplice ma non flessibile e perciò può solo rappresentare informazioni senza tener conto della semantica Lo stack XML/RDF/DC • Il modello attuale prevede l’utilizzo di tre standard come strati diversi (layers comunicativi) – XML stabilisce la sintassi di base (struttura fisica) – RDF definisce la struttura delle relazioni (struttura logica) – DC definisce i contenuti (struttura per i contenuti) 15. Quando un modello per la rappresentazione dei metadati? Resource Description Framework (RDF) 15. RDF la terra di mezzo • “RDF, RDF èthe un middle modellolayer, di metadati will only be visible • toRDF una piattaforma il trattamento dei the èwizards who inventper new ways of metadati describing and organizing cataloging, • information RDF costituisce una ipotesi - the librarian of di thesoluzione future.” individuata dal W3C al problema della rappresentazione deiXML metadati Goldfarb, Prescod - The Handbook (p. 53) • RDF è complementare a XML 16. Metadati perché? 16. Metadati chiave di accesso alla biblioteca ibrida • i metadati rappresentano la chiave d'accesso a differenti sistemi comunicativi, i quali utilizzano linguaggi diversi. • i metadati sono l'anello che congiunge i due mondi, quello della biblioteca tradizionale e le Biblioteca fisicanascenti di biblioteca Biblioteca digitale nuove forme digitale. mondo degli oggetti reali mondo degli oggetti trasposti • l'integrazione tra i due mondi, attuatadal dallo reale scambio comunicativo tra metadati,o nati dà vita e digitali origine ad un ambiente che prende il nome di "biblioteca ibrida". "…Ma anche questo è solo un passo intermedio. Già da molto tempo i bibliotecari hanno capito che il modo migliore per accedere con facilità alle informazioni non consiste nel cercarle direttamente, ma nel restringere la ricerca a insiemi mirati e ristretti di dati: da qui nascono gli schedari delle biblioteche. Queste informazioni che riguardano altre informazioni sono chiamate metadati" [John Bosak e Tim Bray "XML e la Rete di seconda generazione". Le Scienze 373/sett.1999]