VIII giornate CNBA Metadati per la ricerca e la gestione degli oggetti digitali e tipologie di documenti presenti nelle collezioni italiane di architettura e urbanistica : a che punto siamo? Laura ANSELMI gestione di archivi digitali : sostenibilità del progetto finanziamento nel tempo gestione del flusso operativo formati e tecnologie di archiviazione metadati Laura ANSELMI - VIII Giornate CNBA 2 metadati (Metadata) sono “dati sui dati” nel contesto documentario i dati primari sono i documenti i metadati sono le informazioni relative a tali documenti Laura ANSELMI - VIII Giornate CNBA 3 …archivi in evoluzione….. pubblicazione autogestita su siti individuali archiviazione digitale off-line sistema di deposito, archiviazione e pubblicazione centralizzato ‘all archives at your desk’ Laura ANSELMI - VIII Giornate CNBA 4 iniziative di coordinamento degli archivi digitali (digital repositories) INTERNAZIONALI DOI, DUBLIN CORE, OAI, … NAZIONALI USA-METS, IT-MAG, … PER L’ADOZIONE DI REGOLE COMUNI METADATI Laura ANSELMI - VIII Giornate CNBA 5 archivi digitali fattori chiave : interoperatività ARCHIVI ‘APERTI’ OAI affidabilità GESTIONE PIANIFICATA Laura ANSELMI - VIII Giornate CNBA OAIS 6 interoperatività l’adozione di un linguaggio standard di markup dei metadati consente l’harvesting di oggetti digitali user repository harvester repository repository repository repository Laura ANSELMI - VIII Giornate CNBA 7 la logica del World-Wide Web ogni sito è un nodo di una rete mondiale che “espone” le proprie informazioni sotto forma di pagine web le pagine web obbediscono a una logica di strutturazione comune motori di ricerca internet lanciano ricerche contemporanee un grande numero di siti Laura ANSELMI - VIII Giornate CNBA 8 l’esperanto di Internet world wide web 1) un protocollo standard di scambio dati : HTTP HyperText Transfer Protocol 2) un linguaggio standard di redazione : HTML HyperText Markup Language che contrassegna funzionalmente i dati (tags) e la loro struttura organizzativa (links) in modo che le pagine web siano ricercabili da un motore di ricerca internet percorribili in modo universalmente condiviso Laura ANSELMI - VIII Giornate CNBA 9 linguaggi di mark-up mark-up = marcatura del dato con <metatag> (etichetta standard testuale che definisce il senso o funzione del dato) SGML Standard General Markup Language include schemi DTD (Document Type Definition) • HTML • ….. XML eXtended Markup Language più flessibile e personalizzabile (+ XSL + XLL) include gli RDF (Resource Description Framework), schemi ‘oggetto’ per la strutturazione di sequenze complesse di metadati Laura ANSELMI - VIII Giornate CNBA 10 … ad esempio… home page del sito CNBA http://www.cnba.it Laura ANSELMI - VIII Giornate CNBA 11 metadati : una possibile definizione nell’ambito degli archivi digitali – una sequenza strutturata di metadati identificativi, descrittivi, gestionali – riguardanti documenti in formato digitale – espressi in un linguaggio che ne consente lo scambio con tecnologie xml (spesso in ambiente www), neutrale rispetto ai vari sistemi operativi e ai programmi locali di gestione e accesso ai dati (ad es. OPAC) Laura ANSELMI - VIII Giornate CNBA 12 … ad esempio… a b sequenza di metadati descrittivi Dublin Core Metadata Initiative home page CNBA interpretata da un motore di ricerca DCMI Laura ANSELMI - VIII Giornate CNBA 13 DC Dublin Core Metadata Initiative Inizialmente sviluppato per catalogare risorse www esterne unqualified qualified identifier …segue… title subject creator description contributor coverage publisher language date relation type source format rights Laura ANSELMI - VIII Giornate CNBA 14 metadati identificativi DOI del documento e sua localizzazione descrittivi DC sul suo contenuto e responsabilità gestionali MAG tecnici (tipo, formato, struttura) amministrativi (diritti, procedure) Laura ANSELMI - VIII Giornate CNBA 15 per localizzare qualche sigla…. identifica DOI Digital Object Identifier HANDLE, PURL, …. (US DLF) OAI descrive Dublin Core (DCMI) ……. gestione MAG (ICCU) tecn/amm PMF (RLG) ……. ……. Open Archive Initiative METS OAIS Transmission Standard Open Archive Information System Laura ANSELMI - VIII Giornate CNBA Metadata Encoding & 16 interoperatività il motore harvester funziona davvero solo se i vari archivi produttori costituiscono nello stesso modo gli stessi metadati OAI Open Archive Initiative Laura ANSELMI - VIII Giornate CNBA 17 gradi di interoperabilità l’interoperabilità fra le collezioni dipende da quanto risultano standardizzati questi tre livelli ’linguistici’: il linguaggio (xml/rdf) il protocollo (sequenza standard di <metatag> identificativi, descrittivi, gestionali) il contenuto (le regole di redazione del contenuto associato a ciascun metatag) Laura ANSELMI - VIII Giornate CNBA 18 OAI – Open Archive Initiative Harvesting Protocol header oai identificativo univoco del documento date e status, collezione, sito produttore metadata oai DUBLIN CORE 6 unqualified: metadata ….. title creator identifier type subject description altre sequenze di metadati supplementari decise dal sito produttore indirizzo permanente della descrizione Laura ANSELMI - VIII Giornate CNBA 19 limiti dell’interoperabilità limiti della standardizzazione flessibilità del linguaggio XML flessibilità del protocollo OAI variabilità del contenuto (lingua, regole) contesto funzionale di ciascun archivio caratteristiche dei documenti finalità dell’archivio caratteristiche dell’utenza di riferimento Laura ANSELMI - VIII Giornate CNBA 20 soluzione raccomandata : ridurre al minimo le personalizzazioni stabilire regole condivise nel settore disciplinare cui ciascun repository partner contribuisce mantenere in ogni caso una precisa documentazione accessibile via web cui indirizzare i motori di ricerca per chiarire il significato dei metadati utilizzati. Laura ANSELMI - VIII Giornate CNBA 21 documenti digitali: architettura-urbanistica-design libri e riviste tesi multiformato progetti (prodotto e processo) piani (norma e processo) fondi documentari (corrispondenza, relazioni, foto, tavole, modelli 3D, posters, files CAD, videi, …) lezioni, conferenze: registrazioni AV cartografia …… Laura ANSELMI - VIII Giornate CNBA 22 OAI - Harvesting Protocol header oai identificativo univoco del documento, date, status, collezione, sito produttore metadata DUBLIN CORE 6 unqualified: oai title type creator subject identifier description metadata EAD (SAA)– Encoded Archival Description ….. TEI - Text Encoding Initiative CMI (RLG) Cultural Materials Initiative CDWA Categories of Description for Works of Arts VRA Core (Visual Resources Association FMM (CEN) Framework for Metadata for Multimedia Laura ANSELMI - VIII Giornate CNBA ? …………. 23 criteri di selezione… compatibile con il linguaggio XML compatibile con il protocollo OAI ente sviluppatore molto autorevole già ampiamente adottato (a livello nazionale / internazionale?) ben documentato e sempre aggiornato applicabile senza modifiche locali conforme alle necessità della disciplina Laura ANSELMI - VIII Giornate CNBA 24 affidabilità dell’archivio gestione documentata conforme agli standard tecnici Laura ANSELMI - VIII Giornate CNBA 25 affidabilità tracciabilità e certificazione dei processi: deposito controllato digitalizzazione ottimale preservazione dalle alterazioni conservazione pianificata gestione dei diritti Laura ANSELMI - VIII Giornate CNBA 26 OAIS Open Archive Information System IMMISSIONE Information identificazione package descrizione, diritti ARCHIVIAZIONE Information struttura, legami package dati tecnici sul file gestione dati amministrazione Information package CONSERVAZIONE Information piano di migrazione package ACCESSO Information descrizione, diritti package modalità di fruizione gestione dei dati gest. dei processi Laura ANSELMI - VIII Giornate CNBA 27 MAG metadati gestionali e amministrativi gen dati generali sulla collezione di cui il documento fa parte e sull’ istituzione responsabile bib DC identifier title creator publisher fis stru se il documento è parte componente se il documento ha una sottostruttura img ocr dati tecnici sulla singola immagine o pagina testo ottenuto da OCR Laura ANSELMI - VIII Giornate CNBA 28 documenti in formato digitale oggetti digitali ottenuti da originali non digitali? (pagine testo, tavole, foto, registrazioni audiovideo) archiviati off-line o accessibili on-line? accessibili via Internet? generati da un programma computer? (‘born digital’) solo leggibili o anche editabili? interattivi? in un formato a rapida obsolescenza o no? archiviati in più formati? diritti di accesso diversi per i diversi formati? Laura ANSELMI - VIII Giornate CNBA 29 MAG lo sviluppo di uno standard nazionale di gestione e conservazione è essenziale; per la documentazione di architettura risulta necessario contribuire al suo arricchimento: nuove sezioni per altri tipi di oggetti digitali ‘Born digital’ anche complessi (es. CAD) riversamenti da registrazioni AV definibilità articolata dei diritti Laura ANSELMI - VIII Giornate CNBA 30 …a che punto siamo? i documenti digitali vanno documentati in modo standard e gestiti sistematicamente la costituzione di protocolli standard di metadati è il primo passo verso il sistema abbiamo un protocollo internazionale per l’harvesting (OAI) identificaz+descrizione e un protocollo nazionale di gestione (MAG) dati tecnici e amministrativi Laura ANSELMI - VIII Giornate CNBA 31 …. mancano ancora… metadati descrittivi standard per creare chiavi di ricerca specifiche per l’architettura nel protocollo OAI un arricchimento del protocollo MAG per le tipologie non ancora trattate e per una più precisa definizione dei diritti (accesso e riproduzione) Laura ANSELMI - VIII Giornate CNBA 32 … e naturalmente manca ancora… un quadro di coordinamento disciplinare e operativo fra i vari progetti italiani Laura ANSELMI - VIII Giornate CNBA 33