VIII giornate CNBA
Metadati per la ricerca e la gestione
degli oggetti digitali
e
tipologie di documenti presenti
nelle collezioni italiane
di architettura e urbanistica :
a che punto siamo?
Laura ANSELMI
gestione di archivi digitali :
sostenibilità del progetto
finanziamento nel tempo
gestione del flusso operativo
formati e tecnologie di archiviazione
metadati
Laura ANSELMI - VIII Giornate CNBA
2
metadati
(Metadata)
sono “dati sui dati”
nel contesto documentario
 i dati primari sono i documenti
 i metadati sono le informazioni
relative a tali documenti
Laura ANSELMI - VIII Giornate CNBA
3
…archivi in evoluzione…..
pubblicazione autogestita
su siti individuali
archiviazione digitale
off-line
sistema di deposito,
archiviazione e pubblicazione
centralizzato
‘all archives
at your desk’
Laura ANSELMI - VIII Giornate CNBA
4
iniziative di coordinamento
degli archivi digitali
(digital repositories)
INTERNAZIONALI
DOI, DUBLIN CORE, OAI, …
NAZIONALI
USA-METS, IT-MAG, …
PER L’ADOZIONE DI REGOLE COMUNI
METADATI
Laura ANSELMI - VIII Giornate CNBA
5
archivi digitali
fattori chiave :

interoperatività
ARCHIVI ‘APERTI’

OAI
affidabilità
GESTIONE PIANIFICATA
Laura ANSELMI - VIII Giornate CNBA
OAIS
6
interoperatività
l’adozione di un linguaggio standard di
markup dei metadati consente l’harvesting
di oggetti digitali
user
repository
harvester
repository
repository
repository
repository
Laura ANSELMI - VIII Giornate CNBA
7
la logica del World-Wide Web


ogni sito è un nodo di una rete mondiale
che “espone” le proprie informazioni sotto
forma di pagine web

le pagine web obbediscono a una logica di
strutturazione comune

motori di ricerca internet lanciano ricerche
contemporanee un grande numero di siti
Laura ANSELMI - VIII Giornate CNBA
8
l’esperanto di Internet
world wide web
1) un protocollo standard di scambio dati :
HTTP HyperText Transfer Protocol
2) un linguaggio standard di redazione :
HTML HyperText Markup Language
che contrassegna funzionalmente i dati (tags)
e la loro struttura organizzativa (links)
in modo che le pagine web siano
ricercabili da un motore di ricerca internet
percorribili in modo universalmente condiviso
Laura ANSELMI - VIII Giornate CNBA
9
linguaggi di mark-up
mark-up = marcatura del dato con <metatag> (etichetta
standard testuale che definisce il senso o funzione del dato)

SGML Standard General Markup Language
include schemi DTD (Document Type Definition)
• HTML
• …..

XML
eXtended Markup Language
più flessibile e personalizzabile (+ XSL + XLL)
include gli RDF (Resource Description Framework),
schemi ‘oggetto’ per la strutturazione di
sequenze complesse di metadati
Laura ANSELMI - VIII Giornate CNBA
10
… ad esempio…
home page del sito CNBA
http://www.cnba.it
Laura ANSELMI - VIII Giornate CNBA
11
metadati : una possibile definizione
nell’ambito degli archivi digitali
– una sequenza strutturata di metadati
identificativi, descrittivi, gestionali
– riguardanti documenti in formato digitale
– espressi in un linguaggio che ne consente
lo scambio con tecnologie xml (spesso in
ambiente www), neutrale rispetto ai vari
sistemi operativi e ai programmi locali di
gestione e accesso ai dati (ad es. OPAC)
Laura ANSELMI - VIII Giornate CNBA
12
… ad esempio…
a
b
sequenza di metadati descrittivi
Dublin Core Metadata Initiative
home page CNBA interpretata da
un motore di ricerca DCMI
Laura ANSELMI - VIII Giornate CNBA
13
DC
Dublin Core Metadata Initiative
Inizialmente
sviluppato
per catalogare
risorse www
esterne
unqualified
qualified
identifier
…segue…
title
subject
creator
description
contributor
coverage
publisher
language
date
relation
type
source
format
rights
Laura ANSELMI - VIII Giornate CNBA
14
metadati
identificativi
DOI
del documento e sua localizzazione
descrittivi
DC
sul suo contenuto e responsabilità
gestionali
MAG
tecnici (tipo, formato, struttura)
amministrativi (diritti, procedure)
Laura ANSELMI - VIII Giornate CNBA
15
per localizzare qualche sigla….
identifica DOI Digital Object Identifier
HANDLE, PURL, ….
(US DLF)
OAI
descrive
Dublin Core (DCMI)
…….
gestione
MAG (ICCU)
tecn/amm PMF (RLG)
…….
…….
Open
Archive
Initiative
METS
OAIS
Transmission
Standard
Open
Archive
Information
System
Laura ANSELMI - VIII Giornate CNBA
Metadata
Encoding &
16
interoperatività
il motore harvester funziona davvero
solo se i vari archivi produttori
costituiscono nello stesso modo
gli stessi metadati
OAI
Open Archive Initiative
Laura ANSELMI - VIII Giornate CNBA
17
gradi di interoperabilità
l’interoperabilità fra le collezioni dipende da
quanto risultano standardizzati questi tre
livelli ’linguistici’:
 il linguaggio (xml/rdf)
 il protocollo (sequenza standard di <metatag>
identificativi, descrittivi, gestionali)
 il contenuto (le regole di redazione
del contenuto associato a ciascun metatag)
Laura ANSELMI - VIII Giornate CNBA
18
OAI – Open Archive Initiative
Harvesting Protocol
header
oai
identificativo univoco del documento
date e status, collezione, sito produttore
metadata
oai
DUBLIN CORE 6 unqualified:
metadata
…..
title
creator
identifier
type
subject description
altre sequenze di metadati
supplementari decise dal sito produttore
indirizzo permanente della descrizione
Laura ANSELMI - VIII Giornate CNBA
19
limiti dell’interoperabilità

limiti della standardizzazione
flessibilità del linguaggio XML
flessibilità del protocollo OAI
variabilità del contenuto (lingua, regole)

contesto funzionale di ciascun archivio
caratteristiche dei documenti
finalità dell’archivio
caratteristiche dell’utenza di riferimento
Laura ANSELMI - VIII Giornate CNBA
20
soluzione raccomandata :

ridurre al minimo le personalizzazioni

stabilire regole condivise nel settore
disciplinare cui ciascun repository partner
contribuisce

mantenere in ogni caso una precisa
documentazione accessibile via web cui
indirizzare i motori di ricerca per chiarire il
significato dei metadati utilizzati.
Laura ANSELMI - VIII Giornate CNBA
21
documenti digitali:
architettura-urbanistica-design





libri e riviste
tesi multiformato
progetti (prodotto e processo)
piani (norma e processo)
fondi documentari (corrispondenza,
relazioni, foto, tavole, modelli 3D,
posters, files CAD, videi, …)
 lezioni, conferenze: registrazioni AV
 cartografia
 ……
Laura ANSELMI - VIII Giornate CNBA
22
OAI - Harvesting Protocol
header
oai
identificativo univoco del documento,
date, status, collezione, sito produttore
metadata
DUBLIN CORE 6 unqualified:
oai
title
type
creator
subject
identifier
description
metadata EAD (SAA)– Encoded Archival Description
….. TEI - Text Encoding Initiative
CMI (RLG) Cultural Materials Initiative
CDWA Categories of Description for Works of Arts
VRA Core (Visual Resources Association
FMM (CEN)
Framework for Metadata for Multimedia
Laura ANSELMI - VIII Giornate CNBA
?
………….
23
criteri di selezione…




compatibile con il linguaggio XML
compatibile con il protocollo OAI
ente sviluppatore molto autorevole
già ampiamente adottato
(a livello nazionale / internazionale?)



ben documentato e sempre aggiornato
applicabile senza modifiche locali
conforme alle necessità della disciplina
Laura ANSELMI - VIII Giornate CNBA
24
affidabilità
dell’archivio
gestione
documentata
conforme agli
standard tecnici
Laura ANSELMI - VIII Giornate CNBA
25
affidabilità
tracciabilità e certificazione
dei processi:
deposito controllato
digitalizzazione ottimale
preservazione dalle alterazioni
conservazione pianificata
gestione dei diritti
Laura ANSELMI - VIII Giornate CNBA
26
OAIS
Open Archive Information System
IMMISSIONE
Information identificazione
package
descrizione, diritti
ARCHIVIAZIONE
Information struttura, legami
package
dati tecnici sul file
gestione dati
amministrazione
Information
package
CONSERVAZIONE
Information
piano di migrazione
package
ACCESSO
Information descrizione, diritti
package
modalità di fruizione
gestione dei dati
gest. dei processi
Laura ANSELMI - VIII Giornate CNBA
27
MAG
metadati gestionali
e amministrativi
gen
dati generali sulla collezione
di cui il documento fa parte e
sull’ istituzione responsabile
bib
DC identifier title creator publisher
fis
stru
se il documento è parte componente
se il documento ha una sottostruttura
img ocr
dati tecnici sulla singola immagine
o pagina testo ottenuto da OCR
Laura ANSELMI - VIII Giornate CNBA
28
documenti in formato digitale
oggetti digitali
ottenuti da originali non
digitali?
(pagine testo,
tavole, foto, registrazioni
audiovideo)
archiviati off-line o
accessibili on-line?
accessibili via Internet?
generati da un
programma computer?
(‘born digital’)
solo leggibili o anche
editabili? interattivi?
in un formato a rapida
obsolescenza o no?
archiviati in più formati?
diritti di accesso diversi
per i diversi formati?
Laura ANSELMI - VIII Giornate CNBA
29
MAG
lo sviluppo di uno standard nazionale di
gestione e conservazione è essenziale;
per la documentazione di architettura risulta
necessario contribuire al suo arricchimento:
 nuove sezioni per altri tipi di oggetti digitali
‘Born digital’ anche complessi (es. CAD)
riversamenti da registrazioni AV
 definibilità articolata dei diritti
Laura ANSELMI - VIII Giornate CNBA
30
…a che punto siamo?
 i documenti digitali vanno documentati in
modo standard e gestiti sistematicamente
 la costituzione di protocolli standard di
metadati è il primo passo verso il sistema
 abbiamo un protocollo internazionale per
l’harvesting (OAI) identificaz+descrizione
 e un protocollo nazionale di gestione
(MAG) dati tecnici e amministrativi
Laura ANSELMI - VIII Giornate CNBA
31
…. mancano ancora…


metadati descrittivi standard per
creare chiavi di ricerca specifiche
per l’architettura nel protocollo OAI
un arricchimento del protocollo MAG
per le tipologie non ancora trattate
e per una più precisa definizione dei
diritti (accesso e riproduzione)
Laura ANSELMI - VIII Giornate CNBA
32
… e naturalmente
manca ancora…
un quadro di coordinamento
disciplinare e operativo
fra i vari progetti italiani
Laura ANSELMI - VIII Giornate CNBA
33
Scarica

Metadata