Presentazione 1.3
Dati e metadati
Architettura dell'informazione | Prof. Luca A. Ludovico
Dati, informazioni e conoscenza
• Quale relazione esiste tra dati, informazione e
conoscenza? Diverse teorie.
– Relazione gerarchica: dai dati si ricavano le informazioni e da
queste le conoscenza
Alavi Maryam, Leidner Dorothy E.: “Knowledge management and knowledge amanagement systems: conceptual foundations
and reserche issues”, Mis Quarterly, 2001, volume 25
– Dalla conoscenza derivano le informazioni che sono state
formalizzate e strutturate in questo passaggio, e da queste i
dati
Tuomi Ilkka: “Data is more than knowledge: implications of the reversed knowledge hierarchy for knowledge management
and organizational memory”, Journal of management studies, 1999, volume 41, numero 4
– Non c’è un rapporto gerarchico ma una relazione biunivoca: i
tre elementi si sovrappongono e non sono di maggiore valore
uno rispetto all’altro
Stenmark Dick: “Information vs knowledge. The role of intranets in knowledge management”, 35th Hawaii international
conference on system science, 2002, Hawaii
Architettura dell'informazione
Prof. Luca A. Ludovico
Alcune brevi definizioni
• I dati sono fatti oggettivi, immediati. Essi non hanno bisogno di
relazioni con altri elementi per esistere, ma presi a se stanti non
comunicano nulla.
• I dati, ricavati dall’osservazione o dall’esperienza diretta,
diventano informazioni nel momento in cui sono collocati in un
contesto, attraverso:
–
–
–
–
–
la contestualizzazione;
la categorizzazione;
l'elaborazione;
la correzione;
la sintesi.
• L’informazione implica relazioni e canali, grazie ai quali acquista
valore aggiunto rispetto ai dati.
Architettura dell'informazione
Prof. Luca A. Ludovico
Esempi di dati / informazioni
• I dati anagrafici: sono dati per definizione.
Quando vengono richiesti da un interlocutore, diventano per
l’interlocutore stesso informazioni.
Architettura dell'informazione
Prof. Luca A. Ludovico
Esempi di dati / informazioni
• Le informazioni stradali: sono informazioni per definizione.
I nomi delle vie, la disposizione di incroci e semafori, ecc. di per
sé sono dati, si trasformano in informazioni quando se ne fa uso
per trovare un percorso
Architettura dell'informazione
Prof. Luca A. Ludovico
Conoscenza
• La conoscenza è la consapevolezza e la comprensione
di fatti, verità o informazioni ottenuti attraverso
l'esperienza o l'apprendimento (a posteriori), ovvero
tramite l'introspezione (a priori)
– Consapevolezza e comprensione distinguono la conoscenza dal
«nozionismo»
• La conoscenza è l'autocoscienza del possesso di
informazioni connesse tra di loro, le quali, prese
singolarmente, hanno un valore e un'utilità inferiori
• Esiste una disciplina chiamata Knowledge Management
Architettura dell'informazione
Prof. Luca A. Ludovico
I 3 tipi di conoscenza
Conoscenza esplicita, tacita e incorporata
1. Un documentario, un manuale, un corso, sono tutti
contenitori di conoscenza esplicita
2. Il «saper fare» qualcosa e l’«intuizione» sono forme
di conoscenza tacita
3. Un oggetto di design ha conoscenza incorporata
nell'ergonomia piuttosto che nella realizzazione delle
funzionalità
Architettura dell'informazione
Prof. Luca A. Ludovico
Esercizio
Si analizzi il seguente oggetto e si estrapolino dati, informazioni e
conoscenza
Architettura dell'informazione
Prof. Luca A. Ludovico
I metadati
• Il prefisso meta- viene usato spesso in campo
informatico
• Deriva dal greco antico, ove significa «oltre, dopo»
• Viene usato spesso in ambito informatico
– Ad esempio, l’XML è un «meta-linguaggio»
• Un metadato è letteralmente «un dato su un (altro)
dato», quindi un'informazione che descrive un insieme
di dati
Architettura dell'informazione
Prof. Luca A. Ludovico
Esempio
• Scheda del catalogo di una biblioteca
Contiene informazioni circa:
– il contenuto del libro (genere, tipologia, …)
– le figure con responsabilità sul testo (autore, traduttore, curatore,
…)
– l’oggetto fisico (numero di pagine,
formato, …)
– il processo editoriale e di stampa
(casa editrice, ristampa, prezzo, …)
– l’acquisizione e la posizione
nella biblioteca
– …
Architettura dell'informazione
Prof. Luca A. Ludovico
Un concetto, molte sfaccettature
• “Structured information that describes and/or allows
us to find, manage, control, understand or preserve
other information over time”
Cunningham, A. (2000). Dynamic descriptions: recent developments in standards
for archival description and metadata. Canadian Journal of Information and
Library Science, 25(4), 3-17
• “Metadata not only identifies and describes an
information object; it also documents how that object
behaves, its function and use, its relationship to other
information objects, and how it should be managed”
Gilliland-Swetland, A.J. (1998). Introduction to Metadata: Setting the Stage
Architettura dell'informazione
Prof. Luca A. Ludovico
Il contesto e le sfumature di significato
• Per i bibliotecari, l’insieme dei metadati è visto
essenzialmente come informazione bibliografica
• Per gli archivisti, i metadati includono informazioni di
contesto, restrizioni e termini d’accesso, ecc.
• Per gli informatici, il metadato è qualcosa di estraneo
a un bit stream che però aiuta a descriverlo. I
metadati spesso sottendono un database (o un’altra
forma di struttura dati) associabile a un oggetto
digitale
Architettura dell'informazione
Prof. Luca A. Ludovico
A caccia di dati e metadati…
Architettura dell'informazione
Prof. Luca A. Ludovico
Principali funzioni
Architettura dell'informazione
Prof. Luca A. Ludovico
Principali funzioni
• Ricerca, che consiste nell’individuare l’esistenza di un
documento;
• Localizzazione, ovvero rintracciare una particolare occorrenza
del documento;
• Selezione, realizzabile analizzando, valutando e filtrando una
serie di documenti;
• Interoperabilità semantica, che consiste nel permettere la ricerca
in ambiti disciplinari diversi grazie a una serie di equivalenze
fra descrittori;
• Gestione risorse, ossia gestire le raccolte di documenti grazie
all’intermediazione di banche dati e cataloghi;
• Disponibilità, ovvero ottenere informazioni sull’effettiva
disponibilità del documento.
Architettura dell'informazione
Prof. Luca A. Ludovico
I METADATI IN AMBITO DIGITALE
Architettura dell'informazione
Prof. Luca A. Ludovico
L’informazione digitale
• Esempio del vinile: mondo analogico (oggetto fisico)
• Nel contesto dell’informazione digitale, i metadati sono
comunemente intesi come un’amplificazione delle tradizionali
pratiche di catalogazione bibliografica in un ambiente
elettronico.
• Si limita il concetto di “dato” al dominio semantico dei soli dati
digitali e discreti che vengono gestiti da un computer
• Nei progetti di digitalizzazione e nelle attività di gestione degli
archivi di oggetti digitali, i metadati rivestono un’importanza
crescente, tanto da venire considerati parte costituente della
definizione di “oggetto digitale”
Architettura dell'informazione
Prof. Luca A. Ludovico
Tipologie di metadati
• Esistono varie classificazioni dei metadati, a seconda
delle loro caratteristiche e finalità
• Una delle categorizzazioni più utilizzate distingue tra:
– Metadati descrittivi
– Metadati amministrativi e gestionali
– Metadati strutturali
Architettura dell'informazione
Prof. Luca A. Ludovico
Metadati descrittivi
• Servono per l’identificazione ed il recupero degli oggetti digitali
• Sono costituiti da descrizioni dei documenti fonte (ossia i
documenti fisici poi digitalizzati) o dei documenti nati in formato
digitale
• Risiedono generalmente nelle basi dati dei sistemi di Information
Retrieval all’esterno dell’archivio digitale, e sono collegati a
quest’ultimo tramite appositi collegamenti
• Esempi notevoli: Handle, Dublin Core, MARC
Architettura dell'informazione
Prof. Luca A. Ludovico
Il sistema Handle
• In informatica, per handle si intende un riferimento astratto a
una risorsa
• Il sistema Handle (http://www.handle.net) è un insieme di
protocolli per assegnare, gestire e risolvere identificatori
persistenti per oggetti digitali su Internet
• Il sistema permette a un sistema di elaborazione distribuito di
memorizzare gli identificatori (handle) delle risorse digitali, e di
risolverli nell’informazione necessaria per localizzare, accedere
ed utilizzare tali risorse
• Idea: la disponibilità e la locazione fisica dell’oggetto può
cambiare, ma il suo handle rimane fisso (livello di astrazione)
Architettura dell'informazione
Prof. Luca A. Ludovico
Dublin Core
• Il Dublin Core Metadata Initiative (DCMI, http://dublincore.org) è
un sistema di metadati costituito da un nucleo di elementi
essenziali ai fini della descrizione di qualsiasi materiale digitale
accessibile via rete informatica
• Il progetto nasce nel 1995 a Dublin (Ohio) per le biblioteche
statunitensi, su iniziativa di bibliotecari, archivisti, editori,
ricercatori e informatici (tra cui membri dei gruppi di lavoro
dell'Internet Engineering Task Force)
• Esigenze:
–
–
creare un insieme di strumenti condivisi per l’accesso alle risorse digitali
stabilire un insieme minimo di elementi descrittivi che possano essere forniti
dall’autore o dall’editore dell’oggetto digitale, ed inclusi in esso, o da esso
referenziati
Architettura dell'informazione
Prof. Luca A. Ludovico
Esempi: il sistema AIR
• Archivio Istituzionale della Ricerca
Università degli Studi di Milano
http://air.unimi.it/
• Ogni registrazione inserita (pubblicazione scientifica o
altro lavoro) può essere ricercata attraverso metadati
• Per citare o collegarsi alla registrazione viene fornito
un identificativo «handle»
• E’ possibile visualizzare la registrazione in formato
Dublin Core
Architettura dell'informazione
Prof. Luca A. Ludovico
Metadati amministrativi e gestionali
• Evidenziano le modalità di archiviazione e manutenzione degli
oggetti digitali nel sistema di gestione dell’archivio digitale
• Questi tipi di metadati assumono un’importanza preponderante ai
fini della conservazione permanente degli oggetti digitali: essi
possono documentare i processi tecnici associati alla
conservazione permanente, fornire informazioni sulle condizioni
e i diritti di accesso agli oggetti digitali, certificare l’autenticità
e l’integrità del contenuto, documentare la catena di custodia
degli oggetti, ...
• Esempio: MAG
Architettura dell'informazione
Prof. Luca A. Ludovico
Il MAG dell’ICCU
• Metadati Amministrativi Gestionali (MAG) è uno standard per
raccogliere metadati relativi a oggetti digitali creati nei progetti
di digitalizzazione, ed è conforme agli standard internazionali
• La versione 0 è stata creata nel 2001 dall'ICCU (Istituto centrale
per il catalogo unico delle biblioteche italiane e per le
informazioni bibliografiche, http://www.iccu.sbn.it). L'ultima
versione è la 2.0.1 del 2006
• Manuale ed esempi:
http://www.iccu.sbn.it/opencms/opencms/documenti/manuale.html
Architettura dell'informazione
Prof. Luca A. Ludovico
Il MAG dell’ICCU
• Lo schema risulta composto di diverse sezioni, utilizzabili a
seconda del contenuto digitale e dell'impiego dello stesso:
–
–
–
–
–
–
–
–
–
GEN: informazioni generali sul progetto e sul tipo di digitalizzazione
BIB: metadati descrittivi dell'oggetto analogico
STRU: metadati strutturali dell'oggetto digitale
IMG: metadati specifici per le immagini fisse
OCR: metadati specifici relativi al riconoscimento ottico del testo
DOC: metadati specifici per oggetti digitali in formato testo che possono
essere derivati o born digital
AUDIO: metadati specifici per file audio
VIDEO: metadati specifici per file video
DIS: metadati specifici per la distribuzione di oggetti digitali
Architettura dell'informazione
Prof. Luca A. Ludovico
La collaborazione LIM - ICCU
Architettura dell'informazione
Prof. Luca A. Ludovico
Metadati strutturali
• Collegano le varie componenti delle risorse per un’adeguata e
completa fruizione, che spesso avviene attraverso
la mappatura di schemi di metadati diversi
• Sul web confluiscono risorse eterogenee, in parte destrutturate e
prive di metadati, in parte descritte da schemi di metadati
differenti tra loro. A seconda del tipo di risorsa che deve essere
descritta c’è la possibilità di specificare campi di metadati con
caratteristiche complementari che svolgono funzioni diverse a
seconda degli oggetti ai quali devono essere applicati.
• Obiettivo: consentire l’interoperabilità anche tra tipi di risorse
diverse (testi, audio, video, ecc.) e l’integrazione di vari sistemi
informativi
Architettura dell'informazione
Prof. Luca A. Ludovico
Scarica

Presentazione del corso