Presentazione 1.3 Dati e metadati Architettura dell'informazione | Prof. Luca A. Ludovico Dati, informazioni e conoscenza • Quale relazione esiste tra dati, informazione e conoscenza? Diverse teorie. – Relazione gerarchica: dai dati si ricavano le informazioni e da queste le conoscenza Alavi Maryam, Leidner Dorothy E.: “Knowledge management and knowledge amanagement systems: conceptual foundations and reserche issues”, Mis Quarterly, 2001, volume 25 – Dalla conoscenza derivano le informazioni che sono state formalizzate e strutturate in questo passaggio, e da queste i dati Tuomi Ilkka: “Data is more than knowledge: implications of the reversed knowledge hierarchy for knowledge management and organizational memory”, Journal of management studies, 1999, volume 41, numero 4 – Non c’è un rapporto gerarchico ma una relazione biunivoca: i tre elementi si sovrappongono e non sono di maggiore valore uno rispetto all’altro Stenmark Dick: “Information vs knowledge. The role of intranets in knowledge management”, 35th Hawaii international conference on system science, 2002, Hawaii Architettura dell'informazione Prof. Luca A. Ludovico Alcune brevi definizioni • I dati sono fatti oggettivi, immediati. Essi non hanno bisogno di relazioni con altri elementi per esistere, ma presi a se stanti non comunicano nulla. • I dati, ricavati dall’osservazione o dall’esperienza diretta, diventano informazioni nel momento in cui sono collocati in un contesto, attraverso: – – – – – la contestualizzazione; la categorizzazione; l'elaborazione; la correzione; la sintesi. • L’informazione implica relazioni e canali, grazie ai quali acquista valore aggiunto rispetto ai dati. Architettura dell'informazione Prof. Luca A. Ludovico Esempi di dati / informazioni • I dati anagrafici: sono dati per definizione. Quando vengono richiesti da un interlocutore, diventano per l’interlocutore stesso informazioni. Architettura dell'informazione Prof. Luca A. Ludovico Esempi di dati / informazioni • Le informazioni stradali: sono informazioni per definizione. I nomi delle vie, la disposizione di incroci e semafori, ecc. di per sé sono dati, si trasformano in informazioni quando se ne fa uso per trovare un percorso Architettura dell'informazione Prof. Luca A. Ludovico Conoscenza • La conoscenza è la consapevolezza e la comprensione di fatti, verità o informazioni ottenuti attraverso l'esperienza o l'apprendimento (a posteriori), ovvero tramite l'introspezione (a priori) – Consapevolezza e comprensione distinguono la conoscenza dal «nozionismo» • La conoscenza è l'autocoscienza del possesso di informazioni connesse tra di loro, le quali, prese singolarmente, hanno un valore e un'utilità inferiori • Esiste una disciplina chiamata Knowledge Management Architettura dell'informazione Prof. Luca A. Ludovico I 3 tipi di conoscenza Conoscenza esplicita, tacita e incorporata 1. Un documentario, un manuale, un corso, sono tutti contenitori di conoscenza esplicita 2. Il «saper fare» qualcosa e l’«intuizione» sono forme di conoscenza tacita 3. Un oggetto di design ha conoscenza incorporata nell'ergonomia piuttosto che nella realizzazione delle funzionalità Architettura dell'informazione Prof. Luca A. Ludovico Esercizio Si analizzi il seguente oggetto e si estrapolino dati, informazioni e conoscenza Architettura dell'informazione Prof. Luca A. Ludovico I metadati • Il prefisso meta- viene usato spesso in campo informatico • Deriva dal greco antico, ove significa «oltre, dopo» • Viene usato spesso in ambito informatico – Ad esempio, l’XML è un «meta-linguaggio» • Un metadato è letteralmente «un dato su un (altro) dato», quindi un'informazione che descrive un insieme di dati Architettura dell'informazione Prof. Luca A. Ludovico Esempio • Scheda del catalogo di una biblioteca Contiene informazioni circa: – il contenuto del libro (genere, tipologia, …) – le figure con responsabilità sul testo (autore, traduttore, curatore, …) – l’oggetto fisico (numero di pagine, formato, …) – il processo editoriale e di stampa (casa editrice, ristampa, prezzo, …) – l’acquisizione e la posizione nella biblioteca – … Architettura dell'informazione Prof. Luca A. Ludovico Un concetto, molte sfaccettature • “Structured information that describes and/or allows us to find, manage, control, understand or preserve other information over time” Cunningham, A. (2000). Dynamic descriptions: recent developments in standards for archival description and metadata. Canadian Journal of Information and Library Science, 25(4), 3-17 • “Metadata not only identifies and describes an information object; it also documents how that object behaves, its function and use, its relationship to other information objects, and how it should be managed” Gilliland-Swetland, A.J. (1998). Introduction to Metadata: Setting the Stage Architettura dell'informazione Prof. Luca A. Ludovico Il contesto e le sfumature di significato • Per i bibliotecari, l’insieme dei metadati è visto essenzialmente come informazione bibliografica • Per gli archivisti, i metadati includono informazioni di contesto, restrizioni e termini d’accesso, ecc. • Per gli informatici, il metadato è qualcosa di estraneo a un bit stream che però aiuta a descriverlo. I metadati spesso sottendono un database (o un’altra forma di struttura dati) associabile a un oggetto digitale Architettura dell'informazione Prof. Luca A. Ludovico A caccia di dati e metadati… Architettura dell'informazione Prof. Luca A. Ludovico Principali funzioni Architettura dell'informazione Prof. Luca A. Ludovico Principali funzioni • Ricerca, che consiste nell’individuare l’esistenza di un documento; • Localizzazione, ovvero rintracciare una particolare occorrenza del documento; • Selezione, realizzabile analizzando, valutando e filtrando una serie di documenti; • Interoperabilità semantica, che consiste nel permettere la ricerca in ambiti disciplinari diversi grazie a una serie di equivalenze fra descrittori; • Gestione risorse, ossia gestire le raccolte di documenti grazie all’intermediazione di banche dati e cataloghi; • Disponibilità, ovvero ottenere informazioni sull’effettiva disponibilità del documento. Architettura dell'informazione Prof. Luca A. Ludovico I METADATI IN AMBITO DIGITALE Architettura dell'informazione Prof. Luca A. Ludovico L’informazione digitale • Esempio del vinile: mondo analogico (oggetto fisico) • Nel contesto dell’informazione digitale, i metadati sono comunemente intesi come un’amplificazione delle tradizionali pratiche di catalogazione bibliografica in un ambiente elettronico. • Si limita il concetto di “dato” al dominio semantico dei soli dati digitali e discreti che vengono gestiti da un computer • Nei progetti di digitalizzazione e nelle attività di gestione degli archivi di oggetti digitali, i metadati rivestono un’importanza crescente, tanto da venire considerati parte costituente della definizione di “oggetto digitale” Architettura dell'informazione Prof. Luca A. Ludovico Tipologie di metadati • Esistono varie classificazioni dei metadati, a seconda delle loro caratteristiche e finalità • Una delle categorizzazioni più utilizzate distingue tra: – Metadati descrittivi – Metadati amministrativi e gestionali – Metadati strutturali Architettura dell'informazione Prof. Luca A. Ludovico Metadati descrittivi • Servono per l’identificazione ed il recupero degli oggetti digitali • Sono costituiti da descrizioni dei documenti fonte (ossia i documenti fisici poi digitalizzati) o dei documenti nati in formato digitale • Risiedono generalmente nelle basi dati dei sistemi di Information Retrieval all’esterno dell’archivio digitale, e sono collegati a quest’ultimo tramite appositi collegamenti • Esempi notevoli: Handle, Dublin Core, MARC Architettura dell'informazione Prof. Luca A. Ludovico Il sistema Handle • In informatica, per handle si intende un riferimento astratto a una risorsa • Il sistema Handle (http://www.handle.net) è un insieme di protocolli per assegnare, gestire e risolvere identificatori persistenti per oggetti digitali su Internet • Il sistema permette a un sistema di elaborazione distribuito di memorizzare gli identificatori (handle) delle risorse digitali, e di risolverli nell’informazione necessaria per localizzare, accedere ed utilizzare tali risorse • Idea: la disponibilità e la locazione fisica dell’oggetto può cambiare, ma il suo handle rimane fisso (livello di astrazione) Architettura dell'informazione Prof. Luca A. Ludovico Dublin Core • Il Dublin Core Metadata Initiative (DCMI, http://dublincore.org) è un sistema di metadati costituito da un nucleo di elementi essenziali ai fini della descrizione di qualsiasi materiale digitale accessibile via rete informatica • Il progetto nasce nel 1995 a Dublin (Ohio) per le biblioteche statunitensi, su iniziativa di bibliotecari, archivisti, editori, ricercatori e informatici (tra cui membri dei gruppi di lavoro dell'Internet Engineering Task Force) • Esigenze: – – creare un insieme di strumenti condivisi per l’accesso alle risorse digitali stabilire un insieme minimo di elementi descrittivi che possano essere forniti dall’autore o dall’editore dell’oggetto digitale, ed inclusi in esso, o da esso referenziati Architettura dell'informazione Prof. Luca A. Ludovico Esempi: il sistema AIR • Archivio Istituzionale della Ricerca Università degli Studi di Milano http://air.unimi.it/ • Ogni registrazione inserita (pubblicazione scientifica o altro lavoro) può essere ricercata attraverso metadati • Per citare o collegarsi alla registrazione viene fornito un identificativo «handle» • E’ possibile visualizzare la registrazione in formato Dublin Core Architettura dell'informazione Prof. Luca A. Ludovico Metadati amministrativi e gestionali • Evidenziano le modalità di archiviazione e manutenzione degli oggetti digitali nel sistema di gestione dell’archivio digitale • Questi tipi di metadati assumono un’importanza preponderante ai fini della conservazione permanente degli oggetti digitali: essi possono documentare i processi tecnici associati alla conservazione permanente, fornire informazioni sulle condizioni e i diritti di accesso agli oggetti digitali, certificare l’autenticità e l’integrità del contenuto, documentare la catena di custodia degli oggetti, ... • Esempio: MAG Architettura dell'informazione Prof. Luca A. Ludovico Il MAG dell’ICCU • Metadati Amministrativi Gestionali (MAG) è uno standard per raccogliere metadati relativi a oggetti digitali creati nei progetti di digitalizzazione, ed è conforme agli standard internazionali • La versione 0 è stata creata nel 2001 dall'ICCU (Istituto centrale per il catalogo unico delle biblioteche italiane e per le informazioni bibliografiche, http://www.iccu.sbn.it). L'ultima versione è la 2.0.1 del 2006 • Manuale ed esempi: http://www.iccu.sbn.it/opencms/opencms/documenti/manuale.html Architettura dell'informazione Prof. Luca A. Ludovico Il MAG dell’ICCU • Lo schema risulta composto di diverse sezioni, utilizzabili a seconda del contenuto digitale e dell'impiego dello stesso: – – – – – – – – – GEN: informazioni generali sul progetto e sul tipo di digitalizzazione BIB: metadati descrittivi dell'oggetto analogico STRU: metadati strutturali dell'oggetto digitale IMG: metadati specifici per le immagini fisse OCR: metadati specifici relativi al riconoscimento ottico del testo DOC: metadati specifici per oggetti digitali in formato testo che possono essere derivati o born digital AUDIO: metadati specifici per file audio VIDEO: metadati specifici per file video DIS: metadati specifici per la distribuzione di oggetti digitali Architettura dell'informazione Prof. Luca A. Ludovico La collaborazione LIM - ICCU Architettura dell'informazione Prof. Luca A. Ludovico Metadati strutturali • Collegano le varie componenti delle risorse per un’adeguata e completa fruizione, che spesso avviene attraverso la mappatura di schemi di metadati diversi • Sul web confluiscono risorse eterogenee, in parte destrutturate e prive di metadati, in parte descritte da schemi di metadati differenti tra loro. A seconda del tipo di risorsa che deve essere descritta c’è la possibilità di specificare campi di metadati con caratteristiche complementari che svolgono funzioni diverse a seconda degli oggetti ai quali devono essere applicati. • Obiettivo: consentire l’interoperabilità anche tra tipi di risorse diverse (testi, audio, video, ecc.) e l’integrazione di vari sistemi informativi Architettura dell'informazione Prof. Luca A. Ludovico