Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali Maria Teresa Biagetti Roma 10 settembre 2012 ICOM International Council of Museums Section 1. Museum “A museum is a non-profit, permanent institution in the service of society and its development, open to the public, which acquires, conserves, researches, communicates and exhibits the tangible and intangible heritage of humanity and its environment for the purposes of education, study and enjoyment.” http://icom.museum/the-organisation/icom-statutes/3-definition-of-terms/#sommairecontent Multimedia Information Retrieval Peter Enser Image / Visual Retrieval "semantic gap" CIDOC CRM Conceptual Reference Model “significati intesi” CIDOC International Committee for Documentation ICOM International Council of Museums Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 2 Le ontologie le ontologie sono schemi concettuali condivisi e altamente strutturati, attraverso i quali si definiscono i concetti, gli oggetti, i processi, e le relazioni tra di essi, al fine di rendere evidenti e definire in modo stabile i rapporti gerarchici esistenti tra i concetti. Sono impiegate per descrivere e rappresentare un'area della conoscenza utilizzando un linguaggio non ambiguo e suscettibile di essere trattato dalle macchine. Definizioni di ontologia: Thomas Robert Gruber: "An ontology is an explicit specification of a conceptualization" Rudi Studer: "An ontology is a formal, explicit specification of shared conceptualization" Thomas R. Gruber. A Translation Approach to Portable Ontology Specifications. "Knowledge Acquisition", 5 (1993), n. 2, p. 199-220. Rudi Studer, V. Richard Benjamins, Dieter Fensel. Knowledge Engineering: Principles and Methods, "Data & Knowledge Engineering", 25 (1998), n. 1-2, p. 161-198. Una concettualizzazione è la definizione di un insieme di concetti, di entità, di oggetti, e di relazioni tra di essi, relativi ad un'area d'interesse o ad un settore di riferimento, una rappresentazione astratta del campo di conoscenza cui ci si riferisce. Anche i tradizionali sistemi di classificazione biblioteconomica e i thesauri documentari costituiscono un esempio di concettualizzazione, sebbene non formale: sono scritti in linguaggio naturale (che può essere ambiguo, polisenso) non in linguaggio formale, e quindi non sono adatti per realizzare il ragionamento automatico. Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 3 Ontologie formali Rappresentano una concettualizzazione in un linguaggio formale e comprensibile dai computer. Un linguaggio formale si basa su di un insieme finito di simboli, una grammatica che definisce quali sequenze di simboli costituiscono formule "ben formate", si basa su assiomi e regole di inferenza. 1950- Computer Science sviluppa ontologie formali per le basi di dati 1980- Artificial Intelligence realizza i sistemi esperti, ad es. MYCIN, per le diagnosi delle infezioni (Medicina) e DENDRAL, per la chimica organica. I sistemi esperti generalmente usano regole stabilite per risolvere problemi relativi ad ambiti circoscritti, e raggiungono buoni risultati solo nei campi per cui sono stati realizzati, ma risultano inadatti a risolvere nuovi problemi. Artificial Intelligence sviluppa studi per la Rappresentazione della conoscenza Adozione della Description Logics per realizzare linguaggi formali per la rappresentazione della conoscenza da impiegare nell’elaborazione di ontologie formali. La Logica descrittiva (Description Logics) costituisce un sottoinsieme della Logica del primo ordine (First-order Logic, FOL). Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 4 Description Logics rispetto alla Logica proposizionale offre gli strumenti per esprimere proposizioni sugli oggetti, sulle proprietà che gli oggetti possono presentare in comune, e sulle relazioni tra gli oggetti. I formalismi descrittivi che utilizza comprendono gli operatori di congiunzione, di negazione, di intersezione di concetti, di quantificazione esistenziale, di restrizione dei valori e di restrizione numerica (cardinalità). I linguaggi basati sulle Logiche descrittive forniscono agli utenti (agenti umani o automatici) la possibilità di realizzare inferenze, cioè dedurre conoscenze dalla rete di conoscenze esplicitate. Le inferenze vengono realizzate applicando gli algoritmi di subsumption, che determina le relazioni gerarchiche tra concetti, di instance, determina l’appartenenza di un individuo ad una classe, e di consistency, che rende possibile l'analisi della coerenza logica e dell'assenza di contraddizione tra i concetti. I linguaggi basati sulle Logiche descrittive si propongono quindi come i candidati migliori per la realizzazione dei linguaggi formali per le ontologie. OWL Web Ontology Language Overview (W3C Recommendation 10 February <http://www.w3.org/TR/owl-features/> OWL 2 Web Ontology Language Document Overview (W3C Recommendation 27 October 2009) <(http://www.w3.org/TR/owl2-overview/>. Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 2004) Pagina 5 Thesauri documentari e ontologie Nei Thesauri tutte le possibili relazioni tra concetti vengono costrette all'interno di due ampie categorie: le relazioni gerarchiche (BT Broader Terms, NT Narrower Terms) e le relazioni associative (RT Related Terms). Manca una semantica precisa, definita ed esplicitata, e questo produce un significativo livello di ambiguità nell'interpretazione delle relazioni. Aggiungendo relazioni e proprietà formalmente definite, entriamo nel mondo delle ontologie: relazioni tra i membri delle classi e delle sottoclassi; restrizione dei valori; unione; intersezione; disgiunzione. I concetti e le relazioni sono definiti in modo univoco attraverso una semantica formale, che permette di attuare l'interoperabilità tra i diversi sistemi di organizzazione della conoscenza. Lo standard SKOS Simple Knowledge Organization System Reference (W3C Recommendation 18 agosto 2009) http://www.w3.org/TR/2009/REC-skos-reference20090818/ costituisce un modello adatto ad esprimere la struttura di base e i contenuti dei sistemi di organizzazione della conoscenza (KOS), definisce le modalità per la reingegnerizzazione di thesauri e sistemi di classificazioni come ontologie formali, trasformando la struttura di concetti esplicitata in un thesauro, ad esempio, in un insieme più sfaccettato ed elaborato di classi e proprietà, identificate da URI. Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 6 Diversi tipi di ontologie ontologie leggere (lightweight ontologies) semplici tassonomie di concetti, organizzati in gerarchie in base alla relazione genere-specie (relazione is-a, x è una specie di y). Possono essere impiegate anche per raggiungere l'interoperabilità semantica, purché gli utenti facciano parte di gruppi che condividono già la terminologia e i significati. Topic Maps (Steve Pepper le definisce “indici del mondo dell'informazione”). Topici (Topics) sono le entità, le persone, i concetti, gli oggetti, intorno a cui possa essere asserita qualsiasi cosa. Le Associazioni tra Topici formano una rete di relazioni chiaramente definite. Le Occorrenze sono le risorse informative rilevanti per il Topico, una monografia, un’immagine, una citazione all'interno di un'altra risorsa, puntate attraverso URI. ontologie di dominio (domain ontologies) forniscono l'organizzazione di uno specifico campo disciplinare o applicativo, rappresentandone i concetti rilevanti. upper ontologies (o top-level ontologies) rappresentano concetti e proprietà generali, applicabili ad un vasto insieme di ambiti cognitivi, e in questo caso il raggiungimento della condivisione dei significati può presentare notevoli difficoltà. Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 7 Ontologie fondate sulla Logica formale SUMO (Suggested Upper Merged Ontology) (http://www.ontologyportal.org/), è una ontologia che presenta un livello upper-level, sviluppata nel 2000 dalla società Teknowledge Corporation e candidata dallo Standard Upper Ontology Working Group a costituire uno standard per questo tipo di ontologie e ad agire come ontologia fondazionale per le ontologie di dominio. Ma comprende anche alcune ontologie di dominio. Nella versione nella quale sono combinate SUMO e tutte le ontologie di dominio sono gestiti 20.000 concetti e 70.000 assiomi. Gli assiomi, che riflettono per lo più nozioni di senso comune, contribuiscono a restringere le interpretazioni dei singoli concetti e definire i significati, e costituiscono l'aiuto ai software agenti per il ragionamento automatico. E’ disponibile la mappatura con i synset di WordNet, interrogabile attraverso una semplice interfaccia. Nella porzione che contiene le entità generali, SUMO offre 1.000 concetti, 4.000 assiomi e 750 regole. CYC (www.cyc.com) ontologia formale basata sulle acquisizioni dell'Intelligenza Artificiale, che prevede un sistema di categorie molto complesso e ha incorporato un motore per le inferenze, capace di utilizzare centinaia di modelli di deduzioni contemporaneamente. La porzione relativa ai concetti astratti e generali (la upper ontology) definisce i concetti relativi a relazioni spaziali e temporali, i concetti logici e matematici, le nozioni relative a quantità, insiemi, gruppi. Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 8 – Numero speciale sulle ontologie: AidaInformazioni n. 1 / 2 2010 http://www.aidainformazioni.it/ – IAOA International Association for Ontology and its Applications www.iaoa.org organizzazione internazionale il cui scopo è promuovere la ricerca interdisciplinare tra i settori della Filosofia, della Linguistica, della Logica, della Computer Science, della Library and Information Science, della Ingegneria della conoscenza Presidente è Nicola Guarino – ISTC CNR (LOA-Laboratory for Applied Ontology) (Istituto di Scienze e Tecnologie della Cognizione - Trento) Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 9 CIDOC CRM Conceptual Reference Model strumento per l’interoperabilità semantica hygh-level ontology che riguarda un vasto dominio convertibile in formati leggibili dalle macchine come RDF Schema, e OWL permette di organizzare la conoscenza nei musei – integrazione della documentazione scientifica in campo archeologico permette trasferimento e merging di dati anche tra fonti eterogenee Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 10 Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 11 TEMPORAL ENTITIES direttamente connessi allo SPAZIO e al TEMPO Entità denominate attraverso identificatori (Appellations) possono essere classificate attraverso l'uso di categorie Classe E55 Type Proprietà P127 has broader term (has narrower term). classe E1 Entity è il Domain della P2 has type (is type of), che ha come Range E55 Type ogni classe in CRM eredita la Proprietà P2 has type, Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 12 CIDOC CRM Conceptual Reference Model Endurant / Perdurant Ontologia fondazionale DOLCE Nicola Guarino ISTC CNR (Istituto di Scienze cognifive e tecnologia) di Trento http://www.loa.istc.cnr.it/index_ita.html. principio di modellazione generale "mono-tonicità" Instances di E21 Person: El Greco , Re Artù Classi Sottoclassi relazione IsA: Person IsA Biological Object Proprietà Person è sottoclasse di Biological Object Domain e Range delle Proprietà ereditarietà (inheritance) delle Proprietà Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 13 Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 14 Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 15 P67 refers to (is referred to by): E1 CRM Entity (P67.1 has type: E55 Type) P129 is about (is subject of): E1 CRM Entity Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 16 Classe E89 comprende le "proposizioni che riguardano le cose reali o immaginarie“ le Instances appartenenti alla classe E89 possono essere collegate attraverso la Proprietà P129 a tutte le Instances appartenenti alla classe E1 Entity. E1 riguarda tutte le cose che sono nell’universo di discorso di CRM Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 17 FRBRoo FRBR object-oriented definition and mapping to FRBRER (Version 1.0.2) gennaio 2012 editors Chryssoula Bekiari, Martin Doerr, Patrick Le Boeuf FRBR E / R: OPERA. ESPRESSIONE. MANIFESTAZIONE. ITEM Influenza di FRBR su CIDOC CRM: creazione nel 2008 delle classi E89 Propositional object e E90 Symbolic object Influenza di CIDOC CRM su FRBRoo: FRBRoo prevede due classi disgiunte F3 Manifestation Product Type (ciascuna copia di una pubblicazione) e F4 Manifestation Singleton (oggetto fisico unico, ad es. un manoscritto) Concetto di “Complex work” Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 18 Grazie per l’attenzione Prof. Maria Teresa Biagetti Sapienza Università di Roma Dipartimento di Scienze documentarie, linguistico-filologiche e geografiche http://www.dolinfige.uniroma1.it/ http://www.filesuso.uniroma1.it/index.php?q=user/82 Strumenti per l'integrazione e la condivisione delle informazioni bibliografiche e museali 18/12/2015 Pagina 19