Strumenti per l'integrazione e la condivisione delle informazioni
bibliografiche e museali
Maria Teresa Biagetti
Roma 10 settembre 2012
ICOM International Council of Museums
Section 1. Museum
“A museum is a non-profit, permanent institution in the service of society and its
development, open to the public, which acquires, conserves, researches, communicates and
exhibits the tangible and intangible heritage of humanity and its environment for the purposes
of education, study and enjoyment.”
http://icom.museum/the-organisation/icom-statutes/3-definition-of-terms/#sommairecontent
Multimedia Information Retrieval
Peter Enser
Image / Visual Retrieval
"semantic gap"
CIDOC CRM Conceptual Reference Model
“significati intesi”
CIDOC International Committee for Documentation
ICOM International Council of Museums
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 2
Le ontologie
le ontologie sono schemi concettuali condivisi e altamente strutturati, attraverso i quali si
definiscono i concetti, gli oggetti, i processi, e le relazioni tra di essi, al fine di rendere
evidenti e definire in modo stabile i rapporti gerarchici esistenti tra i concetti.
Sono impiegate per descrivere e rappresentare un'area della conoscenza utilizzando un
linguaggio non ambiguo e suscettibile di essere trattato dalle macchine.
Definizioni di ontologia:
Thomas Robert Gruber: "An ontology is an explicit specification of a conceptualization"
Rudi Studer: "An ontology is a formal, explicit specification of shared conceptualization"
Thomas R. Gruber. A Translation Approach to Portable Ontology Specifications. "Knowledge Acquisition", 5 (1993), n. 2, p. 199-220.
Rudi Studer, V. Richard Benjamins, Dieter Fensel. Knowledge Engineering: Principles and Methods, "Data & Knowledge Engineering",
25 (1998), n. 1-2, p. 161-198.
Una concettualizzazione è la definizione di un insieme di concetti, di entità, di oggetti, e di
relazioni tra di essi, relativi ad un'area d'interesse o ad un settore di riferimento, una
rappresentazione astratta del campo di conoscenza cui ci si riferisce.
Anche i tradizionali sistemi di classificazione biblioteconomica e i thesauri documentari
costituiscono un esempio di concettualizzazione, sebbene non formale: sono scritti in
linguaggio naturale (che può essere ambiguo, polisenso) non in linguaggio formale, e quindi
non sono adatti per realizzare il ragionamento automatico.
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 3
Ontologie formali
Rappresentano una concettualizzazione in un linguaggio formale e comprensibile dai
computer.
Un linguaggio formale si basa su di un insieme finito di simboli, una grammatica che definisce
quali sequenze di simboli costituiscono formule "ben formate", si basa su assiomi e regole
di inferenza.
 1950- Computer Science sviluppa ontologie formali per le basi di dati
 1980- Artificial Intelligence realizza i sistemi esperti, ad es. MYCIN, per le diagnosi delle
infezioni (Medicina) e DENDRAL, per la chimica organica.
 I sistemi esperti generalmente usano regole stabilite per risolvere problemi relativi ad
ambiti circoscritti, e raggiungono buoni risultati solo nei campi per cui sono stati
realizzati, ma risultano inadatti a risolvere nuovi problemi.
 Artificial Intelligence sviluppa studi per la Rappresentazione della conoscenza

Adozione della Description Logics per realizzare linguaggi formali per la
rappresentazione della conoscenza da impiegare nell’elaborazione di ontologie formali.
 La Logica descrittiva (Description Logics) costituisce un sottoinsieme della
Logica del primo ordine (First-order Logic, FOL).
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 4
Description Logics rispetto alla Logica proposizionale offre gli strumenti per esprimere
proposizioni sugli oggetti, sulle proprietà che gli oggetti possono presentare in comune, e
sulle relazioni tra gli oggetti.
I formalismi descrittivi che utilizza comprendono gli operatori di congiunzione, di negazione,
di intersezione di concetti, di quantificazione esistenziale, di restrizione dei valori e di
restrizione numerica (cardinalità).
I linguaggi basati sulle Logiche descrittive forniscono agli utenti (agenti umani o automatici) la
possibilità di realizzare inferenze, cioè dedurre conoscenze dalla rete di conoscenze
esplicitate.
Le inferenze vengono realizzate applicando gli algoritmi di subsumption, che determina le
relazioni gerarchiche tra concetti, di instance, determina l’appartenenza di un individuo ad
una classe, e di consistency, che rende possibile l'analisi della coerenza logica e
dell'assenza di contraddizione tra i concetti.
I linguaggi basati sulle Logiche descrittive si propongono quindi come i candidati migliori per
la realizzazione dei linguaggi formali per le ontologie.
OWL Web Ontology Language Overview (W3C Recommendation 10 February
<http://www.w3.org/TR/owl-features/>
OWL 2 Web Ontology Language Document Overview (W3C Recommendation 27 October 2009)
<(http://www.w3.org/TR/owl2-overview/>.
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
2004)
Pagina 5
Thesauri documentari e ontologie
 Nei Thesauri tutte le possibili relazioni tra concetti vengono costrette all'interno di due
ampie categorie: le relazioni gerarchiche (BT Broader Terms, NT Narrower Terms) e le
relazioni associative (RT Related Terms).
Manca una semantica precisa, definita ed esplicitata, e questo produce un significativo livello
di ambiguità nell'interpretazione delle relazioni.
Aggiungendo relazioni e proprietà formalmente definite, entriamo nel mondo delle ontologie:
relazioni tra i membri delle classi e delle sottoclassi; restrizione dei valori; unione;
intersezione; disgiunzione.
I concetti e le relazioni sono definiti in modo univoco attraverso una semantica formale, che
permette di attuare l'interoperabilità tra i diversi sistemi di organizzazione della conoscenza.

Lo standard SKOS Simple Knowledge Organization System Reference (W3C
Recommendation 18 agosto 2009) http://www.w3.org/TR/2009/REC-skos-reference20090818/ costituisce un modello adatto ad esprimere la struttura di base e i contenuti dei
sistemi di organizzazione della conoscenza (KOS), definisce le modalità per la
reingegnerizzazione di thesauri e sistemi di classificazioni come ontologie formali,
trasformando la struttura di concetti esplicitata in un thesauro, ad esempio, in un insieme più
sfaccettato ed elaborato di classi e proprietà, identificate da URI.
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 6
Diversi tipi di ontologie
 ontologie leggere (lightweight ontologies) semplici tassonomie di concetti, organizzati in
gerarchie in base alla relazione genere-specie (relazione is-a, x è una specie di y). Possono
essere impiegate anche per raggiungere l'interoperabilità semantica, purché gli utenti facciano
parte di gruppi che condividono già la terminologia e i significati.
Topic Maps (Steve Pepper le definisce “indici del mondo dell'informazione”).
Topici (Topics) sono le entità, le persone, i concetti, gli oggetti, intorno a cui possa essere
asserita qualsiasi cosa. Le Associazioni tra Topici formano una rete di relazioni chiaramente
definite. Le Occorrenze sono le risorse informative rilevanti per il Topico, una monografia,
un’immagine, una citazione all'interno di un'altra risorsa, puntate attraverso URI.
 ontologie di dominio (domain ontologies) forniscono l'organizzazione di uno specifico campo
disciplinare o applicativo, rappresentandone i concetti rilevanti.
 upper ontologies (o top-level ontologies) rappresentano concetti e proprietà generali,
applicabili ad un vasto insieme di ambiti cognitivi, e in questo caso il raggiungimento della
condivisione dei significati può presentare notevoli difficoltà.
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 7
Ontologie fondate sulla Logica formale
 SUMO (Suggested Upper Merged Ontology) (http://www.ontologyportal.org/), è una ontologia che
presenta un livello upper-level, sviluppata nel 2000 dalla società Teknowledge Corporation e candidata
dallo Standard Upper Ontology Working Group a costituire uno standard per questo tipo di
ontologie e ad agire come ontologia fondazionale per le ontologie di dominio. Ma comprende
anche alcune ontologie di dominio.
Nella versione nella quale sono combinate SUMO e tutte le ontologie di dominio sono gestiti 20.000
concetti e 70.000 assiomi. Gli assiomi, che riflettono per lo più nozioni di senso comune,
contribuiscono a restringere le interpretazioni dei singoli concetti e definire i significati, e
costituiscono l'aiuto ai software agenti per il ragionamento automatico. E’ disponibile la mappatura con
i synset di WordNet, interrogabile attraverso una semplice interfaccia.
Nella porzione che contiene le entità generali, SUMO offre 1.000 concetti, 4.000 assiomi e 750 regole.
CYC (www.cyc.com) ontologia formale basata sulle acquisizioni dell'Intelligenza Artificiale, che
prevede un sistema di categorie molto complesso e ha incorporato un motore per le inferenze, capace
di utilizzare centinaia di modelli di deduzioni contemporaneamente. La porzione relativa ai concetti
astratti e generali (la upper ontology) definisce i concetti relativi a relazioni spaziali e temporali, i
concetti logici e matematici, le nozioni relative a quantità, insiemi, gruppi.
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 8
–
Numero speciale sulle ontologie: AidaInformazioni n. 1 / 2 2010
http://www.aidainformazioni.it/
–
IAOA International Association for Ontology and its Applications
www.iaoa.org
organizzazione internazionale il cui scopo è promuovere la ricerca
interdisciplinare tra i settori della Filosofia, della Linguistica, della Logica, della
Computer Science, della Library and Information Science, della Ingegneria della
conoscenza
Presidente è Nicola Guarino – ISTC CNR (LOA-Laboratory for Applied
Ontology)
(Istituto di Scienze e Tecnologie della Cognizione - Trento)
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 9
CIDOC CRM Conceptual Reference Model
 strumento per l’interoperabilità semantica
 hygh-level ontology che riguarda un vasto dominio
 convertibile in formati leggibili dalle macchine come RDF Schema, e OWL
 permette di organizzare la conoscenza nei musei – integrazione della documentazione
scientifica in campo archeologico
 permette trasferimento e merging di dati anche tra fonti eterogenee
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 10
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 11
TEMPORAL ENTITIES
direttamente connessi allo SPAZIO e al TEMPO
Entità denominate attraverso identificatori (Appellations)
possono essere classificate attraverso l'uso di categorie
Classe E55 Type
Proprietà P127 has broader term (has narrower term).
classe E1 Entity è il Domain della P2 has type (is type of), che ha come Range E55 Type
ogni classe in CRM eredita la Proprietà P2 has type,
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 12
CIDOC CRM Conceptual Reference Model
Endurant / Perdurant
Ontologia fondazionale DOLCE
Nicola Guarino ISTC CNR (Istituto di Scienze cognifive e tecnologia) di Trento
http://www.loa.istc.cnr.it/index_ita.html.
principio di modellazione generale "mono-tonicità"
Instances di E21 Person: El Greco , Re Artù
Classi
Sottoclassi
relazione IsA: Person IsA Biological Object
Proprietà
Person è sottoclasse di Biological Object
Domain e Range delle Proprietà
ereditarietà (inheritance) delle Proprietà
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 13
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 14
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 15
P67 refers to (is referred to by): E1 CRM Entity
(P67.1 has type: E55 Type)
P129 is about (is subject of): E1 CRM Entity
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 16
Classe E89 comprende le "proposizioni che riguardano le cose reali o immaginarie“
le Instances appartenenti alla classe E89 possono essere collegate attraverso la Proprietà P129
a tutte le Instances appartenenti alla classe E1 Entity. E1 riguarda tutte le cose che sono
nell’universo di discorso di CRM
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 17
FRBRoo
FRBR object-oriented definition and mapping to FRBRER (Version 1.0.2)
gennaio 2012 editors Chryssoula Bekiari, Martin Doerr, Patrick Le Boeuf
FRBR E / R: OPERA. ESPRESSIONE. MANIFESTAZIONE. ITEM
Influenza di FRBR su CIDOC CRM: creazione nel 2008 delle classi
E89 Propositional object e E90 Symbolic object
Influenza di CIDOC CRM su FRBRoo: FRBRoo prevede due classi disgiunte
F3 Manifestation Product Type (ciascuna copia di una pubblicazione) e
F4 Manifestation Singleton (oggetto fisico unico, ad es. un manoscritto)
Concetto di “Complex work”
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 18
Grazie per l’attenzione
Prof. Maria Teresa Biagetti
Sapienza Università di Roma
Dipartimento di Scienze documentarie, linguistico-filologiche e geografiche
http://www.dolinfige.uniroma1.it/
http://www.filesuso.uniroma1.it/index.php?q=user/82
Strumenti per l'integrazione e la
condivisione delle informazioni
bibliografiche e museali
18/12/2015
Pagina 19
Scarica

Integrazione e condivisione delle informazioni bibliografiche