Metodologie per la gestione di
conoscenza ontologica
Prof. M.T. PAZIENZA
a.a. 2008-2009
Sommario
• Introduzione
• Wordnet
• Ontologie, framework ontologico
Ontologie e Basi di conoscenza
3
Ontologie, tassonomie, folksonomie
In comunità diverse, per definire entità e le relazioni tra loro esistenti,
vengono creati artefatti di diversa tipologia, ciascuna con finalità
proprie quali:
•
•
•
•
•
•
dataset di annotazione,
supporto alla comprensione del linguaggio naturale,
integrazione di risorse differenti,
interoperabilità semantica,
conoscenza di background in applicazioni,
liste di parole-chiave per annotare risorse web (folksonomie).
Tutti questi artefatti vengono assimilati ad “ontologie”
Ontologie, tassonomie, folksonomie
Tra le ontologie vere e proprie e le folksonomie si
collocano le tassonomie (modelli concettuali e
vocabolari controllati con organizzazione in
genere gerarchica) spesso usati per operazioni di
information indexing e retrieval.
E’ necessario identificare delle dimensioni chiave
che definiscano le ontologie oltre a definire
operativamente tali dimensioni
Framework ontologico
E’ possibile sviluppare ontologie anche con una
conoscenza parziale della loro definizione,
implementazione e scopo applicativo.
Obiettivo: fornire un framework che supporti la
diversità (e non la divergenza) assicurando di
mantenerne la stabilità e la riusabilità
all’interno di approcci ontologici differenti.
Framework ontologico
Possiamo identificare 2 gruppi di dimensioni:
1. dimensioni semantiche (espressività,
granularità strutturale e rappresentazionale)
2. dimensioni pragmatiche (uso previsto,
supporto di ragionamento automatico,
identificazione della descrittività o della
prescrittività di una ontologia, metodologia
di disegno, …)
Framework ontologico
Il framework ontologico è condizione
fondamentale per specificare metadati per
ontologie diverse; tali metadati includono le
proprietà e le caratteristiche usate per
descrivere una ontologia.
Ciò a supporto della condivisione, riuso e
confronto di ontologie
Dimensioni semantiche
Una ontologia include un vocabolario e una specificazione della
interpretazione sottesa (significato) di ciascun termine del
vocabolario.
La specificazione include:
1. identificazione delle categorie fondamentali nel dominio
2. identificazione dei modi in cui membri delle categorie sono
correlati tra loro
3. vincoli sui modi in cui le relazioni possono essere usate
Le dimensioni semantiche caratterizzano come un dato approccio
specifichi i significati dei termini; ciò comprende l’espressività
del linguaggio di rappresentazione ontologica, le proprietà
strutturali, la granularità della rappresentazione delle
specificazioni ontologiche
Espressività
L’espressività è una caratteristica del linguaggio in
cui una ontologia è prodotta. Una ontologia
definisce il proprio vocabolario in una qualche
forma di rappresentazione.
Informalmente una ontologia può essere espressa
soltanto da una lista di termini e da definizioni in
linguaggio naturale (inglese, italiano,…) .
Ciò produce confusione tra “ontologie” ed il
linguaggio usato per rappresentare le ontologie.
Proprietà strutturali
Il livello di struttura spesso corrisponde alla formalità delle definizioni
dei termini nel vocabolario.
• Una ontologia che specifica formalmente i concetti (es. astrazione
matematica) ha molte proprietà strutturali
• Una ontologia che specifica poco i concetti (es. documento,
hyperlink) ha poche proprietà strutturali
• Molte ontologie sono semistrutturate contenendo un mix di
definizioni formali ed informali di concetti e relazioni (es. ontologia
bibliografica con concetto tempo altamente strutturato e concetto
titolo di libro scarsamente strutturato – stringa di testo-)
Proprietà strutturali
Granularità
La granularità è una proprietà del contenuto della ontologia e non
del linguaggio di rappresentazione; attiene alla numerosità di
concetti e relazioni nel proprio vocabolario.
La granularità è misurabile con la profondità media delle sottoclassi
e/o sottoproprietà, la densità media dei termini nella gerarchia, il
numero medio di assiomi per termine
Ridotta granularità se si usano primitive di rappresentazione ad alto
livello (come accade nelle tassonomie con concetti e
sussunzione),
Granularità fine (come nelle ontologie con molti dettagli circa le
proprietà dei concetti e di come essi relazionino tra loro.
Confronto tra ontologie
Le ontologie possono essere confrontate
rispetto ai linguaggi con espressività
minima richiesta per definire il loro
vocabolari
Le tassonomie richiedono un linguaggio più
ristretto per specificare la relazione di
“sottoclasse” tra classi
Dimensioni pragmatiche
L’uso previsto può determinare la proprietà di una
ontologia:
• condividere una base di conoscenza
• migliorare la comunicazione tra agenti
• supporto alle decisioni
• rappresentazione del vocabolario di un linguaggio
naturale
• rappresentazione della semantica per servizi ed
applicazioni software
• fornire un framework concettuale per l’indicizzazione di
contenuti
Dimensioni pragmatiche
Si può misurare la tipologia di ragionamento automatico
supportato dall’ontologia: a livello di specificazione si
valutano i vincoli sia sul linguaggio che sul contenuto
• Ragionamento semplice (fare inferenze usando la
relazione di ereditarietà delle proprietà tra
classi/sottoclassi)
• Ragionamento speciale (il reasoner può fare asserzioni
arbitrarie nel linguaggio di rappresentazione della
conoscenza)
• Ragionamento generale (uso di regole deduttive che
combinano informazioni attraverso l’ontologia)
Dimensioni pragmatiche
Uso descrittivo/prescrittivo si riferisce alla sorgente di
interpretazione attesa del vocabolario dell’ontologia.
Nell’approccio descrittivo il contenuto di una ontologia
descrive l’interpretazione attesa caratterizzando le entità
e le relazioni tra entità come lo farebbe un utente/esperto
Nell’approccio prescrittivo il contenuto di una ontologia
prescrive le interpretazioni attese forzando così il modo
in cui entità e relazioni debbano essere caratterizzate
Dimensioni pragmatiche
Le metodologie di disegno usate nella costruzione di una
ontologia ne determinano il modo d’uso e sono strettamente
connesse all’uso previsto.
Una metodologia bottom-up (o empirica) pone enfasi
sull’analisi dei dati e la loro semantica; si suppone che
questo approccio possa far emergere patterns di
caratterizzazione preferiti da comunità di utenti
Una metodologia top-down (o razionalista) pone enfasi sullo
sviluppo di una ontologia a partire dalla conoscenza sul
mondo o sul dominio. L’ontologia in tal caso è indipendente
dai dati reali. Lo scopo dell’ontologia in tal caso è
determinato dalla classe di domande che un esperto di
dominio può porre.
Dimensione di
Governance delle ontologie
La governance attiene a come le decisioni relative alla struttura ed al
contenuto sono state prese ed include la specificazione dei criteri
di qualità e di certificazione.
Si potrebbe demandare alle organizzazioni professionali o di
categoria (piuttosto che a validi ricercatori o ingegneri della
conoscenza) la definizione in linguaggio naturale delle entità e
delle relazioni semantiche intesa come uno sforzo per
formalizzare i concetti. Ciò potrebbe far riferimento a legislazioni
specifiche , regolamenti standard usati per le definizioni e
permetterebbe di valutare formalmente la bontà dei risultati
ottenuti dalle applicazioni
Riferimenti
• Arash Shaban-Nejad: tutorial on “Ontology:
Foundation of Semantic Web”, 2004
• M. Gruninger, O. Bodenreider, F. Olken, L. Obrst, P.
Yim: “Ontology, taxonomy, folksonomy:
understanding the distinctions”, Applied Ontology
journal, 3 (2008) pagg.191-200
Scarica

ontologie13