Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a. 2008-2009 Sommario • Introduzione • Wordnet • Ontologie, framework ontologico Ontologie e Basi di conoscenza 3 Ontologie, tassonomie, folksonomie In comunità diverse, per definire entità e le relazioni tra loro esistenti, vengono creati artefatti di diversa tipologia, ciascuna con finalità proprie quali: • • • • • • dataset di annotazione, supporto alla comprensione del linguaggio naturale, integrazione di risorse differenti, interoperabilità semantica, conoscenza di background in applicazioni, liste di parole-chiave per annotare risorse web (folksonomie). Tutti questi artefatti vengono assimilati ad “ontologie” Ontologie, tassonomie, folksonomie Tra le ontologie vere e proprie e le folksonomie si collocano le tassonomie (modelli concettuali e vocabolari controllati con organizzazione in genere gerarchica) spesso usati per operazioni di information indexing e retrieval. E’ necessario identificare delle dimensioni chiave che definiscano le ontologie oltre a definire operativamente tali dimensioni Framework ontologico E’ possibile sviluppare ontologie anche con una conoscenza parziale della loro definizione, implementazione e scopo applicativo. Obiettivo: fornire un framework che supporti la diversità (e non la divergenza) assicurando di mantenerne la stabilità e la riusabilità all’interno di approcci ontologici differenti. Framework ontologico Possiamo identificare 2 gruppi di dimensioni: 1. dimensioni semantiche (espressività, granularità strutturale e rappresentazionale) 2. dimensioni pragmatiche (uso previsto, supporto di ragionamento automatico, identificazione della descrittività o della prescrittività di una ontologia, metodologia di disegno, …) Framework ontologico Il framework ontologico è condizione fondamentale per specificare metadati per ontologie diverse; tali metadati includono le proprietà e le caratteristiche usate per descrivere una ontologia. Ciò a supporto della condivisione, riuso e confronto di ontologie Dimensioni semantiche Una ontologia include un vocabolario e una specificazione della interpretazione sottesa (significato) di ciascun termine del vocabolario. La specificazione include: 1. identificazione delle categorie fondamentali nel dominio 2. identificazione dei modi in cui membri delle categorie sono correlati tra loro 3. vincoli sui modi in cui le relazioni possono essere usate Le dimensioni semantiche caratterizzano come un dato approccio specifichi i significati dei termini; ciò comprende l’espressività del linguaggio di rappresentazione ontologica, le proprietà strutturali, la granularità della rappresentazione delle specificazioni ontologiche Espressività L’espressività è una caratteristica del linguaggio in cui una ontologia è prodotta. Una ontologia definisce il proprio vocabolario in una qualche forma di rappresentazione. Informalmente una ontologia può essere espressa soltanto da una lista di termini e da definizioni in linguaggio naturale (inglese, italiano,…) . Ciò produce confusione tra “ontologie” ed il linguaggio usato per rappresentare le ontologie. Proprietà strutturali Il livello di struttura spesso corrisponde alla formalità delle definizioni dei termini nel vocabolario. • Una ontologia che specifica formalmente i concetti (es. astrazione matematica) ha molte proprietà strutturali • Una ontologia che specifica poco i concetti (es. documento, hyperlink) ha poche proprietà strutturali • Molte ontologie sono semistrutturate contenendo un mix di definizioni formali ed informali di concetti e relazioni (es. ontologia bibliografica con concetto tempo altamente strutturato e concetto titolo di libro scarsamente strutturato – stringa di testo-) Proprietà strutturali Granularità La granularità è una proprietà del contenuto della ontologia e non del linguaggio di rappresentazione; attiene alla numerosità di concetti e relazioni nel proprio vocabolario. La granularità è misurabile con la profondità media delle sottoclassi e/o sottoproprietà, la densità media dei termini nella gerarchia, il numero medio di assiomi per termine Ridotta granularità se si usano primitive di rappresentazione ad alto livello (come accade nelle tassonomie con concetti e sussunzione), Granularità fine (come nelle ontologie con molti dettagli circa le proprietà dei concetti e di come essi relazionino tra loro. Confronto tra ontologie Le ontologie possono essere confrontate rispetto ai linguaggi con espressività minima richiesta per definire il loro vocabolari Le tassonomie richiedono un linguaggio più ristretto per specificare la relazione di “sottoclasse” tra classi Dimensioni pragmatiche L’uso previsto può determinare la proprietà di una ontologia: • condividere una base di conoscenza • migliorare la comunicazione tra agenti • supporto alle decisioni • rappresentazione del vocabolario di un linguaggio naturale • rappresentazione della semantica per servizi ed applicazioni software • fornire un framework concettuale per l’indicizzazione di contenuti Dimensioni pragmatiche Si può misurare la tipologia di ragionamento automatico supportato dall’ontologia: a livello di specificazione si valutano i vincoli sia sul linguaggio che sul contenuto • Ragionamento semplice (fare inferenze usando la relazione di ereditarietà delle proprietà tra classi/sottoclassi) • Ragionamento speciale (il reasoner può fare asserzioni arbitrarie nel linguaggio di rappresentazione della conoscenza) • Ragionamento generale (uso di regole deduttive che combinano informazioni attraverso l’ontologia) Dimensioni pragmatiche Uso descrittivo/prescrittivo si riferisce alla sorgente di interpretazione attesa del vocabolario dell’ontologia. Nell’approccio descrittivo il contenuto di una ontologia descrive l’interpretazione attesa caratterizzando le entità e le relazioni tra entità come lo farebbe un utente/esperto Nell’approccio prescrittivo il contenuto di una ontologia prescrive le interpretazioni attese forzando così il modo in cui entità e relazioni debbano essere caratterizzate Dimensioni pragmatiche Le metodologie di disegno usate nella costruzione di una ontologia ne determinano il modo d’uso e sono strettamente connesse all’uso previsto. Una metodologia bottom-up (o empirica) pone enfasi sull’analisi dei dati e la loro semantica; si suppone che questo approccio possa far emergere patterns di caratterizzazione preferiti da comunità di utenti Una metodologia top-down (o razionalista) pone enfasi sullo sviluppo di una ontologia a partire dalla conoscenza sul mondo o sul dominio. L’ontologia in tal caso è indipendente dai dati reali. Lo scopo dell’ontologia in tal caso è determinato dalla classe di domande che un esperto di dominio può porre. Dimensione di Governance delle ontologie La governance attiene a come le decisioni relative alla struttura ed al contenuto sono state prese ed include la specificazione dei criteri di qualità e di certificazione. Si potrebbe demandare alle organizzazioni professionali o di categoria (piuttosto che a validi ricercatori o ingegneri della conoscenza) la definizione in linguaggio naturale delle entità e delle relazioni semantiche intesa come uno sforzo per formalizzare i concetti. Ciò potrebbe far riferimento a legislazioni specifiche , regolamenti standard usati per le definizioni e permetterebbe di valutare formalmente la bontà dei risultati ottenuti dalle applicazioni Riferimenti • Arash Shaban-Nejad: tutorial on “Ontology: Foundation of Semantic Web”, 2004 • M. Gruninger, O. Bodenreider, F. Olken, L. Obrst, P. Yim: “Ontology, taxonomy, folksonomy: understanding the distinctions”, Applied Ontology journal, 3 (2008) pagg.191-200