UNIVERSITA’ DEGLI STUDI DI MODENA E
REGGIO EMILIA
Facoltà di Ingegneria – Sede di Modena
Corso di Laurea in Ingegneria Informatica
Ontology dynamics for Semantic Web:
the MOMIS approach
Dinamica delle ontologie per il
Web Semantico: l’approccio di MOMIS
Relatore
Chiar. mo Prof. Sonia Bergamaschi
Tesi di Laurea di
Alain Fergnani
Correlatore
Dott. Ing. Francesco Guerra
Controrelatore
Chiar. mo Prof. Paolo Tiberio
Sommario
Il Web Semantico
Le ontologie
La dinamica delle ontologie
Il sistema MOMIS
L’inserimento di nuove sorgenti
Conclusioni
Martedì, 18 Febbraio 2003
Alain Fergnani
2
Il WWW oggi
La ricerca di
informazioni in rete…
Osservazioni
Grande quantità di informazioni
Conoscenze
di base nel selezionare le
Difficoltà
e conoscenza
informazioni interessanti
specifica del
dominio
Uso
di HTML non comprensibile dai
calcolatori
(interpretazione)
clic
k
Martedì, 18 Febbraio 2003
Alain Fergnani
3
Il WWW domani
La ricerca di
informazioni in rete…
annotazione
Ontologia
(interpretazione)
annotazione
(istruzioni)
AGENTE
(risultati)
Il Web Semantico
Martedì, 18 Febbraio 2003
Alain Fergnani
4
Il Web Semantico
“The Semantic Web is an extension of the current web in
which information is given well-defined meaning, better
enabling computers and people to work in cooperation.”
“The Semantic Web will bring structure to the meaningful
content of Web pages, creating an environment where
software agents, roaming from page to page, can readily
carry out sophisticated tasks for users.”
[Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web,
Scientific American, May 2001]
Elementi chiave:
– Rappresentazione della conoscenza
– Agenti
– Ontologie
Martedì, 18 Febbraio 2003
Alain Fergnani
5
Il Web Semantico
Agenti
– Sono componenti software con le seguenti proprietà:
• autonomia
• reattività
• pro-attività
• abilità sociali
[M. Wooldridge and N.R. Jennings. Intelligent agents: Theories and
practice. The Knowledge Engineering Review.]
– Raccolgono contenuti dal Web da diverse sorgenti
– Elaborano informazioni
– Scambiano i risultati con altri programmi
Martedì, 18 Febbraio 2003
Alain Fergnani
6
Il Web Semantico
Ontologie
“An ontology is an explicit specification of a
conceptualization.” [Tom Gruber]
Idea di fondo delle ontologie:
–
–
–
–
–
descrizione di un particolare dominio,
da un certo punto di vista,
descrizione esplicita,
costruzione di un vocabolario per quel dominio,
un gruppo usa il vocabolario per accordarsi sul
significato dei termini usati,
– fondamentale per la comunicazione.
Martedì, 18 Febbraio 2003
Alain Fergnani
7
Dinamica delle Ontologie
Le ontologie evolvono durante il loro ciclo di vita
a causa di:
– cambiamenti nel dominio
– cambiamenti nella concettualizzazione
condivisa
– cambiamenti nell’espressione, specificazione
– nuovi requisiti
Martedì, 18 Febbraio 2003
Alain Fergnani
8
Strumenti per la gestione delle Ontologie
Strumenti per lo sviluppo
–
–
–
–
OILEd
OntoEdit
Protégé-2000
WebODE
Strumenti per l’integrazione
e la fusione
–
–
–
–
Chimaera
PROMPT
ODEMerge
FCA-Merge
Osservazioni
– Forniscono soluzioni parziali
– Hanno approcci diversi
– Hanno diverse funzionalità
– Hanno differenti capacità di aiutare l’utente
Martedì, 18 Febbraio 2003
Alain Fergnani
9
MOMIS
MOMIS Mediator envirOnment for Multiple Information Sources
è un sistema intelligente per l’integrazione di dati
eterogenei e distribuiti.
Principali caratteristiche:
–
–
–
–
–
–
“Approccio semantico” all’integrazione
Common Thesaurus
Global Virtual View (GVV)
Interrogazioni sulla Global Virtual View
Un modello dei dati comune – ODMI3
Un linguaggio per descrivere gli schemi delle sorgenti
ODLI3 (Object Definition Language)
http://www.dbgroup.unimo.it/Momis
Martedì, 18 Febbraio 2003
Alain Fergnani
10
MOMIS – Architettura
Integration
Integration
Designer
Designer
SI-Designer
• •SLIM
SLIMWordNet
WordNetinteraction
interaction
• •SIM
ODB-Tools
SIM ODB-Toolsvalidation
validation
• •ARTEMIS
Clustering
ARTEMIS Clustering
• •TUNIM
TUNIMMap.
Map.table
tabletuning
tuning
WordNet
WordNet
Global Schema Builder
creates
ODB-Tools
ODB-Tools
Global
GlobalSchema
Schema
User
User
Application
METADATA
METADATAREPOSITORY
REPOSITORY
USER level
QueryManager
QueryManager
Service level
MOMIS mediator
legenda
User interaction
CORBA interaction
CORBAObject
GUI
User
Software tools
Martedì, 18 Febbraio 2003
Wrapper
Wrapper
Wrapper
Wrapper
Wrapper
Wrapper
Wrapper
Wrapper
Relational
Relational
Source
Source
XML
XML
Source
Source
Object
Object
Source
Source
generic
generic
Source
Source
Data level
Alain Fergnani
11
Processo di integrazione
XML
<interface>
<name=“student”>
RDB
Common Thesaurus
– relazioni intra/inter schema
– relazioni lessicali
(annotazione schemi sorgenti)
Schemi
Common
Sorgenti – relazioni inserite
Thesaurus dall’utente
ODLI3 – relazioni inferite
Tipi di rel.: SYN, NT, BT, RT.
OODB
Calcolo
Cluster
Es: CS.Course SYN UNI.Section
Global Virtual View GVV
Mapping tra
Schema Globale/
Schemi Locali
GloblalClass1
GloblalClass2
GloblalClass3
Martedì, 18 Febbraio 2003
Alain Fergnani
12
MOMIS e la dinamica
La gestione della dinamica consiste nella capacità
di far fronte a:
– inserimento di nuove sorgenti,
– aggiornamento o
– cancellazione di sorgenti già integrate.
MOMIS non è in grado di gestire la dinamica.
Nella tesi si è affrontato il problema
dell’inserimento di nuove sorgenti nel sistema.
Martedì, 18 Febbraio 2003
Alain Fergnani
13
Annotazione della GVV
La GVV deve essere annotata per aumentarne il
potere espressivo.
La fase di annotazione assegna agli elementi
dello schema globale (classi e attributi) un nome
e almeno un significato.
Sono stati individuati i casi che si possono
verificare per rendere il più possibile automatico
il processo.
L’annotazione viene eseguita rispetto al DB
lessicale WordNet (www.cogsci.princeton.edu/~wn/).
Martedì, 18 Febbraio 2003
Alain Fergnani
14
Annotazione della GVV
Le classi locali annotate
CS.Essay=<essay, {essay#1}>
CS.Publication=<publication,{publication#2}>
UNI.Article=<article,{article#1}>
Le relazioni nel CT
UNI.Article
NT
CS.Publication
CS.Essay
NT
CS.Publication
La classe globale annotata
La classe globale
GlobalClass1
CS.Essay
CS.Publication
UNI.Article
significati
GlobalClass1 = <publication, {essay#1,publication#2, article#1}>
nome
essay#1 = an analytic or interpretive literary composition
publication#2 = a copy of a printed work offered for distribution
article#1 = nonfictional prose forming an independent part of a publication
forma basesenso
Martedì, 18 Febbraio 2003
Alain Fergnani
15
Nuovo processo di integrazione
GVV
annotata
XML
RDB
Nuova
Common Thesaurus
– relazioni intra/inter schema
(solo nuove sorgenti)
Schemi – relazioni lessicali
Common
sorgenti annotate)
Sorgenti (GVV e nuove
Thesaurus
3
ODLI – relazioni inserite dall’utente
– relazioni inferite
Calcolo
Cluster
OODB Nuova
Nuova GVV
Mapping tra
Schema Globale/
Schemi Locali
GloblalClass1
GloblalClass2
GloblalClass3
Martedì, 18 Febbraio 2003
Alain Fergnani
16
Vantaggi – Svantaggi
Vantaggi
– Il processo non riparte da scratch
– Il processo sfrutta le conoscenze delle precedenti
sessioni di integrazione
– Riduzione dei tempi di integrazione
– Riduzione degli effetti collaterali, preservando il più
possibile lo schema precedente
– La metodologia di MOMIS viene conservata
Svantaggi
–
–
–
–
La GVV deve essere annotata
Gli errori delle precedenti sessioni si possono propagare
Possibile scarsa rappresentatività del dominio integrato
Riduzione dell’espressività dopo diverse sessioni di
integrazione
Martedì, 18 Febbraio 2003
Alain Fergnani
17
Conclusioni
Difficoltà nell’implementazione del Web Semantico
La comunità scientifica non ha adottato una linea
comune (linguaggi, strumenti, progetti)
Difficoltà nella gestione della dinamica delle ontologie
Estensione di MOMIS per la gestione dell’inserimento
di nuove sorgenti
Sviluppo del codice per l’estensione del sistema
Futura estensione della gestione ai casi di modifica e
cancellazione di sorgenti già integrate
Integrazione del lavoro svolto nel progetto SEWASIE
Martedì, 18 Febbraio 2003
Alain Fergnani
18
SEWASIE
SEWASIE (Semantic Webs and AgentS in
Integrated Economies) è un progetto finanziato dalla
Commissione Europea (Maggio 2002/Aprile 2005).
Goal: progettare e implementare un motore di
ricerca avanzato basato sulla semantica.
I partecipanti:
•
•
•
•
•
•
•
•
Università degli Studi di Modena e Reggio Emilia (ITALY)
CNA SERVIZI Modena s.c.a.r.l. (ITALY)
Università degli Studi di Roma “La Sapienza” (ITALY)
Rheinisch Westfaelische Technische Hochschule Aachen (GERMANY)
Libera Università di Bolzano (ITALY)
Thinking Networks AG (GERMANY)
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung
eingetragener Verein (GERMANY)
IBM Italia SPA (ITALY)
Il sito web: http://www.sewasie.org/
Martedì, 18 Febbraio 2003
Alain Fergnani
19