Università degli Studi di Modena e Reggio Emilia
Relatore:
Prof. Sonia Bergamaschi
Correlatore:
Alexandre Passant
Laurea specialistica in Ingegneria Informatica
Tesi di Laurea di:
Fabrizio Orlandi
Anno Accademico: 2007/2008
Attività progettuale
• Svolta presso l’istituto di ricerca:
DERI (Digital Enterprise Research Institute)
“Il più importante centro di ricerca sul Web Semantico al mondo”
• Situato a Galway in Irlanda
• Più di 30 progetti di ricerca internazionali
• Obiettivo:
Estensione dell’ontologia del progetto SIOC
(Semantically-Interlinked Online Communities) per poter
interconnettere semanticamente i wiki
distribuiti sul Web e separati tra loro
tesi di laurea di: Fabrizio Orlandi
2
Cos’è il Web Semantico?
• “Un’estensione del Web attuale” [Tim Berners-Lee et al.]
• Obiettivo: fornire significato all’informazione sul Web
rendendola interpretabile dai computer
per una migliore cooperazione uomo-macchina
• Comunemente identificato come Web 3.0
• Prevede di aggiungere metadati alle pagine Web basati su
sottostanti schemi o ontologie (specificazione di una
concettualizzazione)
tesi di laurea di: Fabrizio Orlandi
3
SIOC project
(Semantically-Interlinked Online Communities)
Obiettivi:
•
•
•
•
Interconnettere semanticamente le comunità online
Descrivere contenuto e struttura di siti sociali
Risolvere i problemi di interoperabilità del Social Web
Ricercare e navigare informazioni prodotte dalle comunità
online sociali in modi innovativi e più interessanti
Ontologia adottata in più di 50 applicazioni Web e centinaia di siti
http://sioc-project.org
Pubblicata come W3C Member Submission (Agosto 2007)
tesi di laurea di: Fabrizio Orlandi
4
FOAF + SSL
(Per privacy e autenticazione)
tesi di laurea di: Fabrizio Orlandi
5
Ontologia SIOC
Il nucleo dell’ontologia, con classi e proprietà principali:
tesi di laurea di: Fabrizio Orlandi
6
Wiki Semantici
Combinano la capacità espressiva di:
Web Semantico:
•Processabile dalle macchine
•Integrazione dei dati
•Interrogazioni complesse
Wiki:
•Facili da usare e contribuire
•Fortemente interconnessi
•Collaborativi
• Permettono agli utenti di annotare semanticamente, attraverso
semplici interfacce, i contenuti creati all’interno del wiki
• Consentono l’esecuzione di query complesse sui dati strutturati,
quindi vanno oltre alla semplice ricerca di keyword
• Facilitano la manutenzione del wiki (grazie alla propagazione degli update)
• Possono essere usati anche come strumenti di Ontology Engineering
tesi di laurea di: Fabrizio Orlandi
7
Wiki Semantici - ontologie
Molti utilizzano una propria ontologia per definire la struttura del wiki
Ad esempio:
SweetWiki
IkeWiki
Semantic MediaWiki
INRIA (FR)
(Salzburg Research)
(Wikimedia Foundation)
Esistono ontologie specifiche utilizzabili per la modellazione dei wiki
Ad esempio: WikiOnt e WIF (Wiki Interchange Format)
Estensione dell’ontologia SIOC
tesi di laurea di: Fabrizio Orlandi
8
Estensione di SIOC
Caratteristiche fondamentali dei wiki esaminate:
Multi-authoring: diversi utenti collaborano anche contemporaneamente
Categorie: gli articoli dei wiki sono suddivisi e catalogati in gerarchie
Social Tagging: aggiunta di tag ai contenuti delle pagine
Discussioni: ad ogni pagina viene associato uno spazio di discussione tra gli utenti
Backlinks: link entranti in una pagina
Versioning: per ogni pagina viene mantenuta la storia delle versioni precedenti
Modifiche all’ontologia SIOC:
• Definita la classe sioct:Category come sottoclasse di skos:Concept
• Aggiunta la proprietà sioc:has_discussion
• Aggiunta la proprietà sioc:latest_version
• Aggiunte due proprietà inverse transitive earlier_version e later_version
• Definite sioc:previous/next_version sotto-proprietà di earlier/later_version
tesi di laurea di: Fabrizio Orlandi
9
Applicazioni
Create due applicazioni (una in Java e una in PHP) che esportano e
traducono le informazioni strutturali di un qualsiasi wiki di tipo
MediaWiki (es. Wikipedia) in dati RDF basati sul nuovo modello SIOC
L’applicazione in PHP è stata sviluppata come webservice
liberamente accessibile: http://ws.sioc-project.org/mediawiki/
tesi di laurea di: Fabrizio Orlandi
10
Browsing dei dati generati
Una volta che vengono esportati e generati i dati RDF
corrispondenti ad una pagina di un wiki, è possibile visualizzare i
risultati utilizzando ad esempio Tabulator
Il browsing è particolarmente efficace perché la modellazione è
stata effettuata seguendo i principi del “Linked Data”
Per questo motivo è possibile anche il crawling di un intero wiki
semplicemente partendo da una singola pagina
e seguendo i link rdfs:seeAlso
tesi di laurea di: Fabrizio Orlandi
11
Query sui dati raccolti
Circa 1GB di dati RDF sono stati raccolti esportando 3 wiki diversi
utilizzando il webservice PHP e un crawler
I dati estratti sono stati inseriti in un RDF Store
con supporto per inferenza OWL (utilizzato Sesame + OWLIM)
Sono state eseguite query SPARQL sul triple-store per testare le
possibilità offerte dalla modellazione proposta
Esempi di query inter-wiki:
“Seleziona tutti gli utenti con stesso username”
“Seleziona le pagine che appartengono alla stessa categoria”
“Seleziona le coppie di utenti che collaborano su wiki diversi”
tesi di laurea di: Fabrizio Orlandi
12
Conclusioni e Sviluppi Futuri
• Il modello proposto rispetta appieno le aspettative, e permette di
definire la struttura di un qualsiasi wiki
• Permette inoltre l’interconnessione e lo scambio di informazioni tra
wiki differenti e tra le rispettive comunità sociali
• Articolo accettato al 4° Semantic Wiki workshop presso la conferenza
ESWC (European Semantic Web Conference) 2009 a Creta, Grecia
• Le applicazioni create applicano il modello ai wiki di tipo MediaWiki, in
futuro ulteriori esportatori possono essere implementati per
aumentare la diffusione e l’interoperabilità
• Un ulteriore sviluppo può essere quello di fornire maggiore dettaglio
sul contenuto di un articolo wiki, come nel caso dell’integrazione con il
progetto DBPedia
tesi di laurea di: Fabrizio Orlandi
13
Grazie per l’attenzione!
tesi di laurea di: Fabrizio Orlandi
14
Scarica

Estensione dell`ontologia SIOC - DBGroup