Università degli Studi di Modena e Reggio Emilia Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant Laurea specialistica in Ingegneria Informatica Tesi di Laurea di: Fabrizio Orlandi Anno Accademico: 2007/2008 Attività progettuale • Svolta presso l’istituto di ricerca: DERI (Digital Enterprise Research Institute) “Il più importante centro di ricerca sul Web Semantico al mondo” • Situato a Galway in Irlanda • Più di 30 progetti di ricerca internazionali • Obiettivo: Estensione dell’ontologia del progetto SIOC (Semantically-Interlinked Online Communities) per poter interconnettere semanticamente i wiki distribuiti sul Web e separati tra loro tesi di laurea di: Fabrizio Orlandi 2 Cos’è il Web Semantico? • “Un’estensione del Web attuale” [Tim Berners-Lee et al.] • Obiettivo: fornire significato all’informazione sul Web rendendola interpretabile dai computer per una migliore cooperazione uomo-macchina • Comunemente identificato come Web 3.0 • Prevede di aggiungere metadati alle pagine Web basati su sottostanti schemi o ontologie (specificazione di una concettualizzazione) tesi di laurea di: Fabrizio Orlandi 3 SIOC project (Semantically-Interlinked Online Communities) Obiettivi: • • • • Interconnettere semanticamente le comunità online Descrivere contenuto e struttura di siti sociali Risolvere i problemi di interoperabilità del Social Web Ricercare e navigare informazioni prodotte dalle comunità online sociali in modi innovativi e più interessanti Ontologia adottata in più di 50 applicazioni Web e centinaia di siti http://sioc-project.org Pubblicata come W3C Member Submission (Agosto 2007) tesi di laurea di: Fabrizio Orlandi 4 FOAF + SSL (Per privacy e autenticazione) tesi di laurea di: Fabrizio Orlandi 5 Ontologia SIOC Il nucleo dell’ontologia, con classi e proprietà principali: tesi di laurea di: Fabrizio Orlandi 6 Wiki Semantici Combinano la capacità espressiva di: Web Semantico: •Processabile dalle macchine •Integrazione dei dati •Interrogazioni complesse Wiki: •Facili da usare e contribuire •Fortemente interconnessi •Collaborativi • Permettono agli utenti di annotare semanticamente, attraverso semplici interfacce, i contenuti creati all’interno del wiki • Consentono l’esecuzione di query complesse sui dati strutturati, quindi vanno oltre alla semplice ricerca di keyword • Facilitano la manutenzione del wiki (grazie alla propagazione degli update) • Possono essere usati anche come strumenti di Ontology Engineering tesi di laurea di: Fabrizio Orlandi 7 Wiki Semantici - ontologie Molti utilizzano una propria ontologia per definire la struttura del wiki Ad esempio: SweetWiki IkeWiki Semantic MediaWiki INRIA (FR) (Salzburg Research) (Wikimedia Foundation) Esistono ontologie specifiche utilizzabili per la modellazione dei wiki Ad esempio: WikiOnt e WIF (Wiki Interchange Format) Estensione dell’ontologia SIOC tesi di laurea di: Fabrizio Orlandi 8 Estensione di SIOC Caratteristiche fondamentali dei wiki esaminate: Multi-authoring: diversi utenti collaborano anche contemporaneamente Categorie: gli articoli dei wiki sono suddivisi e catalogati in gerarchie Social Tagging: aggiunta di tag ai contenuti delle pagine Discussioni: ad ogni pagina viene associato uno spazio di discussione tra gli utenti Backlinks: link entranti in una pagina Versioning: per ogni pagina viene mantenuta la storia delle versioni precedenti Modifiche all’ontologia SIOC: • Definita la classe sioct:Category come sottoclasse di skos:Concept • Aggiunta la proprietà sioc:has_discussion • Aggiunta la proprietà sioc:latest_version • Aggiunte due proprietà inverse transitive earlier_version e later_version • Definite sioc:previous/next_version sotto-proprietà di earlier/later_version tesi di laurea di: Fabrizio Orlandi 9 Applicazioni Create due applicazioni (una in Java e una in PHP) che esportano e traducono le informazioni strutturali di un qualsiasi wiki di tipo MediaWiki (es. Wikipedia) in dati RDF basati sul nuovo modello SIOC L’applicazione in PHP è stata sviluppata come webservice liberamente accessibile: http://ws.sioc-project.org/mediawiki/ tesi di laurea di: Fabrizio Orlandi 10 Browsing dei dati generati Una volta che vengono esportati e generati i dati RDF corrispondenti ad una pagina di un wiki, è possibile visualizzare i risultati utilizzando ad esempio Tabulator Il browsing è particolarmente efficace perché la modellazione è stata effettuata seguendo i principi del “Linked Data” Per questo motivo è possibile anche il crawling di un intero wiki semplicemente partendo da una singola pagina e seguendo i link rdfs:seeAlso tesi di laurea di: Fabrizio Orlandi 11 Query sui dati raccolti Circa 1GB di dati RDF sono stati raccolti esportando 3 wiki diversi utilizzando il webservice PHP e un crawler I dati estratti sono stati inseriti in un RDF Store con supporto per inferenza OWL (utilizzato Sesame + OWLIM) Sono state eseguite query SPARQL sul triple-store per testare le possibilità offerte dalla modellazione proposta Esempi di query inter-wiki: “Seleziona tutti gli utenti con stesso username” “Seleziona le pagine che appartengono alla stessa categoria” “Seleziona le coppie di utenti che collaborano su wiki diversi” tesi di laurea di: Fabrizio Orlandi 12 Conclusioni e Sviluppi Futuri • Il modello proposto rispetta appieno le aspettative, e permette di definire la struttura di un qualsiasi wiki • Permette inoltre l’interconnessione e lo scambio di informazioni tra wiki differenti e tra le rispettive comunità sociali • Articolo accettato al 4° Semantic Wiki workshop presso la conferenza ESWC (European Semantic Web Conference) 2009 a Creta, Grecia • Le applicazioni create applicano il modello ai wiki di tipo MediaWiki, in futuro ulteriori esportatori possono essere implementati per aumentare la diffusione e l’interoperabilità • Un ulteriore sviluppo può essere quello di fornire maggiore dettaglio sul contenuto di un articolo wiki, come nel caso dell’integrazione con il progetto DBPedia tesi di laurea di: Fabrizio Orlandi 13 Grazie per l’attenzione! tesi di laurea di: Fabrizio Orlandi 14