UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI LETTERE E FILOSOFIA, SCIENZE POLITICHE, GIURISPRUDENZA, INGEGNERIA, ECONOMIA Corso di laurea interfacoltà in Comunicazione, Innovazione, Multimedialità IL WEB SEMANTICO TRATTAZIONE BREVE SUL FUTURO DEL WEB Relatore: Prof. Marco Porta Correlatore: Prof. Claudio Bellinzona Tesi di laurea di Alessandra Sofia Valentini ANNO ACCADEMICO 2012-2013 ANALISI DELLA SITUAZIONE ATTUALE DEL WEB Contenuti online veicolati tramite linguaggio naturale Problema: fruizione limitata alla capacità interpretativa dell’utente umano VERSO IL WEB SEMANTICO Obiettivo: automatizzare le ricerche sul Web Come? Attraverso un nuovo metodo di marcatura dei documenti (metadati) unito a regole di deduzione logica VERSO IL WEB SEMANTICO METADATI: DATI SUI DATI Obiettivo: trasformare il Web da “magazzino” di informazioni a “magazzino” di significati INFORMAZIONI SIGNIFICATI LA LOGICA DEL WEB SEMANTICO Definire significati e creare collegamenti tra significati (“WEB OF LINKED DATA”) I “MATTONI” DEL WEB SEMANTICO PRIMO BLOCCO 1) UNICODE: sistema di codifica tramite “codepoint” 2) URI (Uniform Resource Identifier): stringhe identificative di qualsiasi risorsa sul Web 3) XML (eXtensible Markup Language): metalinguaggio, 1998 Obiettivo: dare ai dati contenuti nelle pagine web una struttura, così da: - ridurre l’ambiguità del testo libero; - garantire l’interoperabilità sintattica e strutturale. SECONDO BLOCCO 1) RDF (Resource Description Framework): 1999 Obiettivo: garantire l’interoperabilità semantica Funzionamento: fare, su ogni risorsa, delle affermazioni che la descrivano SECONDO BLOCCO Costruzione di un’affermazione AFFERMAZIONE: soggetto predicato oggetto SECONDO BLOCCO Esempio di grafo RDF http://www.esempio.org/pagina.html http://www.esempio.org/condizioni/data-creazione http://purl.org/dc/elementi/1.1/creatore 16 agosto 1999 http://www.esempio.org/staffid/85740 http://purl.org/dc/elementi/1.1/lingua It SECONDO BLOCCO 2) RDFS (RDF Schema): sintassi di serializzazione di RDF rdfs:subClassOf SECONDO BLOCCO 3) SPARQL (SPARQL Protocol and RDF Query Language): linguaggio di query per recuperare dal Web le descrizioni relative ad una risorsa RDF TERZO BLOCCO 1) OWL (Web Ontology Language): linguaggio ontologico*, 2007 Obiettivo: arricchire la semantica dei livelli precedenti *Ontologia: rappresentazione della porzione di mondo che si intende modellare in un programma. TERZO BLOCCO La proprietà owl:inverseOf owl:inverseOf 1 ex:isAuthorOf owl:inverseOf ex:hasAuthor. 2 ex:TheLordOfTheRings ex:hasAuthor ex:J.R.R. Tolkien. 3 ex:J.R.R. Tolkien ex:isAuthorOf ex:TheLordOfTheRings. TERZO BLOCCO La proprietà owl:cardinality owl:cardinality MADRE = DONNA CON ALMENO UN FIGLIO (cardinalità della proprietà “hasChild” posta ≥ 1) QUARTO BLOCCO 1) Livello Rules: livello delle regole di inferenza logica Obiettivo: potenziare l’espressività di OWL Il livello delle regole comprende vari linguaggi: tra questi, FOL QUARTO BLOCCO Livello Rules (FOL) FOL (First Order Logic): linguaggio logico che abilita forme di deduzione automatica Caravaggio è un pittore Painter (Caravaggio) Tutti i pittori sono artisti ∀x [Painter (Caravaggio)] quindi Caravaggio è un artista Artist (Caravaggio) QUINTO BLOCCO 1) Trust: consente all’utente di discriminare i dati reperibili sul Web in base alla loro affidabilità 2) Proof: esplicita all’utente le inferenze fatte dalla macchina per derivare il risultato mostrato QUINTO BLOCCO 3) Crittografia: tecniche di validazione della firma digitale Obiettivo: determinare l’affidabilità dell’informazione in base alla fonte da cui promana OSTACOLI ALL’AFFERMAZIONE DEL WEB SEMANTICO Costi di costruzione e manutenzione elevati SEGNALI POSITIVI INIZIATIVA LOD (Linking Open Data): 2007 Obiettivo: unire le esperienze isolate di condivisione di dati sul Web tramite tecnologie semantiche SEGNALI POSITIVI Introduzione della funzione KNOWLEDGE GRAPH di Google: 2012 Obiettivo: raffinare le capacità di ricerca del motore per offrire agli utenti risultati più puntuali e conformi alle interrogazioni CONCLUSIONI LOD e Knowledge Graph testimoniano un crescente interesse verso la ricerca sul Web Semantico Con un maggiore impegno in questa direzione, il Web Semantico potrebbe diventare il Web del futuro