Università
della
Svizzera
italiana
Roma, 24 novembre 2005
Il web semantico: mito o realtà?
Marco Colombetti
Politecnico di Milano
e Università della Svizzera italiana
Università
della
Svizzera
italiana
1
Il computer oggi
Fasi storiche dell’uso del computer:
come strumento di calcolo scientifico e tecnico
come strumento per la gestione di dati e archivi
come strumento per la comunicazione e l’interazione
umana
Il passaggio alla terza fase è essenzialmente dovuto alla
diffusione di internet e in particolare al web
Università
della
Svizzera
italiana
2
Il web
Il web non è un insieme di documenti, è un insieme di luoghi
disposti in un territorio virtuale
I luoghi del web sono punti d’ingresso per l’interazione fra
individui e individui, fra individui e organizzazioni, fra
organizzazioni e organizzazioni
Interazione:
scambio di informazioni e documenti
accesso a servizi:
commercio elettronico
amministrazione pubblica
formazione
salute
...
Università
della
Svizzera
italiana
3
Muoversi nel web
I problemi fondamentali del web:
trovare i luoghi pertinenti
sfruttare le informazioni e i servizi disponibili
I motori di ricerca sono essenziali per muoversi nel web ma
stanno diventando rapidamente insufficienti:
di solito troppi risultati, per la maggior parte inutili
a volte nessun risultato
dipendenza del risultato dal vocabolario (ricerca per parole
o sequenze di parole)
localizzazione di una pagina per volta
Università
della
Svizzera
italiana
4
Un esempio
Una biblioteca intende acquistare un lotto di volumi sul web:
identificare i servizi di vendita
identificare l’offerta migliore
eseguire l’acquisto
monitorare il processo di evasione dell’ordine identificando
eventuali problemi
Ipotesi di soluzione:
un agente software che accede direttamente alle
informazioni e ai servizi disponibili sul web
Problema:
attualmente le informazioni e i servizi sul web sono pensati
per l’accesso umano
Università
della
Svizzera
italiana
5
Il web semantico
La soluzione:
il web semantico
Che cos’è il web semantico?
“A new form of Web content that is meaningful to
computers”
Tim Berners-Lee, James Hendler, Ora Lassila: The Semantic Web,
Scientific American, Maggio 2001
Ma che cosa significa?
consentire la localizzazione delle informazioni e dei servizi
per concetti anziché per parole chiave
consentire la completa automazione dei servizi
Università
della
Svizzera
italiana
6
I problemi da risolvere
Nel web semantico le informazioni e i servizi sono
direttamente accessibili alle applicazioni software
Problemi:
definire formati standard per assicurare l’interoperabilità
delle applicazioni
possibilità di eseguire ragionamenti deduttivi in modo
completamente automatico a partire dalle informazioni
disponibili
Università
della
Svizzera
italiana
7
Formati standard
Superare le limitazioni di HTML
Alcuni standard per il web semantico sviluppati e sostenuti dal
W3C (World Wide Web Consortium, http://www.w3.org):
OWL
Web Ontology Language
RDF
Resource Description Framework
XML
Extensible Markup Language
Università
della
Svizzera
italiana
8
Le deduzioni automatiche
L’utilizzo del web semantico richiede la capacità di dedurre
automaticamente nuovi dati
Esempi:
cerco informazioni sui marsupiali
il motore di ricerca semantico localizza una foto del lupo
della tasmania in una pagina dove la parola ‘marsupiale’
non compare
voglio acquistare un vaso cinese
il motore di ricerca semantico localizza tre aste
elettroniche che trattano vasi cinesi e due spedizionieri
specializzati nel trasporto di oggetti fragili
Università
della
Svizzera
italiana
9
Logica descrittiva
I sistemi di ragionamento automatico si basano sulle tecniche
sviluppate nell’ambito della logica formale e in particolare della
logica descrittiva
La logica descrittiva consente di:
definire concetti e relazioni logiche fra concetti
gestire dati espressi nei termini dei concetti e delle relazioni
logiche predefinite
rispondere a interrogazioni sulla base di ragionamenti
deduttivi
L’uso di una logica descrittiva garantisce che tutte le
interrogazioni poste a un ragionatore automatico ricevano
risposta in tempo finito
Università
della
Svizzera
italiana
10
Ontologie
La definizione formale di un insieme di concetti con le loro
relazioni logiche è chiamata ontologia
I linguaggi RDF e OWL (nelle versioni Lite, DL e Full)
consentono di definire ontologie per il web semantico
Sono disponibili strumenti software per:
l’utilizzo di ontologie RDF o OWL da parte di applicazioni
software (ad es. Jena)
la definizione e l’aggiornamento di ontologie RDF o OWL
(ad es. Protégé)
l’esecuzione automatica di ragionamenti deduttivi in OWL
DL (ad es. Racer)
Università
della
Svizzera
italiana
11
Un esempio OWL DL: concetti e relazioni
Persone e sesso:
il sesso può essere ‘femmina’ o ‘maschio’
SESSO ´ {f,m}
il sesso si attribuisce alle persone
Sesso: PERSONA SESSO
ogni persona ha esattamente un sesso
PERSONA v =1Sesso
una donna è una persona di sesso femminile
DONNA v 9Sesso.{f}
un uomo è una persona di sesso maschile
UOMO v 9Sesso.{m}
Università
della
Svizzera
italiana
12
Un esempio OWL DL: concetti e relazioni
Stato civile:
a ogni persona si può associare una persona come coniuge
Coniuge: PERSONA PERSONA
la relazione coniugale è simmetrica
Coniuge– v Coniuge
ogni persona ha al più un coniuge (per volta...)
PERSONA v ·1Coniuge
l’eventuale coniuge è una persona dell’altro sesso
DONNA v 8Coniuge.UOMO
UOMO v 8Coniuge.DONNA
un celibe è una persona priva di coniuge
CELIBE v PERSONA u :9Coniuge
...
Università
della
Svizzera
italiana
13
Un esempio OWL DL: dati e deduzioni
Dati:
P0036 è
coniugato con P0145
Coniuge(P0036,P0145)
P0036 è
una donna
DONNA(P0036)
Alcune deduzioni automatiche possibili:
P0036 è
una persona
PERSONA(P0036)
P0036 è
di sesso femminile
Sesso(P0036,f)
P0145 è
una persona
PERSONA(P0145)
P0145 è
un uomo
UOMO(P0036)
P0145 è
di sesso maschile
Sesso(P0145,m)
P0145 è
coniugato con P0036
Coniuge(P0145,P0036)
P0036 e P0145
...
non sono celibi
:CELIBE(P0036)
:CELIBE(P0145)
Università
della
Svizzera
italiana
14
Limiti del web semantico
Come ogni tecnologia, anche il web semantico ha i suoi limiti
Ecco alcuni fatti da non scordare:
i computer non capiscono i concetti che manipolano: si
limitano ad applicare ciecamente le definizioni
i concetti umani hanno sfumature che è praticamente
impossibile tradurre in definizioni formali
anche se è garantita la conclusione dei ragionamenti in
tempo finito, a volte possono essere necessarie ingenti
risorse di calcolo
gli attuali linguaggi per definire ontologie non consentono di
dire tutto ciò che si vuole, e alcuni limiti espressivi della
logica descrittiva non potranno essere superati
Università
della
Svizzera
italiana
15
Conclusioni
Con tutti i loro limiti, le tecnologie del web semantico sono
potenti e potenzialmente utilissime
Ci sono attualmente quasi tutte le condizioni per l’adozione di
queste tecnologie da parte delle imprese e delle
amministrazioni pubbliche:
le tecnologie sono mature
sono disponibili gli strumenti necessari a costi accessibili
sussiste una forte esigenza socio-economica di realizzare i
servizi resi possibili dal web semantico
Tuttavia, è ancora insufficiente la diffusione delle competenze
tecniche necessarie
Università
della
Svizzera
italiana
16
Per saperne di più
T. Berners-Lee, J. Hendler, O. Lassila. The semantic web,
Scientific American, Maggio 2001
Reperibile dal sito del W3C, www.w3.org, link “Semantic Web”
G. Antoniou, F. Van Harmelen. A semantic web primer, MIT
Press, Cambridge, MA.
Materiale dal sito del corso di Ingegneria della conoscenza del
Politecnico di Milano:
http://www.elet.polimi.it/upload/colombet/IC_2005/index.html