Tecnologie di Internet
Nascita di XML
Nascita di XML
 I limiti del Web
 I limiti di HTML
Dott. Nicola Dragoni
Tecnologie di Internet
Nascita di XML
In principio era HTML...
HTML nasce come linguaggio di presentazione di dati
ipertestuali, adatto dunque a gestire:
 testo
 immagini
 audio
 filmati
 animazioni
Dott. Nicola Dragoni
2
Tecnologie di Internet
Nascita di XML
Ma gli scenari evolvono velocemente...
 Dati sempre più complessi cominciano ad essere
scambiati attraverso la rete (ad esempio per l’ecommerce).
 Per via dell’importanza economica di alcuni di
questi dati, si sente la necessità di strumenti di
validazione.
 Sempre più spesso i dati vengono scambiati e
processati automaticamente da agenti software.
Devono quindi essere “comprensibili” anche per le
applicazioni software.
Dott. Nicola Dragoni
3
Tecnologie di Internet
Nascita di XML
Il successo del WEB
Il World Wide Web rappresenta oggi il più grande contenitore di
informazione mai assemblata dall’uomo. Contiene infatti documenti
e risorse multimediali riguardanti qualsiasi dominio immaginabile e
tutta questa informazione è disponibile istantaneamente a qualsiasi
utente provvisto di una connessione Internet.
Il successo del Web è dovuto al suo essere decentralizzato e
universale: le pagine web risiedono su computer sparsi in tutto il
mondo e ogni documento può puntare a qualsiasi altro documento.
Un utente, in qualsiasi parte del mondo, può aggiungere
informazione al Web contribuendo così alla sua crescita, che in
pochi anni è diventata esponenziale.
Dott. Nicola Dragoni
4
Tecnologie di Internet
Nascita di XML
I limiti del WEB
Ricerca di un documento
Questa crescita incontrollata del Web ha determinato una reale
difficoltà a trovare informazione utile.
Sebbene le directories (ad es. quelle di Yahoo) e i motori di ricerca
(ad es. Google e Altavista) possono aiutare a reperire informazione,
questi meccanismi hanno ancora molti limiti.
Il più delle volte trovare il documento giusto è come cercare un ago
in un pagliaio.
Dott. Nicola Dragoni
5
Tecnologie di Internet
Nascita di XML
I limiti del WEB
Altri servizi web “più complessi”
I limiti del Web sono ancora più evidenti quando un utente vuole
eseguire qualche operazione più complessa della ricerca di un
documento.
Esempio: un utente potrebbe voler pianificare e prenotare una
vacanza o riservare posti in un ristorante o in un cinema.
Per ottenere questi servizi l’utente è spesso costretto a visitare molte
pagine, analizzarne il contenuto e ragionarci sopra in qualche modo.
Attualmente tali capacità sono sconosciute a qualsiasi motore di
ricerca o assistente virtuale.
Dott. Nicola Dragoni
6
Tecnologie di Internet
Nascita di XML
Il Limite del WEB
Il principale ostacolo e limite del Web consiste nel fatto che non è
stato progettato per essere processato da computer, ma solo
dall’uomo.
Il Web si presenta oggi come una grande rete di informazione, ma
poiché l’informazione diventi conoscenza o informazione utile deve
essere analizzata semanticamente. Purtroppo la tecnologia attuale
non permette alcun tipo di analisi semantica.
Quest’ultima è affidata unicamente all’utente che, dopo essere stato
parzialmente aiutato da qualche motore di ricerca o agente software,
deve distinguere l’informazione utile da quella inutile.
Dott. Nicola Dragoni
7
Tecnologie di Internet
Nascita di XML
Il Limite del WEB: HTML
Tale limite è dovuto al fatto che l’informazione sul Web non è
strutturata, ma viene espressa ad un unico livello tramite l’HTML.
L’HTML non è altro che un linguaggio di formattazione e
visualizzazione di testo che, partendo da un testo qualsiasi, definisce
per ogni elemento la sua dimensione, forma, colore, posizione,
ecc….
In questo modo una pagina Web non ha alcuna informazione che
possa aiutare un’entità software a determinare il significato del testo
e quindi non può essere processata intelligentemente da essa.
Dott. Nicola Dragoni
8
Tecnologie di Internet
Nascita di XML
I limiti di HTML
 Descrive come presentare dati, non l’informazione in
essi contenuta.
 Non è estensibile, ma rigido: non possono essere
definiti nuovi tag e attributi.
 Non è prevista alcuna validazione (semantica) dei dati.
 L’informazione non è strutturata, ma viene espressa ad
un unico livello.
Dott. Nicola Dragoni
9
Tecnologie di Internet
Nascita di XML
Un semplice esempio
<html>
<table border=“1pt”><tr>
<th>Inter</th>
<th>Juventus</th>
<th>3-0</th>
</tr> <tr>
<th>Milan</th>
<th>Roma</th>
<th>1-1</th>
</tr></table>
</html>
Query: seleziona l’elenco delle
partite.
Algoritmo:
Per ogni tag <tr>
ritorna i primi due <th>
Inter Juventus
Milan Roma
Dott. Nicola Dragoni
10
Tecnologie di Internet
Nascita di XML
Un semplice esempio (cont.)
<html>
<table border=“1pt”><tr>
<th>Trefoloni</th>
<th>Milano</th>
<th>Inter</th>
<th>Juventus</th>
<th>0-3</th>
</tr></table>
</html>
Query: seleziona l’elenco delle
partite.
Algoritmo:
Per ogni tag <tr>
ritorna i primi due <th>
Trefoloni Milano
Dott. Nicola Dragoni
11
Tecnologie di Internet
Nascita di XML
Quale soluzione adottare per
risolvere i limiti del Web?
Serve qualcosa di nuovo!
Una nuova tecnologia per il Web!
Dott. Nicola Dragoni
12
Tecnologie di Internet
Nascita di XML
Il Web Semantico
Recentemente Tim Berners-Lee, l’inventore del Web, ha proposto
di aumentare il Web attuale con linguaggi che possano rendere
esplicita l’informazione contenuta nelle pagine, rendendo così il
Web “semantico”.
Non si tratta di definire un nuovo Web, ma di estendere quello già
presente facendo in modo che l’informazione sia processabile dalle
macchine come dall’uomo.
Dott. Nicola Dragoni
13
Tecnologie di Internet
Nascita di XML
Nuove tecnologie per il Web
Attualmente la comunità scientifica sta studiando nuove tecnologie
per poter realizzare il Web Semantico. Sostanzialmente l’architettura
del nuovo Web si baserà su tre livelli fondamentali, ben distinti tra
loro:
Ontologie
(vocabolari)
Metadati
(informazioni sui dati e relazioni che intercorrono fra essi)
Dati
Dott. Nicola Dragoni
14
Tecnologie di Internet
Nascita di XML
Il semplice esempio risolto
<giornata>
<partita>
<arbitro>Trefoloni</arbitro>
<luogo>Milano</luogo>
<altra_informazione/>
<squadra>Inter</squadra>
<squadra>Juventus</squadra>
</partita>
</giornata>
Query: seleziona l’elenco delle
partite.
Algoritmo:
Per ogni tag <partita>
ritorna i primi due <squadra>
Inter Juventus
Dott. Nicola Dragoni
15
Tecnologie di Internet
Nascita di XML
Prossima lezione:
Fondamenti di XML
Dott. Nicola Dragoni
16
Scarica

Corso Integrativo XML 2