Tecnologie di Internet Nascita di XML Nascita di XML I limiti del Web I limiti di HTML Dott. Nicola Dragoni Tecnologie di Internet Nascita di XML In principio era HTML... HTML nasce come linguaggio di presentazione di dati ipertestuali, adatto dunque a gestire: testo immagini audio filmati animazioni Dott. Nicola Dragoni 2 Tecnologie di Internet Nascita di XML Ma gli scenari evolvono velocemente... Dati sempre più complessi cominciano ad essere scambiati attraverso la rete (ad esempio per l’ecommerce). Per via dell’importanza economica di alcuni di questi dati, si sente la necessità di strumenti di validazione. Sempre più spesso i dati vengono scambiati e processati automaticamente da agenti software. Devono quindi essere “comprensibili” anche per le applicazioni software. Dott. Nicola Dragoni 3 Tecnologie di Internet Nascita di XML Il successo del WEB Il World Wide Web rappresenta oggi il più grande contenitore di informazione mai assemblata dall’uomo. Contiene infatti documenti e risorse multimediali riguardanti qualsiasi dominio immaginabile e tutta questa informazione è disponibile istantaneamente a qualsiasi utente provvisto di una connessione Internet. Il successo del Web è dovuto al suo essere decentralizzato e universale: le pagine web risiedono su computer sparsi in tutto il mondo e ogni documento può puntare a qualsiasi altro documento. Un utente, in qualsiasi parte del mondo, può aggiungere informazione al Web contribuendo così alla sua crescita, che in pochi anni è diventata esponenziale. Dott. Nicola Dragoni 4 Tecnologie di Internet Nascita di XML I limiti del WEB Ricerca di un documento Questa crescita incontrollata del Web ha determinato una reale difficoltà a trovare informazione utile. Sebbene le directories (ad es. quelle di Yahoo) e i motori di ricerca (ad es. Google e Altavista) possono aiutare a reperire informazione, questi meccanismi hanno ancora molti limiti. Il più delle volte trovare il documento giusto è come cercare un ago in un pagliaio. Dott. Nicola Dragoni 5 Tecnologie di Internet Nascita di XML I limiti del WEB Altri servizi web “più complessi” I limiti del Web sono ancora più evidenti quando un utente vuole eseguire qualche operazione più complessa della ricerca di un documento. Esempio: un utente potrebbe voler pianificare e prenotare una vacanza o riservare posti in un ristorante o in un cinema. Per ottenere questi servizi l’utente è spesso costretto a visitare molte pagine, analizzarne il contenuto e ragionarci sopra in qualche modo. Attualmente tali capacità sono sconosciute a qualsiasi motore di ricerca o assistente virtuale. Dott. Nicola Dragoni 6 Tecnologie di Internet Nascita di XML Il Limite del WEB Il principale ostacolo e limite del Web consiste nel fatto che non è stato progettato per essere processato da computer, ma solo dall’uomo. Il Web si presenta oggi come una grande rete di informazione, ma poiché l’informazione diventi conoscenza o informazione utile deve essere analizzata semanticamente. Purtroppo la tecnologia attuale non permette alcun tipo di analisi semantica. Quest’ultima è affidata unicamente all’utente che, dopo essere stato parzialmente aiutato da qualche motore di ricerca o agente software, deve distinguere l’informazione utile da quella inutile. Dott. Nicola Dragoni 7 Tecnologie di Internet Nascita di XML Il Limite del WEB: HTML Tale limite è dovuto al fatto che l’informazione sul Web non è strutturata, ma viene espressa ad un unico livello tramite l’HTML. L’HTML non è altro che un linguaggio di formattazione e visualizzazione di testo che, partendo da un testo qualsiasi, definisce per ogni elemento la sua dimensione, forma, colore, posizione, ecc…. In questo modo una pagina Web non ha alcuna informazione che possa aiutare un’entità software a determinare il significato del testo e quindi non può essere processata intelligentemente da essa. Dott. Nicola Dragoni 8 Tecnologie di Internet Nascita di XML I limiti di HTML Descrive come presentare dati, non l’informazione in essi contenuta. Non è estensibile, ma rigido: non possono essere definiti nuovi tag e attributi. Non è prevista alcuna validazione (semantica) dei dati. L’informazione non è strutturata, ma viene espressa ad un unico livello. Dott. Nicola Dragoni 9 Tecnologie di Internet Nascita di XML Un semplice esempio <html> <table border=“1pt”><tr> <th>Inter</th> <th>Juventus</th> <th>3-0</th> </tr> <tr> <th>Milan</th> <th>Roma</th> <th>1-1</th> </tr></table> </html> Query: seleziona l’elenco delle partite. Algoritmo: Per ogni tag <tr> ritorna i primi due <th> Inter Juventus Milan Roma Dott. Nicola Dragoni 10 Tecnologie di Internet Nascita di XML Un semplice esempio (cont.) <html> <table border=“1pt”><tr> <th>Trefoloni</th> <th>Milano</th> <th>Inter</th> <th>Juventus</th> <th>0-3</th> </tr></table> </html> Query: seleziona l’elenco delle partite. Algoritmo: Per ogni tag <tr> ritorna i primi due <th> Trefoloni Milano Dott. Nicola Dragoni 11 Tecnologie di Internet Nascita di XML Quale soluzione adottare per risolvere i limiti del Web? Serve qualcosa di nuovo! Una nuova tecnologia per il Web! Dott. Nicola Dragoni 12 Tecnologie di Internet Nascita di XML Il Web Semantico Recentemente Tim Berners-Lee, l’inventore del Web, ha proposto di aumentare il Web attuale con linguaggi che possano rendere esplicita l’informazione contenuta nelle pagine, rendendo così il Web “semantico”. Non si tratta di definire un nuovo Web, ma di estendere quello già presente facendo in modo che l’informazione sia processabile dalle macchine come dall’uomo. Dott. Nicola Dragoni 13 Tecnologie di Internet Nascita di XML Nuove tecnologie per il Web Attualmente la comunità scientifica sta studiando nuove tecnologie per poter realizzare il Web Semantico. Sostanzialmente l’architettura del nuovo Web si baserà su tre livelli fondamentali, ben distinti tra loro: Ontologie (vocabolari) Metadati (informazioni sui dati e relazioni che intercorrono fra essi) Dati Dott. Nicola Dragoni 14 Tecnologie di Internet Nascita di XML Il semplice esempio risolto <giornata> <partita> <arbitro>Trefoloni</arbitro> <luogo>Milano</luogo> <altra_informazione/> <squadra>Inter</squadra> <squadra>Juventus</squadra> </partita> </giornata> Query: seleziona l’elenco delle partite. Algoritmo: Per ogni tag <partita> ritorna i primi due <squadra> Inter Juventus Dott. Nicola Dragoni 15 Tecnologie di Internet Nascita di XML Prossima lezione: Fondamenti di XML Dott. Nicola Dragoni 16