P2P e Semantic Web Argomenti avanzati di Sistemi Informativi 2005 Alessio Gambi Andrea Gaschi Agenda Peer-to-peer Ontologie Soluzioni Architettura Joining the network Query processing Clustering dei nodi Sintesi Esempi di applicazioni P2P e Semantic Web 2 Peer-to-peer: stato dell’arte Definizione di Peer-to-Peer: Un sistema di P2P si può definire come un sistema distribuito i cui nodi, o peer, hanno capacità e ruoli equivalenti nello scambio di informazioni e servizi tra loro. Panoramica dei modelli P2P: Direct P2P Broker Super Peer mediated Model Network Model BobPeer Super Where is “Star Wars ep. III”? Alice Copying “Star Wars ep. III” Alice Super Peer Alice has it Broker Carol Where is “Star Wars ep. III”? Bob Carol Ted Ted Alice has it P2P e Semantic Web 3 Ontologie Definizione di ontologia Una specifica formale esplicita di una concettualizzazione condivisa Le applicazioni delle ontologie nei sistemi P2P: P2P tradizionali DHT Reti P2P basate su schemi Reti di super-peer per repository distribuiti Sistemi P2P tradizionali DHT P2P basati su schemi P2P e Semantic Web Strategie di routing basate su schemi e ontologie Migliore scalabilità Descrizione del contenuto Indici Usotramite limitato distribuiti dei metadati schemi espliciti Costruzione Indici centralizzati di una Metadati per descrivere le topologia della rete risorse dei nodi e per Routing più efficace garantire interoperabilità semantica Super-peer e repository distributi 4 Problema Esempio di scenario in una rete P2P: quali problemi ci sono. Book Book Publication Journal Novel Peer B Novel Peer A Volume Peer C Peer D Peer Peer X Detective Novel Peer Y Mistery Novel Peer W P2P e Semantic Web Peer Z 5 Soluzioni tecnologiche: introduzione al nostro lavoro Il nostro lavoro si è concentrato sull’analisi delle principali soluzioni tecnologiche disponibili, che integrino Semantic Web e P2P. L’analisi si è concentrata su: Architettura concettuale e moduli software Metodologie utilizzate, in particolare: Rappresentazione della conoscenza Query processing Propagazione delle query Soluzioni tecnologiche analizzate: SWAP (AIFB Institute, University of Karlsruhe) Edutella EDAMOK (Itc-Irst e Università di Trento) PSearch H3 P2P e Semantic Web 6 Architettura dei nodi Definizione di peer: Ogni nodo è una risorsa che si autogestisce e che può compiere molteplici azioni, indipendentemente da tutti i suoi “pari”. Un peer, può accedere anche a sorgenti di conoscenza esterne. Detective Novel Diverse implementazioni: Proprietarie vs. Standard Architettura multilivello vs. Wrapping Peer D ? P2P e Semantic Web 7 Joining the network Nel momento in cui un nodo vuole partecipare ad una rete P2P deve notificare la sua presenza (per ricevere le richieste), fornendo informazioni su se stesso alla rete, e deve recuperare informazioni sulla rete stessa o sui suoi partecipanti (per poter inviare le query). Mistery Novel Peer D Detective Novel Politiche di notifica: Import vs. Export vs. Passive Evoluzione della conoscenza del nodo: Esplicita vs. Implicita Peer Mistery Novel Detective Novel P2P e Semantic Web 8 Query Processing: routing Peer D: “Vorrei trovare altre Detective Novel” (esempio di query “ricca”…) Creazione della richiesta contenente le informazioni semantiche del concetto target La richiesta viene inviata ai nodi collegati Ogni nodo che riceve la richiesta, in base alle proprie conoscenze, la inoltra verso i nodi in grado di rispondere Peer B Book Novel Detective Novel Formulazione delle query Scelta obbligata per il linguaggio vs. Libertà di scelta Potere espressivo Sistemi P2P puri vs. Sistemi con Hub Semantic Overlay Network Peer C Peer X Volume Novel Peer Y Detective Novel Peer D Detective Novel Detective Novel Mistery Novel P2P e Semantic Web Peer W Peer Z 9 Query Processing: matching Il matching si basa sul concetto di confronto tra il soggetto della query e la rappresentazione delle risorse del nodo. Se il peer B adottasse un algoritmo di matching esatto, la query non otterrebbe alcuna risposta. Invece si abbandona il concetto di matching esatto tipico dei tradizionali sistemi di Information Retrieval, a favore di concetti più “laschi” come l'equivalenza e la corrispondenza semantica. Book Detective Novel Novel Peer B Detective Novel Book Novel P2P e Semantic Web Algoritmi di matching Vettori di termini vs. Schemi Formato delle risposte 10 Query Processing: reply Le risposte vengono costruite ed inviate direttamente al nodo che ne aveva fatto richiesta. Il peer D raccoglie le risposte e le presenta all’utente. Nel caso di assenza di risultati, la politica scelta è non creare nessuna risposta. Volume Reply Novel Peer B Book Novel Reply Peer C Peer X Peer Y Peer D Reply Detective Novel Mistery Novel P2P e Semantic Web Peer W Peer Z 11 Clustering dei nodi I nodi che condividono gli stessi interessi o che possiedono informazioni relative a concetti correlati vengono messi logicamente vicini, per aumentare contemporaneamente l'efficienza e l'efficacia delle ricerche di informazioni nella rete. Gli altri nodi, secondo il principio di località, vedono come vicini i nodi correlati. Federazioni esplicite vs. Clustering Volume Novel Peer B Book Novel Peer C Peer X Peer Y Peer D Novel Mistery Novel Detective Novel P2P e Semantic Web Peer W Peer Z 12 Sintesi Dal punto di vista prestazionale, le tecnologie di Semantic P2P rappresentano un effettivo miglioramento rispetto ai sistemi P2P tradizionali: Aumento del recall Aumento della precisione Riduzione del numero di messaggi scambiati Limiti ancora da superare: “Qualità” del servizio Allineamento automatico di schemi diversi Gestione di query complesse Performance non ancora ottimali di meccanismi di matching e di routing P2P e Semantic Web 13 Esempi e applicazioni – problemi tradizionali Bibster: un sistema realizzato in Java e basato sulle tecnologie di SWAP che assiste i ricercatori nella gestione, nella ricerca e nella condivisione di metadati bibliografici in una rete P2P. Molti ricercatori mantengono manualmente liste di dati bibliografici: Senza una semplice visione generale Qualità dei dati variabile. Molti ricercatori desiderano condividere queste risorse senza dover investire tempo nel farlo. Una soluzione centralizzata non esiste, Bibster realizza un ambiente di condivisione della conoscenza che permetta ai ricercatori di: condividere facilmente i dati bibliografici; risparmiare sforzi nella ricerca di questi dati; evitare di dover riscrivere questi dati a mano. PADLR: una infrastruttura web per l’apprendimento che permetta una maggiore flessibilità e funzionalità a tutti i livelli dell’insegnamento universitario. PADLR fa in modo che la conoscenza e i materiali didattici siano costantemente ristrutturati e rimodellati e che possano essere acceduti individualmente e soprattutto quando sono necessari. L’implementazione del sistema P2P per lo scambio di risorse didattiche è basata su nodi Edutella. P2P e Semantic Web 14 Un’applicazione originale Distribuited Knowledge Management in B2B: applicazione delle tecnologie P2P e del Semantic Web al B2B, in particolare ai Marketplace (e in genere all’eProcurement). Marketplace: un luogo “concettuale” in cui si incontrano diversi soggetti per scambiare beni e servizi. I problemi di comunicazioni (sinonimie e omonimie) vengono affrontati attraverso la standardizzazione dei cataloghi: Il gestore del marketplace fornisce un catalogo comune sul quale si “mappano” gli utilizzatori Nel caso eProcurement, sul catalogo di sistema devono essere mappati I cataloghi fisici dei fornitori I cataloghi “mentali” dei compratori Catalogo Standardizzato Ma i cataloghi sono difficili da standardizzare! Prodotti ortofrutticoli Dessert e Frutta Torte Coltivazioni Soluzione: approccio distribuito Estive Invernali Pere Gestione distribuita dei cataloghi Mele Uva Mele Azienda X Azienda Y Aggregazione virtuale di gruppi d’acquisto e vendita Verdura Frutta Frutta Nostrana Ciliege Esotica Mele BUYER SELLER P2P e Semantic Web 15 Grazie per l’attenzione. P2P e Semantic Web 16