P2P e Semantic Web
Argomenti avanzati di Sistemi Informativi 2005
Alessio Gambi
Andrea Gaschi
Agenda





Peer-to-peer
Ontologie
Soluzioni
 Architettura
 Joining the network
 Query processing
 Clustering dei nodi
Sintesi
Esempi di applicazioni
P2P e Semantic Web
2
Peer-to-peer: stato dell’arte

Definizione di Peer-to-Peer:
Un sistema di P2P si può definire come un sistema distribuito i cui nodi,
o peer, hanno capacità e ruoli equivalenti nello scambio di informazioni
e servizi tra loro.

Panoramica dei modelli P2P:
Direct P2P
Broker
Super
Peer
mediated
Model
Network
Model
BobPeer
Super
Where is “Star
Wars ep. III”?
Alice
Copying “Star Wars
ep. III”
Alice
Super Peer
Alice
has it
Broker
Carol
Where is “Star
Wars ep. III”?
Bob
Carol
Ted
Ted
Alice
has it
P2P e Semantic Web
3
Ontologie

Definizione di ontologia
Una specifica formale esplicita di una concettualizzazione condivisa

Le applicazioni delle ontologie nei sistemi P2P:
 P2P tradizionali
 DHT
 Reti P2P basate su schemi
 Reti di super-peer per repository distribuiti
Sistemi P2P
tradizionali
DHT
P2P basati
su schemi
P2P e Semantic Web


Strategie di routing basate
su schemi e ontologie
Migliore scalabilità
 Descrizione del contenuto
 Indici
Usotramite
limitato
distribuiti
dei metadati
schemi
espliciti
  Costruzione
Indici
centralizzati
di una
Metadati
per
descrivere le
topologia
della
rete
risorse dei nodi e per
 Routing
più efficace
garantire
interoperabilità
semantica
Super-peer e
repository distributi
4
Problema

Esempio di scenario in una rete P2P: quali problemi ci sono.
Book
Book
Publication
Journal
Novel
Peer B
Novel
Peer A
Volume
Peer C
Peer D
Peer
Peer X
Detective Novel
Peer Y
Mistery Novel
Peer W
P2P e Semantic Web
Peer Z
5
Soluzioni tecnologiche: introduzione al nostro lavoro

Il nostro lavoro si è concentrato sull’analisi delle principali soluzioni tecnologiche
disponibili, che integrino Semantic Web e P2P.

L’analisi si è concentrata su:
 Architettura concettuale e moduli software
 Metodologie utilizzate, in particolare:
 Rappresentazione della conoscenza
 Query processing
 Propagazione delle query

Soluzioni tecnologiche analizzate:
 SWAP (AIFB Institute, University of Karlsruhe)
 Edutella
 EDAMOK (Itc-Irst e Università di Trento)
 PSearch
 H3
P2P e Semantic Web
6
Architettura dei nodi

Definizione di peer:
Ogni nodo è una risorsa che si autogestisce e che può compiere molteplici azioni,
indipendentemente da tutti i suoi “pari”. Un peer, può accedere anche a sorgenti di
conoscenza esterne.
Detective Novel


Diverse implementazioni:
 Proprietarie vs. Standard
Architettura multilivello vs.
Wrapping
Peer D
?
P2P e Semantic Web
7
Joining the network

Nel momento in cui un nodo vuole partecipare ad una rete P2P deve notificare la sua
presenza (per ricevere le richieste), fornendo informazioni su se stesso alla rete, e
deve recuperare informazioni sulla rete stessa o sui suoi partecipanti (per poter
inviare le query).
Mistery Novel
Peer D


Detective Novel
Politiche di notifica:
 Import vs. Export vs. Passive
Evoluzione della conoscenza del nodo:
 Esplicita vs. Implicita
Peer
Mistery Novel
Detective Novel
P2P e Semantic Web
8
Query Processing: routing
Peer D: “Vorrei trovare altre Detective Novel” (esempio di query “ricca”…)
Creazione della richiesta contenente le informazioni semantiche del concetto target
La richiesta viene inviata ai nodi collegati
Ogni nodo che riceve la richiesta, in base alle proprie conoscenze, la inoltra verso i
nodi in grado di rispondere





Peer B

Book
Novel
Detective Novel
Formulazione delle query
 Scelta obbligata per il linguaggio
vs. Libertà di scelta
 Potere espressivo
Sistemi P2P puri vs. Sistemi con Hub
Semantic Overlay
Network
Peer C
Peer X
Volume
Novel
Peer Y
Detective Novel
Peer D
Detective Novel
Detective Novel
Mistery Novel
P2P e Semantic Web
Peer W
Peer Z
9
Query Processing: matching



Il matching si basa sul concetto di confronto tra il soggetto della query e la rappresentazione delle
risorse del nodo.
Se il peer B adottasse un algoritmo di matching esatto, la query non otterrebbe alcuna risposta.
Invece si abbandona il concetto di matching esatto tipico dei tradizionali sistemi di Information
Retrieval, a favore di concetti più “laschi” come l'equivalenza e la corrispondenza semantica.
Book
Detective Novel
Novel
Peer B
Detective Novel
Book

Novel
P2P e Semantic Web

Algoritmi di matching
 Vettori di termini vs. Schemi
Formato delle risposte
10
Query Processing: reply
Le risposte vengono costruite ed inviate direttamente al nodo che ne aveva fatto
richiesta.
Il peer D raccoglie le risposte e le presenta all’utente.
Nel caso di assenza di risultati, la politica scelta è non creare nessuna risposta.



Volume
Reply
Novel
Peer B
Book
Novel
Reply
Peer C
Peer X
Peer Y
Peer D
Reply
Detective Novel
Mistery Novel
P2P e Semantic Web
Peer W
Peer Z
11
Clustering dei nodi


I nodi che condividono gli stessi interessi o che possiedono informazioni relative a
concetti correlati vengono messi logicamente vicini, per aumentare
contemporaneamente l'efficienza e l'efficacia delle ricerche di informazioni nella rete.
Gli altri nodi, secondo il principio di località, vedono come vicini i nodi correlati.

Federazioni esplicite vs. Clustering
Volume
Novel
Peer B
Book
Novel
Peer C
Peer X
Peer Y
Peer D
Novel
Mistery Novel
Detective Novel
P2P e Semantic Web
Peer W
Peer Z
12
Sintesi

Dal punto di vista prestazionale, le tecnologie di Semantic P2P rappresentano un
effettivo miglioramento rispetto ai sistemi P2P tradizionali:
 Aumento del recall
 Aumento della precisione
 Riduzione del numero di messaggi scambiati

Limiti ancora da superare:
 “Qualità” del servizio
 Allineamento automatico di schemi diversi
 Gestione di query complesse
 Performance non ancora ottimali di meccanismi di matching e di routing
P2P e Semantic Web
13
Esempi e applicazioni – problemi tradizionali







Bibster: un sistema realizzato in Java e basato sulle tecnologie di SWAP che assiste i ricercatori
nella gestione, nella ricerca e nella condivisione di metadati bibliografici in una rete P2P.
Molti ricercatori mantengono manualmente liste di dati bibliografici:
 Senza una semplice visione generale
 Qualità dei dati variabile.
Molti ricercatori desiderano condividere queste risorse senza dover investire tempo nel farlo.
Una soluzione centralizzata non esiste, Bibster realizza un ambiente di condivisione della
conoscenza che permetta ai ricercatori di:
 condividere facilmente i dati bibliografici;
 risparmiare sforzi nella ricerca di questi dati;
 evitare di dover riscrivere questi dati a mano.
PADLR: una infrastruttura web per l’apprendimento che permetta una maggiore flessibilità e
funzionalità a tutti i livelli dell’insegnamento universitario.
PADLR fa in modo che la conoscenza e i materiali didattici siano costantemente ristrutturati e
rimodellati e che possano essere acceduti individualmente e soprattutto quando sono necessari.
L’implementazione del sistema P2P per lo scambio di risorse didattiche è basata su nodi Edutella.
P2P e Semantic Web
14
Un’applicazione originale



Distribuited Knowledge Management in B2B: applicazione delle tecnologie P2P e del Semantic
Web al B2B, in particolare ai Marketplace (e in genere all’eProcurement).
Marketplace: un luogo “concettuale” in cui si incontrano diversi soggetti per scambiare beni e
servizi.
I problemi di comunicazioni (sinonimie e omonimie) vengono affrontati attraverso la
standardizzazione dei cataloghi:
 Il gestore del marketplace fornisce un catalogo comune sul quale si “mappano” gli
utilizzatori
 Nel caso eProcurement, sul catalogo di sistema devono essere mappati
 I cataloghi fisici dei fornitori
 I cataloghi “mentali” dei compratori
Catalogo Standardizzato

Ma i cataloghi sono difficili da standardizzare!
Prodotti ortofrutticoli
Dessert e Frutta
Torte

Coltivazioni
Soluzione: approccio distribuito
Estive
Invernali
Pere
 Gestione distribuita dei cataloghi Mele
Uva
Mele
Azienda X
Azienda Y
 Aggregazione virtuale di gruppi d’acquisto
e vendita
Verdura
Frutta
Frutta
Nostrana
Ciliege
Esotica
Mele
BUYER
SELLER
P2P e Semantic Web
15
Grazie per l’attenzione.
P2P e Semantic Web
16
Scarica

Lucidi