Università degli Studi di Pisa Dipartimento di Informatica Lezione n.20 POWER LAW SCALE FREE NETWORKS Materiale Didattico Van Steen, GRAPH THEORY ANDCOMPLEX NETWORKS Cap 7 Laura Ricci 8/5/2013 Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 1 INTRODUZIONE Distribuzioni power law Che tipo di processo genera una distribuzione power law? Reti scale free Il modello di Barabasi Albert Applicazioni per reti P2P Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 2 INTRODUZIONE Esistono molti tipi di rete ● sociali ● tecnologiche ● ecologiche (preda-predatore, proteine,...) che sono caratterizzate dall'essere ● small world ● clusterizzate ● scale free: caratterizzate da una distribuzione power law Nella lezione di oggi vogliamo capire ● cosa è una distribuzione power law ● come si può modellare una rete con tale distribuzione Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 3 SCALA LOGARITMICA: RICHIAMI si consideri l'asse cartesiano x ed una serie di valori x 1,...xn. ogni valore xi è rappresentato sull'asse ad una distanza dall'origine pari a log10(x) (trasformazione di variabili X = log10 x ) poichè per valori crescenti dell'argomento la curva logaritmica cresce sempre più lentamente, la distanza di un valore dall'origine aumenta sempre più lentamente il valore 1 si trova distanziato di 0 unità rispetto alla origine, il valore 10 distanziato di 1, il valore 100 distanziato di 2 e così via ● i valori 101 , 102 , 103 , . . .(potenze della base) sono equamente distanziati poichè il loro logaritmo in base 10 restituisce i valori 1,2,3,.. ● la distanza dei valori intermedi tra una potenza di 10 e la successiva (ad.esempio 2,..5,...9) è sempre più smorzata Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 4 DISTRIBUZIONE POWER LAW P(x)= C *x-α una distribuzione di probabilità viene detta power law se la probabilità che una certa variabile casuale assuma un certo valore x decresce ad una potenza -α di x, con α valore costante (in generale α compreso tra 2 e 3) la probabilità decresce all'aumentare di α, ma non esponenzialmente (-α costante) ad esempio: probabilità di avere una città di 100 abitanti.... probabilità di avere una città con 1000000 di abitanti bassa, ma non 0 molte città con pochi abitanti, poi una lunga coda di città con un numero molto inferiore di abitanti, Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 5 POWER LAW SU SCALA LOGARITMICA Una power law viene rappresentata come una retta se si utilizza un grafico con scala logaritmica per entrambi gli assi (log-log graph) Consideriamo la seguente power law y=k * xα se si passa ai logaritmi si ottiene log(y) = α log(x) + log(k) applicando la trasformazione X=log(x), Y=log(y) (scala logaritmica) per m=α e q=log(k) possiamo ricondurci alla retta Y = mX + q dove m, il coefficente angolare della retta, dipende da α Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 6 LINEARIZZAZIONE FUNZIONI POTENZA la funzione rappresentata a sinistra è una funzione di potenze, power law y=k * xα in scala log-log la funzione viene rappresentata come una retta la potenza α determina il coefficente angolare della rette Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 7 POWER LAW VS. ESPONENZIALE Distribuzione Esponenziale: la probabilità di trovare un valore molto grande diventa rapidamente 0 Distribuzione Power Law: presenta una lunga coda (heavy tail, right skew) la probabilità di trovare un valore molto alto è bassa, ma non nulla: infinite variance Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 8 POWER LAW VS. ESPONENZIALE Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 9 DISTRIBUZIONE GAUSSIANA DELLE ALTEZZE Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 10 DISTRIBUZIONE POWER LAW Distribuzione power law (o zipfiana), caratteristiche: right skew (skew=distorto), heavy tailed La maggior parte delle città hanno pochi abitanti, ma esistono anche molte città con un gran numero di abitanti, in proporzione sono poche e tutte con un numero diverso di abitanti alto rapporto tra il valore massimo ed il valore minimo popolazione delle città negli USA: New YorK City:popolazione: 8 milioni, Duffield, Virginia, popolazione 52 abitanti: rapporto 150000 distribuzione normale (non heavy tailed) le altezze dei maschi nella popolazione umana, centrate su 180 cm uomo più alto 272 cm, uomo più basso 57 centimetri: rapporto 4.77 Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 11 DISTRIBUZIONE POWER LAW high skew: asimmetria ● lineare in una scala log-log ● Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 12 POWER LAW ONNIPRESENTI.... Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 13 POWER LAW ONNIPRESENTI.... Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 14 UBIQUITA' DELLE POWER LAW Molti sistemi reali presentano un comportamento 'power law' Non seguono una distribuzione normale o esponenziale Esempi: Grado dei nodi in Gnutella Distribuzione delle latenze in Internet Interazione tra proteine: poche proteine che interagiscono con molte altre Potenza distruttrice dei terremoti Lunghezza dei fiumi Ricchezza delle persone Negli esempi precedenti l'esponente della power law è sempre circa 2.5 La “power law” è la distribuzione classica per modellare “sistemi complessi” Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 15 LA REGOLA 20-80 un modo di dire, con un fondamento scientifico... valida per tutti i sistemi che seguono una distribuzione power law 20% dei siti Web ricevono 80% delle visite 20% dei routers Internet gestisce l'80% del traffico 20% delle industrie mondiali possiede l'80% dei ricavi 20% della popolazione mondiale conuma l'80% delle risorse 20% dei terremoti causa l'80% delle viitime 20% delle proteine è responsabile dell'80% dei processi metabolici Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 16 GENERAZIONE DI POWER LAW supponiamo che voglia generare un milione di valori distribuiti secondo una distribuzione power law con α =2.5 si può utilizzare un 'metodo' di trasformazione schema dell'algoritmo: generare un valore random r uniformemente distribuito nell'intervallo [0,1) (utilizzare ad esempio Math.Random di JAVA) un valore x distribuito secondo una power law di parametro α può essere generato mediante la seguente formula: Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 17 PERCHE' UTILIZZARE UNA SCALA LOGARITMICA Power Law: il dominio dei valori è molto 'esteso' È interessante evidenziare quali sono i valori che hanno alta frequenza, meno importante mettere in evidenza i molti valori di bassa frequenza scale free networks: quale è la distribuzione dei nodi di alto grado? disegnando una power law in scale lineare, i pochi valori con grado alto vengono 'schiacciati' a causa della lunga coda Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 18 POWER LAW SU SCALA LOGARIMICA Per valori piccoli di x, rilevazioni aggregate, ad esempio decine di migliaia di rilevazioni dello stesso valore Nella coda della power law un alto numero di rilevazioni “individuali” poche rilevazioni per ogni valore di x molte rilevazioni di valore diverso “accumulo” di dati provoca rumore nella coda della power law molti slot vuoti corrispondenti a valori con nessuna occorrenza Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 19 POWER LAW FITTING curve fitting: partire dai dati sperimentali, individuare la curva che meglio approssima i dati regressione lineare: individua una retta che approssima la power law in scala log-log: individuazione del coefficente angolare α (parametro della power law) il 'rumore' nella coda della power law può indurre errori nella regressione soluzione: utilizzare esponenzialmente sempre grandi Dipartimento di Informatica Università degli Studi di Pisa bins più Laura Ricci Power Law Scale Free Networks 20 POWER LAW FITTING: CUMULATIVE DISTRIBUTION la CDF di una power law è ancora una power law di esponente α-1 Miglior fitting se si utilizza la CDF: nessun valore uguale a 0 Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 21 POWER LAW: CURVE 'MISTE' ● ● ● eliminare alcuni dati per ottenere una power law selezionare xmin, il valore dopo cui inizia il comportamento 'power law' nella power law delle citazioni il comportamento power law è evidente solo per x>100 Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 22 MAXIMAL LIKEWOOD FITTING Date n misurazioni x1, ...xi, ...xn, calcolare α come Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 23 POWER LAW CON CUT-OFF ESPONENZIALE Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 24 RITORNIAMO ALLA ANALISI DI RETI COMPLESSE... Ci interessa disegnare la distribuzione dei gradi dei nodi Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 25 DISTRIBUZIONE DEI GRADI: NODE RANKING • considerare i grafi del lucido precedente: 100 vertici • si ordinano i vertici in base al loro gradi. • si assegna un rank (posizione nell'ordinamento) ad ogni vertice asse X : rank del vertice asse Y : grado del vertice • a destra ranking del grafo (a) a sinistra del grafo (b) • grafo (a): esiste un solo vertice di grado 10, tre vertici di grado 9,.... Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 26 SCALE FREE NETWORKS Scale free Networks: • pochi vertici di grado alto, un altissimo numero vertici di grado basso • può essere descritto con una power law • Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 27 SCALE FREE NETWORKS Watts e Strogatz modellano in modo appropriato il modello small world Tuttavia questo modello non cattura bene altre proprietà importanti di alcune reti reali: in molte reti reali esistono pochi nodi con grado alto e molti con grado basso struttura dei web links topologia di Internet reti P2P: Swarm Bittorrent collaboration Networks Scale Free Network: la distribuzione dei gradi dei nodi segue una legge power law Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 28 SCALE FREENESS ● Scale Freeness: una funzione F è scale free sse f(bx) = C(b) f(x) dove C(b) è una costante dipendente solo da b ● Scale Freeness: la 'forma' della funzione f non cambia quando si considerano valori di x che sono moltiplicati per un fattore b Le power law soddisfano al precedente proprietà, infatti: f(bx) = (bx) Dipartimento di Informatica Università degli Studi di Pisa -α =b -α x-α = b -α f(x) Laura Ricci Power Law Scale Free Networks 29 SCALE FREE NETWORKS • A sinistra: distribuzione dei gradi per nodi con rank tra 10 e 100 • A destra: distribuzione dei gradi per nodi con rank tra 100 e 1000 La forma della funzione non cambia, la forma è indipendente dall'intervallo considerato • Questa proprietà caratteristica le funzioni scale free Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 30 SCALE FREE NETWORKS • esempio di rete scale free: sistema aereo statunitense • contiene alcuni nodi (hubs, rappresentati in rosso) e caratterizzati da un alto numero di links • la distribuzione dei nodi, rappresentata in scala log-log è rappresentata da una retta Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 31 GRAFI RANDOM VS. SCALE FREE NETWORKS Random Graphs (Erdos-Renyi): i link tra i nodi vengono stabiliti in modo casuale, utilizzando una distribuzione binomiale La maggior parte dei nodi possiedono lo stesso numero di links Distribuzione gaussiana dei links dei nodi Esempio di grafo random: sistema autostradale americano Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 32 SCALE FREE: IL WEB Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 33 SCALE: LA RETE DELLE PROTEINE Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 34 SCALE FREE: I ROUTERS DI INTENET Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 35 SCALE FREE NETWORKS:TOPOLOGIA Random Graph Scale Free Network • le reti rappresentate hanno lo stesso numero di nodi e di archi • in rosso i nodi con il maggior numero di links, in verde i loro vicini tutti i nodi hanno approssimamente lo stesso numero di vicini • molti nodi con pochi vicini, pochi nodi con un alto numero di vicini • il 60% dei nodi della rete possono essere solo il 27% dei nodi della rete sono raggiunti direttamente dai nodi rossi raggiunti direttamente dai nodi rossi Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 36 WEB TOPOLOGY Esperimento di Barabasi: obiettivo: esaminare una parte del web utilizza un crawler che memorizza in un database, tutte le URL individuate in un documento e poi, ricorsivamente, segue queste URL per reperire i documenti puntati costruisce la rete corrispondente, in cui i nodi corrispondono alle pagine, gli archi ai links (URLs) tra pagine. ipotesi iniziale di Barabasi: il web può essere descritto mediante un grafo random, perchè ogni persona: sceglie in modo indipendente, secondo i propri interessi, i links da inserire nella propria pagina ha, in genere, interessi diversi può scegliere tra un altissimo numero di pagine da linkare Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 37 SCALE FREE NETWORKS: IL WEB l'esperimento contraddice l'ipotesi iniziale di Barabasi: più dell'80% delle pagine ha meno di 4 links, ma lo 0.01 per cento delle pagine include più di 1000 links esistono alcuni hubs (es: Yahoo o Google), che 'dominano' la rete Pout(k) e Pin(k), probabilità che un documento abbia, k archi rispettivamente in uscita ed in ingresso possono essere descritte come delle power law P(k) ≅ k-γ con valori tipici di γ compresi tra 2 e 3. Esperimento dei fratelli Faloutsos: Esamina la rete definita dai routers e dalle connessioni esistenti tra di loro Anche in questo caso si rileva una distribuzione di tipo power law Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 38 COSTRUZIONE DI SCALE FREE NETWORKS Le reti ER (Erdos Renyi) e WS (Watts e Strogatz) possono essere costruite a partire da un insieme di vertici dato Le reti scale free sono il risultato di due processi un processo dinamico di crescita un processo denominato preferential attachment Procedura per la costruzione di una scale free networl proposta per la prima volta da Barabasi ed Albert, nel 1999 La procedura combina la crescita dinamica di una rete con il fatto che i nuovi nodi si collegano ai nodi già esistenti secondo certe preferenze Watts e Strogatz: riavvolgimento di archi Barabasi ed Albert: crescita + preferential attachment Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 39 COSTRUZIONE DI SCALE FREE NETWORKS Si considera un grafo Go ER(no,p), con V0 = V(G0), n0 insieme di nodi iniziali, piccolo Ad ogni passo s > 0: 1. si aggiunge un nuovo vertice vs a Vs-1 ottenendo così: Vs ← Vs-1 ∪{vs} 2. si aggiungono m ≤ n0 archi. Ogni arco è incidente in vs ed in un vertice u∈Vs-1 con u scelto con probabilità u non deve essere stato scelto precedentemente durante lo stesso passo dell'algoritmo . La probabilità di scegliere u è proporzionale al suo grado. 3. Si ripetono i passi precedenti fino a che non sono stati aggiunti n vertici BA(n,n0,m) è il grafo risultante applicando il processo precedente Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 40 BARABASI ALBERT: COSTRUZIONE Caratteristiche delle scale free networks che favoriscono il formarsi di nodi caratterizzati da alto grado Crescita dinamica della rete il numero di nodi cresce con il tempo. Ad esempio il web cresce continuamente i nodi 'più vecchi' hanno maggior opportunità di acquisire nuovi links al contrario, nella costruzione di un Grafo Random si suppone che tutti i nodi siano disponibili quando comincia la generazione casuale degli archi tra i nodi della rete Preferential Attachment i links non vengono generati in modo random, alcuni nodi vengono scelti più di frequente Esempio: in internet nuovi hosts tendono a connettersi a routers che hanno già molte connessioni, perchè dispongono di una maggior banda Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 41 BARABASI ALBERT Growth + Preferential Attachment Il tempo è discretizzato: la rete cresce nel tempo, ad ogni passo un nuovo nodo entra nella rete la generazione di un arco tra un nuovo nodo w ed uno vecchio v non avviene in modo casuale, ma segue il seguente principio più alto è il grado di v , più alta è la probabilità che w stabilisca un collegamento con v Con una metafora......the rich get richer Preferential Attachment: La probabilità Π(v) che si stabilisca un collegamento tra il vertice v ed il nuovo vertice w è definita come Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 42 GENERAZIONE DI UNA SCALE FREE NETWORK Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 43 GENERAZIONE DI SCALE FREE NETWORKS Una semplice procedura per la generazione di scale free networks: si definisce una rete iniziale, generata casualmente si considerano gli archi del grafo che descrive la rete e, per ogni arco, si registrano in un vettore i due vertici dell'arco si inseriscono incrementalmente nuovi vertici nella rete, per ogni vertice inserito si selezionano i vertici a cui collegare il nuovo vertice scegliendo in modo casuale i vertici dal vettore precedente la probabilità di selezionare un vertice è proporzionale al numero di volte in cui compare nel vettore, che corrisponde al grado del vertice Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 44 GENERAZIONE DI SCALE FREE NETWORKS Registrare in un vettore i vertici di ogni arco, ordinandoli La probabilità di selezionare un vertice è proporzionale al numero di volte in cui esso compare nel vettore, che corrisponde a sua volta al grado del vertice Ad ogni passo si selezionano m vertici Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 45 BARABASI ALBERT: PROPRIETA' Distribuzione dei nodi del grafo. Per ogni grafo G ∈ BA(n,no,m), u ∈V(G) Coefficente di clusterizzazione. Poiché il processo di costruzione di una rete scale free è dinamico, si deve calcolare il coefficente di clusterizzazione di un vertice vs dopo t passi effettuati nella costruzione del grafo BA(t,n 0,m), vs è stato aggiunto al grafo al passo s≤ t Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 46 BARABASI ALBERT: CLUSTERIZZAZIONE si considera BA(100000, n0, 8) e si varia s basso coefficente di clusterizzazione Risulati sperimentali mostrano che il coefficente di clusterizzazione cresece all'aumentare della dimensione della rete Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 47 BARABASI ALBERT: DIAMETRO Lunghezza media dei cammini per BA(n,n 0,m) γ costante di Eulero Confronto tra grafi ER e BA con lo stesso grado medio dei nodi uguale a 10 Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 48 BARABSI ALBERT: DIAMETRO i grafi BA tendono a presentare una lunghezza media dei cammini minimi tra due nodi inferiore a quella dei grafi ER La lunghezza media dei cammini per un grafo random è già molto bassa Questo è dovuto alla presenza di hubs con grado molto alto un hub è vicino ad ogni vertice della rete l'eccentricità di un hub è bassa gli hub si comportano come connettori per i nodi di grado basso Da un qualsiasi vertice si raggiunge un qualsiasi altro vertice della rete mediante un cammino che contiene almeno un hub Per questa ragione una rete scale free viene spesso definita una rete Super Small World diametro log(n)/log(log(n)) Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 49 MODELLO DI BARABASI ALBERT: PROBLEMI Non modella bene la clusterizzazione dei nodi da questo punto di vista migliore Watts-Strogatz oppure Kleinberg Le reti reali non sono completamente power-law exponential cut-off: power law, quindi, improvvisamente, decrescita esponenziale ad esempio l'overlay Gnutella presenta un exponential cut-off in generale, la distribuzione presenta una 'lunga coda' rispetto ad una distribuzione esponenziale, ma...la coda non è infinita il modello di Barabasi Albert non modella bene questo aspetto Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 50 POWER LAW: COME 'LEGGERE' I GRAFICI Distribuzione delle visite degli utenti AOL su vari siti Pochi siti con più di 2000 visitatori, la maggior parte dei siti con pochi visitatori (70000 siti con un unico visitatore) distribuzione “ad L” un sito con pochi visitatori è messo in evidenza più di un sito con molti visitatori Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 51 SCALE FREE NETWORKS: PROPRIETA' Robustezza rispetto a guasti casuali le scale-free networks presentano buone caratteristiche di tolleranza ai guasti fino all'80% dei routers in Internet può essere soggetta a crash senza pregiudicare la connettività della rete esiste un cammino tra due host qualsiasi anche se l'80% dei routers si rende indisponibile Scale free networks sono caratterizzate da una notevole robustezza che deriva dalla loro disomogeneità. Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 52 SCALE FREE NETWORKS: PROPRIETA' Robustezza rispetto a guasti casuali: se si rimuove in modo casuale (distribuzione uniforme) un nodo v, con alta probabilità, tale vertice è di grado basso la struttura della rete, con alta probabilità, non subisce modifiche rilevanti la lunghezza media dei cammini non subisce modifiche sostanziali Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 53 SCALE FREE NETWORKS: PROPRIETA' Robustezza rispetto a guasti casuali: esiste un cammino tra due host qualsiasi anche se l'80% dei routers si rende indisponibile Scale free networks sono caratterizzate da una notevole robustezza che deriva dalla loro disomogeneità. Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 54 SCALE FREE NETWORKS: PROPRIETA' Vulnerabilità verso gli attacchi un attacco mirato può colpire i vertici di grado più alto rimuove prima l'hub di dimensione maggiore, poi quello successivo e così via... la rimozione di un numero limitato di hubs può provocare il frazionamento della rete in tante componenti di piccola dimensione Lunghezza media dei cammini cresce repentinamente Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 55 ERRORI ED ATTACCHI RANDOM VS. SCALE FREE Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 56 SCALE FREE NETWORKS: VULNERABILITA' • Scale free Network: si rimuovono vertici dagli hub • Random Network: si rimuovono i vertici di grado maggiore da una rete random •Scale free network Random Removal: si rimuovono vertici dalla rete scale free in modo casuale Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 57 RANDOM NETWORKS: FALLIMENTO ACCIDENTALE Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 58 SCALE FREE NETWORKS: FALLIMENTO ACCIDENTALE Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 59 SCALE FREE NETWORKS: ATTACCO AGLI HUBS Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 60 SCALE FREE NETWORKS CLUSTERIZZATE Si considera un grafo Go ER(no,p), con V0 = V(G0), n0 piccolo Per ogni passo s>0 1. si aggiunge un nuovo vertice vs a Vs-1 ottenendo così: Vs ← Vs-1 ∪{vs} 2. si seleziona un vertice u da Vs-1 con una probabilità proporzionale al grado del vertice δ(u). Si aggiunge l'arco 〈vs,u〉. I rimanenti m-1 archi si aggiungono come segue a) con probabilità q si seleziona un vertice w adiacente ad u. Se tale vertice esiste si aggiunge l'arco 〈vs,w〉 e si esegue c) atrimenti si esegue b) b) si seleziona un vertice u' da Vs-1 con una probabilità proporzionale al grado del vertice δ(u') e si aggiunge l'arco vs, u e si pone u= u' c) se sono stati aggiunti m archi si va a 3. altriemnti si torna ad a), 3. Se non sono stati ancora aggiunti n vertici si ritorna al passo 1.. Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 61 SCALE FREE NETWORKS: CLUSTERIZZAZIONE La procedura precedente costruisce eplicitamente, con probabilità uguale a p un triangolo contenente il nuovo vertice vs, il vertice u a cui il nuovo vertice vs è stato connesso un vicino w di u Ad esempio se q=1 (probabilità di formare un triangolo =1) e supponendo che u abbia k m vicini, w1,... wk, allors si crea una connessione tra vs ed ognuno di questi vicini Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 62 SCALE FREE NETWORKS: CLUSTERIZZAZIONE Un altro modello proposto recentemente prevede di definire una rete scale free gerarchica Ad ogni livello della gerarchia si creano molti triangoli Un rappresentante per ogni livello della gerarchia connesso con un hub del livello superiore Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 63 P2P SCALE FREE NETWORKS analisi della rete Gnutella effettuata negli anni 2000-2001 sviluppato un crawler che si unisce alla rete Gnutella come servent ed usa i messaggi di PING PONG per analizzare la struttura dell'overlay all'inizio l'unica informazione disponibile riguarda una lista di servent ottenuti dal bootstrap successivamente informazioni su più di un milione di nodi osservate diverse proprietà della rete: numero di nodi nella componente connessa di dimensione massima (giant component) traffico generato dai diversi tipi di messaggio struttura dell'overlay lunghezza media dei cammini tra coppie di nodi grado medio dei nodi Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 64 GNUTELLA: LUNGHEZZA MEDIA DEI CAMMINI Dati collezionati da diversi crawls della rete 95% delle coppie di nodi raggiungibile in meno di 7 hops Rete small world Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 65 GNUTELLA: GRADO MEDIO DEI NODI dati riportati da un crawler nel novembre 2000 ● il grado dei nodi segue una distribuzione power law ● molti nodi con pochi links, alcuni nodi con molti links (server-like) ● Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 66 GNUTELLA: GRADO MEDIO DEI NODI ● ● ● dati riportati dal crawler nel marzo 2001 power law per nodi con un numero di links maggiore di 10 per nodi con meno di 10 links, la distribuzione è quasi costante Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 67 POWER LAW E RETI P2P analisi di Bittorrent ● analizzati 4 dei siti più noti di indicizzazione di .torrent ● rank degli uploaders rispetto al numero di file di cui è stato fatto l'upload ● comportamento power law:la maggior parte degli utenti uploada pochi torrent, alcuni uploadano una quantità enorme di .torrent ● Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 68 POWER LAW E RETI P2P ● ● numero di peer in un torrent ● 82% dei torrent non hanno più di 10 peer ● 22 torrent con più di 10000 peer ● un torrent con più di 150000 peer (heroes, serie TV) Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 69 CONCLUSIONI La struttura di una rete peer-to-peer system influenza la lunghezza media dei cammini, la possibilità di definire algoritmi di routing greedy, decentralizzati la stabilità della rete verso guasti la sensibiltà della rete verso gli attacchi Caratteristiche importanti di una rete P2P : la lunghezza media dei cammini il coefficente di clusterizzazione la distribuzione del grado dei nodi ... E‘ importante stabilire le regole per la generazione degli archi della overlay network in modo tale che la struttura della rete definita garantisca le proprietà desiderate Dipartimento di Informatica Università degli Studi di Pisa Laura Ricci Power Law Scale Free Networks 70