IDUL 09

WEB 2.0
Internet, o della
globalizzazione



Internet è uno dei lati più importanti della
“globalizzazione” del mondo.
Nel momento in cui diventa possibile ed
economico contattare milioni di persone (inviando
posta, permettendo la lettura di documento,
distribuendo lavoro, ecc.) si attivano dinamiche
sociali basate sulla legge dei grandi numeri.
Gli aspetti peggiori e migliori dell’uso attuale della
rete sono legati a idee che sfruttano in maniera
vantaggiosa tali dinamiche.
Aspetti negativi



Spam
Virus, Attacchi a siti web
Truffe elettroniche (e.g. phishing)
Spam
CHINA GOLD CORP
Symbol: CGDC
Current Price: 0.50 A
Company
engaged in gold
and minerals
exploration and
development of
gold and mineral
properties in
China. Why
consider CHINA
GOLD CORP
(CGDC)? Seee
Spam


Chiamasi SPAM (dal nome di un tipo poco
appetitoso di carne in scatola) la posta
indesiderata (commerciale, truffaldina, o
dovuta a virus)
Secondo gli esperti della società di ricerca
americana Ferris Research , il danno causato
dallo spam all'economia mondiale era per il
2005 l'equivalente di 50 miliardi di dollari.
Spam



Il ritorno economico della posta commerciale indesiderata è
bassissimo (forse 1 su varie migliaia), ma i costi di invio sono così
bassi da renderlo vantaggioso.
Metodi di rilevamento (p.es. un invio da persone non nel nostro
indirizzario con destinatari multipli è sospetto). Aumento rischio di
perdite di posta genuina.
Possibile comportamento



opt-in: se non conosco un mittente, accetto
opt-out: se non conosco un mittente, rifiuto
Pericoli del rifiuto esplicito, tipo “clicchi qui per non ricevere
più in futuro questi messaggi”: si segnala che l’ indirizzo
email è corrente e viene letto.
Virus



La percentuale di successo dei virus è bassa,
ma ogni macchina infettata diviene veicolo di
nuove infezioni
Tecnica della falsificazione del mittente
(effetto “al lupo! al lupo!”)
I virus sono spesso usati per coordinare
attacchi web (Denial of Service Attacks)
Denial of Service Attack
Richieste Legittim
vengono respinte
Pseudo Richieste
generate dal virus
Virus
Truffe elettroniche

“MY DEAR, I AM IBN MOHAMMED MOHAMMED, I AM 72 YEARS OLD. I
AM A CITIZEN OF SAUDI ARABIA, BUT I AM RESIDENT IN AYMAN
ISLAND. I WAS BORN AN ORPHAN. I WAS ABANDONED IN THE
STREET AT THE TENDER AGE OF 2 YEARS. AS A YOUNG ORPHAN, I
STRUGGLED AND WORKED HARD AND ALMIGHTY ALLAH BLESSED
ME ABUNDANTLY WITH RICHES. I USED TO BE A DEALER IN GOLD
AND DIAMONDS. DUE TO MY ILLNESS MY COMPANY WAS
LIQUIDATED AND SOLD 3 YEARS BACK. MY DEAR, I AM NOW OLD
AND SICK, BUT I AM NOT A HAPPY MAN. I HAVE NO WIFE AND I HAVE
NO CHILDREN.MY DEAR, FOR 4 YEARS NOW I AM SERIOUSLY SICK.I
AM PRESENTLY SUFFERING FROM LUNG CANCER AND I HAD A
HEART ATTACK WHICH HAS AFFECTED MY SPEACH AND MY BODY
IS PARALYSED. THE DOCTORS SAY I HAVE ABOUT FEW MOUNTHS
LEFT TO LIVE.” …

Vi viene chiesta una piccola somma per attivare una operazione semilegale
che vi darà un’ immensa fortuna.
Truffe elettroniche

Anche i più ingenui cominciano ad
insospettirsi al secondo o terzo
miliardario sconosciuto che intende
lasciargli immensi patrimoni...

“Il peggior nemico dello spam è lo spam
stesso”
Non sempre lo spam è di natura
economica (hoax)
Vi prego fatela girare, non costa nulla ed e' un aiuto enorme !!!
Mar. A. Marco BIANCHI Comando Generale della Guardia di Finanza
[email protected]<mailto:[email protected]<MAILTO:[email protected]<
Doggett: Leucemia - Per favore leggete di seguito
Se la cestinerete davvero non avete cuore.
Salve, sono un padre di 29 anni. Io e mia moglie abbiamo avuto una vita meravigliosa. Dio ci ha voluto
benedire con una bellissima bambina.
Il nome di nostra figlia è Rachele. Ed ha 10 anni. Poco tempo fa i dottori hanno rilevato un cancro al cervello
e nel suo piccolo corpo. C'è una sola via per salvarla è operare. Purtroppo, noi non abbiamo denaro sufficiente
per far fronte al costo. AOL e ZDNET hanno acconsentito per aiutarci.
L'unico modo con il quale loro possono aiutarci è questo: Io invio questa email a voi e voi inviatela ad altre
persone. AOL rileverà la traccia di questa e-mail e calcolerà quante persone la riceveranno. Ogni persona che
aprirà questa e-mail e la invierà ad altre persone ci donerà 32 centesimi.
Per favore aiutateci
Con sincerità George Arlington Barbara Varano Laboratorio di Virologia
Ci sono siti per smascherare questo tipo di email, p.es. http://www.hoaxbusters.org/
Ma spesso sì: Phishing

“Phishing” (cf. fishing) è una tecnica in cui la vittima riceve una mail che
chiede, adducendo motivi vari, di aggiornare alcuni dettagli riservati
(password, numero di carta di credito) presso un apparente sito “ufficiale”,
a cui si arriva cliccando su un link. Il link tuttavia non manda al sito
autentico, ma ad uno cammuffato:
<A href=“gambadilegno.truffa.xk”>https://www.bancaditalia.it/</A>

La pagina del sito viene imitata, ma i dati inseriti dalla vittima vengono
mandati al truffatore.





Diffidare di qualsiasi messaggio vi richieda di (ri)inserire dati riservati
Siete clienti della società a cui si fa riferimento?
Il messaggio è in inglese? Ci sono errori nell’ italiano, specialmente gli accenti?
Dove vi sta veramente mandando il link?
La connessione è criptata (https://...) ?
Phishing: esempio Ebay
Dopo il “dotcom bubble”

Quali compagnie sopravvissero al crollo del
mercato sei servizi web del 2001?



Amazon
Ebay
Google
Cosa hanno in comune?
Aspetti positivi (o del circolo
virtuoso)
“WEB 2.0”: uso della collaborazione tra utenti
per creare risorse distribuite.



Sistemi di raccomandazione / recensione /
classificazione (social bookmarking)
Calcolo distribuito, “cloud-computing”
Open source, Blog, WIKI
Social bookmarking e motori di
ricerca


Grazie alla legge dei grandi numeri il Social
bookmarking permette di valutare e classificare con
occhio umano risorse che i motori di ricerca
potrebbero valutare solo in modo automatico.
Il successo di Google (basato sull’algoritmo Page
Rank) è dato proprio dalla capacità di incorporare
indirettamente una valutazione umana della
importanza dei siti (il numero di puntatori esterni ad
un sito)
Sistemi di raccomandazione


Amazon (www.amazon.com, manca una sede italiana)
 “Gli utenti che hanno comprato questi libri hanno anche comprato
X, Y e Z”
 Recensioni dei lettori (?)
Stumbleupon (http://www.stumbleupon.com/)
 Piccola estensione che si aggiunge al browser consentendoci di
votare i siti che (non) ci sono piaciuti.
 Invio casuale su siti con voti alti
 Invio su siti votati da persone che in altri casi hanno dato voti
simili ai nostri (= persone con gli stessi gusti)
Social bookmarking





In un sistema di social bookmarking gli utenti registrano un
catalogo di risorse Internet ritenute, a vario titolo, utili e stimolanti.
Le risorse stesse vengono spesso offerte dagli utenti stessi (foto,
video, testi, programmi, …)
La categorizzazione delle risorse avviene per mezzo di "parole
chiave" (tag) liberamente e informalmente scelte dall'utente.
La maggioranza dei servizi di social bookmarking permette agli
utenti la ricerca di segnalibri associati a determinate etichette
(tag), e l'ordinamento delle singole risorse Internet in base al
numero delle segnalazioni.
Molti siti hanno implementato algoritmi per ottenere risultati da
ricerche condotte su gruppi di parole chiave.
Problemi


Fiducia vs. Privacy (se le raccomandazioni
sono anonime non abbiamo fiducia; se non lo
sono non abbiamo privacy)
Circolarità (ciò che è famoso lo diventa
sempre di più: che succede se usiamo solo
Google per trovare i link che inseriamo nelle
nostre pagine web?)
Problemi



La legge dei grandi numeri non è sempre una
salvaguardia contro interessi commerciali
Vedi la questione dei Private Label Rights (diritto di
ripubblicare con qualche variazione un testo coperto
da copyright al fine di attirare pubblico su una pagina
web)
Vedi “misuratori di differenze” come
http://www.dupecop.net/index-online.html
Calcolo distribuito


Problemi di enorme complessità computazionale (p.es. Il calcolo della
struttura di proteine complesse) possono essere risolti se sono divisibili in
piccoli moduli che vengono distribuiti tramite la rete sui computer
individuali dei patecipanti al progetto. Ogni PC calcola un pezzo del
problema e manda la soluzione ad un server che “aggrega” il risultato.
Vedi una descrizione sulla prestigiosa rivista Nature:
http://www.nature.com/embor/journal/v10/n5/full/embor200979.html

Esempi:

SETI@HOME (ricerca di segnali extraterrestri: prima applicazione distribuita)
Berkeley Open Infrastructure for Network Computing (BOINC)

http://www.worldcommunitygrid.org/ (progetti per fini umanitari)

Lavorare sulle “nuvole”



La crescente ubiquità della rete stà spingendo il
ritorno di un “vecchio” paradigma (spacciato come
nuovo): il cloud computing
Si tratta della possibilità di usare il proprio PC come
un semplice dispositivo di input/output connesso alla
rete.
Dati e programmi risiedono su server remoti
(collegamento criptato). Il PC diventa un sistema di
I/O (e può essere semplice e “stupido”)
Dati e programmi “in locale”
Server: trasmissione dati
Dati e programmi
Dati e programmi
Dati e programmi
Dati e programmi
Dati e programmi
Dati “su server”, programmi locali
Server: dati di tutti
(esempio: GMAIL)
programmi
programmi
programmi
programmi
programmi
Dati e programmi “su server”
Schermo+tastiera+rete
Server: dati e programmi
(esempio: docs.google.co
Movimento Open Source


Possibilità di aggregare migliaia di
programmatori su un progetto software,
coordinandoli via internet.
Principali risultati:



Sistema operativo Linux
Web server Apache (usato dal 70% dei siti web)
La suite OpenOffice
Movimento Open Source

In questo caso, notevoli capacità di
programmazione richieste (ma non per la traduzione
delle spiegazioni dei software)




Importanza del codice aperto, ma anche della gratuità del
risultato
Problema nei rapporti con software commerciale (in
particolare con la licenza GPL “GNU Public Licence”)
Problema della coordinazione del progetto
Motivazione (si veda il classico “La Cattedrale ed il
Bazar”, in italiano su
http://www.ush.it/2005/09/04/la-cattedrale-e-ilbazaar/)
Wikipedia






“un'enciclopedia online, multilingue, a contenuto libero, redatta in
modo collaborativo da volontari e sostenuta dalla Wikimedia
Foundation, un'organizzazione non-profit”
Versioni in 250 lingue, cui cui 14 con >100.000 voci
Nata nel 2001 come complemento di “Nupedia”, basata però sul
contributo di esperti; fondata da Jimmy Wales;
Principale descrizione:
http://en.wikipedia.org/wiki/Wikipedia:About
Descrizione in italiano:
http://it.wikipedia.org/wiki/Wikipedia
Un interessante articolo di Metitieri, da un punto di vista
“bibliotecario”:
http://www.bibliotecheoggi.it/content/20090101501.pdf
Wikipedia: alcuni dati




75,000 partecipanti attivi
>5,300,000 articoli (tra le varie lingue)
1,796,270 articoli in inglese
300.685 articoli in italiano
Wikipedia: policies





“punto di vista neutrale” (?)
Verificabilità
Niente ricerca originale
Citazione delle fonti
In più, incentivi “morali” per contributi di
qualità (Vetrina dei contributi migliori:
“featured articles/pictures/”…)
Meccanismi di editing




Articolo principale e pagine di discussioni, entrambi editabili (con
poche eccezioni)
Le modifiche rimpiazzano il contenuto precedente, ma tutte le
versioni precedenti di un articolo vengono conservate e possono
facilmente essere ripristinate.
Possibilità di essere avvisati via email se una pagina viene
modificata (sistema di controllo)
Utenti registrati (ma generalità non controllate) o anonimi
(indirizzo IP registrato), con diverse restrizioni sulla modifice
delle pagine.
Formattazione



Segni di formattazioni propri (in parte
sottoinsieme HTML)
Possibilità di inserire link
Pagina di prova (per sperimentare l’editing)
Problema della qualità




Critiche (specialmente da parte degli editor di
enciclopedie più tradizionali), legate alla mancanza
di un processo formale di revisione/controllo.
Legge di Linus: "Dati sufficienti occhi, tutti gli errori
sono superficiali“ (ma è sufficiente?)
Problemi: variabilità nella copertura, faziosità,
vandalismo (cancellazione, oscenità,
disinformazione);
Pregi: reattività, aggiornamento, economicità.
Variabilità nella copertura




Attenzione eccessiva sulla attualità;
Mancanza di copertura per voci “poco
appassionanti” (ma abbondante materiale su soap
operas, etc.)
Affidabilità buona per voci controllate da molti,
discordante per voci specialistiche
Maggiore affidabilità su articoli che sono rimasti
esposti più a lungo (importanza della data)
Visione di parte



Problema degli argomenti controversi: tendenza a
favorire l’accordo a scapito della verità (approccio
del minimo comun denominatore: inserire solo ciò
su cui tutti sono d’accordo, cioè molto poco)
Variazioni continue nel contenuto di alcuni articoli e
conseguente difficoltà a citarne il contenuto
(riportare sempre il testo, non il puntatore, ed
indicare la data)
Esempio: nel agosto 2003 la voce “Microsoft” aveva
avuto 198 revisioni.
Vandalismo



Cancellazione di tutto o gran parte di un
articolo
Inserimento di link o testo fuori tema
Contenuti osceni
Studi sulla resistenza al
vandalismo




Studying Cooperation and Conflict between Authors
with history flow Visualizations
Studio della evoluzione dei mutamenti su un
campione di articoli di Wikipedia
Strumento per la visualizzazione rapida dei
cambiamenti “”history flow”)
Vedi
http://www.research.ibm.com/visual/projects/history_
flow/
Conclusioni:


Grazie al meccanismo di allerta delle watch list, la
concellazione completa di un articolo viene riparata
rapidamente ripristinando la vecchia versione (metà
ripristinata dopo 3 minuti. Metà dei contenuti osceni
eliminati entro 2 minuti).
Più difficile il rilevamento per “new entries”, e per
cambiamenti più insidiosi.


“Tra il 28 dicembre 2005 e il 10 gennaio 2006 l'edizione italiana di
Wikipedia è stata sottoposta a un test da parte del settimanale
L'espresso, che ha inserito quattro errori in altrettante voci
dell'enciclopedia (Alvaro Recoba, Ugo Foscolo, Giovanni Spadolini,
Georg Hegel) e ha inserito una voce del tutto inventata sul poeta
inesistente Carlo Zamolli. La voce Alvaro Recoba è stata corretta in
poco più di un'ora. La voce Georg Hegel è stata corretta dopo dieci
giorni. Le altre due voci errate e la voce inventata sono state corrette
solo dopo l'uscita del settimanale nelle edicole. La voce Elia
Spallanzani, del tutto inventata, è stata inserita l'8 gennaio 2005 e non
è stata corretta fino al 19 maggio 2006. Durante la procedura di
cancellazione la voce è stata modificata in modo da chiarire che si
trattava di una biografia immaginaria.”
(Da http://it.wikipedia.org/wiki/Wikipedia, 20/05/2007)
History Flow: visualizzazione voce
“Microsoft”
Evoluzione delle aggiunte e modifiche alla voce; i colori indicano i diversi partecipanti
Esempi di cancellazioni
Le bande verticali nere indicano cancellazioni massiccie del contenuto
Rappresentazione proporzionata al
tempo
Notare le la cancellazione massiccia diventa invisibile, in quanto troppo breve.
“Edit wars”
Le linee a zig-zag indicano la ripetuta alterazione e ripristino di un particolare
della voce “cioccolata” sulla Wikipedia.
NONSOLOWEB

OPAC: sistemi per la ricerca su cataloghi di
biblioteca

Vedi note del bibliotecario di Unitn Carlo Favale
http://biblio.lett.unitn.it/lezione%20InfoUma.htm

Scarica

Power Point - clic