IL SITO WEB DI TORINO 2006:
PROGETTO, REALIZZAZIONE, ESERCIZIO
Luca Mazzocchi – [email protected]
Senior Solution Architect
Contesto
Descrizione del progetto
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Descriveremo il progetto, la realizzazione e l’erogazione dei siti
web delle:
 XX Olimpiadi Invernali di Torino 2006
 IX Paralimpiadi Invernali di Torino 2006
Entrambi i progetti sono stati realizzati da Matrix, una società
del gruppo Telecom Italia.
Il mio ruolo nel progetto è stato di:
 Responsabile tecnico
http://www.torino2006.org
http://www.paralympicgames.torino2006.org
Storia
Crescita di internet
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Il progetto
I requisiti
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Per rispondere ai seguenti requisiti
 fino a 50 milioni di pagine viste al giorno
 risultati competizioni in tempo reale
 velocità di accesso costante da tutto il mondo
 ridondato geograficamente
 gestione picchi di traffico e attacchi DoS
Il progetto
Capacity plan
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
pagine erogate nell’ora di massimo traffico = 50 Milioni *0,1 = 5 Milioni
media pagine viste al secondo = pagine erogate nell’ora di massimo
traffico / 3600 sec = 1388 pag/sec
coefficiente di picco = 2
picco = media pagine viste al secondo * coefficiente di picco = 2777
pag/sec
Ipotizzando una pagina d dimensione media di 150 KByte implica una
capacità di banda di circa 3,1 GBit/sec = 2770 * 150 Kbyte * 8
Il progetto
Studio di fattibilità
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
CMS, pagine statiche vs. pagine dinamiche
Ricerche, database vs. search engine
Modalità di erogazione, pull vs. push (Akamai)
Piattaforma Linux vs. Microsoft
Il progetto
Le soluzioni – Architettura basata su CDN
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
 Integrazione con CDN di Akamai
 Nessun web server in data center Telecom Italia
 Erogati solo file statici
 CMS
 Output HTML
 WAI A e AAA
 Sistema dei risultati
 Output HTML
 WAI A e AAA
 Motore di ricerca full-text
 Indicizzazione su file system
 tipizzazione file HTML
Il progetto
Le soluzioni – Architettura basata su CDN
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
 Architettura basata Content Delivery Network (Akamai)
Overlay Network
Contenuti erogati vicino alla richiesta
 Risoluzione del first mile, last mile, peering e backbone problem
 1.000 reti
 18.000 server
 20% traffico internet
Il progetto
First mile, last mile, peering e backbone problem
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Il progetto
First mile, last mile, peering e backbone problem
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
BGP ignora la congestione
Esistono rapporti economici internet provider (Tier 1 contro
Tier 2,3)
Gli internet provider aumentano (così le sessioni BGP)
Errori umani (Level 3)
Il progetto
Soluzione Akamai - Edge computing
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Il progetto
Soluzione Akamai - Edge computing
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Il progetto
Risoluzione DNS
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Il progetto
Cenni storici
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
•
•
•
•
•
•
•
Cambridge, MA
Founded by MIT research team
– F. Thomson Leighton, Chief Scientist
– Danny Lewin, CTO
– Fondata nel 1995 come iniziativa dell’MIT per migliorare le
performance di internet
Investitori: Apple ($12M), Microsoft ($15M) and
Cisco ($49M)
http://www-math.mit.edu/%7Esteng/18.996/
http://www.akamai.com/en/resources/pdf/technical_publications/Consi
stenHashingandRandomTreesDistributedCachingprotocolsforrelieving
HotSpotsontheworldwideweb.pdf
Consistent Hashing
Akamai vs. Peer to peer
Il progetto
Le soluzioni – Architettura basata su CDN
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Architettura basata Content Delivery Network (Akamai)
 Nessun web server in data center Telecom Italia
 Solo pagine statiche (eccetto ricerca con XML/XSLT e linguaggio ESI)
Il progetto
Architettura di rete - 1
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Il progetto
Architettura di rete - 2
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Il progetto
Data center
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Il progetto
Le soluzioni – Content management system basato su XML
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
CMS
 Output HTML
 Separazione contenuto/presentazione
 supporta specifiche WAI A e AAA
Il progetto
Le soluzioni – Sistema dei risultati
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Sistema dei risultati
 Output HTML
 pipeline di esecuzione indipendenti
 Scalabile verticalmente e orizzontalmente
 tempo massimo di gestione messaggio 15 sec
Il progetto
Le soluzioni – Motore di ricerca full-text
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Motore di ricerca
 Indicizzazione su file system dove possibile
 Pagine HTML tipizzate con tassonomie
 Erogazione su server Akamai con trasformazione XML/XSLT
Dati di traffico
Indicatori di traffico in sintesi
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
 Il picco di consumo di banda è stato di 3,4 Mbit/sec con 17.700 hit/sec.
 tempo medio di permanenza per ogni visita è stato di 12 minuti con
circa 23 pagine viste
 Il numero di p.v. per visita ed il tempo di sessione medio indica che gli
utenti finali hanno usato il web per seguire le competizioni
Dati di traffico
Pagine viste: comparazione con Atene e Salt Lake
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
 Sorprendentemente l’andamento del traffico (misurato in p.v.) di Atene 2004 e
Torino 2006 è praticamente uguale
 Il sito di Torino 2006 ha sviluppato completamente il potenziale di traffico della base
di utenti
 Le pagine dinamiche al crescere del traffico rallentano, gli utenti abbandonano il sito
Costi di progetto
Budget e digitalizzazione dei contenuti
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
 Il sito di Salt Lake è costato quasi 6 volte quello di Torino 2006. Quello di Atene
2004 è costato 3 volte più di quello di Torino 2006.
 Limiti di budget impongono scelte progettuali semplici ma efficaci. Gli indicatori di
di performance di Torino 2006 sono migliori di quelli delle precedenti Olimpiadi
 L’impegno in gg/uomo per le attività di produzione di contenuti digitali ha quasi
superato quello delle attività tecnologiche
 E’ in linea con la tendenza insita nella convergenza digitale che pone l’enfasi
sulla produzione di contenuti rispetto ai media con cui si fruiranno
Ruolo della tecnologia
Utilizzare tecnologie appropriate
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
 L’esperienza di Torino 2006 mostra come la disponibilità di tecnologie
appropriate influenzi il web design
 E’ stato analizzato il circolo virtuoso rappresentato dall’adozione di CDN,
pagine statiche, CMS con output HTML e Search Engine
Utilizzo della CDN
=>
Pagine statiche
Pagine statiche
=>
Sito veloce
Pagine statiche
=>
URL usabili
Pagine statiche
=>
Indicizzabili
CMS con output HTML
=>
Architettura informazione regolare
Search Engine
=>
Tassonomizzazione contenuti
Tassonomizzazione contenuti =>
 Semplicità
 Velocità
 Contenuti appropriati
Contenuti appropriati
Conclusioni
Perché sono importanti le tecnologie delle comunicazioni
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Elites
Uomini e donne, età medio giovane
Istruzione e reddito alti
Professionisti, Imprenditori, Funzionari
Centralità sociale, Apertura al cambiamento
Sperimentazione, Accettazione del rischio
Progettualità professionale e culturale
Forti istanze sociali:
- partecipazione politica
- efficienza servizi
- questione morale
- iniziativa economica
Uomini, età media
Istruzione e reddito medio alti
Professioni alte e medie
Innovazione e rischio
Leadership
Progettualità professionale
Iniziativa economica
Questione morale
Contesti
adulti
maschili
Uomini, età medio-giovane
Istruzione e reddito medio bassi
Operai e Professioni autonome
Decisione, Disponibilità al rischio
Individualismo
Piacere e divertimento
Libertà dai doveri
Potere ai lavoratori
Conclusioni
Il futuro
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
 La tecnologia ha il compito di essere appropriata rispetto all’obiettivo di orientare
la base di utenti potenziali all’utilizzo del media, qualunque esso sia
 A Beijing 2008 i problemi che dovranno essere risolti saranno analoghi a quelli
di Torino 2006, amplificati dall’accesso al sito della comunità di lingua cinese
 A Vancouver 2010 lo scenario sarà radicalmente diverso perchè i fenomeni di
convergenza digitale renderanno il web uno dei possibili strumenti di
comunicazione (IPTV, cellulari evoluti, TV)
 Diventerà cruciale saper utilizzare tecnologie appropriate (CDN, CMS e Search
Engine) per non indurre i potenziali utenti ad utilizzare altri media digitali.
Conclusioni
The real life
1.Contesto
2.Storia
3.Il progetto
4.Dati di traffico
5.Costi di progetto
6.Ruolo tecnologia
7.Conclusioni
Scarica

Il sito web di Torino 2006