SEMINARI CAMO 2003
LA SIMULAZIONE NUMERICA
COMPIE 50 ANNI
16.12.03
SUPERCALCOLO:
DOVE SIAMO E
DOVE STIAMO ANDANDO
S. Taglienti
LA QUESTIONE DI FONDO
Il recente sviluppo tecnologico nel supercalcolo non
è dovuto ad una pianificazione organica, ma è la
risultanza di un insieme di tendenze non sempre
concordi, tra le quali prevale il technology push.
Esiste il reale bisogno di programmare il prossimo
decennio per far fronte alle richieste sempre più
determinate e stringenti provenienti dalla
comunità scientifica.
Parametri critici


Banda passante
• Canali trasmissivi
• Memoria
Latenza
• Comunicazioni tra processori
• Memoria
I TREND
CPU speed vs. memory bandwidth
1
I TREND
Network vs computer
performance
2
I TREND
Network vs computer
performance


1986 - 2000:
computer x 500
networks x 340,000
2001 - 2010
computer x 60
network x 4000
3
I TREND
Moore. Leggi e leggende
Dal 1962 al 2017
D(t) = D1962* 2(t-1962)*.66
4
Classificazione delle architetture di calcolo
in base alla latenza




Metacomputer. Sistemi distinti ed eterogenei,
interconnessi via WAN, con latenze dell’ordine di 10-2 s.
Cluster computer. Collezione di sistemi di calcolo autonomi
debolmente accoppiati, tipicamente interconnessi in LAN,
con latenze dell’ordine di 10-4 – 10-5 s.
Sistemi massivamente paralleli. Sono costituiti da molti
elementi interconnessi nella stessa unità di elaborazione con
latenze dell’ordine di 10-6 - .5*10-6 s.
Sistemi vettoriali. La tecnica del “pipelining” consente
latenze dell’ordine di 10-8 s.
I CLUSTER BEOWULF
ELEMENTI PECULIARI

M2COTS (Mass Market Commodities
Off The Shelf)

LAN (Local Area Network)

Software di base Open Source

Librerie di comunicazione standard
IL SUPERCOMPUTING NEL
MONDO
I TOP 500
I TOP 500: la crescita delle
prestazioni
I TOP 500: i settori di utenza
I TOP 500: le aree geografiche
I TOP 500: i cluster avanzano
I TOP 500: le architetture vincenti
I TOP 500: commodity vs proprietary
I TOP 500: L’EUROPA
I TOP 500: numeri e riflessioni
1.
Sette dei primi dieci sistemi nella top list sono cluster.
2.
I cluster passano da 149 a 208 in sei mesi.
3.
Il, numero dei sistemi con potenza superiore al teraflop/s in sei
mesi è passato da 59 a 131.
4.
Il sistema posizionato al 500° posto sei mesi fa era al 290°.
5.
La prestazione cumulata dei 500 sistemi passa in sei mesi da
245 a 403 teraflop/s.
6.
IBM è sempre più leader per potenza installata, passando dal
31.8 al 34.9%. Seguono HP con il 22.7% e NEC con l’8.7%.
IL PROBLEMA DELLA DIVERGENZA
Negli ultimi anni il calcolo scientifico è
diventato sempre più dipendente da
hardware progettato ed ottimizzato per
applicazioni commerciali.
1
IL PROBLEMA DELLA DIVERGENZA
Effetto complessivo
Divergenza tra:
potenza di picco e
potenza sustained.
2
LA VISIONE USA DEL PROBLEMA
Gli aspetti politici:
- lo shock dell’Earth Simulator
- la volontà di riconquistare una leadership indiscussa nel
settore dello HEC
Creazione della task force governativa per la
rivitalizzazione dello HEC (HECRTF )
LE PROPOSTE DELLA HECRTF: la strategia


Investimenti specifici per il supercomputing
scientifico (nicchia costosa)
Coinvolgimento delle grandi IT companies
LE PROPOSTE DELLA HECRTF:
gli obiettivi del prossimo quinquennio

Potenza di picco di un petaflop/s entro il 2007-2009

Efficienza per applicazioni scientifiche del 30-50%
LE PROPOSTE DELLA HECRTF:
le architetture

Logica riconfigurabile

Vector processing

Architettura streaming

Processor in memory

Dispositivi speciali
LE PROPOSTE DELLA HECRTF:
le tecnologie software
o
sistemi operativi
o
linguaggi di alto livello
o
algoritmi paralleli
LE PROPOSTE DELLA HECRTF:
le prime architetture
1
1. Parallelo vettoriale con componenti
custom
(CRAY e ORNL)
Dopo X1, seguirà X2 nel 2006 e, entro il 2008,
l’architettura ibrida, che comprende processori
vettoriali e processori superscalari, porterà al
peta-computing
LE PROPOSTE DELLA HECRTF:
le prime architetture
2
2. ViVA (Virtual Vector Architecture)
(IBM, LBNL, LLNL)

Processori commerciali modificati

Programmabilità come in 1.

Costo per unità di potenza pari al 50% rispetto a 1.

Blue Planet (160 teraflop/s entro il 2005)
LE PROPOSTE DELLA HECRTF:
le prime architetture
3
3. Tecnologia SOC (System On a Chip)
(IBM, LLNL, ANL)


Piattaforma Blue Gene con potenza di picco pari a
180 teraflop/s entro il 2005
Costo per unità di potenza pari al 25% di 1.
USA: ALTRE INIZIATIVE




Cooperazione HP-Intel per interventi sui microprocessori
COTS
Cooperazione SNL, Cray, AMD e DOE (ASCI Program) per
la piena implementazione dell’architettura Red Storm (da
10000 processori e 40 teraflop/s nel 2004 fino a 30000
processori)
Sostegno ai partecipanti al programma DARPA “High
Productivity Computer System”: Cray, IBM, HP, SGI, SUN
Sviluppo dell’infrastruttura nazionale di interconnessione
(GRID)
Scarica

SEMINARI CAMO 2003