Il supercalcolo fai-da-te
Il cluster computing - un’ esperienza ENEA
Roberto Guadagni
ENEA - Servizio Centralizzato Informatica e Reti
[email protected]
Alcune definizioni
• Cluster : collezione di nodi + rete di
INFO
comunicazione
• Commodity Cluster : nodi e reti “commerciali”
– Beowulf cluster : pc & linux
– Workstation cluster : workstation & unix
workstation cluster
ENEA
– Beowulf cluster
– Cluster NOW : domina il parallelismo tra nodi (MPI)
– Constellation : domina il parallelismo sul nodo (OpenMP)
Il cluster computing
2/18
Quindi un “Beowulf” è:
ENEA
INFO
• “Commodity Cluster” of networked PCs
– Intel Pentium or …
– Switched 100/1000Mbit/s Ethernet or Myrinet
or QsNet or …
– Linux
– Parallel and batch software support
• “cicli di calcolo al più basso costo possibile”
Il cluster computing
3/18
Un storia di successo
INFO
• 1993 prime teorizzazioni (Beker – Sterling)
• 1994 “Beowulf Project” starts at CESDIS
(Maryland)
– 16 processori connessi con rete a 10 Mbps
• Da allora ogni “mattone” evolve nella giusta
direzione:
Il cluster computing
ENEA
– Processori sempre più integrati/ più potenti / più
economici
– Reti sempre più economiche, veloci ed efficenti
– “Esplosione” della comunità Linux  S.O. sempre più
efficaci
4/18
Cluster Beowulf in ENEA
(siamo nel febbraio 2000)
– Integrazione nodi commerciali e reti commerciali
INFO
• Non solo:
• Anche requisiti più stringenti:
Facilità di gestione
Recupero dei guasti
Facile espansione
Integrazione nella Griglia ENEA
Il cluster computing
ENEA
–
–
–
–
5/18
Quindi …
• Requisiti dell’architettura:
montato su rack
processore up-to-date
basso parallelismo nel nodo
gestione flessibile
rete adeguata alle necessità
INFO
–
–
–
–
–
• Requisiti del partner industriale:
Il cluster computing
ENEA
– condivisione obiettivi
– affidabilità
– cooperazione
6/18
Quindi ….
–
–
–
–
–
montato su rack
processore up-to-date
basso parallelismo nel nodo
gestione flessibile
rete adeguata alle necessità
Scheda
biprocessore alpha
INFO
• Requisiti dell’architettura:
• Requisiti del partner industriale:
Il cluster computing
ENEA
– condivisione obiettivi
– affidabilità
– cooperazione
7/18
Quindi …..
–
–
–
–
–
montato su rack
processore up-to-date
basso parallelismo nel nodo
gestione flessibile
rete adeguata alle necessità
Scheda
biprocessore alpha
INFO
• Requisiti dell’architettura:
– condivisione obiettivi
– affidabilità
– cooperazione
Il cluster computing
ENEA
• Requisiti del partner industriale:
QSW
8/18
Quindi ……
–
–
–
–
–
montato su rack
processore up-to-date
basso parallelismo nel nodo
gestione flessibile
rete adeguata alle necessità
Scheda
biprocessore alpha
INFO
• Requisiti dell’architettura:
QsNet + FastEth.
– condivisione obiettivi
– affidabilità
– cooperazione
Il cluster computing
ENEA
• Requisiti del partner industriale:
QSW
9/18
Quindi …….
–
–
–
–
–
montato su rack
processore up-to-date
basso parallelismo nel nodo
gestione flessibile
rete adeguata alle necessità
Scheda
biprocessore alpha
INFO
• Requisiti dell’architettura:
“Pandora”
QsNet + FastEth.
– condivisione obiettivi
– affidabilità
– cooperazione
Il cluster computing
ENEA
• Requisiti del partner industriale:
QSW
10/18
INFO
Scheda biprocessore Alpha
Two Alpha 21264 processors running at 667, each with integrated
4Mb, L2 Cache
•
• 3.2GB/s L2 Cache bandwidth
• 2.65GB/s memory bandwidth
• 1GB RAM with ECC 256-bit wide
ENEA
memory bus
• 6 PCI slots: Two 64-bit and four 32-bit
• One shared ISA expansion slot
• Two serial ports with modem control
• Dual USB ports
•Il cluster
Thermal
sensor
computing
11/18
INFO
Rete QsNet
• Elan 3
ENEA
• Topologia fath-tree
• Latenza: 4.6 µs
• Larghezza di banda: 300 Mbytes/s
Il cluster computing
12/18
ENEA
INFO
Cluster “Feronia”
Il cluster computing
13/18
Reti specializzate
Qsnet Switch
INFO
Switch Fast Ethernet
feronia1
feronia40
ENEA
feronia0
Terminal Concetrator
Il cluster computing
Hub Fast Ethernet
14/18
40 nodi biprocessore UP2000
100 Gflops
1 nodo di front-end
3 reti: switch, hub, terminal concentrator
Linux, compilatori gnu, librerie compaq
MPI-CH
NIS/NFS
SSH + Tcpwrapper
Il cluster computing
ENEA
•
•
•
•
•
•
•
•
INFO
Configurazione
15/18
La storia e l’evoluzione
rilascio con QsNet e 16 nodi
upgrade a 40 nodi
nasce “feronix” con 6 nodi
Xeon
INFO
• 9/2000
• 6/2001
• 2/2003
Il cluster computing
ENEA
• In valutazione  nuova partizione AMD
16/18
Usabilità
Il cluster computing
ENEA
INFO
• Profili e dati utente omogenei
• Adattabilità ai diversi dialetti di
comunicazione
(MPI/MPICH/PVM)
• Più ambienti disponibili
• Compatibilità con la “griglia
computazionale”
• Supporto on-site
• Percorsi formativi
17/18
INFO
ENEA
[email protected]
Il cluster computing
18/18
Scarica

Cluster