Il supercalcolo fai-da-te Il cluster computing - un’ esperienza ENEA Roberto Guadagni ENEA - Servizio Centralizzato Informatica e Reti [email protected] Alcune definizioni • Cluster : collezione di nodi + rete di INFO comunicazione • Commodity Cluster : nodi e reti “commerciali” – Beowulf cluster : pc & linux – Workstation cluster : workstation & unix workstation cluster ENEA – Beowulf cluster – Cluster NOW : domina il parallelismo tra nodi (MPI) – Constellation : domina il parallelismo sul nodo (OpenMP) Il cluster computing 2/18 Quindi un “Beowulf” è: ENEA INFO • “Commodity Cluster” of networked PCs – Intel Pentium or … – Switched 100/1000Mbit/s Ethernet or Myrinet or QsNet or … – Linux – Parallel and batch software support • “cicli di calcolo al più basso costo possibile” Il cluster computing 3/18 Un storia di successo INFO • 1993 prime teorizzazioni (Beker – Sterling) • 1994 “Beowulf Project” starts at CESDIS (Maryland) – 16 processori connessi con rete a 10 Mbps • Da allora ogni “mattone” evolve nella giusta direzione: Il cluster computing ENEA – Processori sempre più integrati/ più potenti / più economici – Reti sempre più economiche, veloci ed efficenti – “Esplosione” della comunità Linux S.O. sempre più efficaci 4/18 Cluster Beowulf in ENEA (siamo nel febbraio 2000) – Integrazione nodi commerciali e reti commerciali INFO • Non solo: • Anche requisiti più stringenti: Facilità di gestione Recupero dei guasti Facile espansione Integrazione nella Griglia ENEA Il cluster computing ENEA – – – – 5/18 Quindi … • Requisiti dell’architettura: montato su rack processore up-to-date basso parallelismo nel nodo gestione flessibile rete adeguata alle necessità INFO – – – – – • Requisiti del partner industriale: Il cluster computing ENEA – condivisione obiettivi – affidabilità – cooperazione 6/18 Quindi …. – – – – – montato su rack processore up-to-date basso parallelismo nel nodo gestione flessibile rete adeguata alle necessità Scheda biprocessore alpha INFO • Requisiti dell’architettura: • Requisiti del partner industriale: Il cluster computing ENEA – condivisione obiettivi – affidabilità – cooperazione 7/18 Quindi ….. – – – – – montato su rack processore up-to-date basso parallelismo nel nodo gestione flessibile rete adeguata alle necessità Scheda biprocessore alpha INFO • Requisiti dell’architettura: – condivisione obiettivi – affidabilità – cooperazione Il cluster computing ENEA • Requisiti del partner industriale: QSW 8/18 Quindi …… – – – – – montato su rack processore up-to-date basso parallelismo nel nodo gestione flessibile rete adeguata alle necessità Scheda biprocessore alpha INFO • Requisiti dell’architettura: QsNet + FastEth. – condivisione obiettivi – affidabilità – cooperazione Il cluster computing ENEA • Requisiti del partner industriale: QSW 9/18 Quindi ……. – – – – – montato su rack processore up-to-date basso parallelismo nel nodo gestione flessibile rete adeguata alle necessità Scheda biprocessore alpha INFO • Requisiti dell’architettura: “Pandora” QsNet + FastEth. – condivisione obiettivi – affidabilità – cooperazione Il cluster computing ENEA • Requisiti del partner industriale: QSW 10/18 INFO Scheda biprocessore Alpha Two Alpha 21264 processors running at 667, each with integrated 4Mb, L2 Cache • • 3.2GB/s L2 Cache bandwidth • 2.65GB/s memory bandwidth • 1GB RAM with ECC 256-bit wide ENEA memory bus • 6 PCI slots: Two 64-bit and four 32-bit • One shared ISA expansion slot • Two serial ports with modem control • Dual USB ports •Il cluster Thermal sensor computing 11/18 INFO Rete QsNet • Elan 3 ENEA • Topologia fath-tree • Latenza: 4.6 µs • Larghezza di banda: 300 Mbytes/s Il cluster computing 12/18 ENEA INFO Cluster “Feronia” Il cluster computing 13/18 Reti specializzate Qsnet Switch INFO Switch Fast Ethernet feronia1 feronia40 ENEA feronia0 Terminal Concetrator Il cluster computing Hub Fast Ethernet 14/18 40 nodi biprocessore UP2000 100 Gflops 1 nodo di front-end 3 reti: switch, hub, terminal concentrator Linux, compilatori gnu, librerie compaq MPI-CH NIS/NFS SSH + Tcpwrapper Il cluster computing ENEA • • • • • • • • INFO Configurazione 15/18 La storia e l’evoluzione rilascio con QsNet e 16 nodi upgrade a 40 nodi nasce “feronix” con 6 nodi Xeon INFO • 9/2000 • 6/2001 • 2/2003 Il cluster computing ENEA • In valutazione nuova partizione AMD 16/18 Usabilità Il cluster computing ENEA INFO • Profili e dati utente omogenei • Adattabilità ai diversi dialetti di comunicazione (MPI/MPICH/PVM) • Più ambienti disponibili • Compatibilità con la “griglia computazionale” • Supporto on-site • Percorsi formativi 17/18 INFO ENEA [email protected] Il cluster computing 18/18