SEMINARI CAMO 2003 LA SIMULAZIONE NUMERICA COMPIE 50 ANNI 16.12.03 SUPERCALCOLO: DOVE SIAMO E DOVE STIAMO ANDANDO S. Taglienti LA QUESTIONE DI FONDO Il recente sviluppo tecnologico nel supercalcolo non è dovuto ad una pianificazione organica, ma è la risultanza di un insieme di tendenze non sempre concordi, tra le quali prevale il technology push. Esiste il reale bisogno di programmare il prossimo decennio per far fronte alle richieste sempre più determinate e stringenti provenienti dalla comunità scientifica. Parametri critici Banda passante • Canali trasmissivi • Memoria Latenza • Comunicazioni tra processori • Memoria I TREND CPU speed vs. memory bandwidth 1 I TREND Network vs computer performance 2 I TREND Network vs computer performance 1986 - 2000: computer x 500 networks x 340,000 2001 - 2010 computer x 60 network x 4000 3 I TREND Moore. Leggi e leggende Dal 1962 al 2017 D(t) = D1962* 2(t-1962)*.66 4 Classificazione delle architetture di calcolo in base alla latenza Metacomputer. Sistemi distinti ed eterogenei, interconnessi via WAN, con latenze dell’ordine di 10-2 s. Cluster computer. Collezione di sistemi di calcolo autonomi debolmente accoppiati, tipicamente interconnessi in LAN, con latenze dell’ordine di 10-4 – 10-5 s. Sistemi massivamente paralleli. Sono costituiti da molti elementi interconnessi nella stessa unità di elaborazione con latenze dell’ordine di 10-6 - .5*10-6 s. Sistemi vettoriali. La tecnica del “pipelining” consente latenze dell’ordine di 10-8 s. I CLUSTER BEOWULF ELEMENTI PECULIARI M2COTS (Mass Market Commodities Off The Shelf) LAN (Local Area Network) Software di base Open Source Librerie di comunicazione standard IL SUPERCOMPUTING NEL MONDO I TOP 500 I TOP 500: la crescita delle prestazioni I TOP 500: i settori di utenza I TOP 500: le aree geografiche I TOP 500: i cluster avanzano I TOP 500: le architetture vincenti I TOP 500: commodity vs proprietary I TOP 500: L’EUROPA I TOP 500: numeri e riflessioni 1. Sette dei primi dieci sistemi nella top list sono cluster. 2. I cluster passano da 149 a 208 in sei mesi. 3. Il, numero dei sistemi con potenza superiore al teraflop/s in sei mesi è passato da 59 a 131. 4. Il sistema posizionato al 500° posto sei mesi fa era al 290°. 5. La prestazione cumulata dei 500 sistemi passa in sei mesi da 245 a 403 teraflop/s. 6. IBM è sempre più leader per potenza installata, passando dal 31.8 al 34.9%. Seguono HP con il 22.7% e NEC con l’8.7%. IL PROBLEMA DELLA DIVERGENZA Negli ultimi anni il calcolo scientifico è diventato sempre più dipendente da hardware progettato ed ottimizzato per applicazioni commerciali. 1 IL PROBLEMA DELLA DIVERGENZA Effetto complessivo Divergenza tra: potenza di picco e potenza sustained. 2 LA VISIONE USA DEL PROBLEMA Gli aspetti politici: - lo shock dell’Earth Simulator - la volontà di riconquistare una leadership indiscussa nel settore dello HEC Creazione della task force governativa per la rivitalizzazione dello HEC (HECRTF ) LE PROPOSTE DELLA HECRTF: la strategia Investimenti specifici per il supercomputing scientifico (nicchia costosa) Coinvolgimento delle grandi IT companies LE PROPOSTE DELLA HECRTF: gli obiettivi del prossimo quinquennio Potenza di picco di un petaflop/s entro il 2007-2009 Efficienza per applicazioni scientifiche del 30-50% LE PROPOSTE DELLA HECRTF: le architetture Logica riconfigurabile Vector processing Architettura streaming Processor in memory Dispositivi speciali LE PROPOSTE DELLA HECRTF: le tecnologie software o sistemi operativi o linguaggi di alto livello o algoritmi paralleli LE PROPOSTE DELLA HECRTF: le prime architetture 1 1. Parallelo vettoriale con componenti custom (CRAY e ORNL) Dopo X1, seguirà X2 nel 2006 e, entro il 2008, l’architettura ibrida, che comprende processori vettoriali e processori superscalari, porterà al peta-computing LE PROPOSTE DELLA HECRTF: le prime architetture 2 2. ViVA (Virtual Vector Architecture) (IBM, LBNL, LLNL) Processori commerciali modificati Programmabilità come in 1. Costo per unità di potenza pari al 50% rispetto a 1. Blue Planet (160 teraflop/s entro il 2005) LE PROPOSTE DELLA HECRTF: le prime architetture 3 3. Tecnologia SOC (System On a Chip) (IBM, LLNL, ANL) Piattaforma Blue Gene con potenza di picco pari a 180 teraflop/s entro il 2005 Costo per unità di potenza pari al 25% di 1. USA: ALTRE INIZIATIVE Cooperazione HP-Intel per interventi sui microprocessori COTS Cooperazione SNL, Cray, AMD e DOE (ASCI Program) per la piena implementazione dell’architettura Red Storm (da 10000 processori e 40 teraflop/s nel 2004 fino a 30000 processori) Sostegno ai partecipanti al programma DARPA “High Productivity Computer System”: Cray, IBM, HP, SGI, SUN Sviluppo dell’infrastruttura nazionale di interconnessione (GRID)