CAPI 2004 8° Workshop sul Calcolo ad Alte Prestazioni in Italia IL CALCOLO PARALLELO PER LA MODELLISTICA ATMOSFERICA M.Pasqui1, B. Gozzini1, L. Ruffo2. G. Giuliani2, G. Maracchi1 1) IBIMET-CNR, Via Caproni, 8, 50145 Firenze e-mail: [email protected] 2) LaMMA-IBIMET, Via Madonna del Piano, 50019 Sesto Fiorentino (FI) www.ibimet.cnr.it Laboratorio per la Meteorologia e la Modellistica Ambientale Progetto Regione Toscana - Unione Europea Contratto FERS (U.E.) reg. 2081/93 Attuale gestione: Istituto di Biometeorologia Campi IBIMET di applicazione: - CNR • Meteorologia • Qualità dell’aria Servizio Meteorologico Regionale • Climatologia LaMMA-SKYMED SPA • Osservazione della terra soci: Regione Toscana, Agenzia Spaziale Italiana, Consiglio • Nazionale Sistemi informativi delle Ricerche, FMA LEGGE REGIONALE 6 aprile 2000, n. 55 www.lamma.rete.toscana.it www.lamma.rete.toscana.it SERVIZIO METEOROLOGICO REGIONALE monitoraggio dello stato del tempo atmosferico in atto mediante osservazioni remote (radar, satelliti, …) previsioni meteo per RAI (TG3 e GR1), Web, Comuni, Lago di Bilancino, giornali, radio locali, UVB, stagionali, … fornitura campi meteorologici per l’ARPAT supporto alla Protezione Civile con presenza operativa di un previsore meteo 7 giorni su 7 sperimentazione di nuove tecnologie per l’osservazione dei fenomeni: satelliti, pluviometro lineare, ….. 22/11/2004 Ogni previsione meteorologica si basa su una fase di osservazione dell’atmosfera che può essere di due tipi: Osservazioni da terra Osservazioni satellitare Esigenza servizio operativo: dati in tempo reale Osservazioni: base di partenza per le previsioni elaborate utilizzando modelli meteorologici Modello Meteorologico: modello matematico che, a partire dallo stato attuale, è in grado di simulare l'evoluzione dell’atmosfera per un determinato numero di giorni Esigenza servizio operativo: previsioni in tempi utili ed alto dettaglio sul territorio LA CATENA PREVISIONALE Rete globale di rilevazione dati atmosferici Centri di elaborazione dati e produzione previsioni a scala globale: per l’Europa ECMWF presso Reading, UK Centri elaborazione dati e previsioni a scala locale Utenti finali 5 MODELLI GLOBALI A partire dalla situazione attuale a livello globale effettuano la previsione di parametri meteorologici per l’intero globo Modello globale Dati satellitari Dati da reti di rilevamento globale: stazioni meteo boe palloni sonda Pressione al livello del mare e geopotenziale 500 hPa Risol. Oriz. 50/60 Km Precipitazioni previste (mm/6h) IL MODELLO RAMS PRESSO IL LaMMA I Modelli Globali elaborano previsioni sull’intero globo, ma poco dettagliate (a bassa risoluzione) Per ottenere previsioni più dettagliate si impiegano i modelli ad area limitata (RAMS) che grazie alle informazioni dei modelli globali forniscono previsioni ad alta risoluzione Elaborazioni modello globale Modello RAMS LaMMA GFS/AVN Model 00/12 UTC Run 60 km. Elaborazioni modello RAMS Previsioni Meteorologiche richiedono elaborazioni su domini quadrimensionali: calcolo di stime su milioni di variabili e trilioni di operazioni per secondo in virgola. Maggiore Accuratezza Aumento esponenziale numero di operazioni Maggiore tempo per l’elaborazione Enorme potenza di calcolo, di memoria, di spazio disco. 22/11/2004 Grid 1 40 kM Cenni storici 1998 COMPAQ XP900-ALPHASTATION RAMS 3b Model Configuration Grid 2 8 kM TWO NESTED GRIDS GRID 1: 40x36 points (40 Km), 24 levels. GRID 2: 42x52 points (8 Km), 24 levels. INITIALIZED with ECMWF-GCM (T319) 12:00 UTC RUN (0.5°X0.5° Resolution) FORECAST PERIOD: 72 HOURS COMPUTATIONAL TIME: 13 HOURS 22/11/2004 9 Un’unica macchina non riesce a sopperire alle risorse richieste Cluster Dallo sviluppo delle tecnologie di rete e del sistema distribuito raggiunti nel 1990 Supercomputer soluzione disponibile dal 1970 Alta Scalabilità Alte prestazioni Alta affidabilità ed efficienza Tecnologia Proprietaria Buon rapporto prezzo/prestazioni Elevati costi Hardware reperibile da più fonti (costi Bassa scalabilità contenuti e facile manutenzione). Protocolli e librerie standard (software facilmente reperibile) 22/11/2004 Nostra Scelta Novembre 2000 - Inizia l’avventura Cluster ... l’avventura continua (febbraio 2001) 2000 BELLEROFONTE 17 PC Linux Cluster • 10 PIII/800 MHz • 7 PIII/1 GHz • 1 Switch 3COM 3300 24 porte a 100Mb/s MASTER Node SWITCH •PIII-800 Mhz •512 Mbyte RAM •80 GByte HD •Linux Red Hat 6.2 with Kernel 2.2.14 •PIII 800/1000 Mhz •256 Mbyte RAM •20 GByte HD •Linux Red Hat 6.2 with Kernel 2.2.14 MASTER Node Node Node Node Node Node Node Node Node Node Node Node Node Node Node Node Node Conceptual Scheme #1 BELLEROFONTE Linux Cluster RAMS MPICH Linux Red Hat Tipologia di diagramma di flusso del cluster Conceptual Scheme #2: Domain Decomposition BELLEROFONTE Linux Cluster Esempio: 10 PC - Linux Cluster Il processo computazionale seriale viene scomposto in: • 1 processo master: inizializzazione e I/O • 9 processi node/compute: calcolo effettivo Domain decomposition: rappresenta la strategia di distribuzione del carico computazionale sui nodi di calcolo presenti. Ogni Nodo comunica con i Nodi adiacenti scambiandosi le righe di overlap dei subdomain ad ogni timestep della simulazione. Il Subdomain RAMS è stato sviluppato per architetture con memoria distribuita, ma possiede un’elevata efficienza di calcolo anche su architetture con memoria condivisa. IL MODELLO RAMS presso il LaMMA 2000 CENTRO EUROPEO PER LE PREVISIONI A MEDIO TERMINE 20 km. MODELLO GLOBALE ECMWF ECMWF Model 12 UTC Run 60 km. LaMMA “Bellerofonte” Cluster Linux 22/11/2004 4 km. RAMS Operativo “Toscana” Wall Time (I/O + Sys) Wall Time (I/O) Crescita comput. Spin-up Wall Time (Comp.) Configurazione Operativa RAMS 20 Km 2000 4 Km TEMPISTICA DI BELLEROFONTE Ore 1:00 dati modello ECMWF (12 UTC) disponibili al LaMMA Ore 1:00 parte in cascata la run del modello RAMS Km Ore 7:00 4escono le previsioni relative alle prime 24 ore Ore 8:00 quelle per domani (24-48) Ore 9:00 quelle di dopodomani (48-72) 2 Griglie innestate (Two-Way nesting) “Specifiche Griglia 1” • 100x97 punti griglia, 26 liv. Vert., 11 liv. suolo • r.o. 20 Km, r.v. 50m < Z < 1000m, • Simulaz. giorn. a + 60h. • Circa 6 min per 1 ora di previsione “Specifiche Griglia 2” • 90x97 punti griglia, 26 liv. Vert., 11 liv. suolo • r.o. 4 Km, 50m < Z < 1000m, • Simulaz. Giorn. a + 60h. • Circa 6 min per 1 ora di previsione RAMS Operativo “Toscana” 9.00 Total Elapsed Time 8.50 Total Elapsed Time [hour] 8.00 7.50 7.00 6.50 6.00 Grazie a nuovi flags di compilazione 5.50 5.00 27/02/2002 01/03/2002 03/03/2002 05/03/2002 07/03/2002 09/03/2002 Date 11/03/2002 13/03/2002 15/03/2002 17/03/2002 DESMO 2003 L’attuale Cluster è costituito da 21 nodi di calcolo e da un Master che svolge anche la funzione di Server I/O fornendo tutti i servizi di rete di cui necessitano i vari nodi Software: S.O. RedHat Linux 9C Kernel 2.24.26 smp gcc 3.2.2-5 MPICH 1.2.5 Il cluster aderisce al modello Beowulf Intel PGHPF90 5.2-1 Nodi bi-processore AMD Athlon ™ Master processore AMD Athlon ™ MP 2400 - 2,4GHz RAM 512 MB 2 Hard Disk SCSI da 72GB Schede rete 3COM: 100BaseTx, 1000BaseTx Scheda rete Intel Pro 100 MP 2400 - 2,4GHz RAM 512 MB Hard Disk EIDE 30GB Schede rete 3COM: 100BaseTx, 1000BaseTx 22/11/2004 CAMPI PER INIZIALIZZAZIONE MODELLO RAMS Orografia: U.S. Geological Survey (USGS). risoluzione orizzontale spaziale di circa 1 Km; “land use”: U.S. Geological Survey (USGS). risoluzione nominale di 1 Km, è basato sul sensore AVHRR temperatura superficiale del mare derivata dal sensore AVHRR/NOAA. La risoluzione a terra dei dati è di 4 km Dati GFS modello globale AVN run 00/12, risoluzione 50 Km 2003 CONFIGURAZIONE OPERATIVA DI RAMS 2003 Prima griglia (184x120) copre tutto il Mediterraneo e usa la parametrizzazione convettiva KF Seconda griglia (158x178) copre l’intera penisola e usa la parametrizzazione convettiva KF Terza griglia (158x178) centrata sulla Toscana e non usa nessuna parametrizzazione convettiva Doppia run al giorno (00 e 12 UTC) Risoluzione verticale da 50 metri vicino al suolo a 1,2 km al top, con 36 livelli totali. SCHEDA: le griglie di RAMS Operativo “Toscana” Griglia 1 (32 Km): 1. 184 x 120 punti griglia, 36 livelli verticali, 11 livelli di suolo. 2. Risoluzione spaziale orizzontale: 32 km. 3. Risoluzione spaziale verticale: da 50 m fino a 1100 m, con un fattore di stretching di 1.125. 4. Time-step: 90 sec. 5. Parametrizzazione convettiva attivata Griglia 2 (8 Km): 1. 158 x 178 punti griglia, 36 livelli verticali, 11 livelli di suolo. 2. Risoluzione spaziale orizzontale: 8 km. 3. Risoluzione spaziale verticale: da 50 m fino a 1100 m, con un fattore di stretching di 1.125. 4. Time-step: 90/4 sec, NNDRAT = 4 5. Parametrizzazione convettiva attivata. Griglia 3 (2 Km): 1. 158 x 178 punti griglia, 36 livelli verticali, 11 livelli di suolo. 2. Risoluzione spaziale orizzontale: 2 km. 3. Risoluzione spaziale verticale: da 50 m fino a 1100 m, con un fattore di stretching di 1.125. 4. Time-step: 90/16 sec, NNDRAT = 16 5. Nessuna parametrizzazione convettiva. 2003 Le nuove griglie RAMS: la catena operativa 2003 SCARICO DATI DA AVN (RUN 00): dati disponibili ore 05:00 1° RUN 2-WAY NESTING 32 km. Prev. 72 H Tempi: circa 6 ore 2 volte al giorno 8 km. 2° RUN 2-WAY NESTING 8 km. Prev. 48 H Tempi: circa 6,5 ore 1 volta al giorno DOPPIA RUN DATI AVN (run 12):dati disponibili ore 17:00 22/11/2004 2 km. CONFIGURAZIONE DEL MODELLO RAMS PRESSO IL LaMMA Esempi di alcune variabili a diverse risoluzioni: • vento a 10 metri (m/s) • pioggia (mm) • nuvolosità 2003 ATTUALE CONFIGURAZIONE OPERATIVA DI RAMS Prima griglia (200x172), 35 livelli verticali, 11 livelli di suolo, risol. orizzontale: 20 km. Risoluzione verticale: da 50 m fino a 1100 m, con un fattore di stretching di 1.133. Time-step: 60 sec. Parametrizzazione convettiva attivata (Kain - Fritsch). Seconda griglia (180x134), 36 livelli verticali, 11 livelli di suolo, risol. orizzontale: 6.5 km. Risoluzione verticale: da 50 m fino a 1100 m, con un fattore di stretching di 1.125. Time-step: 20 sec. Parametrizzazione convettiva attivata (Kain - Fritsch). 2004 ATTUALE CONFIGURAZIONE OPERATIVA DI RAMS Esempi di alcune variabili a diverse risoluzioni: • vento a 10 metri (m/s) • pioggia (mm) • nuvolosità 2004 MODELLO METEOROLOGICO RAMS 2004 I tempi della catena operativa SCARICO DATI DA AVN (RUN 00): dati disponibili ore 04:00 Tempo di scarico via FTP 10 min. Tempi di calcolo: 20 km 40 minuti per 24 ore 6,5 Km 72 minuti per 24 ore 04:10 circa: inizio run 05:40 circa: 20 km 3 giorni DOPPIA RUN DATI AVN (12): dati disponibili ore 16:00 08:30 circa: 6,5 km 2 giorni dati su web e per modelli in cascata dati su web e per modelli in cascata 22/11/2004 Svantaggi Soluzione Cluster Amministrazione più onerosa di quella di un singolo sistema In fase di studio sistema di monitoraggio dello stato di “salute di rete” automatico Procedure di installazione e aggiornamento automatico Dati Analisi dei Sniffer Registrazione Dati dati e-mail 22/11/2004 grafici Scopo: analisi delle grandezze caratteristiche del protocollo TCP per l’individuazione e/o risoluzione dei ritardi lungo tutta la catena operativa Analisi dati raccolti risultati grafici Latenza Congestione switch Traffico pkt/sec 22/11/2004 Traffico byte/sec CHE FINE HA FATTO IL VECCHIO BELLEROFONTE? La piattaforma è ancora utilizzata dopo 4 anni !! Master kernel 2.6.9 con 3 dischi SCSI 18 GB ed 1 disco EIDE 80 GB. 16 nodi calcolo diskless kernel 2.6.9 con immagine NBI 64MB etherboot e tftp, montano in NFS la directory HOME del master. Rete 100Mb tra i nodi con il master con 2 interfacce in bonding. Prestazioni superiori del 50% rispetto alla versione originale del cluster grazie agli sviluppi del solo software ! Utilizzato operativamente per i modelli marini WAVEWATCHIII e ROMS e per provare le nuove versioni di compilatori, middleware e modelli. La scelta del “modello” cluster è vincente anche in termini di aumento del tempo di vita operativa delle piattaforme. Nuova Struttura Catena Operativa Struttura di memorizzazione centralizzata (MSA1000). Nuova macchina di visualizzazione ed elaborazione risultati RAMS, collegata ai dischi di memorizzazione e con un numero di utenti ad accesso limitato. 2 Cluster operativi (Desmo e Desmo2) con Master dotati di porte ottiche in modo che la comunicazione con i dispositivi di memorizzazione avvenga attraverso fibra ottica 1 Bellerofonte come Cluster di sviluppo 22/11/2004