Dai problemi scientifici alle architetture di calcolo ovvero come cucire con aghi e gomene Vittorio Rosato Servizio di Calcolo e Modellistica ENEA Casaccia [email protected] Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Key-points 1. un legame stretto tra problemi e modelli di calcolo 2. I modelli di calcolo determinano le architetture sulle quali hanno maggiori possibilità di essere eseguiti efficientemente le piattaforme di calcolo dovrebbero essere“”sciencedriven” Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Invece… 3. Le architetture di calcolo sono funzionalizzate per altre classi di applicazioni (grafica, multimedia, internet etc.) dunque…… 4. La computational science ha dovuto elaborare nuovi modelli operativi e/o a utilizzare enormi piattaforme di calcolo visto che non può guidare lo sviluppo delle architetture. Questa presentazione illustrera’ alcuni degli ambiti nei quali la presenza di questi problemi ha spinto l’ elaborazione di (nuovi) modelli operativi. Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Gedanken experiment Problema L’approccio computazionale è ormai considerato come “la ”terza via” dell’approccio conoscitivo alla realtà Architetture: - seriali - parallele Modello Architettura Predizione Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Principali architetture parallele Data partitioning farming Distributed memory Shared memory Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Problema Modello locali linearizzazione data partitioning modello sistolico comp1 com1 comp2 com2 globali (spettrali, n-corpi) data partitioning difficile modello sistolico complesso comp1 com1 comp2 com2 Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Principali architetture parallele Data partitioning farming Data partitioning (ripartizione dei dati tra i nodi di calcolo) Task partitioning (ripartizione del lavoro tra i nodi di calcolo) Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Facciamo un esempio: modelli di reti complesse Reti complesse: grandi sistemi di nodi e archi che descrivono interazioni funzionali tra oggetti (o entità astratte). •interattoma del lievito (N=103) •coautorship (N=104) •rete di routers di internet (N=104) •catena alimentare (N=103) •………. •…….. •Ammasso globulare (N=106) Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Calcolo di proprietà locali Calcolo del coeff. di clustering di una rete nodo della rete devo calcolare il numero di legami tra i suoi vicini e compararlo con il numero massimo di legami che essi potrebbero sviluppare C = 5/10 = 0.5 Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Come implemento il calcolo di questa proprietà ? (1)Fornisco a tutti gli elementi di calcolo la struttura della rete (2) attribuisco il calcolo di c di un subset di nodi a ciascun elemento di calcolo. Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Calcolo di proprietà globali : dinamica di un ammasso globula N=105 (1) Calcolo delle rij (n= 1010) (2) Calcolo delle forze 1/ rij (3) Integrazione eq. del moto per k= 104 volte Problemi: - enorme numero di ops - Struttura non omogenea - Bilanciamento carico Giovedì della Cultura Scientifica, Casaccia 29.4.2004 (1) gruppi di dati sui processori (2) Calcolo rij intra-gruppo (3) Trasmissione dati interproc. (4) Calcolo rij intra-gruppo (5) …… Grande traffico sulla rete (1) Calcolo rij su ciascun proc. (2) Somma delle forze su i (3) …… Ridotto traffico sulla rete Buona scalabilità n<32 Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Problemi computazionali complessi astrofisica (mod. cosmologici, mod. stellari) protein folding modelli quantistici di nano-strutture systems biology analisi e controllo di sistemi complessi real-time (analisi di immagine, compressione etc.) Termofluidodinamica, chimica delle reazioni Plasma physics Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Giovedì della Cultura Scientifica, Casaccia 29.4.2004 ..purtroppo….. www.top500.org 87% 68% 58% 64% 74% www.nersc.gov Giovedì della Cultura Scientifica, Casaccia 29.4.2004 ..le cause principali….. Inoltre le prestazioni di (1) bandwidth e di latenza delle reti (2) bandwidth di accesso alle memorie (3) taglia delle memorie interne (cache) non hanno mostrato, nel tempo, lo stesso andamento della legge di Moore, dunque le piattaforme di calcolo sono ”equilibrate” Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Il risultato di tutto questo é Source: The Divergence problem, H. Simon, Director NERSC, June 2003 Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Soluzioni della tecnologia corrente: Earth Simulator 5192 processors ~ 40 Tflops (Tflops= 103 Miliardi op/sec) http://www.es.jamstec.go.jp/esc/eng/ Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Wide-area computing farms (GRID) Una GRID è un insieme di piattaforme di calcolo distribuite su un’ampia regione che possono eseguire parti diverse dello stesso codice oppure ”repliche” dello stesso codice con dati diversi. Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Applicazioni scientifiche su GRID ”globali” [email protected] www.intel.com/cure/anthrax.htm folding.stanford.edu Giovedì della Cultura Scientifica, Casaccia 29.4.2004 HW dedicato Un’altra strategia consiste nella progettazione di architetture massimamente efficienti per lo svolgimento di specifiche tasks. Esempi: (1) GRAvitational PipE (GRAPE) per simulazioni astrofisiche Giovedì della Cultura Scientifica, Casaccia 29.4.2004 HW dedicato Giovedì della Cultura Scientifica, Casaccia 29.4.2004 HW dedicato Esempio: (2) APE per simulazioni di LQCD Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Giovedì della Cultura Scientifica, Casaccia 29.4.2004 HW dedicato Si possono progettare device HW (microprocessori) specializzati per effettuare in mainera molto efficiente (e dunque rapida) specifiche analisi su grandi quantità di sequenze (DNA, proteine). Su questa idea è in corso di realizzazione uno spin-off : Ylichron Eq. 0 C(i,j,k)=0 Eq. 1 C(i,j,k)=C(i,j,k-1)+A(i,k)*B(k,j) Output C(i,j,k) with 1 i q, 1 j q, k=0 with 1 i q, 1 j q, 1 k q with 1 i q, 1 j q, k=q Automatic synthesis Automatic validation and check VHDL expression CC Output Port Output Port 11 1 1 1 1 11 11 1 1 1 1 00 11 1 1 1 1 1 1 1 1 SEL_3 SEL_3 11 1 1 11 1 1 1 1 1 1 11 SEL_2 SEL_2 A Input Port A Input Port 11 1 1 1 1 1 1 1 1 1 1 00 00 BB Input Port Input Port SEL_1 SEL_1 11 1 1 FPGA-based board (standard PCI) Giovedì della Cultura Scientifica, Casaccia 29.4.2004 Conclusioni (1) Il mercato ha selezionato le nuove architetture di calcolo. Tranne alcune eccezioni di piattaforme ”science driven” (IBM BlueGene, vector machines) la comunità scientifica userà, nei prossimi anni, sistemi MPP basati su componenti COTS . (2) La GRID ha una duplice valenza: da un lato costituisce una soluzione sostenibile, dall’altro consente la realizzazione di progetti ad alto lavoro computazionale. Attribuiamo a questa strategia rilevanti implicazioni commerciali. (3) I sistemi HW/SW possono costituire una soluzione conveniente in alcuni campi applicativi: la bioinformatica, le applicazioni realtime, l’analisi delle immagini etc. Il miglioramento della tecnologia delle logiche programmabili consentirà, a breve, di utilizzare questa soluzione anche per problemi di calcolo scientifico (floating-point). Giovedì della Cultura Scientifica, Casaccia 29.4.2004