Dai problemi scientifici alle architetture di calcolo
ovvero
come cucire con aghi e gomene
Vittorio Rosato
Servizio di Calcolo e Modellistica
ENEA Casaccia
[email protected]
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Key-points
1.  un legame stretto tra problemi e modelli di calcolo
2. I modelli di calcolo determinano le architetture sulle quali
hanno maggiori possibilità di essere eseguiti
efficientemente
le piattaforme di calcolo dovrebbero essere“”sciencedriven”
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Invece…
3. Le architetture di calcolo sono funzionalizzate per altre
classi di applicazioni (grafica, multimedia, internet etc.)
dunque……
4. La computational science ha dovuto elaborare nuovi
modelli operativi e/o a utilizzare enormi piattaforme di
calcolo visto che non può guidare lo sviluppo delle
architetture.
Questa presentazione illustrera’ alcuni degli ambiti nei
quali la presenza di questi problemi ha spinto l’
elaborazione di (nuovi) modelli operativi.
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Gedanken experiment
Problema
L’approccio computazionale è ormai
considerato come “la ”terza via”
dell’approccio conoscitivo alla realtà
Architetture:
- seriali
- parallele
Modello
Architettura
Predizione
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Principali architetture parallele
Data partitioning
farming
Distributed memory
Shared memory
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Problema  Modello
locali  linearizzazione  data partitioning
modello sistolico
comp1 com1 comp2 com2
globali  (spettrali, n-corpi)  data partitioning
difficile
modello sistolico complesso
comp1 com1 comp2 com2
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Principali architetture parallele
Data partitioning
farming
Data partitioning
(ripartizione dei dati tra i
nodi di calcolo)
Task partitioning
(ripartizione del lavoro
tra i nodi di calcolo)
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Facciamo un esempio: modelli di reti complesse
Reti complesse: grandi sistemi di nodi e archi che
descrivono interazioni funzionali tra oggetti (o entità
astratte).
•interattoma del lievito (N=103)
•coautorship (N=104)
•rete di routers di internet
(N=104)
•catena alimentare (N=103)
•……….
•……..
•Ammasso globulare (N=106)
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Calcolo di proprietà locali
Calcolo del coeff. di clustering di una rete
 nodo della rete devo calcolare
il numero di legami tra i suoi
vicini e compararlo con il
numero massimo di legami che
essi potrebbero sviluppare
C = 5/10 = 0.5
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Come implemento il calcolo di questa proprietà ?
(1)Fornisco a
tutti gli
elementi di
calcolo la
struttura della
rete
(2) attribuisco
il calcolo di c
di un subset di
nodi a ciascun
elemento di
calcolo.
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Calcolo di proprietà globali : dinamica di un ammasso globula
N=105
(1) Calcolo delle rij (n= 1010)
(2) Calcolo delle forze 1/ rij
(3) Integrazione eq. del moto
per k= 104 volte
Problemi:
- enorme numero di ops
- Struttura non omogenea
- Bilanciamento carico
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
(1) gruppi di dati sui processori
(2) Calcolo rij intra-gruppo
(3) Trasmissione dati interproc.
(4) Calcolo rij intra-gruppo
(5) ……
Grande traffico sulla rete
(1) Calcolo rij su ciascun proc.
(2) Somma delle forze su i
(3) ……
Ridotto traffico sulla rete
Buona scalabilità n<32
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Problemi computazionali complessi
astrofisica (mod. cosmologici, mod. stellari)
protein folding
modelli quantistici di nano-strutture
systems biology
analisi e controllo di sistemi complessi
real-time (analisi di immagine, compressione etc.)
Termofluidodinamica, chimica delle reazioni
Plasma physics
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
..purtroppo…..
www.top500.org
87%
68%
58%
64%
74%
www.nersc.gov
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
..le cause principali…..
Inoltre le prestazioni di
(1) bandwidth e di latenza delle reti
(2) bandwidth di accesso alle memorie
(3) taglia delle memorie interne (cache)
non hanno mostrato, nel tempo, lo stesso
andamento della legge di Moore, dunque
le piattaforme di calcolo sono ”equilibrate”
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Il risultato di tutto questo é
Source: The Divergence problem, H. Simon, Director NERSC, June 2003
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Soluzioni della tecnologia corrente:
Earth Simulator
5192 processors
~ 40 Tflops
(Tflops= 103 Miliardi
op/sec)
http://www.es.jamstec.go.jp/esc/eng/
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Wide-area computing farms (GRID)
Una GRID è un insieme
di piattaforme di calcolo
distribuite su un’ampia
regione che possono
eseguire parti diverse
dello stesso codice
oppure ”repliche” dello
stesso codice con dati
diversi.
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Applicazioni scientifiche su GRID ”globali”
[email protected]
www.intel.com/cure/anthrax.htm
folding.stanford.edu
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicato
Un’altra strategia consiste nella progettazione di architetture
massimamente efficienti per lo svolgimento di specifiche
tasks.
Esempi:
(1) GRAvitational PipE (GRAPE) per simulazioni
astrofisiche
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicato
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicato
Esempio:
(2) APE per simulazioni di LQCD
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
HW dedicato
Si possono progettare device HW (microprocessori) specializzati per effettuare
in mainera molto efficiente (e dunque rapida) specifiche analisi su grandi
quantità di sequenze (DNA, proteine).
Su questa idea è in corso di realizzazione uno spin-off : Ylichron
Eq. 0 C(i,j,k)=0
Eq. 1 C(i,j,k)=C(i,j,k-1)+A(i,k)*B(k,j)
Output C(i,j,k)
with 1 i q, 1 j q, k=0
with 1 i q, 1 j q, 1 k q
with 1 i q, 1 j q, k=q
Automatic synthesis
Automatic validation and check
VHDL expression
CC
Output
Port
Output
Port
11
1 1
1 1
11
11
1 1
1 1
00
11
1 1
1 1
1 1
1 1
SEL_3
SEL_3
11
1 1
11
1 1
1 1
1 1
11
SEL_2
SEL_2
A Input Port
A Input Port
11
1 1
1 1
1 1
1 1
1 1
00
00
BB
Input
Port
Input
Port
SEL_1
SEL_1
11
1 1
FPGA-based board
(standard PCI)
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Conclusioni
(1) Il mercato ha selezionato le nuove architetture di calcolo. Tranne
alcune eccezioni di piattaforme ”science driven” (IBM BlueGene,
vector machines) la comunità scientifica userà, nei prossimi anni,
sistemi MPP basati su componenti COTS .
(2) La GRID ha una duplice valenza: da un lato costituisce una
soluzione sostenibile, dall’altro consente la realizzazione di
progetti ad alto lavoro computazionale. Attribuiamo a questa
strategia rilevanti implicazioni commerciali.
(3) I sistemi HW/SW possono costituire una soluzione conveniente in
alcuni campi applicativi: la bioinformatica, le applicazioni realtime, l’analisi delle immagini etc. Il miglioramento della tecnologia
delle logiche programmabili consentirà, a breve, di utilizzare
questa soluzione anche per problemi di calcolo scientifico
(floating-point).
Giovedì della Cultura Scientifica, Casaccia 29.4.2004
Scarica

Data partitioning