Progetto FIRB Grid.it
Workshop di Rimodulazione
Workpackage 9
Grid-enabled Scientific Libraries
Resp.: Almerico Murli
Componenti TB: Giuliano Laccetti
Alberto Machì
Mario Rosario Guarracino
Pisa, 27-28 maggio 2003
Ambizione
Vocazione
"... to be leader in new technologies areas
that stand at the critical interface
between scientific and engineering
disciplines and high end computing
..."
2
Problematiche nello sviluppo di librerie scientifiche (1)
• efficienza
• accuratezza
• affidabilità
• modularità
• portabilità
• API standard
• estendibilità
• facilità di (ri)uso
• integrazione ed
interoperabilità
• …
Precedenti esperienze: - Progetto Finalizzato Informatica (1)
Sottoprogetto Software Matematico
- Progetto Niltpack
Pubblicazioni
-…
3
Problematiche nello sviluppo di librerie scientifiche (2)
Supercomputer
le precedenti +
• grado di parallelismo
• località dei dati
• scalabilità
• bilanciamento del carico
• minimizzazione
sincronizz./comunicaz.
• …
Precedenti esperienze: - Progetto Finalizzato Sistemi Informatici
e Calcolo Parallelo
- Progetto europeo PINEAPL
- Parallel Naples Airshed Model (PNAM)
- PSBLAS
Pubblicazioni
4
-…
Problematiche nello sviluppo di librerie scientifiche (3)
le precedenti +
Database
Database
• eterogeneità
Supercomputer
Database
• scheduling richieste
utente
• I/O su rete
• visualizzazione su rete
Supercomputer
• ….
Precedenti esperienze: - SPMIAC (Sistema Sw per Previsione e
Monitoraggio Inquinamento
Atmosferico in Campania)
Pubblicazioni
5
-…
Problematiche nello sviluppo di librerie scientifiche (4)
le precedenti +
• dinamicità
• coordinazione
Supercomputer
Database
• sicurezza
• latenza elevata e
variabile
SPECT
• guasti
• …
Precedenti esperienze: Agenzia 2000, MedIGrid
Pubblicazioni
Progetto FIRB Grid.it
6
Database
Database
Supercomputer
Database
Grid-flow applications
Supercomputer
Le risorse sono allocate staticamente e i task sono eseguiti sui
nodi della griglia computazionale secondo uno schema data-flow
Grid-aware applications
Le risorse sono allocate dinamicamente; l’applicazione controlla
lo stato della griglia e si riconfigura automaticamente
7
… Huge problems can now be computed over Grid
Computing Environments (like Globus or Avaki, …).
Because most of current applications are numerical,
the use of libraries like BLAS, LAPACK, ScaLAPACK or
PETSc is mandatory. …
… Moreover, the computational power and memory
needs of such applications may of course not be
available on just one platform. Thus, Grid Computing
seems to be a good candidate to build Problem
Solving Environments …
Dalla presentazione del Progetto LAMMPS
(Large Scale Atomic Molecular Massively Parallel Simulator)
8
Obiettivi generali del WP9
• studio delle problematiche relative alla
realizzazione di una libreria di software scientifico
efficiente, affidabile e scalabile in ambienti
computazionali di tipo griglia.
• individuazione ed analisi di problemi connessi alla
progettazione ed all’implementazione di algoritmi
per architetture ad alte prestazioni ed alla loro
integrazione in un'architettura software gridoriented.
9
Obiettivi specifici del WP9
• definizione di strutture dati e sviluppo di routine
numeriche promettenti per applicazioni su griglie
computazionali
• studio e realizzazione di moduli di libreria
scientifica efficacemente utilizzabili su griglie
computazionali in contesti applicativi
interdisciplinari e multidisciplinari
• valutazione e validazione del software sviluppato
mediante l’integrazione in opportuni ambienti test
10
Contesto
nazionale
MIUR 5% 1999
(Laforenza)
WP1.1 Dispiegamento
della Griglia
Grid Computing:
WP2.1
Ambienti
di Programmazione
tecnologie
abilitanti
e applicazioni
WP3.1 Applicazioni – EOS
per eScience
WP3.2 Applicazioni Scientifiche
AGENZIA 2000
(Vanneschi)
Integrazione
librerie
scientifiche
Ambiente per
lo sviluppo
di
nell’ambiente
programmazione
applicazioni
addialte
prestazioni …
ASI-PQE2000
(Vanneschi)
Sviluppo di Applicazioni di
Osservazione
Terra
mediante
Integrazione della
librerie
scientifiche
Sistemi
e Strumenti
di Calcolo ad
nell’ambiente
di programmazione
Alte Prestazioni
MIUR 5% 2000
(Vanneschi)
Ampliamento dell’ambiente di
Piattaforma distribuita
programmazione con componenti
ad alte prestazioni
numeriche per applicazioni scientifiche
AGENZIA 2000
(Murli)
• Dispiegamento
della griglia
Griglie Computazionali
• Applicazioni
medico-nucleari
e Applicazioni
…altri progetti
FIRB
• WP8 Ambienti
di programmazione…
Piattaforme
abilitanti per
• WP9 Sviluppo
librerie
scientifiche
Griglie Computazionali
ad Gridenabled
alte prestazioni …
• WP11 Applicaz. EOS: previs. e monitor.
inquinam.
11
Contesto internazionale
NetSolve
http://icl.cs.utk.edu/netsolve
http://www-neos.mcs.anl.gov
PARVOX
http://ess.gsfc.nasa.gov/annual.reports/
ess99/parvox.html
http://hipersoft.cs.rice.edu/grads
…………
12
Esperienze in GrADS: ScaLAPACK demo
• implementazione su Griglia di una versione di
ScaLAPACK
 usare le risorse a disposizione dell’utente
 fornire la soluzione nel minor tempo possibile
 automatizzare alcune fasi dell’esecuzione: scelta di
macchine/processori coinvolti nel calcolo, distribuzione dei
dati e collezione dei risultati, lancio della libreria su ogni
macchina, …
• modifiche minime al software di libreria
• si assume che il middleware per Griglia sia già
disponibile
(Globus MDS, Network Weather Sevice, Autopilot
Manager/Contract Monitor)
J. Dongarra et al., Numerical Libraries and the Grid, Intl. J. High
Performance Applications and SuperComputing, 15(4), 2001
13
ScaLAPACK demo (cont.)
Voglio
usare
user
la
griglia…
Esecuzione
applicazione
Voglio risolvere
un
sistema
lineare
libr.
routine
k
di 10 equazioni
+
in 10 minuti!
wrapper
Finisco in 10
minuti?
contract
Quale
sw/hw
resource
ho a disposizione?
selector
performance
Quanta
potenza
di calcolo
modeler
è necessaria?
developer
14
Verso una maggiore dinamicità…
• i nuclei computazionali non sono in grado di sfruttare
appieno le potenzialità della griglia
necessità di un ambiente computazionale dinamico in cui i
componenti di libreria più “efficaci” rispetto alle
caratteristiche del problema e dei dati ed allo stato della
griglia sia automaticamente selezionati
Self-Adaptive Numerical Software (SANS)
J. Dongarra, V. Eijkhout, Self-Adapting Numerical Software
for Next Generation Applications, LAPACK WN 157, 2002
15
Progetto di un sistema di tipo SANS
/* interactive mode */
Applicazioni
SaNS
 assert(A,spd)
 Solve(A,x,b)
Risolvi Ax=B,
conlanguage
A SPD call */
/* scripting
SaNS (solve,A,x,b,cg)
SANS AGENT
Seleziona
automaticamente
Intelligent
l’algoritmo
dalle
Component
caratteristiche del
problema
Gestisci
l’accesso
System
alla griglia
Component
Utilizza le
informazioni
sulle
prestazioni
History
di
esecuzioni
Database
precedenti
LIBRERIE
SPDSimmetrica Definita Positiva
16
Librerie scientifiche Grid-aware
Challenges:
• librerie che supportino una scelta adattativa degli
algoritmi rispetto al problema (a run-time)
• librerie che si adattino dinamicamente alla
configurazione di Griglia per ottimizzare le
performance
• nuovi algoritmi latency-, fault-, I/O-tolerant
• nuovi algoritmi scalabili
• meccanismi per l’interazione delle librerie con il
middleware
• architettura delle librerie tale da favorire
interfacciamento con differenti linguaggi
• …
17
WP9: descrizione attività di ricerca
approccio metodologico:
definizione ed implementazione di algoritmi comuni ad
applicazioni di rilevante interesse scientifico e tecnologico,
per ambienti distribuiti e paralleli dinamici, fault-prone e
con latenze elevate e variabili, con l’obiettivo di ottenere
prestazioni elevate, scalabilità e portabilità
• Task 1: studio ed analisi dei requisiti
• Task 2: realizzazione della libreria scientifica
• Task 3: validazione e testing
18
Task 1: individuazione ed analisi dei requisiti
obiettivo:
individuazione ed analisi dei requisiti della libreria
scientifica, nonché delle metodologie e degli strumenti
necessari alla sua realizzazione
articolazione:
1.1 individuazione dei nuclei computazionali comuni alle
applicazioni scientifiche di interesse
1.2 determinazione di algoritmi efficienti, scalabili e
portabili su griglie computazionali
1.3 identificazione delle strutture dati/oggetti da
supportare, dei pattern di interazione e delle
metodologie implementabili in elementi di software
19
Subtask 1.1: individuazione nuclei computazionali
esigenze
WP applicativi
competenze
& esperienze
ricercatori WP9
aree applicative di interesse
• elaborazione, ricostruzione e riconoscimento di immagini in medicina
nucleare e per il restauro digitale di filmati (ICAR-NA, ICAR-PA)
• simulazione di interazioni fluido-struttura (sospensione di ponti)
(UNIRM2)
• problemi di decisione ottima, con riferimento al settore economicofinanziario (UNICAL)
• previsione e monitoraggio del rischio ambientale, con particolare
riferimento all’inquinamento atmosferico (sinergia con WP11)
(ICAR-NA)
• gestione ed elaborazione dati EOS (sinergia con WP11) (ICAR-NA)
20
Subtask 1.1 (cont.)
“classi” di algoritmi di interesse
livello 0:
• algoritmi per la risoluzione di sistemi lineari e non lineari
• algoritmi basati sulla FFT
livello 1:
• algoritmi per la risoluzione di problemi di ottimizzazione
non lineare e non vincolata
• algoritmi per la risoluzione di PDE
• algoritmi per elaborazione e riconoscimento di immagini
livello 2:
• integrazione nuclei di livello (0 e ) 1 in polialgoritmi per la
risoluzione di problemi applicativi
21
Subtask 1.2: determinazione algoritmi
dinamicità, eterogeneità, latenze elevate e
variabili delle griglie computazionali
realizzazione di algoritmi
• asincroni, che operino efficientemente nonostante
l’eterogeneità di processori, tempi di comunicazione e di
latenza, etc.
• opportunistici, cioè che tengano conto che le risorse
variano dinamicamente;
• I/O tolerant, cioè in grado di eseguire calcoli in presenza
di input parziali e di rilasciare i risultati on the fly
• …
22 PDE
Esempio: fattorizzazione LU a blocchi
A11
A12
A13
A21
A22
A23
A31
A32
A33
L11
=
U11 U12 U13
L21
L22
L31
L32
*
U22 U23
L33
U33
A11 = L11U11
A12 = L11U12
A13 = L11U13
A21 = L21U11
A22 = L21U12 + L22U22
A23 = L21U13 + L22U23
A31 = L31U11
A32 = L31U12 + L32U22
A33 = L31U13 + L32U23 + L33U33
23
Su architetture parallele MIMD a
memoria distribuita …
versione right-looking
fattorizzazione LU
GETRS
(risoluz. sist. triang.)
A11U11 AU1212
L11
A21
L
21
L
A31
31
UA1313
(mat x mat)
(1)
(U
1) 22
A
A
U
22
23
A
A
23
22
L22
(1)
A
L32
32
32
GEMM
passo
1
(1()2 )
AA
A33
U
33 33
33
L33
distribuzione matrice:
ciclica a blocchi
fattorizzazione LU
GETRS
(risoluz. sist. triang.)
passo
2
GEMM
(mat x mat)
fattorizzazione LU
passo
3
24
LU right-looking
ad ogni passo, calcola definitivamente un
blocco di righe ed un blocco di colonne, e
li usa per aggiornare la rimanente parte
della sottomatrice attiva
 accesso ai dati che si trovano “a destra”
miglior compromesso tra minimizzazione della
comunicazione e bilanciamento del carico computazionale
MA
è necessario avere a disposizione l’intera matrice
all’inizio dell’algoritmo
25
Un’alternativa: versione left-looking
fattorizzazione LU
U12
A11U11 A
12
L11
A21
L
21
L
A31
31
U
A 13
(1)
32
32
32
LA
risoluz. sist. triang.
mat x mat
(1)
U
(1)22
A
A23
U
22
A
A
23
L2222
(1)
( 2)
A
33
U33
A33
33
L33
fattorizzazione LU
passo
2
risoluz. sist. triang.
mat x mat
risoluz. sist. triang.
distribuzione matrice:
ciclica a blocchi
passo
1
mat x mat
passo
3
fattorizzazione LU
26
LU left-looking
ad ogni passo, aggiorna definitivamente un
sol blocco di colonne, utilizzando le
colonne precedentemente calcolate
 accesso ai dati che si trovano “a sinistra”
non è necessario avere a disposizione l’intera
matrice per iniziare la fattorizzazione
algoritmo I/O-tolerant
27
LU left looking (cont.)
fattore critico per la performance:
dimensione del pannello verticale
dipendenza da:
• dimensione del problema
• insieme dei processori utilizzati per il calcolo
• caratteristiche della rete (bandwidth, latenza,
traffico, …)
• …
28
Subtask 1.3: identificazione metodologie e
strutture dati/oggetti
algoritmi opportunistici, asincroni, I/O tolerant
estensione alla griglia di metodologie di
• checkpointing, per far ripartire il calcolo nel caso in cui un
nodo della griglia non è più disponibile
• caching, per consentire un riuso efficiente dei dati
• locality, per minimizzare gli scambi di dati
• load balancing, per sfruttare esplicitamente l’eterogeneità
delle risorse della griglia
29
Task 2: realizzazione libreria scientifica
obiettivo:
implementazione degli algoritmi selezionati in moduli di
libreria scientifica per ambienti di griglia computazionale,
con le metodologie e gli strumenti individuati nel Task 1
articolazione:
2.1 definizione delle API (anche in relazione alle specifiche
del linguaggio di coordinamento atteso dal WP8), per
l’accesso uniforme ai moduli
2.2 implementazione delle routine di libreria scientifica
2.3 valutazione dell’impatto degli strumenti sviluppati in
altri WP nell’integrazione di moduli della libreria nelle
applicazioni demo
30
Subtask 2.1: definizione API
obiettivi:
• fornire all’utente funzionalità adeguate,
eventualmente con differenti livelli di dettaglio
• nascondere dettagli implementativi “inutili”
• conservare o estendere “in maniera naturale”
le API utilizzate in ambiente sequenziale e
parallelo
31
Subtask 2.2: implementazione routine di libreria
obiettivi e metodologia:
•
prima implementazione con tecnologie e strumenti
“consolidati” e disponibili
(Globus toolkit 2.x, MPICH-G2, …)
•
successiva integrazione su piattaforme che fanno
uso di middleware studiato e/o sviluppato da altri
WP
•
uso di building block consolidati
(BLAS, PBLAS, LAPACK, ScaLAPACK, PETSc, …)
32
Subtask 2.3: strumenti sviluppati in altri WP
obiettivi e metodologia:
• individuazione dei benefici risultanti
dall’integrazione della libreria scientifica con
metodologie e strumenti software sviluppati in altri
WP.
• valutazione dell’integrazione di tali strumenti
nell’architettura software per la
valutazione/validazione della libreria
33
Task 3: validazione e testing
obiettivo:
validazione e valutazione delle prestazioni dei moduli
di libreria implementati
articolazione:
3.1 integrazione delle routine in ambienti volti alla
risoluzione di problemi applicativi di interesse
(laboratori virtuali - PSE)
3.2 validazione e testing della libreria sviluppata per la
risoluzione di problemi applicativi di interesse
34
Subtask 3.1: integrazione in laboratori virtuali - PSE
• impatto sulla definizione di protocolli e servizi
standard per la registrazione, attivazione e
composizione dei moduli di libreria
• impatto su algoritmi, API ed implementazioni dei
moduli di libreria
Subtask 3.2: validazione e testing
per la risoluzione di problemi applicativi
• eventuale tuning e revisione/modifica di algoritmi,
API ed implementazioni dei moduli di libreria
35
Sinergie con altri WP
Applications and Demonstrators
CNR
INFN
ASI
(WP10, WP11, WP12, WP13, WP14)
e-science Components (WP9)
Component-based Programming Environment (WP8),
Knowledge Services (WP6), Grid Portals (WP7),
CNR
Photonic, highbandwidth
networks
(WP1, WP2)
CNIT
Security (WP4)
Basic Grid Infrastructure
INFN
and Data Core Services
(WP3, WP5)
36
Naturale interazione WP9 – WP8
•
individuazione e definizione di meccanismi per
l’integrazione di sw numerico nell’ambiente del
progetto
 impatto sullo sviluppo del supporto
dell’ambiente
•
definizione di interfacce per moduli di sw numerico
ad alte prestazioni
 impatto sulla definizione degli algoritmi (e dei
polialgoritmi) implementati nei componenti sw
Pubblicazioni
37
Pianificazione temporale
Primo anno
1. individuazione dei nuclei computazionali comuni alle
applicazioni scientifiche di interesse
ICAR-NA, ICAR-PA, UNICAL, UNIRM2
2. determinazione di algoritmi efficienti, scalabili e
portabili per griglie computazionali
ICAR-NA, ICAR-PA, UNICAL, UNIRM2
3. identificazione delle strutture dati/oggetti da
supportare e delle metodologie implementabili in
elementi di software
ICAR-NA, ICAR-PA, UNIRM2
38
Pianificazione temporale (cont.)
Secondo anno
4. completamento determinazione algoritmi per griglie
computazionali
ICAR-NA, ICAR-PA, UNICAL, UNIRM2
5. completamento identificazione strutture dati/oggetti e
metodologie
ICAR-NA, ICAR-PA, UNIRM2
6. definizione delle API
ICAR-NA, ICAR-PA, UNIRM2
7. sviluppo delle routine di libreria scientifica
ICAR-NA, ICAR-PA, UNICAL, UNIRM2
8. valutazione impatto strumenti sviluppati da altri WP
ICAR-NA, ICAR-PA
39
Pianificazione temporale (cont.)
Terzo anno
9. completamento sviluppo libreria
ICAR-NA, ICAR-PA, UNICAL, UNIRM2
10. completamento valutazione impatto strumenti
sviluppati in altri WP
ICAR-NA, ICAR-PA
11. integrazione routine in ambienti per lo sviluppo di
problemi applicativi (laboratori virtuali – PSE)
ICAR-NA, ICAR-PA
12. validazione e testing della libreria su problemi
applicativi di interesse
ICAR-NA, ICAR-PA, UNICAL, UNIRM2
40
Coinvolgimento gruppi nei task
ICAR NA
ICAR PA
UNIRM2
UNICAL
Task 1.1
Task 1.2
Task 1.3
Task 2.1
Task 2.2
Task 2.3
Task 3.1
Task 3.2
41
Allocazione risorse ai gruppi
ICAR NA
ICAR PA
UNIRM2
UNICAL
Totale
keuro
1 anno
338
69
74
90
113
23
24
30
2 anno
113
23
25
30
3 anno
112
23
25
30
42
Personale
Tipo contratto
Giovani
ricercatori
Assegni di
ricerca
Co.co.co
No
Unità
Durata
Stato primo anno
1
ICAR-PA
3 anni
3 m.u.
02.05.03
1
ICAR-NA
3 anni
7 m.u.
03.03.03
1
UNIRM2
3 anni
7 m.u.
da definire
2
UNICAL
3 anni
6 m.u.
6 m.u.
Bando da definire
7 m.u.
7 m.u.
01.04.03
14.03.03
2
ICAR-NA
3 anni
Bando da definire
Totale: 12 anni uomo
(4 anni/uomo x 3 anni)
43
Partecipanti alla ricerca
• Napoli
 ICAR: Carracciuolo, Corsaro, D’Ambra, Guarracino,
Maddalena, Oliva, Petrosino
 UNINA: D’Amore, Di Serafino, Laccetti, Lapegna
• Palermo
 ICAR: Machì, Nicotra
• Roma
 UNIRM2: Bisegna, Filippone, Maceri, Vairo
• Cosenza
 UNICS: Grandinetti, Musmanno, Guerriero, Belardi
44
Ipse dixit
• …Grid come naturale evoluzione del calcolo ad
alte prestazioni…
• …i problemi da risolvere sono
fondamentalmente quelli del calcolo parallelo,
anche se più difficili e complessi…
45
As soon as grid computing exists, it will
necessarily guide the future course of science.
Whenever any result is sought by its aid, the
question will raise – By what means of
calculation can these results be arrived at by this
technology in the shortest time?
46
As soon as analytic engine exists, it will
necessarily guide the future course of science.
Whenever any result is sought by its aid, the
question will raise – By what means of
calculation can these results be arrived at by this
machine
in the shortest time?
Charles Babbage, 1864
47
Fine presentazione
48
Alcune pubblicazioni
•
Luisa D'Amore, Giuliano Laccetti, Almerico Murli, An Implementation of a Fourier
Series Method for the Numerical Inversion of the Laplace Transform, ACM TOMS,
Vol. 25 · N. 3, 1999
•
Luisa D'Amore, Giuliano Laccetti, Almerico Murli, Algorithm 796: A Fortran
Software Package for the Numerical Inversion of the Laplace Transform Based on
a Fourier Series Method, ACM TOMS, Vol. 25 · N. 3, 1999
•
M. Rizzardi, A Modification of Talbot's Method for the Simultaneous Approximation
of Several Values of the Inverse Laplace Transform, ACM TOMS, Vol. 21 · N. 4,
1995
•
A. Murli, M. Rizzardi, Algorithm 682: Talbot's Method for the Laplace Inversion
Problem, ACM TOMS, Vol. 16 · N. 2, 1990
•
B. S. Garbow, G. Giunta, J. N. Lyness, A. Murli, Software for an Implementation of
Weeks' Method for the Inverse Laplace Transform, ACM TOMS, Vol. 14 · N. 2,
1988
•
B. S. Garbow, G. Giunta, J. N. Lyness, A. Murli, Algorithm 662: A FORTRAN
Software Package for the Numerical Inversion of the Laplace Transform Based on
Weeks' Method, ACM TOMS, Vol. 14 · N. 2, 1988
•
G. Giunta, A. Murli, Algorithm 649: A Package for Computing Trigonometric
Fourier Coefficients Based on Lyness's Algorithm, ACM TOMS, Vol. 13 N. 1, 1987.
•
P.C. Messina, A. Murli eds., Problems and Methodologies in Mathematical Software
Production, Springer-Verlag, 1982.
•
G. Giunta, G. Laccetti, A. Murli, Il Problema della Valutazione del Software
Matematico, Rivista di Informatica, XII, 1982.
49
Alcune pubblicazioni (1/4)
•
•
•
•
•
•
•
L. Antonelli, L.Carracciuolo, M.Ceccarelli, L.D’Amore,A.Murli – Total Variation
rergularization for Edge Preserving 3D SPECT Imaging in High Performance
Computing Environment, Lecture Notes on Computer Science, 2330, springer,
2002.
S. Filippone, P.D’Ambra, M.Colajanni – Using a Parallel Library of Sparse Linear
Algebra in a Flyuid Dynamics Application Code on Linux Clusters, in Parallel
Computing, Advances and Current Issues, G.Joubert, A.Murli, F.Peters,
M.Vanneschi, eds., Imperial College Press, 2002, pp. 441-448
L. Arnone, P. D'Ambra, S. Filippone, A Parallel Version of KIVA-3 based on GeneralPurpose Numerical Software and its Use in Two-stroke Engine Applications,
International Journal of Computer Research, Special Issue on Industrial
Applications of Parallel Computing, M. Paprzycki, L. Tarricone, T. Yang eds., vol.10,
N.4, 2001, pp. 31-46.
P. D'Ambra, S. Filippone, L. Arnone, Using General-Purpose Numerical Software in
the Parallelization of Fluid Dynamics Codes: KIVA-3, a Code for Engine
Simulations, in Practical Parallel Computing, M. Paprzycki, L. Tarricone, T. Yang
eds., NOVA Science Pub., New York, Chap. 3, 2001, pp. 37-55.
G. Barone, P. D'Ambra, D. di Serafino, G. Giunta, A. Murli, A. Riccio, Application of
a Parallel Photochemical Air Quality Model to the Campania Region (Southern
Italy), Environmental Modelling & Software, vol. 15, n. 6-7, 2000, pp. 503-511.
S. Filippone, M.Colajanni, PSBLAS: a Library for Parallel Linear Algebra on Sparse
Matrices, ACM TOMS, 26, 4, 2000
P.Beraldi, L. Grandinetti, R. Musmanno, C. Triki, Parallel Algorithms to Solve
Stochastic Linear Programs with Robustness Constraints, Parallel Computing, 26,
2000, pp. 1889-1908.
50
Alcune pubblicazioni (2/4)
•
A.Murli, P.D’Ambra, L.D’Amore, Parallel Computation and Problem Solving Methodologies: A
View from Some Experiences, in Recent Trends in Numerical Analysis, D.Trigiante ed., NOVA
Science Publ., Advances in Computation: Theory and Practice Series, vol. 3, 2000, pp. 249-268.
•
G. Laccetti, M. Lapegna, M. Marino, A. Murli, F. Perla - Parallel Multidimensional Quadrature: an
Effective Tool for Finance Problems - International Journal on Applied Mathematics, vol. 2,
2000, pp.441-457.
•
G. Barone, P. D'Ambra, D. di Serafino, G. Giunta, A. Murli, A. Riccio, PNAM: Parallel Software
for Air Quality Simulations in the Naples Area, Environmental Management and Health, MCB
University Press UK, vol. 10, n. 4, 1999, pp. 209-215.
•
G. Laccetti e M. Lapegna - PAMIHR. A Parallel Fortran Proram for Multidimensional Quadrature
on Distributed Memory Architectures - Proc. of Euro-Par 99, P. Amestoy et al. eds., Lecture
Notes in Computer Science No. 1685, Springer, 1999, pp. 1144-1148.
G. Barone, P. D'Ambra, D. di Serafino, G. Giunta, A. Murli, A. Riccio, Parallel Numerical
Simulation of Air Pollution in Southern Italy, in "Large-Scale Computations in Air Pollution
Modelling", Z. Zlatev et al. eds., Kluwer, 1999, pp. 39-52.
•
•
M.Ceccarelli, L.D’Amore,V.De Simone,A.Murli – Numerical Methods for Total Variation-based
Deblurring: a Comparison in a Parallel Environment, Notes on Numerical Fluid Mechanics, 73,
1999, pp. 257-264.
•
I. de Bono, D. di Serafino, E. Ducloux, Using a General-Purpose Numerical Library to Parallelize
an Industrial Application: Design of High-Performance Lasers, in ``Euro-Par'98, Parallel
Processing'', D. Pritchard, J. Reeve eds., Lecture Notes in Computer Science, vol. 1470,
Springer, 1998, pp. 812-820.
•
D. di Serafino, L.Maddalena, P.Messina, A.Murli – Some Perspectives on High Performance
Mathematical Software, in High Performance Algorithms and Software for Nonlinear
Optimization, R.De Leone, A.Murli, G.Toraldo, eds., Kluver Ac. Publ., 1998, pp. 1-23.
•
S.Corsaro, L.D’Amore,A.Murli – On the parallel implementation of the Fast Wavelet Packet
Transform on MIMD Distributed Memory Environments, Lecture Notes on Computer Science,
1557, Springer, 1998.
51
Alcune pubblicazioni (3/4)
•
•
•
L.Carracciuolo, L.D’Amore,A.Murli – Fast Wavelet Packet Transform based Algorithm for Image
Restoration Problems in a Parallel Environment, Proc. of 43rd SPIE Annual Meeting, 1998.
M. D'Apuzzo, M. Lapegna e A. Murli - Scalability and Load Balancing in Adaptive Algorithms for
Multidimensional Integration - Parallel Computing, vol. 33, 1997, pp. 1199-1210.
P. D'Ambra, D. di Serafino, G. Giunta, A. Riccio, Parallel Numerical Simulation of Reacting Flows
in Air Quality Models, in "Parallel Computational Fluid Dynamics. Algorithms and Results Using
Advanced Computers", P. Schiano, A. Ecer, J. Periaux, N. Satofuka eds., Elsevier, 1997, pp.
116-123.
•
D. di Serafino, L. Maddalena, A. Murli, PINEAPL: A European Project to Develop a Parallel
Numerical Library for Industrial Applications, in Euro-Par'97, Parallel Processing, C. Lengauer,
M. Griebl and S. Gorlatch eds., Lecture Notes in Computer Science, vol. 1300, Springer, 1997,
pp. 1333-1339.
•
M. D’Apuzzo, L. Maddalena – A Parallel Algorithm for Parametric Cubic B_Spline Curves
Interpolation, in Neural, Parallel and Scientific Computing, Dynamic Publ. Inc., 5, 1997, pp.
201-220.
•
M. D’Apuzzo, L. Maddalena – Parallelization Strategies for B-Spline Curve Interpolation
Problem, in Curves and Surfaces with Application in CAGD, A.Le Méhauté, C.Rabut,
L.L.Schumaker, eds., Vanderbilt Univ. Press, 1997, pp. 1-8.
D. di Serafino, A Parallel Implementation of a Multigrid Multiblock Euler Solver on Distributed
Memory Machines, Parallel Computing, vol. 23, 1997, pp. 2095-2113.
•
•
P. D’Ambra, G.Giunta , Concurrent Banded Cholesky Factorization on Workstation Networks
Using PVM, Parallel Computing, 21, 3, 1995, pp.487-494.
•
M. D'Apuzzo e M. Lapegna - A Parallel Row Projection Solver for Large Sparse Linear system Proc. of Euromicro Workshop on Parallel and Distributed Processing, Valero e Gonzalez eds.,
IEEE Computer Society Press, 1995
52
Alcune pubblicazioni (4/4)
•
A. d'Alessio e M. Lapegna - A Scalable Parallel Algorithm for the
Multidimensional Quadrature - Proceedings of VI SIAM Conference on Parallel
Processing for Scientific Computing, Vol. II, Sincovec et al. eds., SIAM Press,
1993.
•
D. di Serafino, A. Murli, F. Perla, Fast Poisson Solvers Algorithms based on
Generalized Marching for Distributed Memory Multiprocessors, in Parallel and
Distributed Computing in Engineering Systems, P. Borne and L. Grandinetti eds.,
Elsevier, 1992, pp. 297-302.
•
D. di Serafino, A. Murli, F. Perla, A Fast Poisson Solver for Distributed Memory
Multiprocessors, Concurrency: Practice & Experience, vol. 4, n. 7, 1992, pp. 499-508.
•
D. di Serafino, A. Murli, F. Perla, Fast Poisson Solvers: an FFT-based Generalized
Marching Algorithm on Distributed Memory Multiprocessors, in Parallel Computing:
Problems, Methods and Applications, P. Messina and A. Murli eds., Elsevier, 1992, pp.
161-171.
•
M. Lapegna - Global Adaptive Quadrature for the Approximate Computation of
Multidimensional Integrals on Parallel Computers - Concurrency: Practice and
Experiences, vol. 4, 1992, pp. 413-426.
•
G.Giunta, G.Laccetti, A.Murli – Software Matematico e Nuove Architettrure,
Rivista di Informatica, XXI, 2, 1991, pp. 129-144.
53
Alcune pubblicazioni
• R. Montella, A. Riccio, Implementazione di una banca dati delle emissioni
veicolari nella regione Campania, Ingegneria Ambientale, 2003.
• G. Barone, P. D'Ambra, D. di Serafino, G. Giunta, R. Montella, A. Murli, A.
Riccio, An Operational Mesoscale Air Quality Model for the Campania Region,
Annals of University Naval Institute, Special Issue on "Global and Regional
Atmospheric Modelling", G. Barone, P. Builtjes, G. Giunta eds., 2000.
54
Alcune pubblicazioni
• L. D'Amore, A. Formiconi, M.R. Guarracino, A. Murli, G. Oliva - A Grid application
for medical imaging, SIMAI, 2002.
• M. Bertero, P. Bonetto, L. Carracciuolo, L. D'Amore, A. Formiconi, M. R.
Guarracino, G. Laccetti, A. Murli and G. Oliva - MedIGrid: a Medical Imaging
application for computational Grids – IEEE publication, IPDPS, 2003.
• P. Bonetto, G. Comis, A. R. Formiconi, M. R. Guarracino A new approach to brain
imaging, based on an open and distributed environment - IEEE publication,
EMBS Special Topic Conference on Neural Engineering, 2003.
• M. Bertero, P. Bonetto, L. Carracciuolo, L. D'Amore, A. Formiconi, M. R.
Guarracino, G. Laccetti, A. Murli and G. Oliva – A Grid-Based RPC System for
Medical Imaging - to appear, 2003
55
Alcune pubblicazioni
• P.D’Ambra, M.Danelutto, D. di Serafino, M.Lapegna – Integrating MPI-based
numerical software into an advanced parallel computing environment – Proc. of
the 11th EUROMICRO Conf. on Parallel, Distributed and Netwok-based
Processing, IEEE Publ., 2003, pp.283-291.
• P.D’Ambra, M.Danelutto,D.di Serafino, M.Lapegna – Advanced Environments for
Parallel and Distributed Applications: a View of Current Status – Parallel
Computing, 28, 2002, pp. 1637-1662.
• P.D’Ambra, D.di Serafino, M.Lapegna – Embedding Parallel Quadrature Software
into a HPC Environment - in Parallel Numerics 02. Theory and Applications,
R.Trobec et al. eds., 2002, pp. 15-27.
56
Scarica

WP9 - ICAR-CNR