IL PROGETTO GRID INFN
ž SCOPO: Studio e sviluppo di una infrastruttura di calcolo per
l’INFN distribuita su area geografica e connessa da una rete ad
alta banda a strutture simili in corso di sviluppo negli altri paesi
europei. Lo sviluppo dell’architettura e dei tools software
necessari sara’ fatto in collaborazione con le altre Istituzioni dei
paesi europei (UK-RAL,FR-In2p3,SP-IFAE…) all’interno di
un progetto europeo comune
ž REQUIREMENTS : l’infrastruttura di calcolo dovra’ essere
capace di soddisfare i bisogni di calcolo dei moderni
esperimenti e in particolare quelli degli esperimenti a LHC e
Virgo che sono ordini di grandezza superiori di quelli
attualmente in corso al CERN. I risultati degli studi del
progetto Monarc costituiranno un costante punto di riferimento
per lo sviluppo del progetto
18/2/2000
M.Mazzucato - Riunione GRID
1
Storia del progetto GRID INFN
ž Dall’inizio del 1999 il CNTC ha cominciato a discutere ed esaminare
le tecnologie piu’ adatte a soddisfare i bisogni di calcolo degli
esperimenti a LHC e in particolare a realizzare il sistema di Centri
Regionali distribuito a vari livelli (Tier1..Tier4) proposto da Monarc.
Vedi verbale CNTC 16/4/99
ž Riunione congiunta con esperimenti 28/6/99 a Napoli per definire i
requirements e computing models favoriti
 Indicazione verso Centri Regionali distribuiti Tier1…Tier4
ž Workshop CNTC di Martina Franca 28/10/99. Definizione di un
programma di attivita’ per CNTC ed esperimenti a LHC e Virgo per
arrivare a formulare una proposta di sperimentazione di una
infrastruttura di calcolo distribuita in linea con i requirements
ž Workshop di Milano 16/12/99 e CNTC 21/12/99 a conclusione di un
primo ciclo di discussioni nel CNTC, all’interno degli esperimenti e di
valutazioni tecniche approfondite
 Conferma orientamento verso la sperimentazione di tenologie atte a
realizzare Centri Regionali distribuiti
 Orientamento verso la sperimentazione delle Computing GRID
18/2/2000
M.Mazzucato - Riunione GRID
2
L’evoluzione del progetto Europeo
ž Discussioni a livello Europeo in parallelo con le discussioni
interne all’INFN sulla stessa tematica
ž Meeting tra EU and HEPCCC in Novembre 99
incoraggia la formulazione di un progetto europeo che affronti lo
sviluppo di una tecnologia adeguata ad affrontare la problematica del
calcolo distribuito alla scala degli esperimenti LHC
ž Direttivo INFN di Dicembre 99 da’ mandato a M. M. e F.
Ruggieri a partecipare alle riunioni per il lancio del progetto
ž Kick-off meeting al CERN 11 gennaio, 2000
OK dal CERN e dai membri di In2p3, RAL-Pparc, Ifae, Nikhef, Ung.
2 Task forces: preparazione parte tecnica e proposal
ž La EU incoraggia a sottomettere un proposal per il 10 Maggio
2000
ž 13 Febbraio 2000 sottomesso alla CE outline del progetto
18/2/2000
M.Mazzucato - Riunione GRID
3
Descrizione del Progetto Europeo
ž Scopo : Sviluppo e dimostrazione di WA Comp. Fabric
ž Focalizza gli sforzi per risolvere le tematiche che sono
caratteristiche del mondo della fisica delle Alte Enegie e
Nucleare e non sono coperte da altri progetti di GRID :
management di grandi quantita’ di dati (Pbytes)
high throughput computing
management delle computing fabrics locali e wide-area GRID
ž Sviluppo del Middleware
ž Realizzazioni di Testbed demonstrators usati su casi reali
ž Collaborazione con altre scienze
 “OK” a partecipare da parte di una collaborazione di Istituti Metereologici
Europei organizzata da CNR-Bologna
ž Collaborazione con l’Industria
Partners Italiani
18/2/2000
M.Mazzucato - Riunione GRID
4
EU-Project : Workprogramme
ž R&D required on:
Adaptability
Scalability
Wide-area distribution of resources
ž Tentative Workpackages:
computing fabric management
mass storage management
wide area data management
wide-area workload management
wide-area application monitoring
application development/adaptation
ž Develop in the light of today’s workshop
18/2/2000
M.Mazzucato - Riunione GRID
5
EU-Project : Resources
National/regional part of the GRID funded by
national agencies
High performance bandwidth across sites to be
provided by other initiatives (Geant?)
EU financial support for development of
midddleware, overall integration and operation of
testbeds
Support for exchange of staff and dissemination of
information (workshops, conferences etc)
18/2/2000
M.Mazzucato - Riunione GRID
6
Prospettive e benefici dal Progetto
GRID per l’INFN
ž Sfruttamento ottimale delle risorse di calcolo e di storage
presenti nell’INFN e in HEP tramite lo sviluppo di un
software “middleware” di alto livello che consentira’ un
accesso “trasparente” a tutte queste risorse
ž Acquisizione di una tecnologia di frontiera che in
prospettiva potrebbere trovare una larga applicazione in:
Altri settori scientifici che hanno un comune il problema
dell’accesso e dell’analisi distribuita di grandi moli di dati
Settori commerciali come ISP/ASP che si trovano a fronteggiare
l’esigenza dello sviluppo di cluster scalabili in siti centrali diversi
per fronteggiare la domanda che viene dal Web, dalle ricerche su
grandi archivi di dati e dal commercio elettronico
18/2/2000
M.Mazzucato - Riunione GRID
7
Alcuni numeri per il progetto Europeo ed
INFN
Estimated computing resources required at CERN for
LHC experiments in 2006 (Da Tech prop. e Monarc)
ž
ž
ž
ž
ž
ž
ž
ž
ž
ž
collaboration
CPU capacity (SPECint95)2006
annual inc.
estimated # cpus in 2006
disk capacity (TB)in 2006
annual inc.
mag. tape capacity (PB) 2006
annual inc.
aggregate I/O rates (GB/sec)disk
tape
ALICE
450,000
150,000
2,250
300
90
3.7
2.0
100
1.2
ATLAS
600,000
200,000
3,000
550
200
3.4
2.0
100
0.4
CMS
600,000
200,000
3,000
550
200
3.4
2.0
100
0.4
LHCB
70,000
15,000
350
80
20
1.4
0.9
12
0.2
Total
1,720,000
565,000
8,600
1,480
510
11.9
6.9
312
2.2
 SPECint 95: A modern PC has a performance of roughly20-30 SPECint95s. We expect this to
grow to around 200 SPECint95s by 2006.
18/2/2000
M.Mazzucato - Riunione GRID
8
Assunzioni Progetto Europeo
ž Estimated computing resources for an LHC Regional
Computing Centre (2006) (Da Monarc)
ž
ž
ž
ž
ž
CPU capacity
disk capacity
disk I/O rate
tape storage
WAN connection
18/2/2000
120,000
110
20
0.4
2.5
SI95
Tbytes
GBytes/sec
PetaBytes
Gbits/sec
M.Mazzucato - Riunione GRID
9
I TESTBEDS DEL PROGETTO EUROPEO E INFN
ž E’ opinione condivisa in Europa e in USA che per sviluppare la
tecnologia GRID adatta a risolvere i problemi del calcolo dei futuri
esperimenti sia necessario sviluppare dei testbeds che si sviluppino
nel tempo fino ad arrivare a una dimensione non trascurabile di quanto
sara’ necessario per LHC (5-10%)
ž Questo deriva :
Dalla complessita’ del Calcolo a LHC che al momento
non ha uguali in altri settori scientifici o della societa’
ma pero’ anticipa le esigenze di questi (vedi talk
Obectivitj e Nag a Chep2000)
Dalla recente esperienza di Babar che ha mostrato
come a questo livello di complessita’ i problemi non
scalino
ž Si ritiene quindi che la validazione del middleware debba essere fatta
su un Tier0 di circa il 50% di un centro per un esperimento LHC 2006
e su centri regionali fino al 20% negli altri paesi Europei
18/2/2000
M.Mazzucato - Riunione GRID
10
Capacity targets for the Testbed at CERN
ž
ž
ž
ž
ž
ž
ž
ž
units
CPU capacity
SI95
estd. number of cpus
disk capacity
TBytes
disk I/O rate GBytes/sec
tape storage – capacity PB
-sustained data rate MB/s
WAN links to ext. sitesMbs
18/2/2000
end 2000
20,000
400
20
5
0.2
250
155
M.Mazzucato - Riunione GRID
end 2001
70,000
1,000
60
15
0.3
500
622
end 2000
300,000
3,000
250
50
1.0
1,000
2,500
11
TEMPI DI PREPARAZIONE PROGETTO Eu-Grid
Prossime scadenze Eu-Grid e conseguenze per l’INFN
ž 7 Marzo : Workshop al CERN per definire il workplan e i
packages da sviluppare
Il gruppo tecnico Grid-INFN ha gia’ formulato le proposte INFN
ž 15 Marzo : Preparazione Draft con Workplan, schedule,
risorse
Approvazione del Draft da parte Management INFN
ž 30 Marzo : finalizzazione del progetto : Istituzioni
partecipanti, risorse richieste, piano attivita’, deliverables,
schedule etc.. Inizio Scrittura Progetto Eu-Grid
ž 30 Marzo - 30 Aprile : finalizazzione documento da
sottomettere alla firma delle Istituzioni partecipanti
ž 30 Aprile -10 maggio : Firma del documento dai
rappresentanti delle Istituzioni
18/2/2000
M.Mazzucato - Riunione GRID
12
STATO PREPARAZIONE PROGETTO INFN-Grid
Scala dei tempi concordata nella riunione CNTC del 28/10/99
ž Inizio immediato all’interno degli esperimenti della discussione sullo
sviluppo della tecnologia per i Centri regionali LHC e Virgo
ž Costituizione immediata di un gruppo tecnico per la valutazione delle
tecnologie . Riunioni al CNAF 29/11/99, 14/12/99
ž 26 Febbraio : Documenti finali approvati ufficialmenti dgli esperimenti
e contenenti :
 Indicazione del modello di computing che si intende adottare per la
sperimentazione
Struttura gerarchica distribuita Tier1..Tier4 alla Monarc
Sedi che intendono partecipare alla sperimentazione e in che ruolo
Scelta della tecnologia di base per l’inizio della sperimentazione
Piano di attivita’ per l’utilizzo dei test beds
Manpower disponibile per lo sviluppo della tcnologia
18/2/2000
M.Mazzucato - Riunione GRID
13
Le decisioni preliminari degli esperimenti :CMS
Verbale della riunione di CMS Italia a Firenze 25/11/99 (P. Capiluppi- Comp Coord CMS)
ž CMS Italia preferisce un Centro Regionale (Tier1) presso una unita’ INFN coinvolta in
CMS
 La complessita’ del calcolo a LHC richiede infatti la possibilita’ di accedere
direttamente con privilegi ai sistemi specialmente nella fase iniziale di
sperimentazione( Reboot, kill di jobs, daemon etc.)
ž CMS Italia preferisce un Centro Regionale Tier 1 “distribuito misto” che vede una sede
come riferimento primus inter pares
ž CMS Italia ritiene che si debba rapidamente andare verso sperimentazioni reali di un
Centro Regionale del tipo proposto utilizzando gli studi HLT come “use case” reale
Verbale della riunione CMS Comp. Italia a Padova 11/2/2000 (P. Capiluppi)
ž Le tecnologie di Grid (e Globus) sono da sperimentare in quanto possono costiture il
mezzo per realizzare il calcolo distribuito (e gerarchico) necessario ad LHC e all'INFN
(CMS). La partecipazione di CMS deve essere chiara e qualificata per lo sviluppo dei
tools che costituiranno la base dei Centri Regionali.
ž CMS Italia intende pertanto partecipare al Progetto di Grid Europea con tutte le
risorse che riuscira' a mettere in campo.
18/2/2000
M.Mazzucato - Riunione GRID
14
Le decisioni preliminari degli esperimenti : ATLAS
Mail di L. Perini (Comp. Coord. Atlas) 15/2/2000
ž ATLAS-Italia e' intenzionato a realizzare un RC (Tier1) in Italia per lo
start-up di LHC.
ž L'ipotesi preferita per l'implementazione si avvale dei servizi forniti
dai Consorzi di Calcolo per l'outsourcing del personale di tipo
sistemistico e presumibilmente per ospitare l'hardware di calcolo (di
proprieta' INFN)
ž ATLAS-Italia e' interessato alla sperimentazione dei tools di GRID,
come delineato nel progetto EU-GRID, per realizzare in modo
trasparente la distribuzione delle risorse di calcolo e dei dati fra i
diversi Tier-n a disposizione della Collaborazione
ž La realizzazione per il 2003 di un prototipo in scala circa 20%
dell'installato prevedibile per il 2006 presenta molti vantaggi
ž I siti individuati per la partecipazione alla fase iniziale di
prototipizzazione sono due: Roma1 e Milano, con Roma1 capofila
18/2/2000
M.Mazzucato - Riunione GRID
15
Le decisioni preliminari degli esperimenti : ALICE
Mail di A. Masoni (Comp Coord. Alice) 17/2/2000
ž Dato il ruolo che la collaborazione italiana ricopre all’ interno di
ALICE si ritiene necessario poter avere un centro regionale Tier1 in
Italia
ž Si ritiene che la tecnologia della GRID possa costituire un valido
approccio. ALICE-Italia è pertanto disponibile a partecipare all’attività
di sperimentazione di prototipi di centri regionali con tecnologia GRID
ž Si ritiene che la strutturazione definitiva in termini di centri Tier-1,2,3
debba venire dai risultati della sperimentazione. L’ orientamento
attuale è verso una architettura basata su un centro Tier1 distribuito fra
due o tre sedi e tre o più centri Tier2. Una struttura di questo tipo tiene
conto della distribuzione delle risorse nelle varie sedi e ne
consentirebbe un ottimale utilizzo.
18/2/2000
M.Mazzucato - Riunione GRID
16
Le decisioni preliminari degli esperimenti : Virgo
ž Mail di F. Ricci (17/2/99)
ž Come Ti avevo assicurato nella riunione di Milano della commissione
da Te presieduta mi sono fatto carico di innescare nell'ambito della
parte italiana dell'esperimento la discussione relativa al problema della
partecipazione di Virgo alla sperimentazione di Grid.
ž Si e' avuta una rapida convergenza sul manifestare la nostra
disponibilità a tale processo di sperimentazione ed abbiamo
individuato un gruppo di persone, (praticamente uno per ciascuna
sezione partecipante al progetto Virgo) che possano dedicare una
limitata percentuale del loro tempo a questo scopo.
ž Noi siamo coscienti che Grid non risolve da solo il problema del
calcolo di Virgo ma che si tratta certamente di una strada da esplorare
insieme con la costituzione di solidi centri fortemente interconnessi per
l'elaborazione ed il calcolo dei dati dell'esperimento.
ž Sono quindi nella condizione di assicurarTi, come Virgo Italia, il
nostro pieno interessamento allo sviluppo di questi progetti
18/2/2000
M.Mazzucato - Riunione GRID
17
INFN-GRID : future scadenze (da discutere..)
ž Dal 26 febbraio inizio scrittura progetto INFN GRID
ž 30 Marzo preparazione draft contenente
 workplan INFN-Grid
 contributo INFN EU-Grid
 manpower disponibile
 piano attuazione testbeds
 schedule e milestones
ž 30 Marzo -30 Aprile discussione draft nell’INFN e finalizzazione
progetto
ž 30 Aprile presentazione progetto per l’approvazione finale in sintonia
con il progetto EU-Grid
18/2/2000
M.Mazzucato - Riunione GRID
18
INFN-GRID : Piano di attivita’
ž Contributo allo sviluppo dei tools comuni nel progetto Eu-Grid
ž Realizzazione dei servizi necessari all’implementazione dei tools
per tutto l’INFN
Certification authority INFN riconosciuta da Eu-Grid e UsGrid
Implementazione del sistema di Security per l’utilizzo delle
risorse e delle infrastrutture GRID INFN e Internazionali
Sviluppo di Information Server INFN per l’allocazione e la
gestione delle risorse INFN
ž Implementazione di test beds secondo le necessita’ dei futuri
esperimenti
ž Collaborazioni con altri settori scientifici (Istituti metereologi…) in
Italia per la generalizzaione dei tools e dei servizi
ž Collaborazione con partner industriali italiani per il traferimento
tecnologico
18/2/2000
M.Mazzucato - Riunione GRID
19
RISORSE : EU-GRID
ž Resources (initial estimates)
ž Middleware development. Mostly young researchers and
software engineers. Industrial participation. Four teams of 4-5
persons at CERN plus 2-3 other sites. Total EU funded effort 20
person/year per 3 years = 60 PY = €5 M
ž CERN and the other partners will provide system support,
training and management (4 senior system programmers plus 4
senior managers during 3 years). Total = 24 PY = €4 M EU
unfunded effort
ž Testbed expertise and coordination: central team of 4-5
persons at CERN, 3 persons in larger partners and 1-2 in
smaller. Total EU funded effort 20 persons/year = 60 PY = €5 M
ž Applications: 5 persons in HEP, 5 persons in Biology and 5
persons in the other science = 15 person-years per year EU
funded effort = €4 M. The consortium will provide at least twice
as much effort, equivalent to €8 M.
18/2/2000
M.Mazzucato - Riunione GRID
20
ž
Overheads: Relocation of staff, travel subsistence: €1 M per year = €3 M
ž
Dissemination and workshops: €1 M in total
ž
Networking: provided by other EU funded projects (estimated at €5 M
per year)
ž
Materials budget for test beds: CERN (3’000 CPUs = €2 M funded plus
€1 M unfunded; disks = 300 TB = €4 M funded plus €2 M unfunded; mass
storage = €1 M funded plus €1 M unfunded). Total for CERN: €11 M (€7
M EU funded + €4 M EU unfunded); Extensions to nationally funded
testbeds: €5 M distributed between the partners. Total EU funded
materials = €12 M.
ž Total financial envelope:
ž
EU funded: €18 M for personnel (and overheads) and €12 M for
material = €30 M
ž
Funded by the partners: €12 M for personnel and €18 M for materials
= €30 M
ž
Networking: €15 M (estimated) to be provided by Géant or other network
projects.
18/2/2000
M.Mazzucato - Riunione GRID
21
Risorse e manpower per INFN GRID (preliminare..)
ž Gli esperimenti a LHC prevedono dal 2001 al 2003 degli studi
approfonditi per lo studio delle performance del rivelatore, del trigger e
del software con numero crescente di eventi da simulare, ricostruire e
analizzare
 CMS HLT: vari campioni di 10**7 eventi nel 2003
 Alice : Mock data Challenge
 Atlas : Mock data Challenge in corso di definizione
ž Si e’ proposto di dimensionare i test bed di INFN GRID in modo che
possano rispondere a queste esigenze
ž Le esigenze di test beds per LHC-B, Virgo e altri esperimenti saranno
incorporate non appena definite
ž Una prima stima del finanziamento necessario in 3 anni e’ ~18-20 Glit
ž (4.5 , 4.5 e 9 Glit)
ž La prima stima del manpower disponibile per il progetto Eu-Grid e
INFN-Grid e di circa 20-25 FTE
18/2/2000
M.Mazzucato - Riunione GRID
22
EU-GRID e INFN GRID : Conclusioni
ž Lo sviluppo della tecnologia delle GRID sta attirando risorse e progetti
sempre piu’ numerosi in tutto il mondo
ž A Padova dopo Chep2000 sabato 14 piu’ di 100 persone hanno
aprtecipato al workshop sulle GRID e alla discussione dei progetti EuGRI
ž In USA oltre ai progetti HEP PPDG e Griphyn la NASA sta
realizzando il primo sistema di produzione basato sulla tecnologia
GRID e sui tools di Globus
ž L’INFN come e’ apparso dal workshop sulle GRI
18/2/2000
M.Mazzucato - Riunione GRID
23
EU-GRID e INFN GRID : Conclusioni
ž Lo sviluppo della tecnologia delle GRID sta attirando risorse e progetti
sempre piu’ numerosi in tutto il mondo
ž A Padova, dopo una settimana di Chep2000, sabato 14/2, piu’ di 100
persone, inclusi i responsabili del Computing dei maggiori laboratori,
hanno partecipato al workshop sulle GRID, organizzato dall’INFN e
alla discussione dei progetti EU-GRID, US-GRID e alla
collaborazione EU-US in questo campo
ž ~70 persone hanno parteipato al GRID tutorial di Carl Kesselman (coautore del libro GRID con Ian Foster anch’esso presente), organizzato
dall’INFN
ž In USA oltre ai progetti HEP PPDG e Griphyn la NASA sta
realizzando il primo sistema di produzione basato sulla tecnologia
GRID e sui tools di Globus
ž L’INFN come e’ apparso dal workshop e’ all’avvanguardia per
l’esperienze fatte con Condor e i test beds di Globus
ž Occorre mantenere l’iniziativa adottando strutture organizzative
adeguate come raccomandato unanimente dal CNTC
18/2/2000
M.Mazzucato - Riunione GRID
24
Scarica

ppt - To the INFN WWW Server