Relazione dei referee
del calcolo LHC
Gruppo di referaggio
Forti (chair), Bossi,
MenasceMorandin, Simone, Taiuti,
Ferrari (LHCb),
MorandinBozzi(CMS),
ZoccoliCarlin(Atlas)
Outline





Tier 1, 2, ..., N
TDR
MOU
Finanziamento 2006
Ci siamo visti a gennaio, maggio e luglio.
Faccio solo updates.
Nota: i documenti sono reperibili sul sito di
referaggio:
http://www.infn.it/griddb
user/pass dipendente/INFNgrid
17 maggio 2005
Referee Calcolco LHC
2
Stato del Tier1

Gare 2005 concluse ed in fase di
installazione


Efficienza di funzionamento e di utilizzo molto
migliorata nell’ultimo anno


400 kSi2K, 200TB  Totale 1700kSi2k, 460TB
Si inizia ad avere un accounting
Problemi infrastrutturali ancora da risolvere

Spazi e costi ancora non definiti
17 maggio 2005
Referee Calcolco LHC
3
Uso del Tier1

Statistics fo
Il Tier1 viene usato ormai routinely sia dagli
esperimenti LHC sia da molti altri esperimenti
Queue
dteam
15561
babar
58025
4000
2000
39825
28
lhcb
277409
867
cdf
alice
guest
227406
668
9073
20
38
99632
124
argo
13877
10
babar_test
6187
ams
5055
45
64
virgo
358
14
test
292
1
pamela
69
babar_objy
35791
babar_build
192
quarto
139
geant4
3
56
19
186
18
cms_align
2302
8
biomed
1435
21
babar_xxl
Totale
Referee Calcolco LHC
174
cms
magic
17 maggio 2005
94
47
atlas
infngrid
giallo: slot dichiarate
blu: job running
verde: job queued
To
Jobs
Tim
Completed
(
22
16
793051
4
193
Accounting al Tier1

Ancora da perfezionare, ma esiste
CPU time totale
17 maggio 2005
wallclock time totale
Referee Calcolco LHC
http://tier1.cnaf.infn.it/monitor/LSF/plots/acct/
5
Non sempre tutto va bene...
blindosbarra switch
17 maggio 2005
Referee Calcolco LHC
upgrade
6
Infrastrutture al CNAF

Trasformatore



Sostituito 11 agosto 800kVA1250kVA ed
installata ventilazione forzata.
 Senza interruzioni di servizio 
Blindosbarre



Scoperti (con il naso) problemi di fissaggio
meccanico e di masse.
36h fermo farm
Primo fissaggio di emergenza. Necessaria una
completa revisione
17 maggio 2005
Referee Calcolco LHC
7
Infrastrutture al CNAF II

Gruppo Frigorifero




Numerosi problemi e mancanza di ridondanza per
la centralina
Progressivo miglioramento con l’esperienza
Necessario ridondarlo al più presto
Per il 2006

Dopo gli interventi sul trasformatore (fatto), sulle
blindo e sul frigorifero (da fare), le infrastrutture
attuali sono sufficienti a coprire le esigenze 2006.
17 maggio 2005
Referee Calcolco LHC
8
Infrastrutture - prospettiva

Per i potenziamenti successivi (11.5 MSint2K e 6
PByte nel 2010) occorre programmare acquisto e
messa in opera di:





Da reperire gli spazi (200m2: attuale magazzino ?)


nuova potenza elettrica (altri 2 Trasformatori da 1250KVA)
nuova potenza frigorifera (altri 2 Gruppi Frigoriferi)
nuovo sistema di autogenerazione elettrica (altri 2 G.
Elettrogeni)
nuovo UPS
Progetto in corso di definizione, pronto per fine anno
Stima dei costi necessaria al più presto

E’ l’ultimo ostacolo alla definizione ufficiale dell’impegno
italiano sul Tier1 da inserire nel MoU.
17 maggio 2005
Referee Calcolco LHC
9
Dobbiamo usare il Tier1
Funziona, e molti lo usano...
...però ci vuole tanta pazienza.
...e ci vuole aiuto da parte di fisici e
tecnologi del calcolo delle sezioni
Non può essere considerato un servizio
che “qualcun’altro” fornisce
17 maggio 2005
Referee Calcolco LHC
10
Tier 2

Progetto “tipo” di Tier2 disponibile da
luglio
http://www.infn.it/cgi-bin/grid/cgi/ShowDocument?docid=23
user/pass dipendente/INFNgrid



Le sedi stanno compilando, ci aspettiamo
di avere i progetti entro fine settembre
3-4 ottobre workshop a PD sugli
aspetti tecnico-infrastrutturali dei Tier2
Commissione calcolo coinvolta
pienamente

Dovrà referare/finanziare i potenziamenti
infrastrutturali delle sezioni
17 maggio 2005
Referee Calcolco LHC
Bari
ALI
CE CMS
Catania
ALI
CE
CNAF
LH
Cb
LNF
11
ATL
AS
Piano dei Tier2



Gli esperimenti hanno presentato un piano ragionevole
Da approvare quando ci saranno i progetti, almeno in parte
compilati
Ancora da ottimizzare il ramping up, in dipendenza dagli
aggiustamenti di schedule di LHC
ATLAS
CMS
LHCb
TOTALE CSN1
ALICE
TOTALE INFN
17 maggio 2005
Tier2: acquisti per anno (k€)
Piani degli esperimenti
2006 2007 2008 2009 2010
232
381 1182
707
779
221
935
966
639
667
199
134
118
57
44
652 1450 2266 1403 1490
351
590
819
944
304
1003 2040 3085 2347 1794
Referee Calcolco LHC
TOTALE
3281
3428
551
7260
3008
10268
12
Proposta finanziamento Tier2


La CSN3 ha riservato per Alice una tasca di 250 k€
per i Tier2, da assegnare dopo l’approvazione del
piano
TIER2 (k€)
Proposta referee
Proponiamo per la CSN1 un
2006
approccio simile. L’entità della
200
ATLAS
tasca dovrebbe essere di 500K€
CMS
200



LHCb
LHCb ha un picco ingiustificato
TOTALE CSN1
nel 2006
Nota: Roma1 ha inserito il Tier2 su C.A., ALICE
TOTALE INFN
erroneamente
Suddivisione approssimativa, da rivedere
17 maggio 2005
Referee Calcolco LHC
100
500
250
750
13
Tier 3, ..., N

Nei TDR, i Tier3 hanno guadagnato un certo spazio,
con però molte ambiguità




Si dice che possono contribuire “significativamente” alle
risorse di calcolo dell’esperimento, ma si considera
impossibile farne un accounting
Sono risorse fornite e rese disponibili “on best effort basis”
Non sono chiare le dimensioni necessarie
Vorremmo che la comunità italiana elaborasse un
ragionevole piano organico dei Tier3

Fino ad oggi finanziate quasi tutte le sezioni sulla base
delle attività locali e la potenza dello strillo.
17 maggio 2005
Referee Calcolco LHC
14
Un sommario dei finanziamenti
Con beneficio di inventario... (escluso CNAF)
Da aggiungere ALICE...
Inventariabile finanziato per anno per esperimento
Sum of INV
Esperimento
ATLAS
CMS
GRID
LHCb
Grand Total
17 maggio 2005
Anno
2000
48.5
100.5
170
319
2001
158
524
57.5
127.5
867
2002
139.5
182
321.5
2003
99.5
123
508.5
24
755
Referee Calcolco LHC
2004
33
115
107
255
2005 Grand Total
339
1002
728.5
1753.5
151.5
728.5
3246
15
Inventariabile finanziato per anno per sezione
Sum of INV Anno
Sezione
2000
Bari
12
Bologna
19
Cagliari
7.5
Catania
8.5
Cosenza
6
Ferrara
Firenze
11
Genova
6
Lecce
47.5
LNF
LNL
12.5
Milano
11
Napoli
8
Padova
73
Parma
Pavia
6
Perugia
6.5
Pisa
40.5
Roma1
24.5
Roma2
Roma3
7.5
Torino
12
Trieste
17 maggio
2005
Grand Total
319
2001
15
161
7.5
11.5
7.5
15
2002
13.5
21
2003
28.5
34
25
6.5
6
27
10
35
7.5
7.5
210
91.5
68
73.5
8
5.5
5
5
2.5
23
130
10.5
19.5
24
5
7
3.5
1.5
255
5
300
35
17.5
43.5
4
33
38.5
149
4
7.5
5
7.5
867
29
68
39
99
Referee Calcolco LHC
321.5
755
2004
21.5
19
4
35.5
23
2
6
52
19
2005 Grand Total
46
136.5
0
254
6
25
50.5
137.5
12
18
25.5
6
74
0
46
0
62.5
39
46.5
12
586.5
39
246.5
39
138.5
72.5
353.5
0
8
0
34.5
23
62.5
50
171.5
55.5
383
15
34.5
30
52
197
316.5
30
39
728.5
3246
16
17 maggio 2005
Sezione
Referee
Calcolco LHC
Trieste
Torino
Roma3
Roma2
Roma1
Pisa
Perugia
Pavia
Parma
Padova
Napoli
Milano
LNL
LNF
Lecce
Genova
Firenze
Ferrara
Cosenza
Catania
Cagliari
Bologna
700
Bari
Esperimento (All)
Sum of INV
600
500
Anno
400
300
2005
2004
2003
2002
2001
2000
200
100
0
17
Richieste e proposte

Le richieste per Tier3 sono in totale 180K€
per Atlas e CMS


Le giustificazioni variano
Il collegio dei referee propone di non
finanziare nessuna di queste richieste al
momento attuale


Vorremmo vedere un piano dei Tier3
Disponibilità a discutere situazioni particolari, ma
dopo che abbiamo capito meglio i Tier2
17 maggio 2005
Referee Calcolco LHC
18
Riflessioni sui Tier3





Tutte le sezioni hanno avuto finanziamenti per calcolo LHC o per
Grid
 Chi più chi meno (e chi meno giustamente strilla)
Queste risorse devono essere utilizzate per iniziare lo sviluppo
come Tier3 e precisare il modello di integrazione con T2 e T1.
 Integrazione in INFNGrid da un lato e accesso locale (User
Interface) dall’altro.
ll modello di Tier3 rimane al momento indefinito
 Farm locale con un po’ di dischi ?
 PC personali “vestiti” ?
Difficile da definire senza fare veramente dell’analisi nella
configurazione d’uso finale
Vogliamo evitare che grazie alla disponibilità di risorse locali che
risolvono i problemi più urgenti i gruppi si sottraggano alla
responsabilità di aiutare a far funzionare i Tier2 e la Grid
17 maggio 2005
Referee Calcolco LHC
19
MoU


C’è una forte pressione del CERN per
definire le cifre nel MoU per LCG fase II.
A noi (INFN) manca



Una definizione dei costi infrastrutturali per il Tier1
e la revisione del piano temporale.
Una prima bozza dei progetti dei Tier2 e la
valutazione dei costi infrastrutturali delle sedi
Una approvazione da parte di CSN1/3 del piano
temporale dei Tier2
17 maggio 2005
Referee Calcolco LHC
20
Computing TDR

LHCC non ha ancora fatto la review dei Computing
TDR


Schedulata per il 7-8 ottobre. Referee esterni a LHCC:
 D. Boutigny (Annecy; for ALICE C-TDR),
 T. Haas (DESY; for ATLAS C-TDR),
 C. Bozzi (INFN Ferrara; for CMS C-TDR),
 Alan Campbell (DESY; for LHCb)
Stiamo raccogliendo i commenti dei referee italiani


Come avete visto non ci sono modifiche sostanziali rispetto
ai computing model.
Mancano ancora molte verifiche al modello:
 Attendiamo ansiosi i risultati dei Data Challenge e Service
Challenge
17 maggio 2005
Referee Calcolco LHC
21
Grid

Sono stati fatti notevoli passi avanti nella funzionalità e nell’uso
della Grid

Fondamentale il contributo dell’INFN, anche se un po’ dispersivo in
certe occasioni



Convergenza sui “baseline services”, che però non sono quite
enough


Molti progetti, non sempre focalizzati (Ferroni li definì tra l’inutile ed il
dannoso)
Però anche molti ottimi risultati
Si sta convergendo anche sulle funzionalità più avanzate
In corso di definizione la struttura di EGEE-II (progetto europeo)



Si cerca di garantire una maggiore interazione con gli esperimenti,
attraverso task force e struttura esplicita del management
Problema del doppio ruolo di LCG (cioè CERN): deployment del
middleware EGEE ma anche garanzia di interoperabilità tra Grid
(OSG, Nordugrid)
Molti interessi diversi tendono ad un pericoloso aumento di entropia
17 maggio 2005
Referee Calcolco LHC
22
INFNGrid

Gruppo molto attivo
 Struttura di INFNGrid di fatto funzionante e utilizzata



Anche da VO (Virtual Organization) di provenienza non HEP
Monitoraggio online: http://infnforge.cnaf.infn.it/gridice/
Sempre più rilevante per sviluppo, deployment e certification del
MW
17 maggio 2005
Referee Calcolco LHC
23
INFNGrid
Presentate richieste per 1.9MEuro a fronte di un
budget disponibile di 1MEuro
(Ricordiamoci che INFNGrid porta all’INFN molti
soldi attraverso i progetti europei)
Referaggio in corso





Necessario focalizzare sulle necessità più importanti
Prioritizzare le richieste
1.
Far funzionare il calcolo LHC
2.
Calcolo LHC
3.
Che funzioni il calcolo LHC
4.
Che poi si riesca a fare analisi per LHC
5.
Che gli esperimenti LHC possano calcolare efficacemente
6.
E poi c’e’ il resto.
17 maggio 2005
Referee Calcolco LHC
24
Conclusioni e prospettive




Nessuno si illude che il computing di LHC sia un
problema semplice.
La soluzione scelta (GRID) non è provata, ma del
resto nessuna altra soluzione lo era.
Si è visto una derivata decisamente positiva nella
funzionalità e nell’uso della GRID.
E’ assolutamente necessario uno sforzo collettivo e
coerente per avere successo (sia all’interno degli
esperimenti che tra esperimenti)
17 maggio 2005
Referee Calcolco LHC
25
Scarica

ppt - Infn