IL PROGETTO GRID INFN ž SCOPO: Studio e sviluppo di una infrastruttura di calcolo per l’INFN distribuita su area geografica e connessa da una rete ad alta banda a strutture simili in corso di sviluppo negli altri paesi europei. Lo sviluppo dell’architettura e dei tools software necessari sara’ fatto in collaborazione con le altre Istituzioni dei paesi europei (UK-RAL,FR-In2p3,SP-IFAE…) all’interno di un progetto europeo comune ž REQUIREMENTS : l’infrastruttura di calcolo dovra’ essere capace di soddisfare i bisogni di calcolo dei moderni esperimenti e in particolare quelli degli esperimenti a LHC e Virgo che sono ordini di grandezza superiori di quelli attualmente in corso al CERN. I risultati degli studi del progetto Monarc costituiranno un costante punto di riferimento per lo sviluppo del progetto 18/2/2000 M.Mazzucato - Riunione GRID 1 Storia del progetto GRID INFN ž Dall’inizio del 1999 il CNTC ha cominciato a discutere ed esaminare le tecnologie piu’ adatte a soddisfare i bisogni di calcolo degli esperimenti a LHC e in particolare a realizzare il sistema di Centri Regionali distribuito a vari livelli (Tier1..Tier4) proposto da Monarc. Vedi verbale CNTC 16/4/99 ž Riunione congiunta con esperimenti 28/6/99 a Napoli per definire i requirements e computing models favoriti Indicazione verso Centri Regionali distribuiti Tier1…Tier4 ž Workshop CNTC di Martina Franca 28/10/99. Definizione di un programma di attivita’ per CNTC ed esperimenti a LHC e Virgo per arrivare a formulare una proposta di sperimentazione di una infrastruttura di calcolo distribuita in linea con i requirements ž Workshop di Milano 16/12/99 e CNTC 21/12/99 a conclusione di un primo ciclo di discussioni nel CNTC, all’interno degli esperimenti e di valutazioni tecniche approfondite Conferma orientamento verso la sperimentazione di tenologie atte a realizzare Centri Regionali distribuiti Orientamento verso la sperimentazione delle Computing GRID 18/2/2000 M.Mazzucato - Riunione GRID 2 L’evoluzione del progetto Europeo ž Discussioni a livello Europeo in parallelo con le discussioni interne all’INFN sulla stessa tematica ž Meeting tra EU and HEPCCC in Novembre 99 incoraggia la formulazione di un progetto europeo che affronti lo sviluppo di una tecnologia adeguata ad affrontare la problematica del calcolo distribuito alla scala degli esperimenti LHC ž Direttivo INFN di Dicembre 99 da’ mandato a M. M. e F. Ruggieri a partecipare alle riunioni per il lancio del progetto ž Kick-off meeting al CERN 11 gennaio, 2000 OK dal CERN e dai membri di In2p3, RAL-Pparc, Ifae, Nikhef, Ung. 2 Task forces: preparazione parte tecnica e proposal ž La EU incoraggia a sottomettere un proposal per il 10 Maggio 2000 ž 13 Febbraio 2000 sottomesso alla CE outline del progetto 18/2/2000 M.Mazzucato - Riunione GRID 3 Descrizione del Progetto Europeo ž Scopo : Sviluppo e dimostrazione di WA Comp. Fabric ž Focalizza gli sforzi per risolvere le tematiche che sono caratteristiche del mondo della fisica delle Alte Enegie e Nucleare e non sono coperte da altri progetti di GRID : management di grandi quantita’ di dati (Pbytes) high throughput computing management delle computing fabrics locali e wide-area GRID ž Sviluppo del Middleware ž Realizzazioni di Testbed demonstrators usati su casi reali ž Collaborazione con altre scienze “OK” a partecipare da parte di una collaborazione di Istituti Metereologici Europei organizzata da CNR-Bologna ž Collaborazione con l’Industria Partners Italiani 18/2/2000 M.Mazzucato - Riunione GRID 4 EU-Project : Workprogramme ž R&D required on: Adaptability Scalability Wide-area distribution of resources ž Tentative Workpackages: computing fabric management mass storage management wide area data management wide-area workload management wide-area application monitoring application development/adaptation ž Develop in the light of today’s workshop 18/2/2000 M.Mazzucato - Riunione GRID 5 EU-Project : Resources National/regional part of the GRID funded by national agencies High performance bandwidth across sites to be provided by other initiatives (Geant?) EU financial support for development of midddleware, overall integration and operation of testbeds Support for exchange of staff and dissemination of information (workshops, conferences etc) 18/2/2000 M.Mazzucato - Riunione GRID 6 Prospettive e benefici dal Progetto GRID per l’INFN ž Sfruttamento ottimale delle risorse di calcolo e di storage presenti nell’INFN e in HEP tramite lo sviluppo di un software “middleware” di alto livello che consentira’ un accesso “trasparente” a tutte queste risorse ž Acquisizione di una tecnologia di frontiera che in prospettiva potrebbere trovare una larga applicazione in: Altri settori scientifici che hanno un comune il problema dell’accesso e dell’analisi distribuita di grandi moli di dati Settori commerciali come ISP/ASP che si trovano a fronteggiare l’esigenza dello sviluppo di cluster scalabili in siti centrali diversi per fronteggiare la domanda che viene dal Web, dalle ricerche su grandi archivi di dati e dal commercio elettronico 18/2/2000 M.Mazzucato - Riunione GRID 7 Alcuni numeri per il progetto Europeo ed INFN Estimated computing resources required at CERN for LHC experiments in 2006 (Da Tech prop. e Monarc) ž ž ž ž ž ž ž ž ž ž collaboration CPU capacity (SPECint95)2006 annual inc. estimated # cpus in 2006 disk capacity (TB)in 2006 annual inc. mag. tape capacity (PB) 2006 annual inc. aggregate I/O rates (GB/sec)disk tape ALICE 450,000 150,000 2,250 300 90 3.7 2.0 100 1.2 ATLAS 600,000 200,000 3,000 550 200 3.4 2.0 100 0.4 CMS 600,000 200,000 3,000 550 200 3.4 2.0 100 0.4 LHCB 70,000 15,000 350 80 20 1.4 0.9 12 0.2 Total 1,720,000 565,000 8,600 1,480 510 11.9 6.9 312 2.2 SPECint 95: A modern PC has a performance of roughly20-30 SPECint95s. We expect this to grow to around 200 SPECint95s by 2006. 18/2/2000 M.Mazzucato - Riunione GRID 8 Assunzioni Progetto Europeo ž Estimated computing resources for an LHC Regional Computing Centre (2006) (Da Monarc) ž ž ž ž ž CPU capacity disk capacity disk I/O rate tape storage WAN connection 18/2/2000 120,000 110 20 0.4 2.5 SI95 Tbytes GBytes/sec PetaBytes Gbits/sec M.Mazzucato - Riunione GRID 9 I TESTBEDS DEL PROGETTO EUROPEO E INFN ž E’ opinione condivisa in Europa e in USA che per sviluppare la tecnologia GRID adatta a risolvere i problemi del calcolo dei futuri esperimenti sia necessario sviluppare dei testbeds che si sviluppino nel tempo fino ad arrivare a una dimensione non trascurabile di quanto sara’ necessario per LHC (5-10%) ž Questo deriva : Dalla complessita’ del Calcolo a LHC che al momento non ha uguali in altri settori scientifici o della societa’ ma pero’ anticipa le esigenze di questi (vedi talk Obectivitj e Nag a Chep2000) Dalla recente esperienza di Babar che ha mostrato come a questo livello di complessita’ i problemi non scalino ž Si ritiene quindi che la validazione del middleware debba essere fatta su un Tier0 di circa il 50% di un centro per un esperimento LHC 2006 e su centri regionali fino al 20% negli altri paesi Europei 18/2/2000 M.Mazzucato - Riunione GRID 10 Capacity targets for the Testbed at CERN ž ž ž ž ž ž ž ž units CPU capacity SI95 estd. number of cpus disk capacity TBytes disk I/O rate GBytes/sec tape storage – capacity PB -sustained data rate MB/s WAN links to ext. sitesMbs 18/2/2000 end 2000 20,000 400 20 5 0.2 250 155 M.Mazzucato - Riunione GRID end 2001 70,000 1,000 60 15 0.3 500 622 end 2000 300,000 3,000 250 50 1.0 1,000 2,500 11 TEMPI DI PREPARAZIONE PROGETTO Eu-Grid Prossime scadenze Eu-Grid e conseguenze per l’INFN ž 7 Marzo : Workshop al CERN per definire il workplan e i packages da sviluppare Il gruppo tecnico Grid-INFN ha gia’ formulato le proposte INFN ž 15 Marzo : Preparazione Draft con Workplan, schedule, risorse Approvazione del Draft da parte Management INFN ž 30 Marzo : finalizzazione del progetto : Istituzioni partecipanti, risorse richieste, piano attivita’, deliverables, schedule etc.. Inizio Scrittura Progetto Eu-Grid ž 30 Marzo - 30 Aprile : finalizazzione documento da sottomettere alla firma delle Istituzioni partecipanti ž 30 Aprile -10 maggio : Firma del documento dai rappresentanti delle Istituzioni 18/2/2000 M.Mazzucato - Riunione GRID 12 STATO PREPARAZIONE PROGETTO INFN-Grid Scala dei tempi concordata nella riunione CNTC del 28/10/99 ž Inizio immediato all’interno degli esperimenti della discussione sullo sviluppo della tecnologia per i Centri regionali LHC e Virgo ž Costituizione immediata di un gruppo tecnico per la valutazione delle tecnologie . Riunioni al CNAF 29/11/99, 14/12/99 ž 26 Febbraio : Documenti finali approvati ufficialmenti dgli esperimenti e contenenti : Indicazione del modello di computing che si intende adottare per la sperimentazione Struttura gerarchica distribuita Tier1..Tier4 alla Monarc Sedi che intendono partecipare alla sperimentazione e in che ruolo Scelta della tecnologia di base per l’inizio della sperimentazione Piano di attivita’ per l’utilizzo dei test beds Manpower disponibile per lo sviluppo della tcnologia 18/2/2000 M.Mazzucato - Riunione GRID 13 Le decisioni preliminari degli esperimenti :CMS Verbale della riunione di CMS Italia a Firenze 25/11/99 (P. Capiluppi- Comp Coord CMS) ž CMS Italia preferisce un Centro Regionale (Tier1) presso una unita’ INFN coinvolta in CMS La complessita’ del calcolo a LHC richiede infatti la possibilita’ di accedere direttamente con privilegi ai sistemi specialmente nella fase iniziale di sperimentazione( Reboot, kill di jobs, daemon etc.) ž CMS Italia preferisce un Centro Regionale Tier 1 “distribuito misto” che vede una sede come riferimento primus inter pares ž CMS Italia ritiene che si debba rapidamente andare verso sperimentazioni reali di un Centro Regionale del tipo proposto utilizzando gli studi HLT come “use case” reale Verbale della riunione CMS Comp. Italia a Padova 11/2/2000 (P. Capiluppi) ž Le tecnologie di Grid (e Globus) sono da sperimentare in quanto possono costiture il mezzo per realizzare il calcolo distribuito (e gerarchico) necessario ad LHC e all'INFN (CMS). La partecipazione di CMS deve essere chiara e qualificata per lo sviluppo dei tools che costituiranno la base dei Centri Regionali. ž CMS Italia intende pertanto partecipare al Progetto di Grid Europea con tutte le risorse che riuscira' a mettere in campo. 18/2/2000 M.Mazzucato - Riunione GRID 14 Le decisioni preliminari degli esperimenti : ATLAS Mail di L. Perini (Comp. Coord. Atlas) 15/2/2000 ž ATLAS-Italia e' intenzionato a realizzare un RC (Tier1) in Italia per lo start-up di LHC. ž L'ipotesi preferita per l'implementazione si avvale dei servizi forniti dai Consorzi di Calcolo per l'outsourcing del personale di tipo sistemistico e presumibilmente per ospitare l'hardware di calcolo (di proprieta' INFN) ž ATLAS-Italia e' interessato alla sperimentazione dei tools di GRID, come delineato nel progetto EU-GRID, per realizzare in modo trasparente la distribuzione delle risorse di calcolo e dei dati fra i diversi Tier-n a disposizione della Collaborazione ž La realizzazione per il 2003 di un prototipo in scala circa 20% dell'installato prevedibile per il 2006 presenta molti vantaggi ž I siti individuati per la partecipazione alla fase iniziale di prototipizzazione sono due: Roma1 e Milano, con Roma1 capofila 18/2/2000 M.Mazzucato - Riunione GRID 15 Le decisioni preliminari degli esperimenti : ALICE Mail di A. Masoni (Comp Coord. Alice) 17/2/2000 ž Dato il ruolo che la collaborazione italiana ricopre all’ interno di ALICE si ritiene necessario poter avere un centro regionale Tier1 in Italia ž Si ritiene che la tecnologia della GRID possa costituire un valido approccio. ALICE-Italia è pertanto disponibile a partecipare all’attività di sperimentazione di prototipi di centri regionali con tecnologia GRID ž Si ritiene che la strutturazione definitiva in termini di centri Tier-1,2,3 debba venire dai risultati della sperimentazione. L’ orientamento attuale è verso una architettura basata su un centro Tier1 distribuito fra due o tre sedi e tre o più centri Tier2. Una struttura di questo tipo tiene conto della distribuzione delle risorse nelle varie sedi e ne consentirebbe un ottimale utilizzo. 18/2/2000 M.Mazzucato - Riunione GRID 16 Le decisioni preliminari degli esperimenti : Virgo ž Mail di F. Ricci (17/2/99) ž Come Ti avevo assicurato nella riunione di Milano della commissione da Te presieduta mi sono fatto carico di innescare nell'ambito della parte italiana dell'esperimento la discussione relativa al problema della partecipazione di Virgo alla sperimentazione di Grid. ž Si e' avuta una rapida convergenza sul manifestare la nostra disponibilità a tale processo di sperimentazione ed abbiamo individuato un gruppo di persone, (praticamente uno per ciascuna sezione partecipante al progetto Virgo) che possano dedicare una limitata percentuale del loro tempo a questo scopo. ž Noi siamo coscienti che Grid non risolve da solo il problema del calcolo di Virgo ma che si tratta certamente di una strada da esplorare insieme con la costituzione di solidi centri fortemente interconnessi per l'elaborazione ed il calcolo dei dati dell'esperimento. ž Sono quindi nella condizione di assicurarTi, come Virgo Italia, il nostro pieno interessamento allo sviluppo di questi progetti 18/2/2000 M.Mazzucato - Riunione GRID 17 INFN-GRID : future scadenze (da discutere..) ž Dal 26 febbraio inizio scrittura progetto INFN GRID ž 30 Marzo preparazione draft contenente workplan INFN-Grid contributo INFN EU-Grid manpower disponibile piano attuazione testbeds schedule e milestones ž 30 Marzo -30 Aprile discussione draft nell’INFN e finalizzazione progetto ž 30 Aprile presentazione progetto per l’approvazione finale in sintonia con il progetto EU-Grid 18/2/2000 M.Mazzucato - Riunione GRID 18 INFN-GRID : Piano di attivita’ ž Contributo allo sviluppo dei tools comuni nel progetto Eu-Grid ž Realizzazione dei servizi necessari all’implementazione dei tools per tutto l’INFN Certification authority INFN riconosciuta da Eu-Grid e UsGrid Implementazione del sistema di Security per l’utilizzo delle risorse e delle infrastrutture GRID INFN e Internazionali Sviluppo di Information Server INFN per l’allocazione e la gestione delle risorse INFN ž Implementazione di test beds secondo le necessita’ dei futuri esperimenti ž Collaborazioni con altri settori scientifici (Istituti metereologi…) in Italia per la generalizzaione dei tools e dei servizi ž Collaborazione con partner industriali italiani per il traferimento tecnologico 18/2/2000 M.Mazzucato - Riunione GRID 19 RISORSE : EU-GRID ž Resources (initial estimates) ž Middleware development. Mostly young researchers and software engineers. Industrial participation. Four teams of 4-5 persons at CERN plus 2-3 other sites. Total EU funded effort 20 person/year per 3 years = 60 PY = €5 M ž CERN and the other partners will provide system support, training and management (4 senior system programmers plus 4 senior managers during 3 years). Total = 24 PY = €4 M EU unfunded effort ž Testbed expertise and coordination: central team of 4-5 persons at CERN, 3 persons in larger partners and 1-2 in smaller. Total EU funded effort 20 persons/year = 60 PY = €5 M ž Applications: 5 persons in HEP, 5 persons in Biology and 5 persons in the other science = 15 person-years per year EU funded effort = €4 M. The consortium will provide at least twice as much effort, equivalent to €8 M. 18/2/2000 M.Mazzucato - Riunione GRID 20 ž Overheads: Relocation of staff, travel subsistence: €1 M per year = €3 M ž Dissemination and workshops: €1 M in total ž Networking: provided by other EU funded projects (estimated at €5 M per year) ž Materials budget for test beds: CERN (3’000 CPUs = €2 M funded plus €1 M unfunded; disks = 300 TB = €4 M funded plus €2 M unfunded; mass storage = €1 M funded plus €1 M unfunded). Total for CERN: €11 M (€7 M EU funded + €4 M EU unfunded); Extensions to nationally funded testbeds: €5 M distributed between the partners. Total EU funded materials = €12 M. ž Total financial envelope: ž EU funded: €18 M for personnel (and overheads) and €12 M for material = €30 M ž Funded by the partners: €12 M for personnel and €18 M for materials = €30 M ž Networking: €15 M (estimated) to be provided by Géant or other network projects. 18/2/2000 M.Mazzucato - Riunione GRID 21 Risorse e manpower per INFN GRID (preliminare..) ž Gli esperimenti a LHC prevedono dal 2001 al 2003 degli studi approfonditi per lo studio delle performance del rivelatore, del trigger e del software con numero crescente di eventi da simulare, ricostruire e analizzare CMS HLT: vari campioni di 10**7 eventi nel 2003 Alice : Mock data Challenge Atlas : Mock data Challenge in corso di definizione ž Si e’ proposto di dimensionare i test bed di INFN GRID in modo che possano rispondere a queste esigenze ž Le esigenze di test beds per LHC-B, Virgo e altri esperimenti saranno incorporate non appena definite ž Una prima stima del finanziamento necessario in 3 anni e’ ~18-20 Glit ž (4.5 , 4.5 e 9 Glit) ž La prima stima del manpower disponibile per il progetto Eu-Grid e INFN-Grid e di circa 20-25 FTE 18/2/2000 M.Mazzucato - Riunione GRID 22 EU-GRID e INFN GRID : Conclusioni ž Lo sviluppo della tecnologia delle GRID sta attirando risorse e progetti sempre piu’ numerosi in tutto il mondo ž A Padova dopo Chep2000 sabato 14 piu’ di 100 persone hanno aprtecipato al workshop sulle GRID e alla discussione dei progetti EuGRI ž In USA oltre ai progetti HEP PPDG e Griphyn la NASA sta realizzando il primo sistema di produzione basato sulla tecnologia GRID e sui tools di Globus ž L’INFN come e’ apparso dal workshop sulle GRI 18/2/2000 M.Mazzucato - Riunione GRID 23 EU-GRID e INFN GRID : Conclusioni ž Lo sviluppo della tecnologia delle GRID sta attirando risorse e progetti sempre piu’ numerosi in tutto il mondo ž A Padova, dopo una settimana di Chep2000, sabato 14/2, piu’ di 100 persone, inclusi i responsabili del Computing dei maggiori laboratori, hanno partecipato al workshop sulle GRID, organizzato dall’INFN e alla discussione dei progetti EU-GRID, US-GRID e alla collaborazione EU-US in questo campo ž ~70 persone hanno parteipato al GRID tutorial di Carl Kesselman (coautore del libro GRID con Ian Foster anch’esso presente), organizzato dall’INFN ž In USA oltre ai progetti HEP PPDG e Griphyn la NASA sta realizzando il primo sistema di produzione basato sulla tecnologia GRID e sui tools di Globus ž L’INFN come e’ apparso dal workshop e’ all’avvanguardia per l’esperienze fatte con Condor e i test beds di Globus ž Occorre mantenere l’iniziativa adottando strutture organizzative adeguate come raccomandato unanimente dal CNTC 18/2/2000 M.Mazzucato - Riunione GRID 24