Analisi (fake e non) per il DC04 L. Silvestris INFN-Bari 21/01/2004 L. Silvestris 1 Principali goals (tasks) dei PRS nel 2004 Partecipazione al PCP e DC04 con analisi fake!! (perche’ e’ importante farla??) Sviluppo di software di allineamento e calibrazione Messa a punto di tools che consentono di effettuare studi sistematici di allineamento, mappature di campo magnetico Fast simulation. Preparazione di tools, ricostruzione di tracce e vertici, energy flow, b tagging, tau tagging, top tagging Sto preparando una lista piu’ estesa per il prossimo btau 3 Febbraio... Input?? Inviatemi un e-mail... 21/01/2004 L. Silvestris 2 Cosa e’ il DC04? 21/01/2004 L. Silvestris 3 Pre-Data Challenge Production 1) Pre-Data Challenge: Hit-formatting CMSIM data Digitizzare CMSIM and OSCAR – – Codice di digitizzazione quasi pronto.. Verra’ prodotta una nuova versione per correggere i problemi che al momento sono presenti nel codice di CSC. Adesso stiamo facendo la validazione almeno su campioni di singoli muoni e pioni. Non sono ancora disponibili b,c uds... Problema del production team. • Mi sembra difficile che si possa partire prima della fine del mese. Muovere i files di digis al CERN – Cioe’ i “raw data” ed anche su tape al CERN. 2) Vero DC04.. …. 21/01/2004 L. Silvestris 4 Cosa e’ il DC04 ? – Tasks del T0 Ricostruire tutti gli eventi, runnare il codice di HLT ... – 50M (saranno meno probibilmente 20M) di eventi = 2M/giorno=2000 jobs di circa 1000 events each – Tempo necessario per la ricostruzione completa dell’evento ??? • Assume we need to run ~ 500 concurrent jobs 24 hours/day – L’idea e’ quella di processare gli eventi per dataset e quindi anche i jobs di analisi – Una degli argomenti fondamentali che CCS vorrebbe testare e’ lo stream di dati: • Una possibile definizione di stream e’ tramite una pattern di “bits” di HLT – Creare nuove copie (deep) di alcune parti dei dati tramite filtered collections. – Creare nuove collezioni senza il “ deep copying” ma per esempio scrivendo in out-put oggetti ricostruiti cioe’ tracce, vertici, cluster calorimetrici, jets – Registrare i dati in un buffer manager di output. • Distribuire tutti i dati ricostruiti a tutti i T1’s (20TB? to each?) 21/01/2004 L. Silvestris 5 Come sara’ composto il DST del DC04 ? Sometimes called DST, or ESD, or Reconstructed Raw – Links to “raw-data” (digits) – Some “Rechits” reproduced to DST? – HLT, Tracks, clusters, towers, jets, Emiss, Muons, .. ? • To be defined, within reason… – Budget about 500KB/event – At this stage expect to need real work to massage transient objects into good persistent objects… – Clearly the goal (which we will probably fail) is that the DST contains all the data needed for making further selections/cuts and partial reconstructions • Need to make sure that digis make their way at least to the centers which will do most of the analysis for a given dataset (along with the DST of course, if we fail to send that everywhere) • Likewise the MC truth information (non ci sono I tools di produzione capace di gestire l’attach dei corretti files di MC ai dati DST.) 21/01/2004 L. Silvestris 6 Cosa e’ il DC04? Trasferimento tra Tier0 e iTiers1 Utilizzare POOL FCatalog tools per popolare il catalogo CERN RLS catalog (Oracle) necessario per poter utilizzare successivamente ai T1-T2-TN i SW di LCG2. Output buffer manager – Sends all closed files to castor – Pushes data to T1 centers (informs, waits for pull, waits for receipt acknowledgment) – Purges buffer only when data is in castor and at required number of T1 centers. – Uses whatever transfer tools are appropriate now. (probably SRB/MCAT) How well will central RLS catalog scale? – Investigating with IT/DB Oracle replication to a second “Master” DB at a T1 (More T1 if we can, probably this is already stretching things) Questa parte dell’attivita’ dovrebbere essere terminata 21/01/2004 7 L. Silvestris entro “Marzo” Cosa e’ il DC04: task dei Tiers1 Respond to T0 data push requests. – Disk to Disk at least. Expect data volumes to require MSS Maintain a local catalog of its local files – At the RLS catalog replication site(s) try to refer only to the replicated catalog, expect elsewhere to have to use the central CERN one Run reco/analysis pass over DST – Demonstrate we know when all the files required by a job are present! – CCS would really like to write a TAG at this stage (See T2 tasks) • TAG is a couple of kB of global event description data – PRS could use this step to write their rootuples. – TAG has advantage that their management, replication etc can all be managed by the same tools as for the DST and RAW data – ROOTuple has the advantage that they can be used directly in ROOT of course. (If you can keep track of them - 50k 1000 event files…) 21/01/2004 L. Silvestris 8 Cosa e’ il DC04 ? – Task dei Tier-1 The Tier-1 is a CMS production center – Most of its work is for the entire CMS community The Tier-1 is the main access path for Tier-2-N centers to access the data. – (The Tier-0 does not serve the Tier-1’s, it serves the first pass reconstruction and the online and attempts to clear its output buffers to the Tier-1s. The Tier-0 response does not degrade, it has clearly defined workflow strategies to ensure it never fails its basic data management functions) The Tier-1 staff support their dependent Tier-2s (if any) The Tier-1 services all requests for data that it has to any CMS Tier-2’s – “All” within the limitations that its MSS and network degrades gracefully. 21/01/2004 L. Silvestris 9 CMS and LCG2 – Expect last one (run reco/analysis over DST) to continue and be repeated over next 6 months as LCG matures. Factorized from Tier0 and distribution challenges 21/01/2004 L. Silvestris 10 Analisi per il DC04 nel Tracker ttH H->bb B0s->Jpsiphi Cosa intendo per analisi (fake??) finalizzata al DC04 Mettere a punto un programma di analisi pre-confezionato che possa essere utilizzato tramite dei tool di produzione e che produce un tag o una root-pla... Questo output possa essere utilizzato per produrre in un tempo molto limitato in un certo numero di istogrammi gia’ definiti.. Quindi non una vera analisi interattiva!! Nessuna analisi o messa a punto di nuovi tool al fine di migliorare l’analisi Nessuno studio della sistematica... Nessuna applicazioni delle costanti di calibrazione e di allineamento.... 21/01/2004 L. Silvestris 11 Molto importante comprendere dove gli italiani (Tracker) possono e vogliono fare l’analisi!! Input fondamentale per il prossimo PRS SC Altro input: se in Italia vorrei comprendere come si pensa di organizzarci... Come in USA oppure si propone qualcosa di differente.. Al momento solo Fermilab ha gia contattato i PRS Convener... Qualche azione va presa in questa direzione... 21/01/2004 L. Silvestris 12 Software di allineamento/calibrazione Calibration software – We need, urgently, from each detector-PRS group: • Name of person coordinating/running this activity • Plan of work – My proposed optimistic schedule: calibration code complete for all detectors by June CMS week • This is not the mis-calibration code (e.g. tools to misalign) but the actual calibration code (tools to obtain alignment constants and tools to put these constants into the reconstruction) • Intermediate stops: mis-calibration code and tools to obtain calibration ready by March CMS week – This would enable us to run some calibration-like task in the context of DC04 21/01/2004 L. Silvestris 13 Fast simulation FAMOS, OO Analysis – The two are related: plan is to use FAMOS as a quick and easyto-learn training ground (when ready) – Proceeding, release was just put out. – Optimistic schedule: production-level tuned FAMOS by mid2004 • Implies: comparison/tuning exercise some time between first “real” release and then – We need one FTE per subject. One per detector and analysis-PRS group, but also need feedback/supervision by experienced detectorPRS people. 21/01/2004 L. Silvestris 14