Analisi (fake e non) per il DC04
L. Silvestris
INFN-Bari
21/01/2004
L. Silvestris
1
Principali goals (tasks) dei PRS nel 2004






Partecipazione al PCP e DC04 con analisi fake!! (perche’
e’ importante farla??)
Sviluppo di software di allineamento e calibrazione
Messa a punto di tools che consentono di effettuare
studi sistematici di allineamento, mappature di campo
magnetico
Fast simulation.
Preparazione di tools, ricostruzione di tracce e vertici,
energy flow, b tagging, tau tagging, top tagging
Sto preparando una lista piu’ estesa per il prossimo
btau 3 Febbraio... Input?? Inviatemi un e-mail...
21/01/2004
L. Silvestris
2
Cosa e’ il DC04?
21/01/2004
L. Silvestris
3
Pre-Data Challenge Production
1) Pre-Data Challenge:


Hit-formatting CMSIM data
Digitizzare CMSIM and OSCAR
–
–
Codice di digitizzazione quasi pronto.. Verra’ prodotta una
nuova versione per correggere i problemi che al momento sono
presenti nel codice di CSC.
Adesso stiamo facendo la validazione almeno su campioni di
singoli muoni e pioni. Non sono ancora disponibili b,c uds...
Problema del production team.
•
Mi sembra difficile che si possa partire prima della fine del mese.
Muovere i files di digis al CERN

–
Cioe’ i “raw data” ed anche su tape al CERN.
2) Vero DC04.. ….
21/01/2004
L. Silvestris
4
Cosa e’ il DC04 ? – Tasks del T0

Ricostruire tutti gli eventi, runnare il codice di HLT ...
– 50M (saranno meno probibilmente 20M) di eventi = 2M/giorno=2000 jobs
di circa 1000 events each
– Tempo necessario per la ricostruzione completa dell’evento ???
• Assume we need to run ~ 500 concurrent jobs 24 hours/day
– L’idea e’ quella di processare gli eventi per dataset e quindi anche i jobs di
analisi
– Una degli argomenti fondamentali che CCS vorrebbe testare e’ lo stream
di dati:
• Una possibile definizione di stream e’ tramite una pattern di “bits” di HLT
– Creare nuove copie (deep) di alcune parti dei dati tramite filtered
collections.
– Creare nuove collezioni senza il “ deep copying” ma per esempio scrivendo
in out-put oggetti ricostruiti cioe’ tracce, vertici, cluster calorimetrici,
jets
– Registrare i dati in un buffer manager di output.
• Distribuire tutti i dati ricostruiti a tutti i T1’s (20TB? to each?)
21/01/2004
L. Silvestris
5
Come sara’ composto il DST del DC04 ?

Sometimes called DST, or ESD, or Reconstructed Raw
– Links to “raw-data” (digits)
– Some “Rechits” reproduced to DST?
– HLT, Tracks, clusters, towers, jets, Emiss, Muons, .. ?
• To be defined, within reason…
– Budget about 500KB/event
– At this stage expect to need real work to massage transient objects into
good persistent objects…
– Clearly the goal (which we will probably fail) is that the DST contains all
the data needed for making further selections/cuts and partial
reconstructions
• Need to make sure that digis make their way at least to the centers which will
do most of the analysis for a given dataset (along with the DST of course, if we
fail to send that everywhere)
• Likewise the MC truth information (non ci sono I tools di produzione capace di
gestire l’attach dei corretti files di MC ai dati DST.)
21/01/2004
L. Silvestris
6
Cosa e’ il DC04?
Trasferimento tra Tier0 e iTiers1


Utilizzare POOL FCatalog tools per popolare il catalogo CERN RLS
catalog (Oracle) necessario per poter utilizzare successivamente
ai T1-T2-TN i SW di LCG2.
Output buffer manager
– Sends all closed files to castor
– Pushes data to T1 centers (informs, waits for pull, waits for receipt
acknowledgment)
– Purges buffer only when data is in castor and at required number of
T1 centers.
– Uses whatever transfer tools are appropriate now. (probably
SRB/MCAT)

How well will central RLS catalog scale?
– Investigating with IT/DB Oracle replication to a second “Master” DB
at a T1 (More T1 if we can, probably this is already stretching things)
Questa parte dell’attivita’ dovrebbere essere terminata
21/01/2004
7
L. Silvestris
entro
“Marzo”
Cosa e’ il DC04: task dei Tiers1

Respond to T0 data push requests.
– Disk to Disk at least. Expect data volumes to require MSS

Maintain a local catalog of its local files
– At the RLS catalog replication site(s) try to refer only to the
replicated catalog, expect elsewhere to have to use the central CERN
one

Run reco/analysis pass over DST
– Demonstrate we know when all the files required by a job are present!
– CCS would really like to write a TAG at this stage (See T2 tasks)
• TAG is a couple of kB of global event description data
– PRS could use this step to write their rootuples.
– TAG has advantage that their management, replication etc can all be
managed by the same tools as for the DST and RAW data
– ROOTuple has the advantage that they can be used directly in ROOT
of course. (If you can keep track of them - 50k 1000 event files…)
21/01/2004
L. Silvestris
8
Cosa e’ il DC04 ? – Task dei Tier-1

The Tier-1 is a CMS production center
– Most of its work is for the entire CMS community

The Tier-1 is the main access path for Tier-2-N centers to
access the data.
– (The Tier-0 does not serve the Tier-1’s, it serves the first pass
reconstruction and the online and attempts to clear its output
buffers to the Tier-1s. The Tier-0 response does not degrade, it
has clearly defined workflow strategies to ensure it never fails
its basic data management functions)


The Tier-1 staff support their dependent Tier-2s (if any)
The Tier-1 services all requests for data that it has to any
CMS Tier-2’s
– “All” within the limitations that its MSS and network degrades
gracefully.
21/01/2004
L. Silvestris
9
CMS and LCG2
– Expect last one (run reco/analysis over DST) to continue
and be repeated over next 6 months as LCG matures.
Factorized from Tier0 and distribution challenges
21/01/2004
L. Silvestris
10
Analisi per il DC04 nel Tracker


ttH H->bb
B0s->Jpsiphi
Cosa intendo per analisi (fake??) finalizzata al DC04
Mettere a punto un programma di analisi pre-confezionato che possa
essere utilizzato tramite dei tool di produzione e che produce un tag
o una root-pla... Questo output possa essere utilizzato per produrre in
un tempo molto limitato in un certo numero di istogrammi gia’ definiti..
Quindi non una vera analisi interattiva!!
Nessuna analisi o messa a punto di nuovi tool al fine di migliorare
l’analisi
Nessuno studio della sistematica...
Nessuna applicazioni delle costanti di calibrazione e di allineamento....
21/01/2004
L. Silvestris
11



Molto importante comprendere dove gli
italiani (Tracker) possono e vogliono fare
l’analisi!!
Input fondamentale per il prossimo PRS SC
Altro input: se in Italia vorrei comprendere
come si pensa di organizzarci... Come in USA
oppure si propone qualcosa di differente.. Al
momento solo Fermilab ha gia contattato i
PRS Convener... Qualche azione va presa in
questa direzione...
21/01/2004
L. Silvestris
12
Software di allineamento/calibrazione

Calibration software
– We need, urgently, from each detector-PRS group:
• Name of person coordinating/running this activity
• Plan of work
– My proposed optimistic schedule: calibration code
complete for all detectors by June CMS week
• This is not the mis-calibration code (e.g. tools to misalign)
but the actual calibration code (tools to obtain alignment
constants and tools to put these constants into the
reconstruction)
• Intermediate stops: mis-calibration code and tools to obtain
calibration ready by March CMS week
– This would enable us to run some calibration-like task in the
context of DC04
21/01/2004
L. Silvestris
13
Fast simulation

FAMOS, OO Analysis
– The two are related: plan is to use FAMOS as a quick and easyto-learn training ground (when ready)
– Proceeding, release was just put out.
– Optimistic schedule: production-level tuned FAMOS by mid2004
• Implies: comparison/tuning exercise some time between first “real”
release and then
– We need one FTE per subject. One per detector and analysis-PRS
group, but also need feedback/supervision by experienced detectorPRS people.
21/01/2004
L. Silvestris
14
Scarica

PPT - Tracker Italian Software Board