Software per il b-tagging
Gabriele Segneri
Firenze, 16 Gennaio 2003
Sommario
• Framework: descrizione (veloce) e stato
• Algoritmi: stato attuale, richieste principali,
possibili sviluppi futuri
• Conclusioni
Framework
CMS IN 2002/067
Stato del Framework
• Esiste gia` un framework (cfr. CMS IN 2002/067)
con struttura modulare adatto ad una vasta
gamma di algoritmi (3 gia` implementati e
disponibili)
• Esistono molti tools utilizzati da diversi algorimi
• Possibili (piccole) modifiche possono essere
applicate per inserire nuovi algoritmi – richiesto
feedback dagli sviluppatori
Stato degli Algoritmi - 1
 Stato degli algoritmi basati sul parametro di
Impatto:
1. Conteggio di Tracce: gia` disponibile in
versione base con IP2D e IP3D – studiato
l’effetto delle variablili rilevanti (cfr CMS NOTE
2002/046) – Gia` utilizzato per studi di Fisica!
(crf e.g. CMS NOTE 2002/048)
2. Probabilistico: gia` disponibile in versione base
con IP2D e IP3D – studiato l’effetto delle
variablili rilevanti (cfr CMS NOTE 2002/046) –
Occorre Sistema per calibrazioni!
3. Con Likelihood Ratio: vedi Alessia
Stato degli Algoritmi - 2
Necessario fornire dei tagli ottimizzati in funzione
di ET, h per un utente blind – a tale scopo servono:
• Ntupla Standard (c’e’… va bene?)
• Elevata statistica di eventi con getti di b,u (QCD,
W+getti, tt, H) in modo da coprire tutti gli
intervalli (da capire se bastano, quanti ce ne
vogliono e di che tipo)
• Tools di ottimizzazione: kumac, classi, macro,
programmi che permettono l’ottimizzazione
automatica (da scrivere … di che tipo?)
• Tools di debug (inesistenti… da pensare)
Da provare prima su algoritmi semplici e poi estendere ai
piu’ complessi
Stato degli Algoritmi - 3
Necessario fornire un tagger con prestazioni
migliori in vista del Physics-TDR. Proposta:
1. Occorre almeno 1 FTE (e.g. Ph.D.) che per
primo utilizzi tutti gli algoritmi su un canale e
sviluppi dei metodi per capire quale algoritmo
sia l’ottimale (ed eventualmente combinarli)
2. Che per ogni altro canale rilevante ci sia una
persona che, avvalendosi dei metodi (gia`
sviluppati) del punto 1, sia in grado di trovare
l’algoritmo migliore
Stato degli Algoritmi - 5
Sistema per eseguire le calibrazioni
automaticamente per algoritmi con probabilita` –
da capire:
• in quanti stadi bisogna suddividere l’operazione
(creazione di ntuple, lettura e fit dei dati, scrittura
su DB o file ASCII,…)
• che tipo di software serve (programmi in ORCA,
kumac, script, sistemi per scrittura e lettura dal
DB)
• strumenti (PAW, ROOT?) e librerie (per
manipolare gli istogrammi) da usare
Stato degli Algoritmi - 6
Stato degli algoritmi basati sui Vertici Secondari:
• Algoritmo basato su lifetime con vertex finder
d0f: studiate le prestazioni (cfr CMS NOTE
2002/046)- gia` disponibile in versione base
• Da studiare con vertex finders piu’ evoluti (in
attesa di un vertex finder ottimale da Pascal &
Co.)
• Da utilizzare differenti variabili (e.g. masse, …)
• Da studiare altri algoritmi di b-tagging basati su
vertici secondari
Stato degli Algoritmi - 7
Nuovi algoritmi:
• Algoritmo basato su leptoni:minime implicazioni
sul framework – stato:?
• Algorimi basati su masse: ancora da studiare:
minime implicazioni sul framework – nuove
classi da sviluppare
• Combinazione di Algoritmi: consentita dal
framework – ancora da studiare!
Conclusioni
• Una gran parte del software e’ gia` stato scritto
ed utilizzato, ma occorre concentrare gli sforzi
nella parte di ottimizzazione
• Alcuni algoritmi non sono mai stati studiati
• Necessario trovare nuove persone !
Scarica

ppt