Software per il b-tagging Gabriele Segneri Firenze, 16 Gennaio 2003 Sommario • Framework: descrizione (veloce) e stato • Algoritmi: stato attuale, richieste principali, possibili sviluppi futuri • Conclusioni Framework CMS IN 2002/067 Stato del Framework • Esiste gia` un framework (cfr. CMS IN 2002/067) con struttura modulare adatto ad una vasta gamma di algoritmi (3 gia` implementati e disponibili) • Esistono molti tools utilizzati da diversi algorimi • Possibili (piccole) modifiche possono essere applicate per inserire nuovi algoritmi – richiesto feedback dagli sviluppatori Stato degli Algoritmi - 1 Stato degli algoritmi basati sul parametro di Impatto: 1. Conteggio di Tracce: gia` disponibile in versione base con IP2D e IP3D – studiato l’effetto delle variablili rilevanti (cfr CMS NOTE 2002/046) – Gia` utilizzato per studi di Fisica! (crf e.g. CMS NOTE 2002/048) 2. Probabilistico: gia` disponibile in versione base con IP2D e IP3D – studiato l’effetto delle variablili rilevanti (cfr CMS NOTE 2002/046) – Occorre Sistema per calibrazioni! 3. Con Likelihood Ratio: vedi Alessia Stato degli Algoritmi - 2 Necessario fornire dei tagli ottimizzati in funzione di ET, h per un utente blind – a tale scopo servono: • Ntupla Standard (c’e’… va bene?) • Elevata statistica di eventi con getti di b,u (QCD, W+getti, tt, H) in modo da coprire tutti gli intervalli (da capire se bastano, quanti ce ne vogliono e di che tipo) • Tools di ottimizzazione: kumac, classi, macro, programmi che permettono l’ottimizzazione automatica (da scrivere … di che tipo?) • Tools di debug (inesistenti… da pensare) Da provare prima su algoritmi semplici e poi estendere ai piu’ complessi Stato degli Algoritmi - 3 Necessario fornire un tagger con prestazioni migliori in vista del Physics-TDR. Proposta: 1. Occorre almeno 1 FTE (e.g. Ph.D.) che per primo utilizzi tutti gli algoritmi su un canale e sviluppi dei metodi per capire quale algoritmo sia l’ottimale (ed eventualmente combinarli) 2. Che per ogni altro canale rilevante ci sia una persona che, avvalendosi dei metodi (gia` sviluppati) del punto 1, sia in grado di trovare l’algoritmo migliore Stato degli Algoritmi - 5 Sistema per eseguire le calibrazioni automaticamente per algoritmi con probabilita` – da capire: • in quanti stadi bisogna suddividere l’operazione (creazione di ntuple, lettura e fit dei dati, scrittura su DB o file ASCII,…) • che tipo di software serve (programmi in ORCA, kumac, script, sistemi per scrittura e lettura dal DB) • strumenti (PAW, ROOT?) e librerie (per manipolare gli istogrammi) da usare Stato degli Algoritmi - 6 Stato degli algoritmi basati sui Vertici Secondari: • Algoritmo basato su lifetime con vertex finder d0f: studiate le prestazioni (cfr CMS NOTE 2002/046)- gia` disponibile in versione base • Da studiare con vertex finders piu’ evoluti (in attesa di un vertex finder ottimale da Pascal & Co.) • Da utilizzare differenti variabili (e.g. masse, …) • Da studiare altri algoritmi di b-tagging basati su vertici secondari Stato degli Algoritmi - 7 Nuovi algoritmi: • Algoritmo basato su leptoni:minime implicazioni sul framework – stato:? • Algorimi basati su masse: ancora da studiare: minime implicazioni sul framework – nuove classi da sviluppare • Combinazione di Algoritmi: consentita dal framework – ancora da studiare! Conclusioni • Una gran parte del software e’ gia` stato scritto ed utilizzato, ma occorre concentrare gli sforzi nella parte di ottimizzazione • Alcuni algoritmi non sono mai stati studiati • Necessario trovare nuove persone !