Tracking in high
energy physics
Alberto Pulvirenti
http://www.ct.infn.it/~pulvir/LezioniTracking.ppt
Obiettivi della ricerca moderna
Investigare
la struttura dell’universo
microscopico
Studiare
collisioni ad energia sempre più
alta
…che producono sempre più particelle ad alta energia
Strategia
sperimentale: Tracking Detectors
Il rivelatore non “stoppa” le particelle
La particella viene “seguita” lungo il suo percorso
2
Tracking detectors
3
Struttura a strati (“layer”) sensibili
La particella attraversa gli strati…
…e ogni strato “prende nota” del punto in cui è stato attraversato
Output finale = insiemi di punti spaziali in ogni layer
Come visualizzare le traiettorie delle
particelle?
Metodi “visuali”
Camere a bolle
Camere a scintille
Emulsioni fotografiche
Metodi elettronici
Rivelatori a gas
Rivelatori a stato solido
4
Metodi “visuali” per la rivelazione di
particelle
Materiale trasparente che reagisce al passaggio di particelle
Analisi visuale di una immagine ottenuta impressionando lastre fotografiche
5
Metodi “visuali” per la rivelazione di
particelle
… analisi laboriosa e faticosa, difficile da automatizzare al computer
6
Rivelazione di particelle con segnali
elettronici
Rivelatori a gas
Contatori proporzionali
Camere a deriva
TPC
Rivelatori a stato solido
Pixel detectors
Drift detectors
Strip detectors
7
Dal rivelatore all’algoritmo: dati di base
1.
Survey Data (o “geometria”)
2.
Calibration Constants
3.
Costanti per convertire i segnali elettrici del rivelatore in
informazione utilizzabile per l’analisi fisica
Mappatura del campo magnetico
4.
Posizione spaziale di ogni volume (sensibile o non sensibile) del
rivelatore
Fondamentale per ricostruire l’impulso della particella in base alla
curvatura della sua traiettoria
RAW DATA ( “clusters”)
I veri e propri dati sperimentali, raccolti dal rivelatore in
seguito alla collisione generata con i fasci di particelle
8
Come ricostruire la traiettoria di una
particella?
Fit dei punti generati da una particella,
usando una opportuna equazione per la traiettoria
…ma se le tracce sono tante e vicine?
Prima di ricostruire i percorsi delle particelle, bisogna sapere
QUALI punti appartengono a ciascuna particella:
PATTERN RECOGNITION PROBLEM
9
Un caso realistico…
Questo è 1/100 di quello che potrebbe succedere in ALICE.
Contate le tracce (se ci riuscite)!
10
11
What’s “tracking”?
INPUT:
Punti spaziali
TRACKING
OUTPUT:
Particelle
(impulso, PID)
Fase 1 (track recognition):
selezione dei punti (probabilmente) prodotti da una stessa particella
Fase 2 (track reconstruction):
ricostruzione delle caratteristiche
fisiche della particella
(identificazione, impulso)
Cosa significa “pattern recognition”?
Letteralmente: “riconoscimento di modelli”
Punto di partenza: “immagine”:
Insieme di segnali o informazioni che caratterizzano
completamente un oggetto, nel contesto in cui esso viene
analizzato.
◊ NON è ristretto alle immagini visive
Due step essenziali:
1. Definizione di un set di Immagini-Modello
2. Classificazione di ogni altra Immagine dello stesso insieme
statistico secondo il Modello cui somiglia di più (se esiste).
> Definizione di “somiglianza” o “distanza” fra immagini
12
Qualche definizione più rigorosa…
Problema di “classificazione”:
Input: un vettore di misura (“pattern”) contenente tutte le
informazioni necessarie per definire un oggetto
◊ {Xk}, k = 1, …, N
Output: classificazione del vettore (e quindi dell’oggetto
associato) mediante una funzione di decisione:
◊ C = d({Xk})
Pattern space ( P ):
Spazio di tutti i possibili pattern {Xk}
Obiettivo:
Suddividere P in regioni separate, corrispondenti alle varie
classificazioni possibili…
◊ …+ una classe per “unidentified patterns”
13
Esempio 1: lettura
Per farlo, dobbiamo prima conoscere le lettere
Pattern: segni sulla carta
“a”, “b”, “c”, etc…
Classificazione: suono associato al segno
Dalle forme delle lettere in stampatello, possiamo “intuire”
come leggere uno scritto a mano, per analogia o
somiglianza
“Nel mezzo del cammin di nostra vita
Mi ritrovai per una selva oscura…”
…ma non sempre tutto è così scontato:
االتحاد األوروبي يدعو شارون لوقف العمليات العسكرية في المناطق الفلسطينية ومنح محمود عباس مزيدا من
الوقت للسيطرة على المسلحين
14
Esempio 2: riconoscimento visivo
Cosa è questo?
…un gatto?
COMPLIMENTI!
Avete appena eseguito
un Pattern Recognition!
15
Pattern space e Feature space
16
Definizione concettuale:
Funzione degli elementi del pattern che consente di ridurre il numero
di parametri di cui tenere conto
◊ Riduzione dell’informazione agli elementi “essenziali”
Definizione “rigorosa”:
Base {ek} ortogonale nello spazio dei pattern che si possa scomporre
in due blocchi {e1,…, m < N }, {em+1, …, N } tali che due pattern con le
stesse componenti nei primi m (< N ) elementi sono abbastanza
simili da poter essere considerati “identici” ai fini della classificazione
da fare
Esempio:
N punti allineati retta di best-fit + 2 (3 o 5 parametri)
◊ Meno informazione
◊ Si mantengono solo le informazioni “importanti”.
Vantaggi delle features
Meno elementi nel vettore da classificare
Gerarchia di importanza dei parametri.
“Residui” (gli N – m elementi “secondari”)
Criterio di valutazione di classificabilità
Esempio dei punti allineati:
◊ stabilire se possono essere accettati come “retta” o meno
17
Tracking e pattern recognition
Pattern: sequenze di punti restituiti dal rivelatore
Uno per ogni strato sensibile
Problema n! – combinatorio (n = numero di strati del rivelatore)
Feature: parametri della traiettoria della particella
Classificazione: traccia finale
Punto di produzione della particella (vertice)
Modulo e orientamento spaziale dell’impulso iniziale
18
Complicazioni
L’impulso
è un numero reale
Il numero di classi è infinito
I
punti sperimentali sono tanti
Impossibile lavorare su tutte le combinazioni possibili
Selezione di “track candidates” check di validità
19
Parametrizzazione della traccia
Fondamentale per la ricostruzione
5 parametri essenziali
Posizione (3 coordinate) + Impulso (3 componenti) - 1 (perché
può essere scelto qualsiasi punto)
Qualsiasi set di 5 parametri è matematicamente equivalente
◊ Sconsigliabili i parametri che diventano troppo grandi
• Meglio usare 1/p piuttosto che p
◊ Attenzione ai parametri che, durante il fit, presentano discontinuità
o correlazione con altri.
La scelta corretta è sempre dipendente dalla situazione
(apparato sperimentale, range di impulso da ricostruire, …)
20
“Disturbi” nella ricostruzione
Scattering multiplo nel mezzo: formula di Moliére
la traccia si scosta dalla forma “regolare” (potrebbe anche non essere trovabile)
2
x
0.015 z 2 x
1 0.12 log 10
p X 0
X 0
Energy loss: formula di Bethe-Bloch
(in presenza di campo magnetico) la traccia spiraleggia nel piano trasverso
dE
Zz 2 2me c 2 2 2
2
0.31
log
2
dx
A I 1 me / M
21
Metodi di track finding
Metodi
22
locali
Viene aggiunto alla traccia un punto alla volta, in base a
criteri di scelta che dipendono dalla forma prevista per la
traccia e dai punti precedentemente acquisiti
Metodi
globali
Viene selezionato direttamente un insieme di punti sui quali
viene operato un check unico, cosicché la traccia viene
restituita direttamente
NB:
è necessario in ogni caso un adattamento specifico
all’apparato sperimentale da usare.
Local vs. Global
Metodi locali:
Scelta dei punti “step-by-step” con una informazione che rimane
parziale fino al termine della procedura
Il risultato può dipendere dall’ordine con cui i dati vengono
analizzati
Necessita di un innesco ben congegnato
Non necessita di un modello globale di traccia (traiettoria)
Consente una trattazione ottimale dei “disturbi”
Metodi globali
La decisione viene presa sfruttando l’intera informazione
Può operare direttamente sui dati grezzi
Ha bisogno di una precisa espressione della traiettoria
Può tenere conto dei “disturbi” solo in media
23
Metodi locali
Tre possibili criteri logici:
“segui il tuo naso” track following method
◊ Si innesca la traccia partendo da un estremo, e si esegue una
“proiezione” nel layer successivo, selezionando il punto meglio
compatibile con essa
24
Metodi locali
Tre possibili criteri logici:
“segui il tuo naso” track following method
◊ Si innesca la traccia partendo da un estremo, e si esegue una
“proiezione” nel layer successivo, selezionando il punto meglio
compatibile con essa
“congiungi gli estremi” track road method
◊ Si determinano due punti sui layer estremi e si congiungono cercando
un percorso adeguato fra i punti del rivelatore
25
Metodi locali
Tre possibili criteri logici:
“segui il tuo naso” track following method
◊ Si innesca la traccia partendo da un estremo, e si esegue una
“proiezione” nel layer successivo, selezionando il punto meglio
compatibile con essa
“congiungi gli estremi” track road method
◊ Si determinano due punti sui layer estremi e si congiungono cercando
un percorso adeguato fra i punti del rivelatore
“definisci una immagine” track element method
◊ Si individuano segmenti lungo il percorso della traccia, e poi vengono
collegati fra loro in base alla compatibilità
26
Il “principe” dei metodi locali: Kalman
Filter
Base: track following
Introdotto da P. Billoir (1983)
In seguito si è compreso che tale metodo si riconduce ad un metodo
generale sviluppato da Kalman per il fit di sistemi complessi
Ingredienti:
An (5)
◊ vettore di stato contenente i 5 parametri essenziali di traccia
Vn (5x5)
◊ matrice di covarianza dei 5 parametri (5x5)
Mn = H An(2)
◊ vettore di “misura” (che passa dai parametri alla misura osservabile punto)
Cn = H Vn HT (2x2)
◊ matrice di covarianza delle misure
27
Algoritmo del Kalman Filter
Start:
“seeding”
Stime ragionevoli per An e Vn a partire da alcuni punti.
Propagazione
stima del vettore di stato nel punto n – 1:
A*n-1 = Pn An
viene propagata anche la matrice di covarianza, che
viene artificiosamente aumentata di un termine di
disturbo che tiene conto dello scattering multiplo:
V*n-1 = Pn ( Vn + Nn ) PnT
28
Algoritmo del Kalman Filter
Selezione di un punto candidato all’inclusione, in
un layer di rivelazione:
Mn-1 coordinate; Cn-1 covarianza
Calcolo dei residui
RAn-1 = Mn-1 – M(A*n-1)
RCn-1 = Cn-1 – C(A*n-1)
Filtro: modifica del vettore di stato includendo
nuova informazione
Definizione: “gain matrix” K = V*n-1 HT (Cn-1 + H V*n-1 HT)-1
An-1 = A*n-1 + K RAn-1
Vn-1 = (1 – K H) V*n-1
D2 (RAn-1)T(RCn-1)-1 RAn-1
29
Kalman Filter
Track
finding:
Single step:
◊ Propagazione su più punti sul layer in studio
◊ Inclusione del punto che determina il minimo D2
Hypothesis tree:
◊ Generazione di “alberi” di punti, tenendo conto di tutte le
possibilità
◊ Selezione del percorso cui corrisponde il minimo D2 totale
(dalla somma di tutti I contributi)
Track
fitting:
Avviene “in itinere” durante il finding
3D fit contemporaneo “locale”
30
Vantaggi e svantaggi del Kalman Filter
OK
Esegue contemporaneamente track finding e fitting
Opera sui parametri di traccia (retta: 4, elica: 5)
◊ Niente matrici della dimensione del numero di punti del
campione
Molto utile per collegare punti su rivelatori diversi
E’ molto semplice introdurre gli effetti dei “disturbi”:
◊ Multiple scattering: incremento sulla matrice di covarianza
◊ Energy loss: variazione “locale” della curvatura, step per step
KO
Richiede una procedura ottimale di ricerca dei punti
E’ fortemente dipendente dalle condizioni iniziali
31
Metodi globali
Combinatorio totale
Analisi di tutte le possibilità
Template matching
Confronto con modelli
Histogramming
Ricerca di configurazioni ripetitive
Metodi neurali o neural-like
Associazioni locali
32
Template matching
Applicazione
“nativa” del pattern recognition
Definizione di “template”:
◊ Definire parametri iniziali di traccia
◊ Stabilire che punti produrranno
Confronto con lo schema di punti ottenuto
sperimentalmente:
◊ Individuazione dei template presenti nel campione
◊ Nessun processing aggiuntivo: i parametri finali della traccia
sono quelli del matched template
Applicabilità molto limitata
◊ Solo in caso di poche combinazioni possibili
33
Template matching recursive tree
search
Procedura iterativa con diverse gerarchie di template, via
via più precise, in modo da operare l’incremento del
dettaglio solo nei sottoinsiemi di pattern che si adattano, via
via, al template precedente che è stato riscontrato nei dati.
1
2
3
4
34
Complete combinatorial method
L’algoritmo concettualmente più semplice:
Costruire tutte le possibili sequenze di punti (1 per layer)
Valutare la compatibilità con il modello di traccia previsto
◊ Fit e calcolo del 2 parametro di qualità
Ordinare le combinazioni secondo il parametro di qualità
Stabilire un criterio di accettazione:
◊ Quantitativo: i primi N elementi
• (se si ha una idea della molteplicità da attendere in un evento)
◊ Qualitativo: tutti gli elementi per cui 2 < 2max
Applicabilità fortemente dipendente dal numero di
punti per layer e dal numero di layer stessi
Crescita fattoriale della complessità
Inapplicabile nella quasi totalità dei casi
35
Histogramming: Radon Transform
Distribuzione dei punti nel rivelatore:
x p x Dpd p
p
Risposta media del rivelatore per una particella
con una data configurazione di parametri {p}
Popolazione tipica dello spazio delle features (param. di traccia),
per la feature corrispondente a una particella [delta function]
Problema di inversione:
36
~
Dp x p x dx
X
Conoscenza dettagliata della risposta dei rivelatori
Presenza di una precisa forma teorica della traccia
Hough Transform histogramming
Estensione del caso della trasformata di Radon.
Dipendenza dalla sola forma teorica della traccia
Base: espressione teorica della traiettoria
Caso 1: (B = 0) retta 4 parametri
Caso 2: (B = costante) elica 5 parametri
Ipotesi dell’algoritmo:
Se N punti appartengono alla stessa traccia, estraendo i parametri
di traccia da qualsiasi loro sottoinsieme otterrò valori simili a quelli
che otterrei dall’intero insieme.
Se i punti non appartengono ad una specifica traccia, estrarrò
parametri casuali, che si distribuiranno a caso nello spazio delle
features
37
Hough Transform: procedimento
Esempio: rette nel piano da un punto fisso
Equazione: y = mx [m = tan()]
1. Estrazione di da tutte le coppie di punti istogramma
2. Ricerca di picchi nell’istogramma
> corrispondenti a tante coppie “concordi” stessa traccia
38
Pro e contro della Hough Transform
PRO
Semplice e veloce
Non richiede un cluster finding
Può lavorare direttamente con i dati grezzi
CONTRO
Dimensionalità dello spazio delle features
Nel caso più semplice (retta) serve un istogramma a 4D
Necessità di una equazione “teorica” della traccia
Necessità di una quantità di layer del rivelatore
abbastanza grande da evidenziare gli
addensamenti
39
40
Digressione: cos’è una rete neurale
SINAPSI
Sistema distribuito di “processing units”
collegate fra loro in modo da scambiarsi
informazioni.
Due costituenti di base:
Il nodo di calcolo: neurone
◊ raccoglie segnali in input da altri elementi della rete
◊ restituisce un output (“attivazione”) in risposta al segnale
ricevuto
Veicolo di scambio di informazioni: sinapsi pesata
◊ implementa le correlazioni (o competizioni) fra neuroni
◊ agisce come un fattore moltiplicativo sul segnale ricevuto da
ogni unità (“peso sinaptico”)
NEURONI
Come opera la rete neurale
RN a connessione completa
a i 0,1
wij 0 correlazione incremento attivazione
wij 0 competizione decremento attivazione
a i 1 exp
j
wij a j
T
1
La variazione nell’attivazione diminuisce di ciclo in ciclo
1
Stabilizzazione finale
N
Dai
i a
i
41
Come opera la rete neurale
42
Mappa di attivazioni reali comprese fra 0 e 1
Confronto con una soglia fissa di attivazione S
Mappa binaria di attivazioni (“on” / “off”)
abin
1 se areal S
0 altrimenti
43
Implementazione del Tracking Neurale
Punti nel rivelatore Neuroni = segmenti fra coppie di punti
Competizione peso inibitorio costante
Nessuna relazione fra
segmenti non contigui
wI B
Concatenamento peso
eccitatorio dipendente
dall’allineamento
wE A 1 sin
n
CATTIVO
allineamento:
wE 0
BUON
allineamento:
wE A
Tracking neurale: work flow
Lettura
punti sui layer
Creazione segmenti
“accettabili” (cut)
La rete neurale “spegne” i
segmenti sbagliati,
lasciando “accesi” quelli
giusti, che producono le
catene di segmenti che poi
verranno passate al fit della
traccia.
44
Elastic Arms
Combinazione di metodo neurale e “template matching”
Definizione di N templates (Hough Transform)
Calcolo di una funzione “energia”:
◊ E = S SiaMia
•
•
S = condizione di appartenenza del punto “i” alla traccia “a”
M = distanza del punto “i” dalla traccia “a”
Tale funzione deve essere minimizzata in due step:
1. Correzione dei parametri dei template a partire dai punti
◊ Refit
2. “Riassegnazione” dei punti secondo il template più vicino
◊ (rete neurale dei fattori Sia pesati in base ai valori M ia)
◊
Convergenza ciascun punto viene assegnato al template migliore.
45
Come si valuta la bontà di un
algoritmo?
Simulazione
Insieme di punti “assegnati” a ogni traccia
Confronto fra le associazioni vere e quelle dedotte dal tracking
Classificazione
delle tracce trovate:
Perfect Track
◊ Solo cluster con lo stesso ID traccia
• Tutti quelli presenti nell’evento Complete Perfect Track
• Alcuni punti mancanti Incomplete Perfect Track
Imperfect Track
◊ Cluster con ID di tracce diversi (si assegna quello di
maggioranza)
• “Sufficiente” maggioranza di un ID Majority Good Track
(accettabile)
• “Insufficiente” maggioranza di un ID Majority Fake Track
(non accettabile)
46
Come si valuta la bontà di un
algoritmo?
47
Classificazione degli indici di traccia simulata
Track ID
Perfect Track
Class 1:
Perfect
Complete
Imperfect Track
Class 2:
Perfect
Incomplete
Class 3:
Majority Good
Class 5:
Not Found
Class 4:
Majority Fake
Efficienza
Tracce Trovate vs. Tracce Simulate
“Event
by event”
# tracce trovate correttamente / # tracce generate
Criterio
di massima resa su un campione
# eventi ricostruiti al 100% / # eventi generati
Criterio
di resa sufficiente su un campione
# eventi ricostruiti al 90% (o meno) / # eventi generati
48
49
Efficienza
Non
tutte le tracce generate sono “trovabili”:
Limiti dell’algoritmo
Eccessivo effetto distorcente di EL e MS
Quantità insufficiente di segnale nei rivelatori
Efficienza
“del metodo”
Calcolata sul campione delle sole tracce “trovabili”
Efficienza
“globale”
Calcolata sul campione delle tracce generate
E’ importante che l’algoritmo non
sia “troppo” limitato!
Esempio: efficienza di un algoritmo di
tracking
good
fake
50
Track fitting
Una
volta assegnati i punti ad una
particella…
…bisogna ricostruire I parametri fisici
dei punti con l’equazione della
traiettoria
Best-Fit
M. Locali (Kalman) fit progressivo
M. Globali fit “globale”
Caso
facile: retta
Caso difficile: elica
Necessario un fit del cerchio nel piano trasverso
51
Track fitting: Kalman Filter
Utilizzabile anche come semplice fitter
I punti non devono essere “cercati”
Il filtro è “forzato” a eseguire correzioni adeguate a
includere, uno alla volta, i punti della traccia
Vantaggio: il fit viene eseguito “all in one” in 3D
Svantaggio: è necessario un innesco (“seed”)
Fit preliminare con altri metodi
Ipotesi preliminare su 2 punti (retta) o 3 punti (elica)
52
Metodi per il fit del cerchio nel piano
Metodo
dei minimi quadrati non risolubile
esattamente (equazioni di minizzazione
complesse)
Operazioni
di linearizzazione
Mapping conforme
Sfera di Riemann
53
Mapping conforme
Ipotesi: il punto (xV, yV) appartiene alla circonferenza
Utile per il fit di tracce primarie
54
x xV
yV y
u
, v
2
2
x xV y yV
x xV 2 y yV 2
Inversione dell’ordine dei layer!
55
Mapping conforme
L’equazione cartesiana del cerchio…
x x0 y y0
2
2
R2
…si trasforma in una retta (non passante per l’origine)
2xV x0 u 2 yV y0 v 1
fit banale
Occhio alla propagazione degli errori!!!
u v
2
u
2
2 2
2
x
4u v
2
v
2 2
2
x
4u v
u v
2
xV
2
xV
2
2 2
2
y
2
yV
2 2
2
y
2
yV
56
Sfera di Riemann
Una sfera di raggio unitario “poggiata” sul piano XY
Intersezione sulla sfera di Riemann
Dato un punto sul piano XY, si congiunge con il polo della sfera opposto al
“punto di appoggio”, e si individua il punto in cui la congiungente interseca
la sfera.
Coord. nel piano
Proprietà di base: le proiezioni dei punti di un cerchio nel piano XY stanno su un piano
57
Sfera di Riemann
Fit di un piano nello spazio
Raggio
Centro
Da minimizzare
= autovettore di A con l’autovalore più piccolo
Fit della traccia nello spazio
Quando
si esegue un fit nel piano, bisogna
linearizzare l’equazione dell’elica nello
spazio, per completare la procedura di fit.
C r 2 D2
2
t
z Dz tan t , t arcsin
C
2 1 CDt
Curvatura
Parametro di
impatto trasverso
58
Risoluzione
Importante: conoscere l’indeterminazione sulle
proprietà della particella ricostruita (p, PID, vertice)
Ancora una volta, confronto con la simulazione
Confronto fra i parametri “veri” della traccia trovata
e quelli ricostruiti con il fit
Differenza assoluta ( Pvero – Pricostruito )
Differenza percentuale ( Pvero – Pricostruito ) / Pvero
Criterio di “accettabilità” di punti sbagliati:
Entro che limiti un punto sbagliato “rovina” la risoluzione dei
parametri?
E’ accettabile una quantità di punti sbagliati che non modifica
sensibilmente la risoluzione
◊ …quando ciò non significa che la procedura di ricostruzione vada
rivista perchè troppo indeterminata
59
Esempio: risoluzione parametri
Dip angle ()
resolution (in mrad)
sigma = 3.69 0.01
Azimuthal angle ()
resolution (in mrad)
pt resolution (in % of true value)
sigma = 13.4 0.3 %
sigma = 4.71 0.01
60
Stand-alone tracking: results (III)
Longitudinal impact parameter
resolution (in microns)
sigma = 265.6 0.4
Transverse impact parameter
resolution (in microns)
sigma = 79.7 0.1
61
Summary
Strategia di analisi di eventi di collisione ad alta
energia:
Tracking detectors
Algoritmi di Tracking
Track finding:
Problema di Pattern Recognition
◊ Metodologie locali e globali di riconoscimento di tracce
Valutazione: efficienza di tracking
Track reconstruction:
Fit non lineare in presenza di campi magnetici
◊ Splitting della procedura in più step
Valutazione: risoluzione dei parametri di traccia
62