Metodi di Ricostruzione
in Fisica Subnucleare
Corso di Metodologie Informatiche Avanzate
Per la Fisica Nucleare e Subnucleare
A.A. 2009/2010
III Lezione, 11/11/09
Silvia Arcelli
1
Sommario della scorsa lezione:
• Metodi di riconoscimento di traccia (pattern recognition):
• Metodi Globali → Template Matching, MST, Fuzzy
Radon (Hough) Transform, Neural Networks
• Metodi Locali: il track following
Silvia Arcelli
2
In questa lezione:
• Track Fitting:
• Track Fit - generalità
• Track Model:
• Parametrizzazione della traccia
• Effetti del materiale
• Kalman Filter: un metodo recursivo di track finding e
fitting simultaneo
Silvia Arcelli
3
Track Fitting
Dopo il track finding, si vuole estrarre dal set di misure associate
alla traccia suoi parametri (origine, direzioni e impulso/carica
al piano di riferimento). Il LSM (Minimizzazione del 2 ) è il
metodo generalmente adottato :

λ
 2
(m i  f i (λ))
2
χ 
2
σi
N
mi 
Vettore dei parametri di traccia
Misura i-esima di posizione
σ i  Incertezza sulla misura i-esima

Valore previsto della misura
f i (λ)  i-esima sulla base del track
Silvia Arcelli
Model, in funzione dei
parametri della traccia
4
Track Fitting
1
 2
σi
Notazione Matriciale:
con






2
T
1
χ  (m  f(λ)) V (m  f(λ))
diagonale:
•incertezze non correlate
•misure gaussiane
dχ 2
Condizione di minimo   0 :
dλ

T 1
T 1 
F V f F V m
Vii
1
F è la matrice delle derivate:

f i (λ)
Fij 
λ j
Si assume inoltre
Silvia Arcelli
dV
 0
dλ
5
Track Fitting


Se il track model è lineare (N.B: nei parametri!) allora f  Fλ e:

T
1
1 T
1 
dim. vedere ad esempio:
λ  (F V F) F V m Per
“Data Analysis Techniques for
High Energy Physiscs”, R.

Fruhwirth et al, p.232,
T
1
1
(Cambridge Univ. Press)
cov( λ)  (F V F)
Silvia Arcelli
6
Track Fitting
Vantaggi di avere un Track Model Lineare:

Soluzione esplicita

Se gli errori di misura sono gaussiani, gli errori sui parametri
sono gaussiani (i parametri di traccia sono una funzione
lineare delle misure)


Il LSM fornisce un estimatore non biassato ed efficiente,
cioè di minima varianza
Test Statistics: 2, pulls (validazione dei candidati di traccia)
Silvia Arcelli
7
Track Fitting
Un esempio banale di fit globale con track model lineare: traccia
in un piano in assenza di campo magnetico:

Track model: f i (λ)  a  bz i
(zr=0)
 2
(y i  f i (λ))
(y i  a  bz i ) 2
2
χ 

2
σi
σ 2i
N
N
 y0 
1 z0 

 


 y2 
1 z1  
a 
  


m 
λ   
  F    
b

  
  
y 
1 z 
Silvia Arcelli
 n
N

Applicando:

T
1
1 T
1 
λ  (F
F V m
 V F)
T
1
cov( λ)  (F V F) 1
Si arriva alle note formule
di regressione lineare
8
Track Model-Equazioni del Moto
Moto di una particella carica in un campo magnetico statico B(x):
 

Poichè F  v  0
  
dp
 q  v  B(x)

 v  c  costante
dt
Si può eliminare la dipendenza esplicita dal tempo esprimendo
l’equazione in funzione della distanza lungo la traiettoria, s=ct.

 

d x q dx
   B(x)
2
ds
P ds
2
Se B é uniforme, la soluzione (analitica) é un’elica cilindrica. Se
il campo è significativamente non uniforme, occorre risolvere
l’equazione utilizzando metodi numerici.
Silvia Arcelli
9
Track Model-Equazioni del Moto
Principali configurazioni di campo magnetico negli esperimenti:
Deflessione in xy (ρ)
Deflessione in yz
Campo uniforme lungo z (asse dei fasci),
simmetria cilindrica, piani di misura a R=cost
(Geometria a Collider)
Silvia Arcelli
Campo uniforme lungo x,
rivelatore planare con layer (xy) lungo z
(Geometria a Bersaglio Fisso)
10
Track Model-Elica Cilindrica
Equazione parametrica dell’elica cilindrica (B lungo z):
cos 
x( s )  x0  RH  [cos( 0  hs
)  cos  0 ],
RH
cos 
y ( s )  y0  RH  [sin(  0  hs
)  sin  0 ],
RH
B
z ( s )  z0  s  sin  ,
(con P 
qR H B
, h  sign(qB) )
cos 
Sei parametri (tre equazioni differenziali del secondo ordine...).
Silvia Arcelli
11
Track Model-Elica Cilindrica
PL
tan  
PT
•λ é il “dip angle”:
•x0,y0,z0 sono le coordinate a s=0
La proiezione in xy è un cerchio:
2
( x  x0  RH cos 0 ) 2  ( y  y0  RH sin 0 ) 2  RH
•RH é il raggio dell’elica
• 0 è legato alla pendenza della
tangente alla circonferenza a s=0,
0   0 

2
Silvia Arcelli
H
H
12
Track Model-Parametri della traccia
Tuttavia, una volta fissata una superficie di riferimento
(ad esempio, in R o in z), la traiettoria è descritta da solo
cinque parametri indipendenti (scelta del pivot).
Simmetria cilindrica (collider),
riferimento: cilindro raggio R
quanto più prossimo al
vertice di interazione :
Silvia Arcelli
p1  R r
p2  z r
Punto
impatto
p3   r
p4  tan r
direzioni
p5  1 / RH
impulso
13
Track Model-Parametri della traccia
•Simmetria planare (Bersaglio
Punto
x

p
r
1
fisso): il riferimento è in genere
impatto
p2  y r
un piano a z=cost (vicino al vertice)
dx
( z  zr )
p3 
dz
direzioni
dy
( z  zr )
p4 
dz
p5  1 / RH
momento
•In assenza di campo magnetico, la traiettoria è una retta e
sono ovviamente necessari solo quattro parametri (l’impulso
è indefinito)
Silvia Arcelli
14
Track Fitting


L’elica cilindrica non è lineare nei parametri di traccia, ma se
si sceglie la parametrizzazione in modo opportuno, di fatto
“localmente” è lineare con una buona approssimazione.
Per localmente si intende che le distanze entro cui assumo
che il track model sia lineare sono piccole rispetto al raggio
dell’elica. In questo caso le proprietà del track model lineare
sono in gran parte preservate.
Silvia Arcelli
15
Track Fitting
Quindi, in presenza di track model ~lineare, ci si riconduce ad
un problema piuttosto semplice, con una soluzione esplicita:

T
1
1 T
1 
λ  (F V F) F V m
(5 x 1)
(5 x N)
(N x 1)
( N x N), diagonale
(N x 5)
Inversione di matrici di dimensione uguale al numero massimo
di parametri di traccia (n=5). Come cambia quando includo
l’effetto dei materiali (Scattering Multiplo, perdita di Energia,...)?
Silvia Arcelli
16
Track Model-Effetti del Materiale
Multiple Scattering: non cambia il valore assoluto dell’impulso,
ma influenza la direzione della particella.

In media, su molti scattering elementari ci si aspetta una deviazione
nulla. Non si applica una correzione esplicita alla descrizione
parametrica della traiettoria (f)

Nel fit di traccia , si introducono ulteriori incertezze
sulla posizione della traccia sull’i-esimo layer di misura,
correlate tra le misure nei differenti layer. Questo implica
la comparsa di termini non diagonali nella matrice di covarianza V
delle misure (altrimenti assunte indipendenti)
Silvia Arcelli
17
Multiple Scattering
Direzione di volo
della particella
Elementi diagonali della Matrice di Covarianza:
Vii  σ i
2
MS 2
2
Vjj  σ j  (z j  z i ) (i )
2
MS 2
MS 2
2
2
Vkk  σ k  (z k  z j ) ( j )  (z k  z i ) (i )
2
Silvia Arcelli
18
Multiple Scattering
Direzione di volo
della particella
Elementi off-diagonal della Matrice di Covarianza:
Vij  0
Vik  0
MS 2
Vjk  0  (z k  z i )(z j  z i )(i )
Silvia Arcelli
19
Multiple Scattering
Questi termini sono significativi?
Pioni con impulso 1 GeV/c:
 θ MS
2
13.6 MeV/c
 
βp
d
X0
Si (300 μm)
Argon (1m)
X0
9.4 cm
110 m
MS
0.8 10-3
1 10-3
Se consideriamo un rivelatore a silicio con layer di spessore 300
μm, e una distanza da layer a layer di 10 cm, l’incertezza indotta
dal MS per pioni da 1 GeV/c a incidenza normale è ~80  m,
confrontabile con la precisione del rivelatore.
Silvia Arcelli
20
Multiple Scattering
•Scala come 1/p, contributo dominante per particelle di
basso impulso!
•Lo spessore effettivo d aumenta con l’angolazione della
traccia rispetto al piano del materiale
Atlas Pixel Detector
“Material Budget”
Silvia Arcelli
21
Multiple Scattering
Un altro metodo a volte usato per tener conto nel fit del MS è
quello dei “Break-Points”: in pratica, si introducono nel fit di
traccia altri parametri liberi (angoli) in corrispondenza delle
superfici di scattering:








2
T
1
χ (λ, θ bp )  (m  f( λ, θ bp )) V (m  f( λ, θ bp ))
Numero di parametri extra = numero di superfici di scattering,
per N elevato è impraticabile. La sua applicazione sono i casi
in cui si ha un numero limitato di superfici (attive o passive) in
cui ci aspetta un forte effetto di MS.
Silvia Arcelli
22
Perdita di Energia
Perdita di energia per ionizzazione : non cambia la direzione,
ma l’impulso. In seguito ad una perdita di energia in uno strato
d di materiale, la curvatura aumenta:
1
dE
C  C(1   ( )  d),
βp
dx
1
C
, d  spessore " effettivo"
IP
RH
Nel fit di traccia:
•Correzione a C su ogni layer di materiale
•In genere si trascurano le fluttuazioni sulla dE/dx
(non si modifica la matrice di covarianza).
Silvia Arcelli
23
Perdita di Energia
Quanto è grande questo effetto, per MIP?
Per Pioni con impulso 1 GeV/c:
densità
(g cm-3)
dE

(MIP)  2 MeV  g 1  cm 2 Si (300 μm)
dx
Argon (1m)
2.33
1.8 10-3
dE
(MeV)
0.14
0.36
E’ molto piccolo, relativamente all’impulso iniziale. Per MIP la
correzione può essere rilevante se nel volume di tracking la
traccia attraversa uno strato significativo di materiale passivo
denso. In particolare, nel tracking di muoni.
Silvia Arcelli
24
Perdita di Energia
La perdita di energia è significativamente maggiore per
particelle di impulso più basso, e pesanti. Ad esempio:
Protoni con impulso
0.2 GeV/c (=0.2)
In Si (300 μm): 1 MeV. Correzione dello ~0.5% su ogni layer.
N.B. Per applicarla correttamente dovrei conoscere la massa!
Silvia Arcelli
25
Track Model-Effetti del Materiale
In entrambi i casi, MS e dE/dx, la trattazione degli effetti del
materiale nel fit dipende 1) dai parametri della traccia (angoli
di incidenza, impulso) e 2) dalla massa (che è in genere
ignota,
a questo livello).

Si può adottare una procedura iterativa (prima stima dei
parametri senza correzione, si calcola la correzione, si
ripete il fit, e così via fino alla convergenza).

Si esegue il fit con diverse ipotesi di massa (π,k,p,...) che
possono essere ulteriormente discriminate utilizzando l’
informazione di PID del tracking (se presente)
Silvia Arcelli
26
Track Model-Effetti del Materiale

In generale, la trattazione degli effetti di materiale in un fit
di traccia globale è complessa e pesante dal punto di vista
computazionale.

In particolare, la matrice V non è più diagonale, e questo
comporta l’inversione di matrici N x N, (N il numero di
misure), operazione che scala come N3

Inoltre, il risultato del fit corrisponde alla miglior stima
dei parametri della traccia alla superficie di riferimento, e
la traiettoria estrapolata non segue in dettaglio la traiettoria
reale della traccia (MS).
Silvia Arcelli
27
Kalman Filter

R.E.Kalman (“A new approach to linear filtering and prediction
problems” Trans. ASME J. Basic Eng. 82 (1960), 35):
metodo recursivo per stimare gli stati di un sistema
dinamico sulla base ad una serie di misure.

Introdotto in fisica subnucleare (1984) da P. Billoir sotto il
nome di “Progressive Fit”, sviluppato ulteriormente da
R.Frühwirth e M. Regler.

Nel contesto del track finding, il Kalman Filter è la stima
dello stato della traccia in corrispondenza di un numero
finito di superfici, su cui sono eventualmente disponibili
delle misure.
Silvia Arcelli
28
Kalman Filter

Metodo recursivo di track finding e fitting simultaneo

Si dimostra che è equivalente ad una procedura globale di
minimizzazione di 2, con le stesse proprietè del LSM

Costo computazionale limitato, massima dimensione delle
matrici pari a quelle del vettore dei parametri della traccia

E’ in grado di fornisce la stima ottimale dei parametri della
traccia in ogni punto della traiettoria
Silvia Arcelli
29
Kalman Filter
Una traccia è rappresentata da un set di parametri, che nel
formalismo del Kalman Filter vengono raggruppati in quello
che si definisce lo “StateVector”:

x
Lo stato evolve su un insieme di valori, secondo una
componente deterministica ed una componente stocastica.
Il Kalman Filter è la procedura utilizzata per determinare lo
stato della traccia in corrispondenza di un numero finito N
di posizioni (i layer di misura del rivelatore), sulla base di N
misure, tenendo anche conto di processi stocastici.
Silvia Arcelli
30
Kalman Filter

Il Kalman Filter è un estimatore recursivo, cioè per
fornire la stima dello State Vector allo step k+1 sono
necessari unicamente la stima dello State Vector allo
step k, e il vettore di misura allo step k+1.

Questo nell’ambito di una serie di assunzioni generali
(che corrispondono sostanzialmente ad avere un
modello di traccia lineare, e processi stocastici che non
diano un bias sulla stima dei parametri dello State
Vector)
Silvia Arcelli
31
Kalman Filter-Assunzioni Generali
Si assume che l’evoluzione del vettore di stato dal layer k al
layer successivo k+1 sia descritto da una “System Equation”
con definite proprietà :



x k 1  Fk (x k )  wk





Dove F è una funzione lineare: Fk ( xk )  Fk xk

Il termine wk descrive il “process noise”. Si assume
che non sia biassato  wk  0 , sia gaussiano e sia
caratterizzato da una definita matrice di covarianza Qk

La matrice di covarianza di xkè indicata con Ck
Silvia Arcelli
32
Kalman Filter-Assunzioni Generali


F descrive la parte deterministica dell’evoluzione dello stato
dal layer k al layer k+1 (è legata alle soluzione delle equazioni
del moto). Se la funzione non è strettamente lineare ma è
“localmente lineare”, il principio resta inalterato e il Filtro di
Kalman si dice “esteso”.

Il termine wk tiene conto della variazione stocastica dello
State Vector durante la propagazione dal layer k al layer k+1
(dovuta, ad esempio, al MS).
Silvia Arcelli
33
Kalman Filter-Assunzioni Generali
Inoltre, si assume che sia possibile, dato il vettore di stato
ad

un certo layer k, connetterlo al vettore delle misure m k
(coordinate) allo stesso layer attraverso la “Measurement
Equation”:


m k  Hk x k   k


Anche H è una funzione lineare

Il termine  k descrive la componente stocastica associata
all’incertezza sulle misure (“measurement
noise”), e si

suppone che non sia biassato   k  , sia gaussiano e che sia
caratterizzato da una matrice di covarianza V
k

Si assume inoltre che il process noise e il measurement
noise siano indipendenti
Silvia Arcelli
34
Kalman Filter
Lo stesso esempio usato per il formalismo del fit di traccia
globale ora nel formalismo del Kalman Filter:
  y  a
   
xk  

tan

y

k  b k

mk  yk
 1 zk 1  zk 

Fk  
1 
0
H k  (1 0)
 y 

  yk
mk  H k xk  (1 0) 

 tan  y  k
 y 
 1 z k 1  z k  y 

  


xk 1  

1  tan  y  k
 tan  y  k 1  0
Silvia Arcelli
N.B. Qui ho ignorato il
process ed il measurement noise
35
Kalman Filter
Rispetto al formalismo del fit di traccia globale :

Il modello di traccia mette in relazione due stati consecutivi
(continuo cambio del piano di riferimento)

Il modello di traccia deve essere lineare solo tra due layer
consecutivi

Il MS è trattato nella matrice Qk, che ha la dimensionalità
dello State Vector

Correzioni (come quella per dE/dx o piccole disuniformità di
campo magnetico) si incorporano in maniera molto semplice
Silvia Arcelli
36
Kalman Filter-Come funziona
Operativamente, il Kalman Filter si articola secondo 2 processi
di base ( più un terzo “opzionale”, smoother) iterati N volte:

Prediction: Stima di uno stato “futuro”

Filter : Stima dello stato “presente”, includendo
l’informazione della misura

Smoother: Stima di uno stato “passato”, in base a tutta
l’informazione della traccia.
Silvia Arcelli
37
Kalman Filter-Come
funziona

Quindi, se si indica con x k|j la stima dello State Vector al layer
k sulla base delle j misure nei j layer {m1,...mj}:
1) k>j : Prediction
2) k=j : Filter
3) k<j: Smoother
Per “partire”, il filtro ha bisogno di un “seed” (vedi track
following), che dia una stima iniziale dello State Vector:

x0|0, C0|0
Quindi il filtro procede alternando le due operazioni 1) e 2)
fino all’ultima misura che si ritiene associata alla traccia.
(il track finding si fa in simultanea)
Silvia Arcelli
38
Kalman Filter, “Prediction” Step


Supponiamo di avere una stima xk |kdello State Vector xkal layer
k sulla base delle misure {m1,..mk}, con matrice di covarianza Qk |k
Equazioni del “Prediction Step”:


xk 1|k  Fk xk |k (  wk  0)
Ck 1|k  Fk Ck |k F T k  Qk
•dim(Q,F,C)= dim(x) · dim(x)
• ho già una stima locale dei
parametri (errori MS)

xk | k
State Vector
Covariance Matrix
Fk
Qk
Fk

xk 1|k
• posso applicare correzioni (dE/dx)
Silvia Arcelli
39
Kalman Filter, Filter Step
In questa fase, si utilizza la stima dello State Vector e della sua
matrice di covarianza dal Prediction Step, combinandola con una
eventuale misura al layer k+1, per produrre la miglior stima dello
State Vector al layer k+1, sulla base delle misure {m1,...,mk+1}.
La prescrizione si deriva richiedendo che sia minima la funzione:


 T 1 

L( xk 1 )  (mk 1  H k 1 xk 1 ) Vk 1 (mk 1  H k 1 xk 1 )


 T 1 

( xk 1|k  xk 1 ) Ck 1|k ( xk 1|k  xk 1 )
2 della parte “di misura”
2 della parte “di predizione”
Silvia Arcelli
40
Kalman Filter, Filter Step
dL
Imponendo   0 si ottengono le Equazioni di Filter, che
dx
~

danno la miglior stima x  x
dello stato al layer
k 1
k 1|k 1
k+1, e della sua matrice di covarianza:
C

xk 1|k 1 

x
1
k 1|k k 1|k
T
1
k 1 k 1

H V m
H V H
T
1
k 1 k 1 k 1
1
k 1
k 1|k
C
Ck 1|k 1  ( H kT1Vk11 H k 1  Ck11|k ) 1
Silvia Arcelli
State Vector
Covariance Matrix
41
Kalman Filter, “Filter” Step
La miglior stima dello State Vector al layer k+1, basato sulle
misure {m1,...mk+1} non è altro che la media pesata della
previsione e della misura.

mk 1

xk | k
Fk
Qk
Fk
Anche in questa fase, si fa track
finding!

xk 1|k 1
•Ho una serie di informazioni per
decidere l’associazione dell’hit

xk 1|k
•Posso tener conto della eventuale
dipendenza degli errori di misura
dai parametri della traccia
Silvia Arcelli
42
Kalman Filter, Filter Step
Usando Ck11|k  Ck11|k 1  HkT1Vk11Hk 1 e sostituendo, le
equazioni di filter si possono anche scrivere:
“Correction”
“Prediction”




xk 1|k 1  xk 1|k  K k 1 (mk 1  H k 1 xk 1|k )
Dove:
Ck 1|k 1  ( I  K k 1 H k 1 )Ck 1|k
K k 1 
Ck 1|k HkT1
(Vk 1 
T
Hk 1Ck 1|k Hk 1 )
Silvia Arcelli
é la “Gain Matrix”
43
Kalman Filter, Filter Step
La Gain Matrix K determina il peso della correzione.
K k 1 
Ck 1|k HkT1
(Vk 1  Hk 1Ck 1|k HkT1 )
All’inizio del filtro:
massimo guadagno
nell’incorporare la misura
C  V , K  I
Alla fine del filtro:
incorporare nuove misure
ha sempre meno impatto
C  V , K  0
Silvia Arcelli
44
Kalman Filter, Filter Step
La Stima filtrata ha tutte le proprietà ottimali di un estimatore
lineare di minimi quadrati. Ad essa è associata un 2 :



rk 1|k 1  mk 1  H k 1 xk 1|k 1

2
k 1, F
T

1
 rk 1|k 1 Rk 1|k 1rk 1|k 1
Rk 1|k 1  Vk 1  H k 1Ck 1|k 1 H k 1
T
distribuito come una variabile di 2 a dim(mk) gradi di libertà. Il
2 globale della traccia è la somma di tutti i 2 ad ogni passo del
filtro.

2
k 1

2
k 1, F
Silvia Arcelli

2
k
45
Kalman Filter
Il filtro procede iterando queste due operazioni fino all’ N-esimo
layer, rifinendo continuamente la stima dello State Vector al layer
corrente:
•La stima filtrata segue più da vicino la traiettoria fisica della
traccia (soprattutto nello stadio iniziale)
•La stima all’ultimo layer è la più precisa, perchè contiene
l’informazione delle misure di tutti i layer. Se si vuole la miglior
stima al vertice, si inizia il filtro dal layer più esterno.
Silvia Arcelli
46
Kalman Filter-Smoother Step
Abbiamo visto che lo State Vector è più preciso all’ultimo layer di
misura. Ma il Kalman Filter permette di ottenere la stima migliore,
basata su tutte le N misure, a qualunque layer k={1...N}.
Equazioni di Smoothing (ancora un processo recursivo):




xk | N  xk |k  Ak ( xk 1|k  xk 1| N )
Ck | N  Ck |k  Ak (Ck 1|k  Ck 1| N ) Ak
Ak  Ck |k F C
T
k 1
T
1
k 1|k
Silvia Arcelli
47
Kalman Filter-Smoother Step
•Anche alla stima “smoothed” è associato un 2, ma la
loro somma non dà il 2 globale (non sono indipendenti)

2
k ,S
 T 1 
 rk|n Rk |n rk|n
Utile per l’individuazione di hit di rumore (“outliers”)
•Lo Smoother si dimostra equivalente alla media pesata
di un “Forward Filter” e di un “Backward Filter”.
•La traiettoria dopo lo smoothing è, appunto, più “smooth”
Silvia Arcelli
48
Kalman Filter-Sommario

Permette di fare track finding e fitting simultaneamente

Perturbazioni alla traiettoria “ideale” (MS, perdita di Energia,
disuniformità di campo magnetico) sono trattabili in maniera
più semplice

Il formalismo consente di utilizzare matrici di dimensione
limitata (al massimo quella dello State Vector). Quindi il
numero di operazioni scala come ~N, e non come N3.
 Il modello lineare di traccia deve essere valido solo
“localmente” (tra step e step)
Silvia Arcelli
49
Kalman Filter-Sommario

I parametri di traccia sono stimati localmente, e seguono
da vicino la traiettoria fisica della traccia, non solo
l’estrapolazione delle condizioni iniziali come in un fit
globale

Estrapolazione ottimale dello stato della traccia ad altri
device (calorimetri, sistemi di Particle-ID, rivelatori di
muoni)

Quando conviene usarlo? Quando sono in condizione
di “continuità e prossimità” delle misure.
Silvia Arcelli
50
Scarica

Kalman Filter