La misura e la statistica (1)
La misura e la statistica (1)
Ricapitoliamo la situazione dal
‘700 in poi
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
115
La misura e la statistica (1)
Gauss verso la fine
del 1700 scopre un
fatto nuovo
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
116
La misura e la statistica (1)
La posizione angolare
di una stella non viene
mai riprodotta
esattamente
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
117
La misura e la statistica (1)
• Nasce una nuova visione della misura
• I dati sperimentali non sono certi, ma
approssimati
• Più tardi ci si accorgerà che ciò accade
anche per le previsioni teoriche
– Sia per imprecisioni di calcolo
– Sia per imprecisioni di metodo
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
118
La misura e la statistica (1)
• Più tardi ci si accorgerà che ciò accade
anche per colpa del metodo
• Scarsa conoscenza dello strumento
– Ed impossibilità di andare oltre a certi limiti
• Più tardi ci si accorgerà che ciò accade
anche per colpa della Natura
• Impossibilità fisica di misurare certe zone della
Natura (energia-tempo, momento-posizione, etc.)
• Impossibilità pratica di prevedere fenomeni iterati
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
119
La misura e la statistica (1)
• Ciò che riusciamo a dominare (entro certi
limiti) sono
L’imprecisione casuale
• ERRORI CASUALI
L’imprecisione strumentale
• ERRORI SISTEMATICI
L’imprecisione teorica
• ERRORI DI FORMALISMO E DI CALCOLO
NUMERICO
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
120
La misura e la statistica (1)
• Con Gauss il caso entra nella Scienza
• ... è la fine dell’epoca della Dea Ragione?
Oggi
senza la statistica
non esiste
metodo sperimentale
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
121
La probabilità e le sue leggi
Gli inizi
La probabilità e le sue leggi
• La definizione astratta di probabilità è
praticamente inutile
• Petizione di principio
Rapporto fra i casi favorevoli ad un evento
ed i casi possibili, quando questi siano
equiprobabili
• È la probabilità a priori
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
123
La probabilità e le sue leggi
• La difficoltà concettuale è solo apparente
– Si tratta di una sistemazione di fatti empirici
• Il dado ed i suoi rimbalzi
• I fenomeni complessi ed iterati
La statistica è al confine fra
Empiria (= Natura) ed
Astrazione
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
124
La probabilità e le sue leggi
• Definizione
P
Ncasi favorevoli
Ncasi possibili
impossibilità  0  P  1  certezza
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
125
La probabilità e le sue leggi
• In generale, per un evento ripetuto N tot
volte, definiremo
– Frequenza assoluta: numero di casi favorevoli
f ass  N fav
– Frequenza relativa: di solito semplicemente
frequenza
f rel  f 
N fav
N tot
0  f 1
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
126
La probabilità e le sue leggi
LEGGE DEI GRANDI NUMERI
Per Ntot   la frequenza
tende
alla probabilità (a priori)
Attenzione: in senso statistico o stocastico
Non è la solita tendenza al limite
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
127
La probabilità e le sue leggi
• Tendenza al limite stocastica
– Diverse sequenze danno diversi percorsi
– Non si può stabilire un “N talmente grande
che...”
• Sono sempre possibili scostamenti molto grandi
• ...solo che divengono sempre più rari
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
128
La probabilità e le sue leggi
• Facciamo l’esempio del solito dado
– Uscita di una faccia
1
P   0.16
6
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
0.167
129
La probabilità e le sue leggi
Legge della somma
• Due eventi mutuamente esclusivi A e B
• Uscita del 2 o del 4
• Si considera evento favorevole il verificarsi
del primo o del secondo
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
130
La probabilità e le sue leggi
• I casi favorevoli si sommano
Quindi si sommano le probabilità
P  A  B   P  A  P  B 
– Per un or (  +) di eventi mutuamente esclusivi
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
131
La probabilità e le sue leggi
Legge del prodotto
• Due eventi indipendenti A e B
• Uscita del 2 su un dado e del 4 sull’altro
• Si considera evento favorevole il verificarsi
del primo e del secondo
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
132
La probabilità e le sue leggi
• I casi favorevoli e possibili si combinano, e
quindi si moltiplicano
Quindi si moltiplicano le probabilità
P  A B   P  A  P  B 
– Per un and ( ) di eventi indipendenti
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
133
La probabilità e le sue leggi
• Se A a B non sono indipendenti definiremo
le probabilità condizionali
P  A B  P  B A
– Probabilità che avvenga A dopo che si è verificato B, etc.
• Evidentemente...
P  A B   P  B   P  A B   P  A  P  B A
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
134
La probabilità e le sue leggi
• La formula di Bayes:
• Partiamo da una serie di eventi Bk
mutuamente esclusivi
– La scelta di un cassetto in cui siano contenuti diversi
miscugli di palle bianche e nere
• Un evento E può accadere solo se è
accaduto un evento B
– Estrazione di una palla bianca o nera
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
135
La probabilità e le sue leggi
P  Bk E  
P  Bk  P  E Bk 
 PB  PE B 
j
j
j
• Probabilità che avendo estratto una palla
nera il cassetto da cui è stata estratta sia il
secondo
• Praticamente mai usata in fisica, e difatti...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
136
La probabilità e le sue leggi
ATTENZIONE
Siamo sicuri che siano rispettate teoricamente le
ipotesi?
» La scelta dei cassetti è veramente equiprobabile?
Siamo sicuri che siano rispettate in pratica le
ipotesi?
» La scelta dei cassetti è stata fatta effettivamente in modo
equiprobabile?
» Non ci sono bias? Non ci sono errori sistematici?
• Questioni molto sottili e molto difficili da
controllare...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
137
La probabilità e le sue leggi
• Se A e B non sono mutuamente esclusivi
otteniamo
P  A  B   P  A  P  B   P  A B 
P  A  P  B 
 P  A B   P  A B   P  B A  P  B A 
 P  A B  P  A  B
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
138
La probabilità e le sue leggi
• Se la probabilità di un evento è p, la
probabilità che esso avvenga k volte in n
tentativi vale
k k
nk
P  k , n     p 1  p 
 n
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
139
La probabilità e le sue leggi
• Il calcolo delle probabilità è
essenzialmente un gioco di calcolo
combinatorio
• Il calcolo può divenire anche molto
complicato
• Esempio: il terno al Lotto
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
140
La probabilità e le sue leggi
 87 
 
2  87  86
1 2  3  4  5
3 4 5

P



 90  1 2 90  89  88  87  86 90  89  88
 
5
1

11748
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
141
La probabilità e le sue leggi
• Quindi se io gioco tutti i terni ad 1€ per
terno spendo 11748 €
– Uno esce
• Per la vincita mi pagano 5000 €
– Ed i rimanenti 6748 €?
......
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
142
La probabilità e le sue leggi
• Attenzione alle
leggende metropolitane
– I numeri che ritardano
– ...e che quindi scientificamente debbono uscire
– (Se no che figura ci farebbero?)
In realtà l’evento raro è già accaduto
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
143
La probabilità e le sue leggi
• Importante il calcolo dei fattoriali
• Formula di Stirling
n
n !  2 n  
e
n
 2 n  
e
n

1
1 1


1 
2
 12 n 2 12 n 



n
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
144
Elementi di statistica
Elementi di statistica
• La statistica è un’estensione del calcolo
delle probabilità
– Si parte dai concetti fondamentali
– Si estende la definizione di probabilità
– Si introducono delle nuove variabili
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
146
Estensione del concetto di probabilità
Estensione del concetto di probabilità
• La probabilità viene fatta passare
– da un numero razionale ...
– ... ad un numero reale
• La probabilità può essere infinitesima
– Anche se poi si darà significato sempre all
probabilità finita
– Tramite integrazioni
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
148
Estensione del concetto di probabilità
• Si suppongono valide tutte le leggi delle
probabilità già stabilite
• Non si può più definire la probabilità come
rapporto fra casi favorevoli e casi possibili
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
149
Le variate
Le variate
• Una variata è una variabile...
– ... reale
– ... discreta o continua
– ... associata ad una probabilità
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
151
Le variate
• Una variata discreta
– Assume i valori ...
 x1, x2 ,
– ... con probabilità
 p1 , p2 ,
, xN 
, pN 
p
k
1
k
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
152
Le variate
• Esempio classico: il dado
– Variata: un numero da 1 a 6
– Probabilità associata: 1/6
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
153
Le variate
• Si definisce
– Valore atteso
– Speranza matematica
– Valore medio
E  x   x  x   xk pk
k
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
154
Le variate
• La variata discreta può essere definita da
una tabella
• Esempio:
– I numeri riportati sulle facce di un dado
• Attenzione: i numeri potrebbero essere diversi
– Anche le probabilità se il dado fosse truccato...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
155
Le variate
xk
pk
1
0.167
2
0.167
3
0.167
4
0.167
5
0.167
6
0.167
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
156
Le variate
• Ed ecco una rappresentazione grafica
– Distribuzione
– Spettro
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
157
0.3
0.25
0.2
0.15
0.1
0.05
2
3
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
4
5
6
158
Le variate
• Se si conoscono solo valori proporzionali
alle probabilità occorrerà normalizzarli
Ak
pk 
 Ak
k
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
159
Le variate
• Una variata continua
– Assume valori reali in un dominio D con
probabilità infinitesima
 
dp  f  x  dx
– La f x è la funzione di distribuzione
(spettro)
• Funzione densità
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
160
Le variate
• Il dominio D sarà per noi, praticamente
sempre, uno dei seguenti insiemi
– Tutto l’asse reale
– Il semiasse reale positivo
– Un intervallo (e di solito chiuso)
• Indicheremo in ogni caso l’estremo inferiore con
low e quello superiore con high
• Ecco degli esempi
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
161
0.8
0.6
0.4
0.2
0
0
0.5
1
1.5
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2
2.5
3
162
1
0.8
0.6
0.4
0.2
0
2
1
0
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
1
2
163
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
2.5
0
2.5
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
5
7.5
10
164
0.5
0.4
0.3
0.2
0.1
0
0
2
4
6
8
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
10
12
14
165
Le variate
• In ogni caso vale la condizione di
normalizzazione

D


f  x  dx   pk   1
k


• ...ed in generale un valore atteso
(“speranza matematica”) vale...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
166
Le variate


D G  x  f  x  dx  k G  xk  pk 
 E G  x    G  x 
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
167
Le variate
• Una distribuzione si può descrivere
– Con la funzione di distribuzione stessa
– Con la distribuzione cumulativa
F  x 
f  x
x
 f  t  dt
low
– Con la trasformata di Fourier della
– Funzione caratteristica
– Funzione generatrice dei momenti
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
f  x
168
Le variate
• Attenzione alle funzioni cumulative
– Sono più simili delle funzioni di distribuzione!
• Solo un paio di esempi
– Hanno molta importanza quando si simulano
dei dati
• MonteCarli
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
169
0.8
0.6
0.4
0.2
0
0
0.5
1
1.5
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2
2.5
3
170
1
0.8
0.6
0.4
0.2
0
0
0.5
1
1.5
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2
2.5
3
171
Le variate
• ...è sempre il solito passaggio dalle
derivate agli integrali e viceversa...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
172
Le distribuzioni in generale
Le distribuzioni in generale
• Sono funzioni per cui è sempre
f  x  0
• Per un insieme di definizione infinito
dev’essere
f  x
lim
x 
x
0
» Per evitare la divergenza logaritmica
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
174
Le distribuzioni in generale
• Di solito hanno quindi dei picchi
– Il picco più alto si chiama moda della
distribuzione
– Un picco: unimodale
• Poi bimodale, multimodale...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
175
Le distribuzioni in generale
• Si definisce la mediana
M

low
f  x  dx 
high

f  x  dx
M
• È definita con un’equazione integrale
• Non gode di proprietà di linearità
• Molto utile e potente soprattutto
nell’analisi delle serie temporali
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
176
Le distribuzioni in generale
• Poi ci sono i quartili
• Mediane della mediana
• Poi i percentili ...
NON USATELI
MAI
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
177
Le distribuzioni in generale
• Quasi sempre di una distribuzione si
fornisce
– La media   x
2
x
– La standard deviation  
– La moda
– A volte anche il momento secondo (o la sua
radice)


» Valore quadratico medio
» È il caso delle velocità in un gas
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
178
Le distribuzioni in generale
• Attenzione a non confondere
2
x
x
2


   x f  x  dx 
D

2
  x f  x  dx
2
D
• Facili a confondere se si usa il simbolo
x x
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
179
Distribuzioni discrete e continue
Distribuzioni discrete e continue
• In molti testi sono trattate assieme
• Per usare sommatorie + integrali occorre
usare gli integrali di Stjeltjes
• Ma ne vale la pena?...
• Noi separeremo i due casi
• Non capita mai di avere variate miste (discrete +
continue)
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
181
Le principali distribuzioni discrete
Le principali distribuzioni discrete
• Veramente importanti solamente due
– Distribuzione di Bernoulli e binomiale
– Distribuzione di Poisson, o degli eventi rari
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
183
La distribuzione di Bernoulli
La distribuzione di Bernoulli
• Il caso più semplice
• Variata che può
assumere due valori
• SCHEMA
X
1
successo
0
insuccesso
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
Prob.
p
q=1-p
185
La distribuzione di Bernoulli
• Valor medio
x  1   p    0   1  p  p
• Varianza
x  
2
 1  p   p    0  p  1  p 
2
2
 p 1  p   p 1  p 
2
2
 p 1  p  1  p  p 
 p 1  p   p q
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
186
La distribuzione binomiale
• Estensione della distribuzione di Bernoulli
• Caso tipico:
– Estraiamo da un’urna una palla
• Bianca: probabilità
p
• Nera: probabilità q=1-p
– Probabilità di estrarre k palle bianche su n
estrazioni, rimpiazzando ogni volta la palla
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
187
La distribuzione binomiale
• Legge della distribuzione
n k
 n  k nk
nk
P  k n, p     p 1  p     p q
k 
k 
• Introduciamo una variata che valga 1 per
successo e 0 per insuccesso
– Quindi x
– Su n prove
p
k 
x
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
 np
188
La distribuzione binomiale
• Si può calcolare anche con la funzione
caratteristica
• Varianza
2
2
 
k 
k
  x1  p  
 n  x  p

  xn  p  
2
2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
189
La distribuzione binomiale
  n pq
2
  n pq
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
190
La distribuzione binomiale
• All’aumentare della probabilità (da 0.1 a
0.3) la distribuzione diviene più simmetrica
– Assomiglia ad una distribuzione gaussiana
• ...che vedremo
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
191
0.2
0.15
0.1
0.05
5
10
15
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
20
25
30
192
La distribuzione di Poisson
La distribuzione di Poisson
• È la distribuzione di eventi rari
• È ciò che diviene la binomiale quando
n  
  np    cost
p  0
• Legge della distribuzione
e 
P k   
k!

Flavio Waldner - Dipt.di Fisica - UDINE - Italy
k
194
La distribuzione di Poisson
f  k n, p  

n  n  1
n  n  1
 n  k  1 p k
n!
 n  k  1  m 
n!
n  1  2 
 1   1  
n  n  n 
k
 m
  1  
n
n 
1  p 
nk
nk
m
k 
 k 1  1
1 
  m  1  
n  n!
n


Flavio Waldner - Dipt.di Fisica - UDINE - Italy
nk
195
La distribuzione di Poisson
 1  2 
lim 1  1  
n 
 n  n 
1 k
 m
 m lim 1  
k ! n 
n
m
k 
 k 1  1
1 
  m  1  
n  k!
n


nk
nk

1 k m
 me
k!
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
196
• Media
La distribuzione di Poisson
k 
• Varianza
 
2
 
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
197
La distribuzione di Poisson
• Ed infine un grafico per   2 e   5
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
198
0.25
0.2
0.15
0.1
0.05
5
10
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
15
20
199
Le principali distribuzioni continue
Le principali distribuzioni continue
• Molte hanno interesse limitato
• Qui studiamo solo quelle di maggiore
interesse per la misura
• Definite
– In un intervallo (solo la uniforme)
– Semiasse reale positivo
– Tutto l’asse reale
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
201
La distribuzione uniforme
La distribuzione uniforme
• Definita fra –1/2 e 1/2
• Di solito però fra 0 e 1
– Il calcolatore estrae “numeri a caso” in questo
intervallo
– In realtà i numeri sono pseudocasuali
– Estratti con un formalismo causale si verifica a posteriori
che rispettino la casualità
• Il caso di 
– Sono la base per simulazioni statistiche
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
203
1
0.8
0.6
0.4
0.2
0
2
1
0
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
1
2
204
La distribuzione uniforme
• Definizione della distribuzione
• In generale
x  0

x  1
x  0

x  0

x  1
x  0

Flavio Waldner - Dipt.di Fisica - UDINE - Italy
x0
 0  x 1
 x 1
xm
m xM
xM
205
1
0.8
0.6
0.4
0.2
2
4
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
6
8
10
206
La distribuzione uniforme
• Media
mM

2
• Varianza
M  m

 
2
2
12
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
1

 M  m
12
207
UN PROBLEMA INTERESSANTE
Un problema interessante
• Visto che il calcolatore mi dà solo numeri
(pseudo)casuali fra 0 ed 1, posso (e se sì
come) ottenere dei numeri distribuiti fra A
e B con una distribuzione f(x) ?
• La risposta è affermativa
Metodo di reiezione
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
209
Un problema interessante
• Uno schizzo grafico...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
210
Un problema interessante
Ricetta
1. Calcoliamo anzitutto il massimo della
funzione nel nostro intervallo
2. Poi calcoliamo M  1.05  max  f  x a b 
*
3. Estraiamo un numero X fra 0 ed 1
4. Calcoliamo
X  a  b  a  X
*
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
211
Un problema interessante
• Ora estraiamo un secondo numero fra 0
ed 1, e moltiplichiamolo per M: Y
– Quindi una distribuzione
uniforme fra 0 ed M
• Siamo ora in possesso di due numeri
(pseudo)casuali
– X fra a e b
– Y fra 0 ed M
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
212
Un problema interessante
• Calcoliamo la f  X 
• Terremo per buono il valore X
se è f  X   Y
• Rigetteremo il valore X
se è f  X   Y
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
213
Un problema interessante
• Il metodo è usatissimo e garantito
• Funziona a spese di estrazioni a vuoto
– In pratica
• Si riempie uniformemente il rettangolo verde di
punti
• Si tengono per buoni solo quelli sotto la curva
– Funziona anche per più dimensioni
• ...e si allungano i tempi...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
214
La distribuzione gaussiana
La distribuzione gaussiana
• Se sommiamo variabili distribuite
uniformemente otteniamo
– Numero di variabili: 1, 2, 3, 4, 10
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
216
120
100
80
60
40
20
0
-0.4
-0.2
0
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
0.2
0.4
217
200
150
100
50
0
-0.4
-0.2
0
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
0.2
0.4
218
200
150
100
50
0
-0.4
-0.2
0
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
0.2
0.4
219
250
200
150
100
50
0
-0.4
-0.2
0
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
0.2
0.4
220
400
300
200
100
0
-0.4
-0.2
0
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
0.2
0.4
221
La distribuzione gaussiana
• Si dimostra che si tende ad una
distribuzione tipica, “a campana”
La distribuzione normale
In generale
La distribuzione gaussiana
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
222
La distribuzione gaussiana
• Dimostrazione non immediata
– Bisogna lavorare sulle funzioni caratteristiche
– Passare al limite (e si tratta di dipendenze
funzionali...
• Si vede anche che il limite è lo stesso
anche se le distribuzioni NON sono
uniformi
• ...e difatti è MOLTO IMPORTANTE il
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
223
La distribuzione gaussiana
Teorema del limite centrale
Se una variata ha una X ha una
distribuzione F  X  la media di un
campione X  n  su n osservazioni
tende ad essere distribuita normalmente al
crescere di n
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
224
La distribuzione gaussiana
• Quindi le
Y   X k  n X n
k
al crescere di n tendono ad essere
distribuite normalmente anche se non lo
sono le singole variate X
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
225
La distribuzione gaussiana
• Noi ci limiteremo alle variate normali
• Sono le più utili
• Coprono l’assoluta maggioranza dei casi pratici
– Quando occorre qualcosa di più si è nei guai
• In questo caso bastano due momenti
– Media e SD
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
226
La distribuzione gaussiana
Caso importante “fuori dal coro”
i conteggi
Seguono la statistica di Poisson
Però
Quando 
Regola a spanne
10 usate pure Gauss con
 
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
227
La distribuzione gaussiana
• Sotto a questo limite bisogna stare attenti
perchè...
La distribuzione
è
asimmetrica
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
228
La distribuzione gaussiana
• Insomma...
TUTTO FINISCE
PER ESSERE
GAUSSIANO
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
229
La distribuzione gaussiana
• La funzione di distribuzione
1
G  x  ,  
e
 2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
1  x 

2 2
2
230
La distribuzione gaussiana
• Media 
2
• Varianza 

Flavio Waldner - Dipt.di Fisica - UDINE - Italy
231
La distribuzione gaussiana
• Definiremo a partire da una variata
normale x
– La variata centrata (detta anche scarto)
xc  x  x
– La variata ridotta (detta anche scarto ridotto)

x x

• Vediamo degli esempi grafici
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
232
0.4
0.3
0.2
0.1
-2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2
4
233
La distribuzione gaussiana
• Una proprietà importante:
– Le probabilità di stare dentro un certo numero
N di SD sono sempre le stesse
 N 
P  x    N   1  erf 

 2
• Attenzione: la funzione d’errore è
(storicamente) definita per una gaussiana
non normalizzata...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
234
La distribuzione gaussiana
• Definizione
erf  x  
2

x
e
t 2
dt
2
0
2




e
t 2
dt  1
0
e
dt

2

t 2

Flavio Waldner - Dipt.di Fisica - UDINE - Italy
235
La distribuzione gaussiana
• In realtà a noi serve
1
2
t2

2
 x 
 x e dt  erf  2 
x
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
236
La distribuzione gaussiana
1
P  x    N 
0.317
2
0.0455
N
3
4
5
0.0027  2.7 10
5
6.33 10
7
3
5.73 10  0.573 10
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
6
237
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
238
La distribuzione maxwelliana
La distribuzione maxwelliana
• Importante per la distribuzione dei moduli
delle velocità delle molecole in un gas
• Funzione di distribuzione
2
4  x
M x V  
  e
V  V 
x
 
V 
2
• Stavolta non conviene usare la funzione
caratteristica...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
240
La distribuzione maxwelliana
• Moda
• Media
• Varianza
m V
2

V  1.128 V

3  8 2
2
 
V  0.227 V
2
2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
241
La distribuzione maxwelliana
• Standard deviation
  0.476 V
• Velocità quadratica media
v
2

x
2
3
 V  1.225V
2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
242
La distribuzione maxwelliana
• Skewness
1 
• Kurtosis
2 
2 2 16  15  
 3  8 
3
2
15  16  192
2
 3  8 
2
 0.486
 3.108
• Quasi una gaussiana
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
243
0.8
0.6
0.4
0.2
1
2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
3
4
5
244
La distribuzione del
2
La distribuzione del
2
• La funzione di distribuzione è temibile...
 


2
F  
2
   
1

 
2  
 2
e
2

 
2 2 1
2
• Funzione caratteristica
  t   1  2it 

Flavio Waldner - Dipt.di Fisica - UDINE - Italy

2
246
La distribuzione del
• Media
 
• Varianza
  2
2
2

2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
  2
247
La distribuzione del
2
• Una rappresentazione grafica per
  2,5,10
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
248
0.5
0.4
0.3
0.2
0.1
5
10
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
15
20
249
Perché il
2?
Perché il
• Prendiamo N
variate
• Distribuite normalmente
• Indipendenti
• La somma
N
Z 
, XN 
 X k  k 

k 1
si distribuisce come 
 X1 ,
2
2?
2
2
k
N
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
251
Perché il
2?
• La somma dei quadrati degli scarti ridotti
ci dice quanto può essere buona una
previsione rispetto ai dati osservati
• Dobbiamo osservare (sempre in senso
stocastico!)
Z N
• Con una varianza
Z 2  2N
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
252
Perché il
2?
• Che probabilità c’è di osservare un valore
di 2 superiore ad un valore trovato?
CL   2  


F 2  d2
2
• Si chiama livello di confidenza
– Un grande 2 ha un basso CL
– È improbabile osservarlo
– -> qualcosa sta andando male...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
253
Perché il
2?
• Ecco cosa succede per N=10
– Funzione CL
CL  

2
   F   d
2
2
2
2
 1
 F   d
2
2
0
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
254
1
0.8
0.6
0.4
0.2
5
10
15
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
20
25
30
255
Perché il
2?
• C’è solo il 10% di probabilità di trovare un
2 maggiore o uguale a 15
• Se lo si trova si è di fronte ad un evento
improbabile
• ...se questo deriva da un’ipotesi teorica
che abbiamo fatto...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
256
Perché il
2?
• Insomma abbiamo un
Test di
ipotesi
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
257
Perché il
2?
• ...ma anche se troviamo un 2 troppo
piccolo qualcosa potrebbe non andar bene
• Non è che abbiamo sbagliato a calcolare le
varianze?
• ...magari stimandole troppo elevate?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
258
Le distribuzioni bivariate
Le distribuzioni bivariate
• Sono definite per due variate
f  x, y  dx dy
– La situazione adesso è molto più complessa
– Il grafico è una superficie
f  x, y  dx dy   X  x  dx  C x  y x  dy 
 Y  y  dy  C y  x y  dx 
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
260
Le distribuzioni bivariate
• Si definiscono le distribuzioni marginali...
X  x    f  x, y  dy
D
• ...e quelle condizionali
Cx  y x  
f  x, y 
 f  x, y  dy
D
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
261
Le distribuzioni bivariate

• Se la C x y x

non dipende da x allora
f  x, y   X  x   Y  y 
• ...e le variabili si dicono indipendenti
• Tutto simmetrico per la y
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
262
Le distribuzioni bivariate
• Per ogni valore di x avremo una media
y
x
  y f  x, y  dy
D
• Plottando questo verso x si ottiene la
curva di regressione di y su x
• Regressione: da studi di biometria (Galton): la statura dei figli
di genitori con statura superiore alla media tende a regredire
verso la statura media della razza
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
263
Le distribuzioni bivariate
• Il caso delle distribuzioni di variate normali
indipendenti:
1
X  x 
e
2
x2

2
1
Y  y 
e
2
1
f  x, y   X  x  Y  y  
e
2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
y2

2
x2  y 2

2
264
Le distribuzioni bivariate
• Se le variate non sono indipendenti
1
f  x, y  
e
2
ax2  2bxy  cy 2

2
• È sempre possibile riportarsi ad una forma
del tipo
2
2
Ax   Bx  Cy 
» La curva di regressione di y su x è una retta
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
265
Le distribuzioni bivariate
• Abbiamo una serie di osservazioni  xk , yk 
• Calcoliamo la somma dei quadrati degli
scarti
1
2
S
y

N
k
 r xk 
k
• Questa è minima per
S
1
0  r 
r
N
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
x y
k
k
k
266
Le distribuzioni bivariate
1
S
N
 y
 y
 2r xy  r
2
k
 r xk 
2
k
 1  2r xy  r
2
x
2
2
S  1 r
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2
267
Le distribuzioni bivariate
• Questo è il coefficiente di correlazione fra
le variate
• La stima teorica è
 xy
• Per variabili non ridotte
y  x

 x  x  y 
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
y

 x y
268
Le distribuzioni bivariate
• La varianza di Y su X è data quindi da
S  1 
2
y  x
• Le variabili indipendenti sono x
x2
• Leggi:
1 2
X  x 
2
1
Cx  y x  
2
e

1
1 
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2
e
 y  x

2 1  2
2

269
Le distribuzioni bivariate
• Quindi la legge generale
1
f  x, y  
2
1
1 
2
e
1 x 2  2  xy  y 2

2
1  2
   1 dipendenza funzionale (correlazione perfetta)

   0 indipendenza
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
270
Le distribuzioni bivariate
• Due esempi di distribuzioni con variate
indipendenti e due con variate dipendenti
• Nel caso di quelle indipendenti:
– Una stella fotografata da un telescopio
• Tremolio attorno ad una posizione media
» La SD misurata in secondi d’arco, prende il nome di
seeing
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
271
0.006
20
0.004
0.002
10
0
-20
0
-10
-10
0
10
20 -20
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
272
0.003
0.002
20
0.001
0
0
-20
0
-20
20
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
273
0.2
2
0.1
0
0
-2
0
-2
2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
274
0.01
10
0.005
5
0
0
-10
-5
-5
0
5
10
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
-10
275
Le distribuzioni bivariate
• In generale...
1
1
f  x, y  
2  x y 1   2

e

1
2 1  2

 x x

  x2

   y y 
2
 y2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2

2   x x
 y  y  
 x y


276
La somma delle varianze
La somma delle varianze
• Supponiamo di avere delle variabili
indipendenti
Z  X Y
Z  X  Y
• Ora prendiamo le variate centrate
   

2
 
2
 
2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
 2 
278
La somma delle varianze
• Ora abbiamo
     0
E quindi la legge della somma delle varianze
per variate indipendenti

2
 
2
 
2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
Z
2
 X
2
 Y
2
279
La somma delle varianze
Per somme di variate indipendenti
le varianze si sommano
quadraticamente
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
280
La somma delle varianze
• Quindi sommare direttamente le standard
deviation porta ad una sovrastima della
varianza finale
• A volte può essere perfino conveniente...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
281
La misura come variata
La misura come variata
• Una qualunque misura è affetta da una
serie di incertezze
• Se ripetuta non dà gli stessi risultati
• Molte (ed in numero sempre maggiore) di
previsioni teoriche non possono essere
fatte con mezzi formali
• Vengono fatte con mezzi o numerici o statistici
• MonteCarli
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
283
La misura come variata
In definitiva il confronto
fra teoria ed
esperimento è sempre
probabilistico
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
284
La misura come variata
• Il primo passo è che una misura è sempre
pensata come una variata
– E di solito normale
• Questo vale sia per misure “tipiche”
– Il diametro di un chiodo
• ... sia per misure di tipo statistico
– Il peso medio di un pollo di un allevamento
• ...sia per misure complesse
– Densitometria ossea
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
285
La misura come variata
Di norma si suppone che
• La misura di una quantità singola sia una
variata normale
• Con valore atteso
• Con SD
• I momenti superiori sono (evidentemente) noti
• La SD sia piccola rispetto al valore atteso
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
286
La misura come variata
SE QUESTE IPOTESI NON
FUNZIONANO OCCORRE
AGIRE DI CONSEGUENZA E
CAMBIARE IL FORMALISMO
DI QUANTO DIREMO
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
287
Medie ed errori
Medie ed errori
• Risultato di una misura: una variata
normale
• Momenti:
– Primo: -> la media
– Secondo: -> la varianza
• Si fornisce la deviazione standard
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
289
Medie ed errori
• Nell’ipotesi normale è sufficiente fornire i
primi due momenti
• In realtà si fornisce per convenzione media e SD
• Il risultato di una misura viene espresso in
generale come
 
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
290
Medie ed errori
• Due tipi di errore
– Assoluto
– Relativo



• Di solito misurato in % o in ppm
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
291
Medie ed errori
• Quasi sempre  è espresso con una o al
massimo due cifre significative
• Non si ritiene utile andare più in là
• Esempio:
– Numero di Avogadro
6.022 141 99 (47) 10 mol
23
  6.022 141 99  4.7 10
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
7
1
 10
23
mol
1
292
Medie ed errori
• La SD ha sempre il significato statistico
visto nella distribuzione normale
– Fuori di 1 SD ->  33 %
– Fuori di 2 SD ->  4 %
– Fuori di 3 SD ->  0,3 % = 3000 ppm
• Cosiddetto errore massimo
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
293
La misura diretta
La misura diretta
Il caso più semplice
• Misuriamo il lato di un cubo con un calibro
– O stimiamo l’errore in base alla lettura
– O ripetiamo N volte la misura
• Otteniamo un vettore
X   x1 , x1 ,
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
, xN 
295
La misura diretta
• Stima del valore più probabile
1
x 
N
x
k
k
• Questo è il valore che si fornisce come
risultato della misura
• MA: anche questa è una variata!
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
296
La misura diretta
• Le medie hanno dispersione minore

x
1


N
 X
k
 X

2
k
N
• Attenzione: ridurre la SD costa caro!
– Per ridurre la SD di un fattore 10 occorre
aumentare il campione di un fattore 100!
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
297
La misura diretta
• ...e le fluttuazioni?
• Si fa l’ipotesi (ragionevole) che la caduta
in un bin rappresenti un evento raro
– Statistica di Poisson
– Quindi in un bin abbiamo
Nbin  Nbin
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
298
La misura diretta
• Errore relativo...
N bin
N bin 
 

N bin

N bin
1
N bin
• ...ancora la dipendenza dalla radice!
• A spanne: aumentare di 10 volte la
statistica riduce l’errore di un fattore 3
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
299
La misura diretta
Un esempio pratico:
• Prendiamo un campione casuale di 1000
casi, da cui traiamo una certa conclusione.
Che fluttuazioni ci possiamo aspettare?
1000
3%
1000
• ...e con 100 casi
100
 10 %
100
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
300
La misura diretta
• ...e se volessimo ottenere fluttuazioni del
3 per mille?
Dovremmo salire a
100 000 casi!
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
301
La misura diretta
Insomma:
attenti ai sondaggi
ed ai risultati di medicamenti
miracolosi provati su
ben 127 casi...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
302
La misura diretta
•
E se non abbiamo a disposizione molte
misure?
• Si stima l’errore.
CONVENZIONI ACCETTATE
1. Per strumenti a indicatore: metà della
divisione più piccola
2. Per strumenti digitali: metà dell’ultima
cifra significativa
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
303
La misura di grandezze funzioni
di altre
La misura di grandezze funzioni di altre
Caso tipico
• Misuriamo il diametro di una sfera
• Determiniamo l’errore di misura
• Calcoliamo il volume della sfera
1
3
V  D
6
• Come facciamo a calcolare l’errore sul
volume?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
305
La propagazione degli errori
La propagazione degli errori
• Riprendiamo la formula
1
3
V  D
6
• Nell’ipotesi normale e di errori piccoli
1
 2
2
dV    3D dD  D dD
6
2
V 

2
D D
2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
307
La propagazione degli errori
• Errore relativo
• Più in generale

D
2
V 2
D

D  3
 3
V
D
D
6
Y  F  X   Y
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
dF
X
dX
308
La propagazione degli errori
• E se le variabili sono in numero maggiore?
Z  F  X ,Y 
• Dovremo tener conto
– Del teorema del differenziale totale
– Dell’additività quadratica delle varianze
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
309
La propagazione degli errori
• In totale...
 F
  F

Z  
X   
Y 
 X
  Y

2
2
• E l’errore relativo diviene
Z
 1 F
  1 F

 
X   
Y 
Z
 F X
  F Y

2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2
310
La derivata logaritmica
La derivata logaritmica
• Nel caso di una variabile...
1
3
V  D
6
1
3
ln V  ln   D 
6

1 
ln V  ln     3ln  D 
6 
dV
dD
V
D
3
3
V
D
V
D
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
312
La derivata logaritmica
• Una comoda scorciatoia
– Usabile per errori piccoli
– Utile se le funzioni sono di tipo algebrico
– Facile da memorizzare
• … se uno non ha molte pretese …
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
313
La derivata logaritmica
• Ecco un esempio strambo
3
X Y
Z
1.5
W
1
ln Z  3ln X  ln Y  1.5ln W
2
Z
X 1 Y
W
3

 1.5
Z
X
2 Y
W
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
314
La derivata logaritmica
Attenzione:
Non è rispettata l’additività
quadratica delle varianze
Si ottiene una sovrastima
dell’errore complessivo
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
315
La misura statistica
La misura statistica
• Un problema: come misuriamo l’energia (o
il momento) di un fascio ad es. Di
elettroni?
– Non c’è un’energia unica
– Possiamo far passare gli elettroni in campo
magnetico e poi misurare l’intensità alle varie
deflessioni
– Possiamo usare campi magnetici ed elettrici
incrociati
– ...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
317
La misura statistica
• Cosa succede se gli elettroni sono pochi?
• Dobbiamo accumulare statistica
– Misurare l’energia di uno alla volta
– Accumulare i dati
– Riportare le misure in un istogramma delle
frequenze
• A questo punto abbiamo dei conteggi ad
intervalli fissati
» In conteggi sono interi (numeri esatti...)
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
318
La misura statistica
• Prenderemo
– Come valori della x i centri degli intervalli
– Come valori della y i conteggi
– Come errori la loro radice quadrata
– Statistica di Poisson
• Abbiamo l’approssimazione di una
funzione
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
319
La misura statistica
• Da questo momento in poi le misure
statistiche si trattano come le altre
Attenzione a pensare che il
numero dei casi sia “esatto”
– Cosa comune in economia e medicina...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
320
La misura statistica
• Aver osservato 100 casi vuol dire
100  100  100  10
N 10

 10%
N 100
– Altroché valore esatto...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
321
IL problema
IL problema
• Abbiamo dei dati sperimentali
• DOBBIAMO avere almeno un modello
teorico
• Il(-i) modell0(-i) dipende(-ono) da alcuni
parametri incogniti
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
323
IL problema
Come facciamo a
determinare
le migliori stime
dei parametri in
questione?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
324
IL problema
Come facciamo a
determinare
gli errori sulle stime
dei suddetti parametri?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
325
IL problema
Come facciamo a
decidere se un
modello è
accettabile?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
326
IL problema
Come facciamo a
decidere qual’è il
modello
“migliore”?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
327
IL problema
Come facciamo ad
escludere
un modello?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
328
La stima parametrica
La stima parametrica
• Un esempio:
• A vari xk si misurano dei valori y k
– Come possiamo determinare la migliore stima
dei coefficienti della retta y  mx  q che
meglio approssima i dati?
– Come possiamo determinare gli errori sui
coefficienti della retta?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
330
La stima parametrica
Scegliamo ora per l’approssimazione una
parabola, e ripetiamo il processo
– Come possiamo decidere quale è il modello
migliore (retta o parabola)?
– È possibile determinare la probabilità che sia
verificato il modello?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
331
La stima parametrica
• Il primo problema si chiama
stima parametrica
• Il secondo problema si chiama
test di ipotesi
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
332
La stima parametrica
• Supponiamo ora di misurare distanze ed
angoli fra tre vette di montagne.
– Come possiamo determinare le migliori stime
di distanze ed angoli in modo che il triangolo
chiuda?
– La somma degli angoli interni dev’essere 180°
– Vera la geometria euclidea
– Come possiamo decidere se vale o no la
geometria euclidea?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
333
La stima parametrica
• Il problema si chiama
stima parametrica vincolata
• Il secondo problema è un’estensione del
test di ipotesi ed è il test di una teoria
– Nessuna differenza concettuale, solo una maggiore
“importanza”
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
334
La Maximum Likelihood
La Maximum Likelihood
Esempio della retta
• Se conosciamo la legge di distribuzione
intorno a y, calcoliamo la probabilità di
ottenere le y osservate attorno al valore
previsto
– Se sono indipendenti è solo il prodotto
• Otteniamo una funzione
L  x, y m, q 
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
336
La Maximum Likelihood
• Che di solito è complicatissima
• Esprime la probabilità di trovare i valori
osservati nell’ipotesi del nostro modello
• Funzione delle osservazioni e dei
parametri incogniti
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
337
La Maximum Likelihood
• Cercheremo i parametri in modo da
renderla massima
• Siccome è un prodotto si semplifica
prendendo il suo ln
• Le derivate di un prodotto...
ln L  x, y m, q  
• ...ed i prodotti divengono somme!
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
338
La Maximum Likelihood
• Di questa funzione si deve cercare il
massimo
– Se poi ci sono correlazioni, apriti Cielo...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
339
Questo è l’unico
metodo statistico
di stima
parametrica
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
340
La Maximum Likelihood
• Il calcolo delle condizioni di massimo va
fatto con metodi numerici
• In giro ci sono ottimi packages
• Un consiglio
USATE ALMENO DUE PACKAGES
DIVERSI!
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
341
Il minimo del 2
Il minimo del 2
• Supponiamo che le osservazioni siano
indipendenti e normali
• La probabilità diviene il prodotto di tante
2
gaussiane


P   exp 

Flavio Waldner - Dipt.di Fisica - UDINE - Italy
x



2


343
Il minimo del 2
• Ed il logaritmo della funzione di likelihood
diviene una somma...
 x  
   2

2



• ...che dev’essere massima
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
344
Il minimo del 2
• ...e quindi
  x  X 2 
k
th , k
2

  
2
k

k 


dovrà essere minimo
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
345
Il minimo del 2
La stima dei parametri va in
cerca dei valori dei parametri
che rendono minima la somma
dei quadrati degli scarti ridotti
rispetto ai valori previsti dal
modello scelto
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
346
Il minimo del 2
• Come si scrive una funzione di 2?
• Anzitutto occorre scrivere la funzione X th
• Questa è il nostro modello teorico
• Dipende
– dalle variabili che osserviamo
– da alcuni parametri che vogliamo determinare
• Poi occorre determinare gli errori sulle xk
• Problema non facile
– Da esso dipende non tanto la bontà della risposta,
quanto il valore del minimo
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
347
Il minimo del 2
• Un caso eclatante
– Il fit geometrico di tracce di camere a bolle in
campo magnetico (anni ’60 al CERN ed
altrove)
– Supposto un modello con archi di cerchio
• In realtà erano archi di spirale che si stringeva
– Ne derivava una sovrastima degli errori sui
parametri
– Si traduceva in fit eccessivamente ottimistici
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
348
Il minimo del 2
• In generale la previsione è funzione di
certi parametri
X th  X th   
• Quindi
  x  X  
k
th , k
2

   
2
k
k 

Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2




349
Il minimo del 2
• Per trovare il minimo si possono seguire
due strade
• Derivare rispetto ai parametri   2
• Si ottiene un sistema di equazioni
• Sistema normale
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
   0
 1

  2

0
  K
350
Il minimo del 2
• Se il sistema è lineare si risolve nei
parametri
• Il problema è semplice ed è trattato in
tutti i testi di statistica
• Peccato che tutto ciò accada raramente:
– Regressione lineare o quadratica: retta, parabola,...
– In genere con funzioni lineari nei parametri incogniti
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
351
Il minimo del 2
Un esempio:
• Dato un set di coppie  x, y  nel piano
qual’è la parabola che le approssima
meglio?
– Problema lineare

2
 a, b, c   
y  ax  bx  c
2
 yk   ax  bxk  c  


k
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2
k

2
2
k
352
Il minimo del 2
2


y

a
x

b
x

c


k
k
k



2
 2
 xk   0

2
a
k
k
2
 yk xk2  axk4  bxk3  cxk2 
0

2
k
k
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
353
Il minimo del 2

k
2
k k
2
k
yx

 a
k
4
k
2
k
x

 b
k
3
k
2
k
x

 c
k
2
k
2
k
x

0
 x 
 x 
 x   yx 
a    b    c    

 k  
 k  
 k    k  
4
k
2
k
3
k
2
k
2
k
2
k
2
k k
2
k
• Ed analoghe per gli altri due coefficienti
della parabola
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
354
Il minimo del 2
• E se volessimo un cerchio?
• Problema comune: particelle in campi magnetici
disegnano cerchi, e non parabole...
• Siamo nei guai:
• Dobbiamo determinare coordinate del
centro e raggio
• Di nuovo tre parametri
• Solo che...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
355
Il minimo del 2
 x  xc    y  yc 
2
2
R
2
x  2 xxc  x  y  2 yyc  y  R  0
2
2
c
2
2
c
2
2
2

y  2 yyc   x  xc   yc  R  0


2
2
y  yc  R   x  xc 
2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2
356
Il minimo del 2
• ...ed ora...

2
 xc , yc , R   


 y  y  R2  x  x 2 


k
c
c


k
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
2
 k2
357
Il minimo del 2
• Anche ora potete calcolare le derivate...
• Auguri...
• ...ma come si risolve poi il sistema
normale NON lo trovate sui testi di
statistica...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
358
Il minimo del 2
• Se il sistema non è lineare si può provare
a linearizzarlo
  2    2 
1 




 k   k  k ,in k 1! k
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
  2 

 k  0
 k 
359
Il minimo del 2
• Quindi
  2    2 
 2  2 
 
k  0



2 
 k   k  k ,in k  k 
• Si calcolano le correzioni e si pone
 k ,in   k ,in  k
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
360
Il minimo del 2
– Non si tratta di un problema facile
– Le derivate possono diventare facilmente
formalmente molto complesse
– Si tratta di programmi non semplici da
scrivere e da gestire
– Occorre scrivere dei programmi diversi per
ogni problema che si affronta
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
361
Il minimo del 2
• Molti problemi pratici:
– Abbiamo dei ragionevoli valori di prima
approssimazione?
– Il metodo converge ?
– Dopo quante iterazioni?
– Con quale precisione?
– Quando lo fermiamo?
– Cosa facciamo se diverge?
» Se le correzioni aumentano invece di diminuire
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
362
Il minimo del 2
Ultimo sistema
• Minimizzare direttamente la funzione
2
min    xc , yc , R 
• Packages appositi
• MINFUN
• MINUIT
• MATHEMATICA
• MatLab
• MathCad
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
363
Il minimo del 2
• Strategie tipiche (MINUIT)
– Si parte su una catena di montagne
– Si esplorano gli incrementi
– Derivate direzionali
– Si sceglie quello più negativo
– Gradiente
– Si segue la direzione del gradiente
– Ad un certo punto l’incremento diviene
positivo
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
364
Il minimo del 2
• Si esplora intorno
– Se è positivo dappertutto si è in fondo ad uno
stagno
– Se no si riprende
• Come si fa a sapere che lo stagno è il più
profondo di tutti?
• In due variabili si può visualizzare, ma in più di
due?
• Problemi, problemi...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
365
Il minimo del 2
Attenzione:
• Se trovate un minimo, chi vi dice che sia
quello vero?
– Siete arrivati davvero nella valle più profonda
di tutte?
– Potete arrangiarvi se siete in 2 variabili con la
grafica
– Se no...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
366
Il minimo del 2
NESSUNA SOLUZIONE AL
PROBLEMA DEI MINIMI
LOCALI
SOLO PAZIENZA ED
ATTENZIONE
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
367
Il test di ipotesi
Il test di ipotesi
• Torniamo al caso della retta
– Una serie di punti, riportati con le loro barre d’errore
• Ecco un esempio ed un possibile fit
– Fatto ad occhio...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
369
5
4.5
4
3.5
3
2.5
1.5
2
2.5
3
3.5
1.5
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
370
Il test di ipotesi
• Calcoliamo il
 
2
k
Yk   m X k  q  

2
2
k
• Ci sono 6 punti indipendenti, 2 parametri
• 4 equazioni in più
4 gradi di libertà
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
371
Il test di ipotesi
• Ci aspettiamo quindi
  4 4  42
2
– Attenzione alla skewness di 2!
2
• Supponiamo di aver misurato   C
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
372
2

La probabilità di osservare un
uguale o maggiore di C è assunta
come livello di confidenza
dell’ipotesi
“i punti sperimentali sono stati presi
da un campione di punti che in
realtà stanno su una retta, coi
coefficienti da noi calcolati”
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
373
Il test di ipotesi
• ...ed ecco la curva per 4 gradi di libertà
– Ascissa: valore del 2
– Ordinata: probabilità di osservare un 2
maggiore o uguale a quello dell’ascissa
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
374
Il test di ipotesi
1
0.8
0.6
0.4
0.2
5
10
15
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
20
25
30
375
Il test di ipotesi
• Però potremmo anche fare l’ipotesi che i
punti nel nostro modello dovrebbero stare
su una parabola
 
2
k
Yk   a X  b X k  c  


2
k

2
2
k
• E stavolta avremmo 3 gradi di libertà
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
376
Il test di ipotesi
Un problema
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
377
Il test di ipotesi
• Aumentando il numero dei parametri il CL
migliora
• Se usiamo una curva di 5° grado questa passa per
tutti e 6 i punti
– Il 2 diviene 0!
» CL=100 %!
• Vuol dire forse che questa ipotesi è la
migliore?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
378
Il test di ipotesi
NO!
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
379
Il test di ipotesi
Vuol dire solo che noi non
conosciamo il nostro
mestiere...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
380
Il test di ipotesi
• Un dubbio: ma allora come facciamo a
distinguere fra
– una teoria che predice una retta
– (Prof.Tizio)
– Una teoria che predice una curva di 5° grado?
– (Prof.Caio)
Risposta:
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
381
Il test di ipotesi
NON CON QUESTI DATI
• Ne occorrono di più e con errori più
piccoli
• Quindi più misure, e più precise ed
accurate
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
382
Il test di ipotesi
• Un panico: ma allora la scelta, anche nella
Scienza Esatta, è in certo modo arbitraria?
Risposta:
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
383
Il test di ipotesi
SÌ
• Scienza e Tecnologia non hanno mai preteso di
dare Verità Ideologiche, Religiose, Superstiziose
o alla Vanna Marchi
– È per questo che tanti ne hanno paura...
• Si procede stringendo il cerchio
– Confrontandosi, e con molto buon senso
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
384
Il test di ipotesi
• Parametro importante, e molto usato il 2
diviso per il numero di gradi di libertà
2
• Plot: curve

vs 

parametrizzate su diversi livelli di confidenza
• Le trovate nella letteratura
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
385
Il test di ipotesi
• Per grandi N (>10 è un buon valore)
1
CL    
2
2

t2

2
e
dt

y
y  2   1
2
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
386
Il test di ipotesi
• Quindi esplicitamente




1


1
2
2
CL     1  erf   
 
2 
2

 
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
387
Il test di ipotesi
• Le approssimazioni, tabulazioni, funzioni,
tabelle, routines si trovano ormai
dappertutto
» Librerie IMSL (IBM)
» EXCEL (MicroSoft)
» ...
• Importante è che sappiate come usarle e
cosa vogliono dire...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
388
Il test di ipotesi
Approfondiamo
l’argomento
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
389
Il test di ipotesi
Un altro problema
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
390
Il test di ipotesi
• Ho dei dati e faccio il fit con una retta
• Il 2 è così così
• Adesso provo una parabola
• Il 2 migliora (diviene più piccolo)
• Poi provo una cubica
• ...va ancora meglio
DOVE MI FERMO?
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
391
Il test di ipotesi
CERTO È CHE SE HO 10 PUNTI
UNA CURVA DI IX GRADO RENDE
IL 2 PROPRIO 0...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
392
Il test di ipotesi
PROCEDURA COMUNEMENTE
ACCETTATA
• Si fa un grafico con
– In ascissa il numero di gradi di libertà del fit
– In ordinata il valore del corrispondente 2
• Ad un certo punto si nota un brusco calo
– Uno scalino
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
393
Il test di ipotesi
• Si tiene per buono il fit allo scalino
– Poi aumentando i parametri il 2 continua a
calare lentamente
– Si considera questo calo poco significativo
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
394
Il test di ipotesi
• Tipico il caso per i polinomi
– Scarso livello di confidenza per una retta
– Un po’ meglio con una parabola
– Buono con una cubica
– Meglio con una quartica
• Il risultato è che questi dati danno per
buona l’ipotesi della cubica
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
395
Il test di ipotesi
Un panico
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
396
Il test di ipotesi
• E se il 2 cala, ma non c’è scalino?
• Risposta: niente da fare
– O meglio: il tipo di curva da noi scelta
non funziona
– Esempio tipico: dati su un esponenziale,
fittati con polinomi
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
397
Il test di ipotesi
• Anche questo è un risultato
Il modello teorico proposto
non va,
Ed occorre cercarne un altro
» Naturalmente bisogna essere ben sicuri dei dati
sperimentali e degli errori ad essi associati
» ...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
398
I vincoli sui parametri
I vincoli sui parametri
• Ci possono essere delle condizioni extra
sui parametri
1  1 , ,  K   0


   , ,    0
K
 M 1
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
M K
400
I vincoli sui parametri
• Esempio (un po’ banale...):
– Misuriamo tre angoli
– Ci chiediamo la migliore stima con la
condizione che la somma dei valori finali dia
180°
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
401
I vincoli sui parametri
Ci sono varie strade
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
402
I vincoli sui parametri
• Una è quella di ridursi a soli parametri
indipendenti
F  ,  ,          180
F  ,  ,180     
• Può non essere facile esplicitare un
parametro
» E se sono parecchi, con equazioni non lineari...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
403
I vincoli sui parametri
Provare per credere
• Passate da
F  x, y   0 
y  f  x
sin  x y   0.5  0
• Facile in linea di principio, ma nei casi
pratici basta un radicale
– Di solito questa strada non è quasi mai usata
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
404
I vincoli sui parametri
• L’altra strada è quella dei
moltiplicatori di Lagrange
• Si minimizza
    11   
2
 M M  
rispetto sia alle  sia alle 
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
405
I vincoli sui parametri
• Alle derivate prime si ottengono delle
equazioni

2
k


    0
0
• Automaticamente soddisfatte
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
406
I vincoli sui parametri
• Il problema si riduce a minimizzare una funzione
più complessa, con più parametri
  j k   
2
       
j
k
k
j
• Di questi i moltiplicatori non entrano nelle analisi
successive
• Problema sempre serio: evitare i minimi locali
• La cosa peggiora all’aumentare del numero di dimensioni...
Flavio Waldner - Dipt.di Fisica - UDINE - Italy
407
Scarica

MIS_002 - Universita` di Udine