La misura e la statistica (1) La misura e la statistica (1) Ricapitoliamo la situazione dal ‘700 in poi Flavio Waldner - Dipt.di Fisica - UDINE - Italy 115 La misura e la statistica (1) Gauss verso la fine del 1700 scopre un fatto nuovo Flavio Waldner - Dipt.di Fisica - UDINE - Italy 116 La misura e la statistica (1) La posizione angolare di una stella non viene mai riprodotta esattamente Flavio Waldner - Dipt.di Fisica - UDINE - Italy 117 La misura e la statistica (1) • Nasce una nuova visione della misura • I dati sperimentali non sono certi, ma approssimati • Più tardi ci si accorgerà che ciò accade anche per le previsioni teoriche – Sia per imprecisioni di calcolo – Sia per imprecisioni di metodo Flavio Waldner - Dipt.di Fisica - UDINE - Italy 118 La misura e la statistica (1) • Più tardi ci si accorgerà che ciò accade anche per colpa del metodo • Scarsa conoscenza dello strumento – Ed impossibilità di andare oltre a certi limiti • Più tardi ci si accorgerà che ciò accade anche per colpa della Natura • Impossibilità fisica di misurare certe zone della Natura (energia-tempo, momento-posizione, etc.) • Impossibilità pratica di prevedere fenomeni iterati Flavio Waldner - Dipt.di Fisica - UDINE - Italy 119 La misura e la statistica (1) • Ciò che riusciamo a dominare (entro certi limiti) sono L’imprecisione casuale • ERRORI CASUALI L’imprecisione strumentale • ERRORI SISTEMATICI L’imprecisione teorica • ERRORI DI FORMALISMO E DI CALCOLO NUMERICO Flavio Waldner - Dipt.di Fisica - UDINE - Italy 120 La misura e la statistica (1) • Con Gauss il caso entra nella Scienza • ... è la fine dell’epoca della Dea Ragione? Oggi senza la statistica non esiste metodo sperimentale Flavio Waldner - Dipt.di Fisica - UDINE - Italy 121 La probabilità e le sue leggi Gli inizi La probabilità e le sue leggi • La definizione astratta di probabilità è praticamente inutile • Petizione di principio Rapporto fra i casi favorevoli ad un evento ed i casi possibili, quando questi siano equiprobabili • È la probabilità a priori Flavio Waldner - Dipt.di Fisica - UDINE - Italy 123 La probabilità e le sue leggi • La difficoltà concettuale è solo apparente – Si tratta di una sistemazione di fatti empirici • Il dado ed i suoi rimbalzi • I fenomeni complessi ed iterati La statistica è al confine fra Empiria (= Natura) ed Astrazione Flavio Waldner - Dipt.di Fisica - UDINE - Italy 124 La probabilità e le sue leggi • Definizione P Ncasi favorevoli Ncasi possibili impossibilità 0 P 1 certezza Flavio Waldner - Dipt.di Fisica - UDINE - Italy 125 La probabilità e le sue leggi • In generale, per un evento ripetuto N tot volte, definiremo – Frequenza assoluta: numero di casi favorevoli f ass N fav – Frequenza relativa: di solito semplicemente frequenza f rel f N fav N tot 0 f 1 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 126 La probabilità e le sue leggi LEGGE DEI GRANDI NUMERI Per Ntot la frequenza tende alla probabilità (a priori) Attenzione: in senso statistico o stocastico Non è la solita tendenza al limite Flavio Waldner - Dipt.di Fisica - UDINE - Italy 127 La probabilità e le sue leggi • Tendenza al limite stocastica – Diverse sequenze danno diversi percorsi – Non si può stabilire un “N talmente grande che...” • Sono sempre possibili scostamenti molto grandi • ...solo che divengono sempre più rari Flavio Waldner - Dipt.di Fisica - UDINE - Italy 128 La probabilità e le sue leggi • Facciamo l’esempio del solito dado – Uscita di una faccia 1 P 0.16 6 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 0.167 129 La probabilità e le sue leggi Legge della somma • Due eventi mutuamente esclusivi A e B • Uscita del 2 o del 4 • Si considera evento favorevole il verificarsi del primo o del secondo Flavio Waldner - Dipt.di Fisica - UDINE - Italy 130 La probabilità e le sue leggi • I casi favorevoli si sommano Quindi si sommano le probabilità P A B P A P B – Per un or ( +) di eventi mutuamente esclusivi Flavio Waldner - Dipt.di Fisica - UDINE - Italy 131 La probabilità e le sue leggi Legge del prodotto • Due eventi indipendenti A e B • Uscita del 2 su un dado e del 4 sull’altro • Si considera evento favorevole il verificarsi del primo e del secondo Flavio Waldner - Dipt.di Fisica - UDINE - Italy 132 La probabilità e le sue leggi • I casi favorevoli e possibili si combinano, e quindi si moltiplicano Quindi si moltiplicano le probabilità P A B P A P B – Per un and ( ) di eventi indipendenti Flavio Waldner - Dipt.di Fisica - UDINE - Italy 133 La probabilità e le sue leggi • Se A a B non sono indipendenti definiremo le probabilità condizionali P A B P B A – Probabilità che avvenga A dopo che si è verificato B, etc. • Evidentemente... P A B P B P A B P A P B A Flavio Waldner - Dipt.di Fisica - UDINE - Italy 134 La probabilità e le sue leggi • La formula di Bayes: • Partiamo da una serie di eventi Bk mutuamente esclusivi – La scelta di un cassetto in cui siano contenuti diversi miscugli di palle bianche e nere • Un evento E può accadere solo se è accaduto un evento B – Estrazione di una palla bianca o nera Flavio Waldner - Dipt.di Fisica - UDINE - Italy 135 La probabilità e le sue leggi P Bk E P Bk P E Bk PB PE B j j j • Probabilità che avendo estratto una palla nera il cassetto da cui è stata estratta sia il secondo • Praticamente mai usata in fisica, e difatti... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 136 La probabilità e le sue leggi ATTENZIONE Siamo sicuri che siano rispettate teoricamente le ipotesi? » La scelta dei cassetti è veramente equiprobabile? Siamo sicuri che siano rispettate in pratica le ipotesi? » La scelta dei cassetti è stata fatta effettivamente in modo equiprobabile? » Non ci sono bias? Non ci sono errori sistematici? • Questioni molto sottili e molto difficili da controllare... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 137 La probabilità e le sue leggi • Se A e B non sono mutuamente esclusivi otteniamo P A B P A P B P A B P A P B P A B P A B P B A P B A P A B P A B Flavio Waldner - Dipt.di Fisica - UDINE - Italy 138 La probabilità e le sue leggi • Se la probabilità di un evento è p, la probabilità che esso avvenga k volte in n tentativi vale k k nk P k , n p 1 p n Flavio Waldner - Dipt.di Fisica - UDINE - Italy 139 La probabilità e le sue leggi • Il calcolo delle probabilità è essenzialmente un gioco di calcolo combinatorio • Il calcolo può divenire anche molto complicato • Esempio: il terno al Lotto Flavio Waldner - Dipt.di Fisica - UDINE - Italy 140 La probabilità e le sue leggi 87 2 87 86 1 2 3 4 5 3 4 5 P 90 1 2 90 89 88 87 86 90 89 88 5 1 11748 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 141 La probabilità e le sue leggi • Quindi se io gioco tutti i terni ad 1€ per terno spendo 11748 € – Uno esce • Per la vincita mi pagano 5000 € – Ed i rimanenti 6748 €? ...... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 142 La probabilità e le sue leggi • Attenzione alle leggende metropolitane – I numeri che ritardano – ...e che quindi scientificamente debbono uscire – (Se no che figura ci farebbero?) In realtà l’evento raro è già accaduto Flavio Waldner - Dipt.di Fisica - UDINE - Italy 143 La probabilità e le sue leggi • Importante il calcolo dei fattoriali • Formula di Stirling n n ! 2 n e n 2 n e n 1 1 1 1 2 12 n 2 12 n n Flavio Waldner - Dipt.di Fisica - UDINE - Italy 144 Elementi di statistica Elementi di statistica • La statistica è un’estensione del calcolo delle probabilità – Si parte dai concetti fondamentali – Si estende la definizione di probabilità – Si introducono delle nuove variabili Flavio Waldner - Dipt.di Fisica - UDINE - Italy 146 Estensione del concetto di probabilità Estensione del concetto di probabilità • La probabilità viene fatta passare – da un numero razionale ... – ... ad un numero reale • La probabilità può essere infinitesima – Anche se poi si darà significato sempre all probabilità finita – Tramite integrazioni Flavio Waldner - Dipt.di Fisica - UDINE - Italy 148 Estensione del concetto di probabilità • Si suppongono valide tutte le leggi delle probabilità già stabilite • Non si può più definire la probabilità come rapporto fra casi favorevoli e casi possibili Flavio Waldner - Dipt.di Fisica - UDINE - Italy 149 Le variate Le variate • Una variata è una variabile... – ... reale – ... discreta o continua – ... associata ad una probabilità Flavio Waldner - Dipt.di Fisica - UDINE - Italy 151 Le variate • Una variata discreta – Assume i valori ... x1, x2 , – ... con probabilità p1 , p2 , , xN , pN p k 1 k Flavio Waldner - Dipt.di Fisica - UDINE - Italy 152 Le variate • Esempio classico: il dado – Variata: un numero da 1 a 6 – Probabilità associata: 1/6 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 153 Le variate • Si definisce – Valore atteso – Speranza matematica – Valore medio E x x x xk pk k Flavio Waldner - Dipt.di Fisica - UDINE - Italy 154 Le variate • La variata discreta può essere definita da una tabella • Esempio: – I numeri riportati sulle facce di un dado • Attenzione: i numeri potrebbero essere diversi – Anche le probabilità se il dado fosse truccato... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 155 Le variate xk pk 1 0.167 2 0.167 3 0.167 4 0.167 5 0.167 6 0.167 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 156 Le variate • Ed ecco una rappresentazione grafica – Distribuzione – Spettro Flavio Waldner - Dipt.di Fisica - UDINE - Italy 157 0.3 0.25 0.2 0.15 0.1 0.05 2 3 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 4 5 6 158 Le variate • Se si conoscono solo valori proporzionali alle probabilità occorrerà normalizzarli Ak pk Ak k Flavio Waldner - Dipt.di Fisica - UDINE - Italy 159 Le variate • Una variata continua – Assume valori reali in un dominio D con probabilità infinitesima dp f x dx – La f x è la funzione di distribuzione (spettro) • Funzione densità Flavio Waldner - Dipt.di Fisica - UDINE - Italy 160 Le variate • Il dominio D sarà per noi, praticamente sempre, uno dei seguenti insiemi – Tutto l’asse reale – Il semiasse reale positivo – Un intervallo (e di solito chiuso) • Indicheremo in ogni caso l’estremo inferiore con low e quello superiore con high • Ecco degli esempi Flavio Waldner - Dipt.di Fisica - UDINE - Italy 161 0.8 0.6 0.4 0.2 0 0 0.5 1 1.5 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 2.5 3 162 1 0.8 0.6 0.4 0.2 0 2 1 0 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 1 2 163 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 2.5 0 2.5 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 5 7.5 10 164 0.5 0.4 0.3 0.2 0.1 0 0 2 4 6 8 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 10 12 14 165 Le variate • In ogni caso vale la condizione di normalizzazione D f x dx pk 1 k • ...ed in generale un valore atteso (“speranza matematica”) vale... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 166 Le variate D G x f x dx k G xk pk E G x G x Flavio Waldner - Dipt.di Fisica - UDINE - Italy 167 Le variate • Una distribuzione si può descrivere – Con la funzione di distribuzione stessa – Con la distribuzione cumulativa F x f x x f t dt low – Con la trasformata di Fourier della – Funzione caratteristica – Funzione generatrice dei momenti Flavio Waldner - Dipt.di Fisica - UDINE - Italy f x 168 Le variate • Attenzione alle funzioni cumulative – Sono più simili delle funzioni di distribuzione! • Solo un paio di esempi – Hanno molta importanza quando si simulano dei dati • MonteCarli Flavio Waldner - Dipt.di Fisica - UDINE - Italy 169 0.8 0.6 0.4 0.2 0 0 0.5 1 1.5 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 2.5 3 170 1 0.8 0.6 0.4 0.2 0 0 0.5 1 1.5 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 2.5 3 171 Le variate • ...è sempre il solito passaggio dalle derivate agli integrali e viceversa... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 172 Le distribuzioni in generale Le distribuzioni in generale • Sono funzioni per cui è sempre f x 0 • Per un insieme di definizione infinito dev’essere f x lim x x 0 » Per evitare la divergenza logaritmica Flavio Waldner - Dipt.di Fisica - UDINE - Italy 174 Le distribuzioni in generale • Di solito hanno quindi dei picchi – Il picco più alto si chiama moda della distribuzione – Un picco: unimodale • Poi bimodale, multimodale... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 175 Le distribuzioni in generale • Si definisce la mediana M low f x dx high f x dx M • È definita con un’equazione integrale • Non gode di proprietà di linearità • Molto utile e potente soprattutto nell’analisi delle serie temporali Flavio Waldner - Dipt.di Fisica - UDINE - Italy 176 Le distribuzioni in generale • Poi ci sono i quartili • Mediane della mediana • Poi i percentili ... NON USATELI MAI Flavio Waldner - Dipt.di Fisica - UDINE - Italy 177 Le distribuzioni in generale • Quasi sempre di una distribuzione si fornisce – La media x 2 x – La standard deviation – La moda – A volte anche il momento secondo (o la sua radice) » Valore quadratico medio » È il caso delle velocità in un gas Flavio Waldner - Dipt.di Fisica - UDINE - Italy 178 Le distribuzioni in generale • Attenzione a non confondere 2 x x 2 x f x dx D 2 x f x dx 2 D • Facili a confondere se si usa il simbolo x x Flavio Waldner - Dipt.di Fisica - UDINE - Italy 179 Distribuzioni discrete e continue Distribuzioni discrete e continue • In molti testi sono trattate assieme • Per usare sommatorie + integrali occorre usare gli integrali di Stjeltjes • Ma ne vale la pena?... • Noi separeremo i due casi • Non capita mai di avere variate miste (discrete + continue) Flavio Waldner - Dipt.di Fisica - UDINE - Italy 181 Le principali distribuzioni discrete Le principali distribuzioni discrete • Veramente importanti solamente due – Distribuzione di Bernoulli e binomiale – Distribuzione di Poisson, o degli eventi rari Flavio Waldner - Dipt.di Fisica - UDINE - Italy 183 La distribuzione di Bernoulli La distribuzione di Bernoulli • Il caso più semplice • Variata che può assumere due valori • SCHEMA X 1 successo 0 insuccesso Flavio Waldner - Dipt.di Fisica - UDINE - Italy Prob. p q=1-p 185 La distribuzione di Bernoulli • Valor medio x 1 p 0 1 p p • Varianza x 2 1 p p 0 p 1 p 2 2 p 1 p p 1 p 2 2 p 1 p 1 p p p 1 p p q Flavio Waldner - Dipt.di Fisica - UDINE - Italy 186 La distribuzione binomiale • Estensione della distribuzione di Bernoulli • Caso tipico: – Estraiamo da un’urna una palla • Bianca: probabilità p • Nera: probabilità q=1-p – Probabilità di estrarre k palle bianche su n estrazioni, rimpiazzando ogni volta la palla Flavio Waldner - Dipt.di Fisica - UDINE - Italy 187 La distribuzione binomiale • Legge della distribuzione n k n k nk nk P k n, p p 1 p p q k k • Introduciamo una variata che valga 1 per successo e 0 per insuccesso – Quindi x – Su n prove p k x Flavio Waldner - Dipt.di Fisica - UDINE - Italy np 188 La distribuzione binomiale • Si può calcolare anche con la funzione caratteristica • Varianza 2 2 k k x1 p n x p xn p 2 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 189 La distribuzione binomiale n pq 2 n pq Flavio Waldner - Dipt.di Fisica - UDINE - Italy 190 La distribuzione binomiale • All’aumentare della probabilità (da 0.1 a 0.3) la distribuzione diviene più simmetrica – Assomiglia ad una distribuzione gaussiana • ...che vedremo Flavio Waldner - Dipt.di Fisica - UDINE - Italy 191 0.2 0.15 0.1 0.05 5 10 15 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 20 25 30 192 La distribuzione di Poisson La distribuzione di Poisson • È la distribuzione di eventi rari • È ciò che diviene la binomiale quando n np cost p 0 • Legge della distribuzione e P k k! Flavio Waldner - Dipt.di Fisica - UDINE - Italy k 194 La distribuzione di Poisson f k n, p n n 1 n n 1 n k 1 p k n! n k 1 m n! n 1 2 1 1 n n n k m 1 n n 1 p nk nk m k k 1 1 1 m 1 n n! n Flavio Waldner - Dipt.di Fisica - UDINE - Italy nk 195 La distribuzione di Poisson 1 2 lim 1 1 n n n 1 k m m lim 1 k ! n n m k k 1 1 1 m 1 n k! n nk nk 1 k m me k! Flavio Waldner - Dipt.di Fisica - UDINE - Italy 196 • Media La distribuzione di Poisson k • Varianza 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 197 La distribuzione di Poisson • Ed infine un grafico per 2 e 5 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 198 0.25 0.2 0.15 0.1 0.05 5 10 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 15 20 199 Le principali distribuzioni continue Le principali distribuzioni continue • Molte hanno interesse limitato • Qui studiamo solo quelle di maggiore interesse per la misura • Definite – In un intervallo (solo la uniforme) – Semiasse reale positivo – Tutto l’asse reale Flavio Waldner - Dipt.di Fisica - UDINE - Italy 201 La distribuzione uniforme La distribuzione uniforme • Definita fra –1/2 e 1/2 • Di solito però fra 0 e 1 – Il calcolatore estrae “numeri a caso” in questo intervallo – In realtà i numeri sono pseudocasuali – Estratti con un formalismo causale si verifica a posteriori che rispettino la casualità • Il caso di – Sono la base per simulazioni statistiche Flavio Waldner - Dipt.di Fisica - UDINE - Italy 203 1 0.8 0.6 0.4 0.2 0 2 1 0 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 1 2 204 La distribuzione uniforme • Definizione della distribuzione • In generale x 0 x 1 x 0 x 0 x 1 x 0 Flavio Waldner - Dipt.di Fisica - UDINE - Italy x0 0 x 1 x 1 xm m xM xM 205 1 0.8 0.6 0.4 0.2 2 4 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 6 8 10 206 La distribuzione uniforme • Media mM 2 • Varianza M m 2 2 12 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 1 M m 12 207 UN PROBLEMA INTERESSANTE Un problema interessante • Visto che il calcolatore mi dà solo numeri (pseudo)casuali fra 0 ed 1, posso (e se sì come) ottenere dei numeri distribuiti fra A e B con una distribuzione f(x) ? • La risposta è affermativa Metodo di reiezione Flavio Waldner - Dipt.di Fisica - UDINE - Italy 209 Un problema interessante • Uno schizzo grafico... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 210 Un problema interessante Ricetta 1. Calcoliamo anzitutto il massimo della funzione nel nostro intervallo 2. Poi calcoliamo M 1.05 max f x a b * 3. Estraiamo un numero X fra 0 ed 1 4. Calcoliamo X a b a X * Flavio Waldner - Dipt.di Fisica - UDINE - Italy 211 Un problema interessante • Ora estraiamo un secondo numero fra 0 ed 1, e moltiplichiamolo per M: Y – Quindi una distribuzione uniforme fra 0 ed M • Siamo ora in possesso di due numeri (pseudo)casuali – X fra a e b – Y fra 0 ed M Flavio Waldner - Dipt.di Fisica - UDINE - Italy 212 Un problema interessante • Calcoliamo la f X • Terremo per buono il valore X se è f X Y • Rigetteremo il valore X se è f X Y Flavio Waldner - Dipt.di Fisica - UDINE - Italy 213 Un problema interessante • Il metodo è usatissimo e garantito • Funziona a spese di estrazioni a vuoto – In pratica • Si riempie uniformemente il rettangolo verde di punti • Si tengono per buoni solo quelli sotto la curva – Funziona anche per più dimensioni • ...e si allungano i tempi... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 214 La distribuzione gaussiana La distribuzione gaussiana • Se sommiamo variabili distribuite uniformemente otteniamo – Numero di variabili: 1, 2, 3, 4, 10 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 216 120 100 80 60 40 20 0 -0.4 -0.2 0 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 0.2 0.4 217 200 150 100 50 0 -0.4 -0.2 0 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 0.2 0.4 218 200 150 100 50 0 -0.4 -0.2 0 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 0.2 0.4 219 250 200 150 100 50 0 -0.4 -0.2 0 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 0.2 0.4 220 400 300 200 100 0 -0.4 -0.2 0 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 0.2 0.4 221 La distribuzione gaussiana • Si dimostra che si tende ad una distribuzione tipica, “a campana” La distribuzione normale In generale La distribuzione gaussiana Flavio Waldner - Dipt.di Fisica - UDINE - Italy 222 La distribuzione gaussiana • Dimostrazione non immediata – Bisogna lavorare sulle funzioni caratteristiche – Passare al limite (e si tratta di dipendenze funzionali... • Si vede anche che il limite è lo stesso anche se le distribuzioni NON sono uniformi • ...e difatti è MOLTO IMPORTANTE il Flavio Waldner - Dipt.di Fisica - UDINE - Italy 223 La distribuzione gaussiana Teorema del limite centrale Se una variata ha una X ha una distribuzione F X la media di un campione X n su n osservazioni tende ad essere distribuita normalmente al crescere di n Flavio Waldner - Dipt.di Fisica - UDINE - Italy 224 La distribuzione gaussiana • Quindi le Y X k n X n k al crescere di n tendono ad essere distribuite normalmente anche se non lo sono le singole variate X Flavio Waldner - Dipt.di Fisica - UDINE - Italy 225 La distribuzione gaussiana • Noi ci limiteremo alle variate normali • Sono le più utili • Coprono l’assoluta maggioranza dei casi pratici – Quando occorre qualcosa di più si è nei guai • In questo caso bastano due momenti – Media e SD Flavio Waldner - Dipt.di Fisica - UDINE - Italy 226 La distribuzione gaussiana Caso importante “fuori dal coro” i conteggi Seguono la statistica di Poisson Però Quando Regola a spanne 10 usate pure Gauss con Flavio Waldner - Dipt.di Fisica - UDINE - Italy 227 La distribuzione gaussiana • Sotto a questo limite bisogna stare attenti perchè... La distribuzione è asimmetrica Flavio Waldner - Dipt.di Fisica - UDINE - Italy 228 La distribuzione gaussiana • Insomma... TUTTO FINISCE PER ESSERE GAUSSIANO Flavio Waldner - Dipt.di Fisica - UDINE - Italy 229 La distribuzione gaussiana • La funzione di distribuzione 1 G x , e 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 1 x 2 2 2 230 La distribuzione gaussiana • Media 2 • Varianza Flavio Waldner - Dipt.di Fisica - UDINE - Italy 231 La distribuzione gaussiana • Definiremo a partire da una variata normale x – La variata centrata (detta anche scarto) xc x x – La variata ridotta (detta anche scarto ridotto) x x • Vediamo degli esempi grafici Flavio Waldner - Dipt.di Fisica - UDINE - Italy 232 0.4 0.3 0.2 0.1 -2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 4 233 La distribuzione gaussiana • Una proprietà importante: – Le probabilità di stare dentro un certo numero N di SD sono sempre le stesse N P x N 1 erf 2 • Attenzione: la funzione d’errore è (storicamente) definita per una gaussiana non normalizzata... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 234 La distribuzione gaussiana • Definizione erf x 2 x e t 2 dt 2 0 2 e t 2 dt 1 0 e dt 2 t 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 235 La distribuzione gaussiana • In realtà a noi serve 1 2 t2 2 x x e dt erf 2 x Flavio Waldner - Dipt.di Fisica - UDINE - Italy 236 La distribuzione gaussiana 1 P x N 0.317 2 0.0455 N 3 4 5 0.0027 2.7 10 5 6.33 10 7 3 5.73 10 0.573 10 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 6 237 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 238 La distribuzione maxwelliana La distribuzione maxwelliana • Importante per la distribuzione dei moduli delle velocità delle molecole in un gas • Funzione di distribuzione 2 4 x M x V e V V x V 2 • Stavolta non conviene usare la funzione caratteristica... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 240 La distribuzione maxwelliana • Moda • Media • Varianza m V 2 V 1.128 V 3 8 2 2 V 0.227 V 2 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 241 La distribuzione maxwelliana • Standard deviation 0.476 V • Velocità quadratica media v 2 x 2 3 V 1.225V 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 242 La distribuzione maxwelliana • Skewness 1 • Kurtosis 2 2 2 16 15 3 8 3 2 15 16 192 2 3 8 2 0.486 3.108 • Quasi una gaussiana Flavio Waldner - Dipt.di Fisica - UDINE - Italy 243 0.8 0.6 0.4 0.2 1 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 3 4 5 244 La distribuzione del 2 La distribuzione del 2 • La funzione di distribuzione è temibile... 2 F 2 1 2 2 e 2 2 2 1 2 • Funzione caratteristica t 1 2it Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 246 La distribuzione del • Media • Varianza 2 2 2 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 247 La distribuzione del 2 • Una rappresentazione grafica per 2,5,10 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 248 0.5 0.4 0.3 0.2 0.1 5 10 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 15 20 249 Perché il 2? Perché il • Prendiamo N variate • Distribuite normalmente • Indipendenti • La somma N Z , XN X k k k 1 si distribuisce come X1 , 2 2? 2 2 k N Flavio Waldner - Dipt.di Fisica - UDINE - Italy 251 Perché il 2? • La somma dei quadrati degli scarti ridotti ci dice quanto può essere buona una previsione rispetto ai dati osservati • Dobbiamo osservare (sempre in senso stocastico!) Z N • Con una varianza Z 2 2N Flavio Waldner - Dipt.di Fisica - UDINE - Italy 252 Perché il 2? • Che probabilità c’è di osservare un valore di 2 superiore ad un valore trovato? CL 2 F 2 d2 2 • Si chiama livello di confidenza – Un grande 2 ha un basso CL – È improbabile osservarlo – -> qualcosa sta andando male... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 253 Perché il 2? • Ecco cosa succede per N=10 – Funzione CL CL 2 F d 2 2 2 2 1 F d 2 2 0 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 254 1 0.8 0.6 0.4 0.2 5 10 15 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 20 25 30 255 Perché il 2? • C’è solo il 10% di probabilità di trovare un 2 maggiore o uguale a 15 • Se lo si trova si è di fronte ad un evento improbabile • ...se questo deriva da un’ipotesi teorica che abbiamo fatto... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 256 Perché il 2? • Insomma abbiamo un Test di ipotesi Flavio Waldner - Dipt.di Fisica - UDINE - Italy 257 Perché il 2? • ...ma anche se troviamo un 2 troppo piccolo qualcosa potrebbe non andar bene • Non è che abbiamo sbagliato a calcolare le varianze? • ...magari stimandole troppo elevate? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 258 Le distribuzioni bivariate Le distribuzioni bivariate • Sono definite per due variate f x, y dx dy – La situazione adesso è molto più complessa – Il grafico è una superficie f x, y dx dy X x dx C x y x dy Y y dy C y x y dx Flavio Waldner - Dipt.di Fisica - UDINE - Italy 260 Le distribuzioni bivariate • Si definiscono le distribuzioni marginali... X x f x, y dy D • ...e quelle condizionali Cx y x f x, y f x, y dy D Flavio Waldner - Dipt.di Fisica - UDINE - Italy 261 Le distribuzioni bivariate • Se la C x y x non dipende da x allora f x, y X x Y y • ...e le variabili si dicono indipendenti • Tutto simmetrico per la y Flavio Waldner - Dipt.di Fisica - UDINE - Italy 262 Le distribuzioni bivariate • Per ogni valore di x avremo una media y x y f x, y dy D • Plottando questo verso x si ottiene la curva di regressione di y su x • Regressione: da studi di biometria (Galton): la statura dei figli di genitori con statura superiore alla media tende a regredire verso la statura media della razza Flavio Waldner - Dipt.di Fisica - UDINE - Italy 263 Le distribuzioni bivariate • Il caso delle distribuzioni di variate normali indipendenti: 1 X x e 2 x2 2 1 Y y e 2 1 f x, y X x Y y e 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy y2 2 x2 y 2 2 264 Le distribuzioni bivariate • Se le variate non sono indipendenti 1 f x, y e 2 ax2 2bxy cy 2 2 • È sempre possibile riportarsi ad una forma del tipo 2 2 Ax Bx Cy » La curva di regressione di y su x è una retta Flavio Waldner - Dipt.di Fisica - UDINE - Italy 265 Le distribuzioni bivariate • Abbiamo una serie di osservazioni xk , yk • Calcoliamo la somma dei quadrati degli scarti 1 2 S y N k r xk k • Questa è minima per S 1 0 r r N Flavio Waldner - Dipt.di Fisica - UDINE - Italy x y k k k 266 Le distribuzioni bivariate 1 S N y y 2r xy r 2 k r xk 2 k 1 2r xy r 2 x 2 2 S 1 r Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 267 Le distribuzioni bivariate • Questo è il coefficiente di correlazione fra le variate • La stima teorica è xy • Per variabili non ridotte y x x x y Flavio Waldner - Dipt.di Fisica - UDINE - Italy y x y 268 Le distribuzioni bivariate • La varianza di Y su X è data quindi da S 1 2 y x • Le variabili indipendenti sono x x2 • Leggi: 1 2 X x 2 1 Cx y x 2 e 1 1 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 e y x 2 1 2 2 269 Le distribuzioni bivariate • Quindi la legge generale 1 f x, y 2 1 1 2 e 1 x 2 2 xy y 2 2 1 2 1 dipendenza funzionale (correlazione perfetta) 0 indipendenza Flavio Waldner - Dipt.di Fisica - UDINE - Italy 270 Le distribuzioni bivariate • Due esempi di distribuzioni con variate indipendenti e due con variate dipendenti • Nel caso di quelle indipendenti: – Una stella fotografata da un telescopio • Tremolio attorno ad una posizione media » La SD misurata in secondi d’arco, prende il nome di seeing Flavio Waldner - Dipt.di Fisica - UDINE - Italy 271 0.006 20 0.004 0.002 10 0 -20 0 -10 -10 0 10 20 -20 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 272 0.003 0.002 20 0.001 0 0 -20 0 -20 20 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 273 0.2 2 0.1 0 0 -2 0 -2 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 274 0.01 10 0.005 5 0 0 -10 -5 -5 0 5 10 Flavio Waldner - Dipt.di Fisica - UDINE - Italy -10 275 Le distribuzioni bivariate • In generale... 1 1 f x, y 2 x y 1 2 e 1 2 1 2 x x x2 y y 2 y2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 2 x x y y x y 276 La somma delle varianze La somma delle varianze • Supponiamo di avere delle variabili indipendenti Z X Y Z X Y • Ora prendiamo le variate centrate 2 2 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 278 La somma delle varianze • Ora abbiamo 0 E quindi la legge della somma delle varianze per variate indipendenti 2 2 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy Z 2 X 2 Y 2 279 La somma delle varianze Per somme di variate indipendenti le varianze si sommano quadraticamente Flavio Waldner - Dipt.di Fisica - UDINE - Italy 280 La somma delle varianze • Quindi sommare direttamente le standard deviation porta ad una sovrastima della varianza finale • A volte può essere perfino conveniente... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 281 La misura come variata La misura come variata • Una qualunque misura è affetta da una serie di incertezze • Se ripetuta non dà gli stessi risultati • Molte (ed in numero sempre maggiore) di previsioni teoriche non possono essere fatte con mezzi formali • Vengono fatte con mezzi o numerici o statistici • MonteCarli Flavio Waldner - Dipt.di Fisica - UDINE - Italy 283 La misura come variata In definitiva il confronto fra teoria ed esperimento è sempre probabilistico Flavio Waldner - Dipt.di Fisica - UDINE - Italy 284 La misura come variata • Il primo passo è che una misura è sempre pensata come una variata – E di solito normale • Questo vale sia per misure “tipiche” – Il diametro di un chiodo • ... sia per misure di tipo statistico – Il peso medio di un pollo di un allevamento • ...sia per misure complesse – Densitometria ossea Flavio Waldner - Dipt.di Fisica - UDINE - Italy 285 La misura come variata Di norma si suppone che • La misura di una quantità singola sia una variata normale • Con valore atteso • Con SD • I momenti superiori sono (evidentemente) noti • La SD sia piccola rispetto al valore atteso Flavio Waldner - Dipt.di Fisica - UDINE - Italy 286 La misura come variata SE QUESTE IPOTESI NON FUNZIONANO OCCORRE AGIRE DI CONSEGUENZA E CAMBIARE IL FORMALISMO DI QUANTO DIREMO Flavio Waldner - Dipt.di Fisica - UDINE - Italy 287 Medie ed errori Medie ed errori • Risultato di una misura: una variata normale • Momenti: – Primo: -> la media – Secondo: -> la varianza • Si fornisce la deviazione standard Flavio Waldner - Dipt.di Fisica - UDINE - Italy 289 Medie ed errori • Nell’ipotesi normale è sufficiente fornire i primi due momenti • In realtà si fornisce per convenzione media e SD • Il risultato di una misura viene espresso in generale come Flavio Waldner - Dipt.di Fisica - UDINE - Italy 290 Medie ed errori • Due tipi di errore – Assoluto – Relativo • Di solito misurato in % o in ppm Flavio Waldner - Dipt.di Fisica - UDINE - Italy 291 Medie ed errori • Quasi sempre è espresso con una o al massimo due cifre significative • Non si ritiene utile andare più in là • Esempio: – Numero di Avogadro 6.022 141 99 (47) 10 mol 23 6.022 141 99 4.7 10 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 7 1 10 23 mol 1 292 Medie ed errori • La SD ha sempre il significato statistico visto nella distribuzione normale – Fuori di 1 SD -> 33 % – Fuori di 2 SD -> 4 % – Fuori di 3 SD -> 0,3 % = 3000 ppm • Cosiddetto errore massimo Flavio Waldner - Dipt.di Fisica - UDINE - Italy 293 La misura diretta La misura diretta Il caso più semplice • Misuriamo il lato di un cubo con un calibro – O stimiamo l’errore in base alla lettura – O ripetiamo N volte la misura • Otteniamo un vettore X x1 , x1 , Flavio Waldner - Dipt.di Fisica - UDINE - Italy , xN 295 La misura diretta • Stima del valore più probabile 1 x N x k k • Questo è il valore che si fornisce come risultato della misura • MA: anche questa è una variata! Flavio Waldner - Dipt.di Fisica - UDINE - Italy 296 La misura diretta • Le medie hanno dispersione minore x 1 N X k X 2 k N • Attenzione: ridurre la SD costa caro! – Per ridurre la SD di un fattore 10 occorre aumentare il campione di un fattore 100! Flavio Waldner - Dipt.di Fisica - UDINE - Italy 297 La misura diretta • ...e le fluttuazioni? • Si fa l’ipotesi (ragionevole) che la caduta in un bin rappresenti un evento raro – Statistica di Poisson – Quindi in un bin abbiamo Nbin Nbin Flavio Waldner - Dipt.di Fisica - UDINE - Italy 298 La misura diretta • Errore relativo... N bin N bin N bin N bin 1 N bin • ...ancora la dipendenza dalla radice! • A spanne: aumentare di 10 volte la statistica riduce l’errore di un fattore 3 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 299 La misura diretta Un esempio pratico: • Prendiamo un campione casuale di 1000 casi, da cui traiamo una certa conclusione. Che fluttuazioni ci possiamo aspettare? 1000 3% 1000 • ...e con 100 casi 100 10 % 100 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 300 La misura diretta • ...e se volessimo ottenere fluttuazioni del 3 per mille? Dovremmo salire a 100 000 casi! Flavio Waldner - Dipt.di Fisica - UDINE - Italy 301 La misura diretta Insomma: attenti ai sondaggi ed ai risultati di medicamenti miracolosi provati su ben 127 casi... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 302 La misura diretta • E se non abbiamo a disposizione molte misure? • Si stima l’errore. CONVENZIONI ACCETTATE 1. Per strumenti a indicatore: metà della divisione più piccola 2. Per strumenti digitali: metà dell’ultima cifra significativa Flavio Waldner - Dipt.di Fisica - UDINE - Italy 303 La misura di grandezze funzioni di altre La misura di grandezze funzioni di altre Caso tipico • Misuriamo il diametro di una sfera • Determiniamo l’errore di misura • Calcoliamo il volume della sfera 1 3 V D 6 • Come facciamo a calcolare l’errore sul volume? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 305 La propagazione degli errori La propagazione degli errori • Riprendiamo la formula 1 3 V D 6 • Nell’ipotesi normale e di errori piccoli 1 2 2 dV 3D dD D dD 6 2 V 2 D D 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 307 La propagazione degli errori • Errore relativo • Più in generale D 2 V 2 D D 3 3 V D D 6 Y F X Y Flavio Waldner - Dipt.di Fisica - UDINE - Italy dF X dX 308 La propagazione degli errori • E se le variabili sono in numero maggiore? Z F X ,Y • Dovremo tener conto – Del teorema del differenziale totale – Dell’additività quadratica delle varianze Flavio Waldner - Dipt.di Fisica - UDINE - Italy 309 La propagazione degli errori • In totale... F F Z X Y X Y 2 2 • E l’errore relativo diviene Z 1 F 1 F X Y Z F X F Y 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 310 La derivata logaritmica La derivata logaritmica • Nel caso di una variabile... 1 3 V D 6 1 3 ln V ln D 6 1 ln V ln 3ln D 6 dV dD V D 3 3 V D V D Flavio Waldner - Dipt.di Fisica - UDINE - Italy 312 La derivata logaritmica • Una comoda scorciatoia – Usabile per errori piccoli – Utile se le funzioni sono di tipo algebrico – Facile da memorizzare • … se uno non ha molte pretese … Flavio Waldner - Dipt.di Fisica - UDINE - Italy 313 La derivata logaritmica • Ecco un esempio strambo 3 X Y Z 1.5 W 1 ln Z 3ln X ln Y 1.5ln W 2 Z X 1 Y W 3 1.5 Z X 2 Y W Flavio Waldner - Dipt.di Fisica - UDINE - Italy 314 La derivata logaritmica Attenzione: Non è rispettata l’additività quadratica delle varianze Si ottiene una sovrastima dell’errore complessivo Flavio Waldner - Dipt.di Fisica - UDINE - Italy 315 La misura statistica La misura statistica • Un problema: come misuriamo l’energia (o il momento) di un fascio ad es. Di elettroni? – Non c’è un’energia unica – Possiamo far passare gli elettroni in campo magnetico e poi misurare l’intensità alle varie deflessioni – Possiamo usare campi magnetici ed elettrici incrociati – ... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 317 La misura statistica • Cosa succede se gli elettroni sono pochi? • Dobbiamo accumulare statistica – Misurare l’energia di uno alla volta – Accumulare i dati – Riportare le misure in un istogramma delle frequenze • A questo punto abbiamo dei conteggi ad intervalli fissati » In conteggi sono interi (numeri esatti...) Flavio Waldner - Dipt.di Fisica - UDINE - Italy 318 La misura statistica • Prenderemo – Come valori della x i centri degli intervalli – Come valori della y i conteggi – Come errori la loro radice quadrata – Statistica di Poisson • Abbiamo l’approssimazione di una funzione Flavio Waldner - Dipt.di Fisica - UDINE - Italy 319 La misura statistica • Da questo momento in poi le misure statistiche si trattano come le altre Attenzione a pensare che il numero dei casi sia “esatto” – Cosa comune in economia e medicina... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 320 La misura statistica • Aver osservato 100 casi vuol dire 100 100 100 10 N 10 10% N 100 – Altroché valore esatto... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 321 IL problema IL problema • Abbiamo dei dati sperimentali • DOBBIAMO avere almeno un modello teorico • Il(-i) modell0(-i) dipende(-ono) da alcuni parametri incogniti Flavio Waldner - Dipt.di Fisica - UDINE - Italy 323 IL problema Come facciamo a determinare le migliori stime dei parametri in questione? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 324 IL problema Come facciamo a determinare gli errori sulle stime dei suddetti parametri? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 325 IL problema Come facciamo a decidere se un modello è accettabile? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 326 IL problema Come facciamo a decidere qual’è il modello “migliore”? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 327 IL problema Come facciamo ad escludere un modello? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 328 La stima parametrica La stima parametrica • Un esempio: • A vari xk si misurano dei valori y k – Come possiamo determinare la migliore stima dei coefficienti della retta y mx q che meglio approssima i dati? – Come possiamo determinare gli errori sui coefficienti della retta? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 330 La stima parametrica Scegliamo ora per l’approssimazione una parabola, e ripetiamo il processo – Come possiamo decidere quale è il modello migliore (retta o parabola)? – È possibile determinare la probabilità che sia verificato il modello? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 331 La stima parametrica • Il primo problema si chiama stima parametrica • Il secondo problema si chiama test di ipotesi Flavio Waldner - Dipt.di Fisica - UDINE - Italy 332 La stima parametrica • Supponiamo ora di misurare distanze ed angoli fra tre vette di montagne. – Come possiamo determinare le migliori stime di distanze ed angoli in modo che il triangolo chiuda? – La somma degli angoli interni dev’essere 180° – Vera la geometria euclidea – Come possiamo decidere se vale o no la geometria euclidea? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 333 La stima parametrica • Il problema si chiama stima parametrica vincolata • Il secondo problema è un’estensione del test di ipotesi ed è il test di una teoria – Nessuna differenza concettuale, solo una maggiore “importanza” Flavio Waldner - Dipt.di Fisica - UDINE - Italy 334 La Maximum Likelihood La Maximum Likelihood Esempio della retta • Se conosciamo la legge di distribuzione intorno a y, calcoliamo la probabilità di ottenere le y osservate attorno al valore previsto – Se sono indipendenti è solo il prodotto • Otteniamo una funzione L x, y m, q Flavio Waldner - Dipt.di Fisica - UDINE - Italy 336 La Maximum Likelihood • Che di solito è complicatissima • Esprime la probabilità di trovare i valori osservati nell’ipotesi del nostro modello • Funzione delle osservazioni e dei parametri incogniti Flavio Waldner - Dipt.di Fisica - UDINE - Italy 337 La Maximum Likelihood • Cercheremo i parametri in modo da renderla massima • Siccome è un prodotto si semplifica prendendo il suo ln • Le derivate di un prodotto... ln L x, y m, q • ...ed i prodotti divengono somme! Flavio Waldner - Dipt.di Fisica - UDINE - Italy 338 La Maximum Likelihood • Di questa funzione si deve cercare il massimo – Se poi ci sono correlazioni, apriti Cielo... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 339 Questo è l’unico metodo statistico di stima parametrica Flavio Waldner - Dipt.di Fisica - UDINE - Italy 340 La Maximum Likelihood • Il calcolo delle condizioni di massimo va fatto con metodi numerici • In giro ci sono ottimi packages • Un consiglio USATE ALMENO DUE PACKAGES DIVERSI! Flavio Waldner - Dipt.di Fisica - UDINE - Italy 341 Il minimo del 2 Il minimo del 2 • Supponiamo che le osservazioni siano indipendenti e normali • La probabilità diviene il prodotto di tante 2 gaussiane P exp Flavio Waldner - Dipt.di Fisica - UDINE - Italy x 2 343 Il minimo del 2 • Ed il logaritmo della funzione di likelihood diviene una somma... x 2 2 • ...che dev’essere massima Flavio Waldner - Dipt.di Fisica - UDINE - Italy 344 Il minimo del 2 • ...e quindi x X 2 k th , k 2 2 k k dovrà essere minimo Flavio Waldner - Dipt.di Fisica - UDINE - Italy 345 Il minimo del 2 La stima dei parametri va in cerca dei valori dei parametri che rendono minima la somma dei quadrati degli scarti ridotti rispetto ai valori previsti dal modello scelto Flavio Waldner - Dipt.di Fisica - UDINE - Italy 346 Il minimo del 2 • Come si scrive una funzione di 2? • Anzitutto occorre scrivere la funzione X th • Questa è il nostro modello teorico • Dipende – dalle variabili che osserviamo – da alcuni parametri che vogliamo determinare • Poi occorre determinare gli errori sulle xk • Problema non facile – Da esso dipende non tanto la bontà della risposta, quanto il valore del minimo Flavio Waldner - Dipt.di Fisica - UDINE - Italy 347 Il minimo del 2 • Un caso eclatante – Il fit geometrico di tracce di camere a bolle in campo magnetico (anni ’60 al CERN ed altrove) – Supposto un modello con archi di cerchio • In realtà erano archi di spirale che si stringeva – Ne derivava una sovrastima degli errori sui parametri – Si traduceva in fit eccessivamente ottimistici Flavio Waldner - Dipt.di Fisica - UDINE - Italy 348 Il minimo del 2 • In generale la previsione è funzione di certi parametri X th X th • Quindi x X k th , k 2 2 k k Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 349 Il minimo del 2 • Per trovare il minimo si possono seguire due strade • Derivare rispetto ai parametri 2 • Si ottiene un sistema di equazioni • Sistema normale Flavio Waldner - Dipt.di Fisica - UDINE - Italy 0 1 2 0 K 350 Il minimo del 2 • Se il sistema è lineare si risolve nei parametri • Il problema è semplice ed è trattato in tutti i testi di statistica • Peccato che tutto ciò accada raramente: – Regressione lineare o quadratica: retta, parabola,... – In genere con funzioni lineari nei parametri incogniti Flavio Waldner - Dipt.di Fisica - UDINE - Italy 351 Il minimo del 2 Un esempio: • Dato un set di coppie x, y nel piano qual’è la parabola che le approssima meglio? – Problema lineare 2 a, b, c y ax bx c 2 yk ax bxk c k Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 k 2 2 k 352 Il minimo del 2 2 y a x b x c k k k 2 2 xk 0 2 a k k 2 yk xk2 axk4 bxk3 cxk2 0 2 k k Flavio Waldner - Dipt.di Fisica - UDINE - Italy 353 Il minimo del 2 k 2 k k 2 k yx a k 4 k 2 k x b k 3 k 2 k x c k 2 k 2 k x 0 x x x yx a b c k k k k 4 k 2 k 3 k 2 k 2 k 2 k 2 k k 2 k • Ed analoghe per gli altri due coefficienti della parabola Flavio Waldner - Dipt.di Fisica - UDINE - Italy 354 Il minimo del 2 • E se volessimo un cerchio? • Problema comune: particelle in campi magnetici disegnano cerchi, e non parabole... • Siamo nei guai: • Dobbiamo determinare coordinate del centro e raggio • Di nuovo tre parametri • Solo che... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 355 Il minimo del 2 x xc y yc 2 2 R 2 x 2 xxc x y 2 yyc y R 0 2 2 c 2 2 c 2 2 2 y 2 yyc x xc yc R 0 2 2 y yc R x xc 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 356 Il minimo del 2 • ...ed ora... 2 xc , yc , R y y R2 x x 2 k c c k Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 k2 357 Il minimo del 2 • Anche ora potete calcolare le derivate... • Auguri... • ...ma come si risolve poi il sistema normale NON lo trovate sui testi di statistica... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 358 Il minimo del 2 • Se il sistema non è lineare si può provare a linearizzarlo 2 2 1 k k k ,in k 1! k Flavio Waldner - Dipt.di Fisica - UDINE - Italy 2 k 0 k 359 Il minimo del 2 • Quindi 2 2 2 2 k 0 2 k k k ,in k k • Si calcolano le correzioni e si pone k ,in k ,in k Flavio Waldner - Dipt.di Fisica - UDINE - Italy 360 Il minimo del 2 – Non si tratta di un problema facile – Le derivate possono diventare facilmente formalmente molto complesse – Si tratta di programmi non semplici da scrivere e da gestire – Occorre scrivere dei programmi diversi per ogni problema che si affronta Flavio Waldner - Dipt.di Fisica - UDINE - Italy 361 Il minimo del 2 • Molti problemi pratici: – Abbiamo dei ragionevoli valori di prima approssimazione? – Il metodo converge ? – Dopo quante iterazioni? – Con quale precisione? – Quando lo fermiamo? – Cosa facciamo se diverge? » Se le correzioni aumentano invece di diminuire Flavio Waldner - Dipt.di Fisica - UDINE - Italy 362 Il minimo del 2 Ultimo sistema • Minimizzare direttamente la funzione 2 min xc , yc , R • Packages appositi • MINFUN • MINUIT • MATHEMATICA • MatLab • MathCad Flavio Waldner - Dipt.di Fisica - UDINE - Italy 363 Il minimo del 2 • Strategie tipiche (MINUIT) – Si parte su una catena di montagne – Si esplorano gli incrementi – Derivate direzionali – Si sceglie quello più negativo – Gradiente – Si segue la direzione del gradiente – Ad un certo punto l’incremento diviene positivo Flavio Waldner - Dipt.di Fisica - UDINE - Italy 364 Il minimo del 2 • Si esplora intorno – Se è positivo dappertutto si è in fondo ad uno stagno – Se no si riprende • Come si fa a sapere che lo stagno è il più profondo di tutti? • In due variabili si può visualizzare, ma in più di due? • Problemi, problemi... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 365 Il minimo del 2 Attenzione: • Se trovate un minimo, chi vi dice che sia quello vero? – Siete arrivati davvero nella valle più profonda di tutte? – Potete arrangiarvi se siete in 2 variabili con la grafica – Se no... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 366 Il minimo del 2 NESSUNA SOLUZIONE AL PROBLEMA DEI MINIMI LOCALI SOLO PAZIENZA ED ATTENZIONE Flavio Waldner - Dipt.di Fisica - UDINE - Italy 367 Il test di ipotesi Il test di ipotesi • Torniamo al caso della retta – Una serie di punti, riportati con le loro barre d’errore • Ecco un esempio ed un possibile fit – Fatto ad occhio... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 369 5 4.5 4 3.5 3 2.5 1.5 2 2.5 3 3.5 1.5 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 370 Il test di ipotesi • Calcoliamo il 2 k Yk m X k q 2 2 k • Ci sono 6 punti indipendenti, 2 parametri • 4 equazioni in più 4 gradi di libertà Flavio Waldner - Dipt.di Fisica - UDINE - Italy 371 Il test di ipotesi • Ci aspettiamo quindi 4 4 42 2 – Attenzione alla skewness di 2! 2 • Supponiamo di aver misurato C Flavio Waldner - Dipt.di Fisica - UDINE - Italy 372 2 La probabilità di osservare un uguale o maggiore di C è assunta come livello di confidenza dell’ipotesi “i punti sperimentali sono stati presi da un campione di punti che in realtà stanno su una retta, coi coefficienti da noi calcolati” Flavio Waldner - Dipt.di Fisica - UDINE - Italy 373 Il test di ipotesi • ...ed ecco la curva per 4 gradi di libertà – Ascissa: valore del 2 – Ordinata: probabilità di osservare un 2 maggiore o uguale a quello dell’ascissa Flavio Waldner - Dipt.di Fisica - UDINE - Italy 374 Il test di ipotesi 1 0.8 0.6 0.4 0.2 5 10 15 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 20 25 30 375 Il test di ipotesi • Però potremmo anche fare l’ipotesi che i punti nel nostro modello dovrebbero stare su una parabola 2 k Yk a X b X k c 2 k 2 2 k • E stavolta avremmo 3 gradi di libertà Flavio Waldner - Dipt.di Fisica - UDINE - Italy 376 Il test di ipotesi Un problema Flavio Waldner - Dipt.di Fisica - UDINE - Italy 377 Il test di ipotesi • Aumentando il numero dei parametri il CL migliora • Se usiamo una curva di 5° grado questa passa per tutti e 6 i punti – Il 2 diviene 0! » CL=100 %! • Vuol dire forse che questa ipotesi è la migliore? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 378 Il test di ipotesi NO! Flavio Waldner - Dipt.di Fisica - UDINE - Italy 379 Il test di ipotesi Vuol dire solo che noi non conosciamo il nostro mestiere... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 380 Il test di ipotesi • Un dubbio: ma allora come facciamo a distinguere fra – una teoria che predice una retta – (Prof.Tizio) – Una teoria che predice una curva di 5° grado? – (Prof.Caio) Risposta: Flavio Waldner - Dipt.di Fisica - UDINE - Italy 381 Il test di ipotesi NON CON QUESTI DATI • Ne occorrono di più e con errori più piccoli • Quindi più misure, e più precise ed accurate Flavio Waldner - Dipt.di Fisica - UDINE - Italy 382 Il test di ipotesi • Un panico: ma allora la scelta, anche nella Scienza Esatta, è in certo modo arbitraria? Risposta: Flavio Waldner - Dipt.di Fisica - UDINE - Italy 383 Il test di ipotesi SÌ • Scienza e Tecnologia non hanno mai preteso di dare Verità Ideologiche, Religiose, Superstiziose o alla Vanna Marchi – È per questo che tanti ne hanno paura... • Si procede stringendo il cerchio – Confrontandosi, e con molto buon senso Flavio Waldner - Dipt.di Fisica - UDINE - Italy 384 Il test di ipotesi • Parametro importante, e molto usato il 2 diviso per il numero di gradi di libertà 2 • Plot: curve vs parametrizzate su diversi livelli di confidenza • Le trovate nella letteratura Flavio Waldner - Dipt.di Fisica - UDINE - Italy 385 Il test di ipotesi • Per grandi N (>10 è un buon valore) 1 CL 2 2 t2 2 e dt y y 2 1 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 386 Il test di ipotesi • Quindi esplicitamente 1 1 2 2 CL 1 erf 2 2 Flavio Waldner - Dipt.di Fisica - UDINE - Italy 387 Il test di ipotesi • Le approssimazioni, tabulazioni, funzioni, tabelle, routines si trovano ormai dappertutto » Librerie IMSL (IBM) » EXCEL (MicroSoft) » ... • Importante è che sappiate come usarle e cosa vogliono dire... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 388 Il test di ipotesi Approfondiamo l’argomento Flavio Waldner - Dipt.di Fisica - UDINE - Italy 389 Il test di ipotesi Un altro problema Flavio Waldner - Dipt.di Fisica - UDINE - Italy 390 Il test di ipotesi • Ho dei dati e faccio il fit con una retta • Il 2 è così così • Adesso provo una parabola • Il 2 migliora (diviene più piccolo) • Poi provo una cubica • ...va ancora meglio DOVE MI FERMO? Flavio Waldner - Dipt.di Fisica - UDINE - Italy 391 Il test di ipotesi CERTO È CHE SE HO 10 PUNTI UNA CURVA DI IX GRADO RENDE IL 2 PROPRIO 0... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 392 Il test di ipotesi PROCEDURA COMUNEMENTE ACCETTATA • Si fa un grafico con – In ascissa il numero di gradi di libertà del fit – In ordinata il valore del corrispondente 2 • Ad un certo punto si nota un brusco calo – Uno scalino Flavio Waldner - Dipt.di Fisica - UDINE - Italy 393 Il test di ipotesi • Si tiene per buono il fit allo scalino – Poi aumentando i parametri il 2 continua a calare lentamente – Si considera questo calo poco significativo Flavio Waldner - Dipt.di Fisica - UDINE - Italy 394 Il test di ipotesi • Tipico il caso per i polinomi – Scarso livello di confidenza per una retta – Un po’ meglio con una parabola – Buono con una cubica – Meglio con una quartica • Il risultato è che questi dati danno per buona l’ipotesi della cubica Flavio Waldner - Dipt.di Fisica - UDINE - Italy 395 Il test di ipotesi Un panico Flavio Waldner - Dipt.di Fisica - UDINE - Italy 396 Il test di ipotesi • E se il 2 cala, ma non c’è scalino? • Risposta: niente da fare – O meglio: il tipo di curva da noi scelta non funziona – Esempio tipico: dati su un esponenziale, fittati con polinomi Flavio Waldner - Dipt.di Fisica - UDINE - Italy 397 Il test di ipotesi • Anche questo è un risultato Il modello teorico proposto non va, Ed occorre cercarne un altro » Naturalmente bisogna essere ben sicuri dei dati sperimentali e degli errori ad essi associati » ... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 398 I vincoli sui parametri I vincoli sui parametri • Ci possono essere delle condizioni extra sui parametri 1 1 , , K 0 , , 0 K M 1 Flavio Waldner - Dipt.di Fisica - UDINE - Italy M K 400 I vincoli sui parametri • Esempio (un po’ banale...): – Misuriamo tre angoli – Ci chiediamo la migliore stima con la condizione che la somma dei valori finali dia 180° Flavio Waldner - Dipt.di Fisica - UDINE - Italy 401 I vincoli sui parametri Ci sono varie strade Flavio Waldner - Dipt.di Fisica - UDINE - Italy 402 I vincoli sui parametri • Una è quella di ridursi a soli parametri indipendenti F , , 180 F , ,180 • Può non essere facile esplicitare un parametro » E se sono parecchi, con equazioni non lineari... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 403 I vincoli sui parametri Provare per credere • Passate da F x, y 0 y f x sin x y 0.5 0 • Facile in linea di principio, ma nei casi pratici basta un radicale – Di solito questa strada non è quasi mai usata Flavio Waldner - Dipt.di Fisica - UDINE - Italy 404 I vincoli sui parametri • L’altra strada è quella dei moltiplicatori di Lagrange • Si minimizza 11 2 M M rispetto sia alle sia alle Flavio Waldner - Dipt.di Fisica - UDINE - Italy 405 I vincoli sui parametri • Alle derivate prime si ottengono delle equazioni 2 k 0 0 • Automaticamente soddisfatte Flavio Waldner - Dipt.di Fisica - UDINE - Italy 406 I vincoli sui parametri • Il problema si riduce a minimizzare una funzione più complessa, con più parametri j k 2 j k k j • Di questi i moltiplicatori non entrano nelle analisi successive • Problema sempre serio: evitare i minimi locali • La cosa peggiora all’aumentare del numero di dimensioni... Flavio Waldner - Dipt.di Fisica - UDINE - Italy 407