1 Sintesi conclusiva su errori e loro propagazione
Una volta termina la trattazione degli errori casuali è opportuno, prima di affrontare la
spiegazione delle esperienze, fare una sintesi riassuntiva, che ripercorra alcune informazioni fornite
a lezione e nelle varie note, e fissi dei criteri pratici per affrontare l’analisi dei dati sperimentali.
Misura diretta di una grandezza fisica.
La misura diretta di una grandezza fisica X è assegnare un numero x, che fornisca un rapporto
rispetto alla grandezza omogenea fondamentale (campione di misura con relativa unità) ed un errore
δx, che indichi l’errore su tale rapporto.
L’operazione di misura
Si è parlato di
• grado di precisione δx/⏐x⏐, anche detto errore relativo.
Se presentato come δx/⏐x⏐*100, errore percentuale.
Le incertezze su una misura si possono catalogare come segue :
• Incertezze (errori) sistematiche,
per le quali si possono distingure due sottocategorie:
o Incertezze sistematiche di accuratezza (ηx),
la cui probabilità di verificarsi con un dato segno è maggiore di quella di
verificarsi con il segno opposto. L’origine di tali incertezze è varia: uso non
corretto di leggi o metodi, strumenti non tarati bene, operatore, condizioni
ambientali, utilizzo improprio degli strumenti, ecc. ...
o Incertezze (errori) sistematiche a priori o strumentali (εx),
dette anche di sensibilità di misura, sono dovute alla risoluzione del dispositivo
di misura utilizzato.
• Incertezze (errori) casuali (σx),
ogni valore dell’incertezza ha pari probabilità si manifestarsi in eccesso (segno
positvo) o in difetto (segno negatico) sulla misura.
Tali incertezze sono dovute alle non prevedibili interazioni del sistema con
l’ambiente, anche all’operatore ecc. . Non sono facili da eliminare ma possono essere
trattati statisticamente.
Gli errori casuali si individuano facilmente, in quanto in misure ripetute di una stessa grandezza
si osservano valori misurati diversi per ogni misura.
Gli errori di accuratezza ηx sono di difficile individuazione, e possono essere corretti per
confronto con uno strumento calibrato (tarato) o mediante una procedura opportuna di calibrazione
(taratura).
Si è espresso in modo formale quanto indicato con il disegno del tiro a segno nel capitolo 4 a
pagina 97 del Taylor per l’accuratezza e la precisione:
•
Accuratezza =
•
Precisione =
|
|
Si faccia attenzione alla differenza tra grado di precisione, riferito al valore della misura, utile
per il confronto tra misure diverse, rispetto alla precisione che invece riguarda il metodo di misura e
la strumentazione usata.
L’errore assoluto totale sarà dato dal contributo di tutti tipi di errore, che essendo indipendenti
tra loro si sommano in quadratura:
2 Si osservi che gli errori hanno un significato diverso ovvero:
•
errori sistematici ηx: assumiamo che il nostro risultato sia spostato (verso
valori maggiori o minori) di ηx, e ci aspettiamo che tutte le nostre misure (100%) siano
spostate in modo omogeneo.
•
errori a priori, strumentale, di sensibilità εx: è un errore massimo a priori,
ovvero tutti i nostri risultati (100% dei dati ) sono compresi nel intervallo [x- εx; x + εx]
•
errori casuali σx : si fornisce l’intervallo entro il quale abbiamo la fiducia che
si trovino il 68% dei nostri dati nell’intervallo [x- σx; x + σx].
Inoltre possiamo fornire anche la fiducia (68%) entro cui si troverebbe qualsiasi
valore medio misurato nell’intervallo compreso tra più e meno la deviazione standard
della media .
Si deve cercare in tutti i modi di eliminare errori sistematici del tipo ηx, mediante il controllo
della taratura degli strumenti, o una calibrazione della strumentazione.
Fatto ciò si affronta il problema dei solo errori casuali e di sensibilità di lettura.
Assumiamo di non avere errori sistematici del tipo ηx e quindi di avere solo errori casuali e di
sensibilità di lettura
anche nel caso di massima accuratezza comunque non si hanno misure prive di errore, per
giunta anche se σx fosse pari a 0, saremmo limitati comunque dalla sensibilità di misura εx ≠ 0.
Se ripetiamo una misura ed otteniamo sempre lo stesso risultato siamo nel caso in cui
• εx>> σx:
la nostra sensibilità è bassa e quindi non osserviamo le fluttuazioni statistiche.
Nel caso in cui invece osserviamo per ogni misura ripetuta dei valori diversi, siamo nelle
condizioni
• εx<< σx:
in questo caso possiamo utilizzare la statistica per la stima degli errori della misurazione.
Si dovrebbero utilizzare strumenti sufficientemente sensibili per osservare le fluttuazioni
statiche.
Si deve precisare una cosa spesso per alcuni strumenti la casa costruttrice fornisce
l’accuratezza anche come + un determinato valore, e quindi si può sommare in quadratura.
Ci sono anche strumenti in cui l’accuratezza varia con le condizioni ambientali, e/o
strumenti la cui accuratezza dipende anche dal valore misurato.
Si può calibrare lo strumento con un altro o utilizzare una tecnica opportuna di calibrazione
che permette di individuare precisamente l’errore ed il suo segno.
In questo caso per non perdere l’informazione risulta più opportuno fornire la misura con
l’errore
separato da quello ci calibrazione
Per evidenziare meglio che l’errore è stato stimato con la calibrazione o taratura, si è
aggiunto al pedice “cal”.
Nella misura diretta la distinzione tra gli errori è semplice e diretta, e si individua facilmente
quali sono dominanti, percui si possono trascurare gli altri.
Ma come ci si deve comportare quando è necessario combinare, nella propagazione degli
errori, pero ottenere la misura indiretta di una grandezza g funzione di altre grandezze x, y, z
ecc., misurate direttamente.
Per affrontare questo argomento è necessario fare appello ad un teorema fondamentale:
3 Teorema del limite centrale: una combinazione lineare di g=a1·x+ a2·y + a3·z + …, di
variabili aleatorie indipendenti x, y, z, …, ciascuna avente legge di distribuzione qualsiasi, ma con
valori aspettati comparabili e varianze finite dello stesso ordine di grandezza, all’aumentare del
numero di variabili aleatorie tende alla distribuzione normale con valore aspettato G e varianza σ
date da: G= a1·X+ a2·Y + a3·Z + …. e σ2G= a21· σ2x+ a2·σ2y + a3·σ2z + …distribuzione dove X, Y, Z,
… sono i valori di aspettazione delle variabili x, y, z … e σ2x, σ2y, σ2z, … sono le varianza rispettive.
Per accettare questo teorema lo si utilizza per ricavare la varianza della media campionaria, già
ottenuta in altro modo.
Si supponga di avere M studenti che eseguano della stessa grandezza x con gli stessi strumenti
un campione elevato di N misure. Indichiamo con xji la i-esima misura del j-esimo studente e con
la media ottenuta dallo studente j-esimo.
Questo teorema afferma, che anche se i campioni di misure dei vari studenti seguissero
distribuzioni qualsiasi, le medie delle M serie di misure sarebbero distribuite normalmente
intorno alla media delle medie ; quest’ultima quantità dato l’elevato numero di misure N·M
presumiamo sia una misura più precisa del valore atteso X e sicuramente gaussiana.
Per mostrare questo supponiamo che sia sempre lo stesso studente j-esimo che ripete le sue
osservazioni, percui il pedice j individua ora la serie di N misure tratti dalla stessa popolazione, in
genere la prima misura xj1, la seconda xj2, ecc., nei diversi campioni j non avranno lo stesso valore.
Quindi la media dalla j-esima serie
1
1
1
1
…
1
può essere considerata una combinazione lineare di variabili aleatorie con coefficienti tutti
uguali a1= a2 = a3= …= 1/N. Dato che le medie riguardano la stessa grandezza, ci aspettiamo che
tendano allo stesso valore atteso X e che abbiamo anche la stessa deviazione standard σ.
Il teorema del limite centrale afferma che il valore atteso è dato da
1
1
1
1
…
quindi il teorema conferma quanto già derivato in altro modo.
Per la varianza il teorema afferma che:
1
1
1
1
…
anche per la varianza dal teorema si ottiene quanto già ricavato a suo tempo:
√
ovvero la deviazione standard della media.
Per il corso di laboratorio del primo anno riteniamo sufficiente aver ottenuto mediante l’utilizzo
del teorema quanto ricavato in altro modo per accettare tale teorema.
Ricordiamo che, dato che non sono noti i valori veri X e σ, possiamo solo fornire delle stime con
la media e la deviazione standard del campione.
Si noti che è illusorio pensare di ridurre aumentando in modo indefinito N, non sarà
possibile mantenere inalterate le condizione sperimentali ed è inevitabile introdurre errori
sistematici, si pensi al logorio per usura della strumentazione. Su questo ritorneremo più avanti nel
corso di questo documento.
Ripercorriamo le formule di propagazione degli errori con il supporto di questo teorema.
La misura indiretta di una grandezza g, funzione di altre grandezze misurate direttamente x, y,
z ... .
Si è osservato che, se x, y, z ... sono grandezze affette solo da errori statistici e sono
indipendenti, per la propagazione degli errori si ha:
4 2
2
2
…. (equ.1)
Quindi la stima della deviazione standard definisce un intervallo di confidenza gaussiano solo se
tutte le variabili sono gaussiane. Quindi g risulterà anch’essa gaussiana.
Nel caso di errori totali, per variabili che non siano gaussiane, finora si è segnalato che se le
grandezze misurate direttamente sono tra loro indipendenti si può utilizzare la relazione:
2
2
2
… . equ. 2 Le equazioni 1 e 2 sono simili, tranne che nella 1 sono errori statistici nella 2 sono invece errori
totali. Ovviamente per errori strumentali e/o combinazione con tra errori diversi.
Nel caso in cui non si sia sicuri del fatto che le grandezze siano scorrelate, si utilizza la
propagazione degli errori in somma lineare sia per errori statistici σ sia per errori totali δ:,
riportiamo di seguito la formula per gli errori totali, sostituendo alle δ le rispettivi σ si ha la
formula per variabili casuali ma correlate tra loro:
. equ. 3 Si è osservato che questo risulta un limite superiore per l’errore.
È opportuno utilizzare tali formule, quando le grandezze sono correlate in modo complicato.
Il valore assoluto delle derivate garantisce che l’effetto della propagazione venga sempre preso
nel modo più sfavorevole, ovvero corrispondente ad un incremento positivo dell’errore di misura in
ogni caso.
Si considerino ora le incertezze strumentali (risoluzione) alle quali si attribuisce la densità
uniforme (vedi es. 5.9).
Nel caso che le grandezze non sono correlate si è riportato la somma in quadratura. Ma in questo
caso bisogna fare una considerazione, si è visto che nel caso di una densità di probabilità uniforme,
possiamo comunque definire una varianza che risulta per il caso di immediata comprensione
relativo all’errore di sensibilità di lettura:
√3
Su alcuni testi si riporta la risoluzione Δ, che risulta quindi 2· ε. percui spesso si trova:
∆
√12
Ovviamente se si hanno più variabili indipendenti affette da errori per le quali si assume una
densità uniforme si può fornire la varianza data da
2
2
∆
2
∆ ∆ … ·
1
12
Queste varianze non vanno associate alla densità gaussiana.
Mentre una combinazione lineare di errori gaussiani mantiene intervalli di confidenza
gaussiani, in questo caso la somma di due o più variabili uniformi, dà luogo a densità differenti che
dipendono dal numero di errori sommati.
È solo grazie al teorema del limite centrale (…ciascuna avente legge di distribuzione
qualsiasi…) che si può affermare che all’aumentare di N questa densità tende rapidamente ad una
gaussiana.
Il problema è stabilire a partire da quale numero di misure combinate linearmente sia lecito
assumere che la combinazione di esse sia gaussiana. Il risultato sarà sorprendente.
Se si assumuno due misure affette da errori sistematici uguali compresi in un intervallo [–a, a],
si ottiene una densità di probabilità triangolare, questo non sarà dimostrata o ricavato in questo
corso.
5 Ma assunto che si ottenga già da due variabili a densità uniforme una densità di probabilità
triangolare, e ricavando la σ è possibile calcolare le probabilità di ottenere dei valori in determinati
intervalli (es. 5.5).
Questa probabilità per un valore x compreso nell’intervallo
+σ si ha 0.649, tra + 2σ si ha
0.966 e tra + 3σ si ha 1.
Se si confrontano questi probabilità con quelle relative agli stessi intervalli per una densità di
probabilità gaussiana si ottengono dei valori molto vicini.
Da questo ne consegue che gli sperimentatori considerano intervalli di confidenza gaussiani già
a partire da errori ottenuti dalla combinazione di due soli errori sistematici a densità uniforme.
Veniamo ora alla combinazione di errori sistematici (di tipo uniforme) ed errori gaussiani,
sicuramente se già due variabili a densità uniforme tendono ad una gaussiana, si aspetta una
tendenza più forte tra una gaussiana e una uniforme.
Infatti si osserva che utilizzando la somma in quadratura delle due varianze
∆
12
i livelli di probabilità sono molto vicini a quelli di una gaussiana sia per σ = Δ che per σ > Δ,
solo nel caso di σ << Δ ( a circa 100 volte inferiore) tendono ad una densità di probabilità uniforme.
Ripercorriamo ora come si propone di presentare i risultati sulla base delle considerazioni
scaturite dal teorema del limite centrale.
Misure affette solo da errore sistematico
La misura non presenta fluttuazioni e quindi si ottiene sempre lo stesso risultato,
si fornirà quindi il valore:
x+εx con un livello di confidenza del 100%.
In questo caso l’errore è l’errore massimo.
Per il teorema e le considerazioni sulla densità di probabilità triangolare, possiamo affermare già
per due variabili di questo tipo che la
∆
∆
12
12
Una varianza che ci permette di affermare che ci aspettiamo un livello di confidenza del 68%.
Misure affette solo da errore statistico
Misura di una grandezza fisica con un apparato di sensibilità elevata percui si osservano
fluttuazioni statistiche.
Si fanno una serie di misure N da cui si ottiene la media e la deviazione standard, siccome si
assume che la misura tenda al valore vero X si presenterà il risultato come:
√
con un livello di confidenza del 68 % (se N>10).
Attenzione che per N → ∞ una misura di questo tipo tende ad avere errore nullo, ma l’ipotesi
per dedurre questa formula è stata che lo strumento fosse perfetto, ovvero ε=0.
In pratica i risultati vanno presentati in questo modo fino al limite in cui la dimensione del
campione raggiunga una precisione della misura statistica che non competa con la sensibilità di
lettura dell’apparato, cioè quando
6 √
Ribadiamo ancora che l’intervallo
, fornisce la stima della probabilità di ottenere
una singola misura. Quindi rappresenta la precisione di una singola misura.
Invece /√ rappresenta la precisione della misura globale.
Si osservi anche che se due misure hanno errori diversi è possibile ottenere la stessa precisione
finale da entrambe se si soddisfa la relazione:
Ovvero il numero di misure con errore dell’esperimento con errore più grande deve essere più
grande.
Nel caso di varie misure ottenute da vari campioni con medie e varianze differenti si deve
utilizzare invece la media pesata:
∑
1
∑
∑
Abbiamo ricavato questo per misure gaussiane, deviazione standard della media pesata descrive
un livello di confidenza del 68% della misura globale (vedi σx).
Ma grazie al teorema del limite centrale anche se i dati non fossero gaussiani per N > 10 vale il
teorema del limite centrale. Come per il caso della deviazione standard della media.
Misure affette da errori statistici e sistematici
Nel caso di misure effettuate con un apparato, in cui si abbiano sia errori statistici che
sistematici, misure ripetute forniscono comunque diversi valori e i risultati vengono presentati sotto
forma di istogrammi. Ovviamente non ha senso scegliere la larghezza delle classi dell’istogramma
inferiore all’errore sistematico. Supponiamo di aver raccolto un campione di N misure e di aver
calcolato media e varianza.
Nel seguito, sebbene espresso in simboli si tenga conto che risultato di una misura è un numero.
La varianza del campione osservato è la somma di due varianze, quella statistica e quella
sistematica ovvero:
∆
12
E quindi fornire il risultato una distribuzione di probabilità uniforme e quindi
±
∆2
12
Chiariamo con esempio. Supponiamo di aver misurato come grandezza la costante di
accelerazione gravitazionale pari a 9.75 ms-2 indirettamente, mediante la misura diretta di altre
⁄
variabili e di aver propagato separatamente errori casuali e quelli sistematici, se si suppone
2
-2 2
-2 2
= 0.2 (ms ) ∆ ⁄12 = 0.3 (ms ) si fornirà il risultato
g = 9.75 + 0.84 ms-2
dove 0.84 si ottiene da √0.2
0.3
Per il teorema del limite centrale possiamo quindi considerare la variabile come una variabile
gaussiana, e quindi fare gli studi opportuni per fornire il livello di confidenza di ottenere un
determinato valore atteso. Sicuramente serve questo modo di procedere per tale confronto e per
fornire la discrepanza con il valore atteso e il relativo livello di confidenza.
7 Spesso nella letteratura scientifica si preferisce tenere separati i due tipi di errore e quindi si
riportare la misura come
∆
2
√
Questo se si vuole dare evidenza ai due differenti tipi di errore.
Con i valori numerici forniremo:
g= 9.75 + 0.45 (stat) + 0.95 (sist) ms-2
in questo caso i livelli di confidenza risultano diversi per i due tipi di errore, 68 % per quello statistico e
100% quello sistematico.
Alcuni invece preferisco presentare l’errore massimo totale e quindi
3·
∆
2
percui si ha un livello di confidenza del 100% uniforme per entrambi gli errori.
√
In questo modo si fornirebbe il risultato separato
g= 9.75 + 1.35 (stat) + 0.95 (sist) ms-2 livello di confidenza 100%,
o anche in quadratura:
g= 9.75 + 1.65 ms-2 livello di confidenza 100%,
Ovviamente quanto presentato va chiarito nel testo della relazione o articolo.
Misure con calibrazione
Nella descrizione precedente abbiamo usato quasi in modo generico sia ε che Δ per gli errori sistematici
o strumentali.
Spesso nei manuali viene fornita l’accuratezza come + val . Quindi segue le discussioni su riportate per
le variabili a densità di probabilità uniforme.
Quando non si ha a disposizione un manuale con le relative informazioni, si assume per un strumento di
ottime prestazioni, che l’accuratezza sia maggiore della sensibilità di misura, quindi l’errore di accuratezza si
minore percui rimane solo l’errore di sensibilità di lettura.
Abbiamo anche detto che di solito l’accuratezza è un errore sistematico che ha un segno costante, e il
modo per determinarlo e mediante la calibrazione o taratura.
Nel caso di una calibrazione grazie alla quale si determina il valore ed segno dell’errore mediante una
calibrazione si può presentare il risultato come
∆2
12
se si è misuraton con un apparato g= 10.0 ms-2, e si è ottenuto per gli errori il valore riportato sopra
0.84, che include errori statistici e strumentali del tipo suddetto, mentre accuratezza sono
determinati dalla calibrazione.
Si possono rifare tutte le considerazioni sui livelli di confidenza di sopra e portare ovviamente il
risoltano nel modo seguente
√
.
∆
√12
Ovvero numericamenre g= 10.0 + 0.45 (stat) + 0.6 (syst) - 0.2 (acc) ms-2 , con livello di
confidenza del 68%.
Scarica

Sintesi conclusiva su errori e loro propagazione