Infe 03 - 1 / 61
Lezione 6
Inferenza
statistica
Infe 03 - 2 / 61
ERRATA CORRIGE
teorema 5.1:
• estraendo a caso un campione di numerosità n finita
da una popolazione su cui è definita una variabile casuale X
con distribuzione normale, media m e varianza s2,
la variabile casuale
Xn  m
T
s
n
Xn  m
T
Sn
n
segue una distribuzione t di Student con n-1 gradi di libertà
Infe 03 - 3 / 61
parte 3
Esercizi sulla stima
della media e della varianza
Infe 03 - 10 / 61
Distribuzione della media campionaria
• estraendo da una popolazione per cui è definita la
variabile casuale X avente distribuzione qualsiasi,
media m e varianza s2,
un campione di n elementi a cui corrisponde l’insieme di
variabili casuali { X1, X2, …, Xn },
se n è sufficientemente grande
la media campionaria
1
Xn 
n
- segue una distribuzione normale
- con media m e varianza s 2 / n
n
X
j 1
j
Infe 03 - 11 / 61
Distribuzione della media campionaria
• estraendo da una popolazione per cui è definita la
variabile casuale X con distribuzione normale,
media m e varianza s 2 finite,
un campione di n elementi a cui corrisponde l’insieme di
variabili casuali { X1, X2, …, Xn },
per qualsiasi n
la media campionaria
1
Xn 
n
- segue una distribuzione normale
- con media m e varianza s 2 / n
n
X
j 1
j
Infe 03 - 12 / 61
Dalla media campionaria alla
media campionaria standardizzata
• Considerazioni già fatte ci permettono di affermare che la
media campionaria, sotto determinate ipotesi, segue una
distribuzione normale con media m e varianza s2 / n
• è quindi facile costruire una variabile casuale
con distribuzione normale standard, cioè
con media nulla e varianza unitaria.
Xn  m
Z
s
n
Infe 03 - 13 / 61
Intervallo di confidenza per la media
possiamo sostenere che:
estraendo a caso un campione con un numero n sufficientemente elevato elementi da una popolazione per cui è definita
una variabile casuale X con distribuzione qualsiasi, media m e
varianza s2, c’è una probabilità pari a 1 - a che l’intervallo
casuale
I1 a
s


 Xn 
 z1 a / 2 
n


in cui z1-a/2 è il valore del quantile (1 - a/2) di una variabile
Z normale standardizzata
contenga il valore della media m per l’intera popolazione.
Infe 03 - 14 / 61
Intervallo di confidenza per la media: n finito
possiamo sostenere che:
estraendo a caso un campione con n finito da una popolazione
per cui è definita una variabile casuale X con distribuzione
normale, media m e varianza s2, c’è una probabilità pari a 1 - a
che l’intervallo casuale
I1a
s


 Xn 
 z1a / 2 
n


in cui z1-a/2 è il valore del quantile (1 - a/2) di una variabile
normale standardizzata
contenga il valore della media m per l’intera popolazione.
Infe 03 - 15 / 61
Intervallo di confidenza per la media:
n finito e s 2 sconosciuta
possiamo sostenere che:
estraendo a caso un campione con n finito da una popolazione
su cui è definita una variabile casuale X con distribuzione
normale, media m e varianza s2, c’è una probabilità pari a 1 - a
che l’intervallo casuale
I1 a
Sn


 Xn 
 t1 a / 2 
n


in cui t1-a/2 è il valore del quantile (1 - a/2) di una variabile
T distribuita secondo la t di Student con n -1 g.d.l.
contenga il valore della media m della popolazione.
Infe 03 - 17 / 61
Intervallo di confidenza per la media: n < N
• se n  30 e la varianza per la popolazione s
s
m  xn  zQ sup 
n
2
è nota:
N n
N 1
• se n < 30 , X è normale e la varianza per la popolazione s
s
n
N n
N 1
Sn
m  xn  tQ sup 
n
N n
N 1
m  xn  zQ sup 
• se X è normale:
2
è nota:
Infe 03 - 18 / 61
Esercizio 1
stima della media
Infe 03 - 19 / 61
Esercizio 1
• Determinazione dei parametri statici di un OpAmp:
misurazione della tensione di offset di ingresso
• La tensione di offset di ingresso è quella tensione
continua che, in assenza di segnale utile, deve
essere applicata all’ingresso di un operazionale per
rendere nulla la tensione di uscita.
Infe 03 - 25 / 61
Esercizio 1
la tensione di offset di ingresso è quindi espressa dalla:
vout
 R2 
 vos 1  
R1 

 R1 

vos  vout 
 R1  R2 
Infe 03 - 26 / 61
Esercizio 1
 R1 

vos  vout 
 R1  R2 
costituiamo un campione con 11 propotipi di un nuovo OpAmp e
misuriamo i valori delle tensioni vout in mV usando i resistori
R1 = 1 W e R2 = 1 kW:
{ + 17,87 ; + 18,16 ; + 17,80 ; + 17,99 ; + 18,16 ;
+ 17,97 ; + 18,12 ; + 17,98 ; + 17,99 ; + 17,84 ; + 17,99 }
da questi ricaviamo i valori delle tensioni di offset in mV:
{ + 17,85 ; + 18,14 ; + 17,78 ; + 17,97 ; + 18,14 ;
+ 17,95 ; + 18,10 ; + 17,96 ; + 17,97 ; + 17,82 ; + 17,97 }
Infe 03 - 27 / 61
Esercizio 1
Sulla popolazione degli OpAmp definiamo una variabile aleatoria X che
assume, per ciascun elemento della popolazione, un valore x coincidente con
il valore in mV della tensione di offset dell’elemento (trasformazione lineare).
A causa della molteplicità dei fattori del processo produttivo che condizionano
l’offset e per la linearità della trasformazione è plausibile ritenere che la X
abbia distribuzione normale.
Le immagini dei componenti il campione sono:
x1 = + 17,85 ;
x2 = + 18,14 ;
x3 = + 17,78 ;
x4 = + 17,97 ;
x5 = + 18,14 ;
x6 = + 17,95 ;
x7 = + 18,10 ;
x8 = + 17,96 ;
x9 = + 17,97 ;
x10 = + 17,82 ;
x11 = + 17,97
Infe 03 - 28 / 61
Esercizio 1
utilizziamo questi valori per individuare la stima del valore medio
dell’offset per la intera popolazione mediante lo stimatore “media
campionaria”:
1
xn 
11

11
xj
j 1
lo stimatore “media campionaria” ci fornisce il valore
xn   17,97
Questo risultato ci permette di affermare che la stima fatta del
valore medio della tensione di offset di ingresso per l’intera
popolazione di OpAmp risulta di +17,97 mV
Infe 03 - 29 / 61
Esercizio 1
dobbiamo ora trovare quanto il dato è “affidabile” stimando quanto
la casualità del campione può condizionarne il valore: dato che
non conosciamo la varianza della X per la popolazione degli
OpAmp costruiamo la variabile T che avrà una distribuzione
“t di Student”:
Xn m
T
Sn
n
attraverso cui individueremo l’intervallo di confidenza usando la:
sn
sn
tQ inf 
 xn  m  tQ sup 
n
n
Infe 03 - 30 / 61
Esercizio 1
il campione ha n = 11 quindi useremo la t di Student a 10 g.d.l.
e, se cerchiamo un intervallo di confidenza al 90%, dovremo
individuare i percentili 5% e 95% (cioè 0,05 e 0,95): in realtà ci
basta individuare il 95% in quanto l’altro percentile è simmetrico
rispetto a zero.
la tabella della t di Student ci fornisce il valore del percentile:
tQ sup  1,812
da cui:
tQ inf   1,812
Infe 03 - 31 / 61
Esercizio 1
ricordando che vogliamo applicare la:
sn
sn
tQ inf 
 xn  m  tQ sup 
n
n
notiamo che ora è necessario stimare la varianza della media
campionaria X
mediante la varianza campionaria corretta
n
1
S 
n 1
2
n
 X
n
j
 Xn 
2
j 1
Dai valori della X del campione individuiamo quindi il valore della
varianza campionaria corretta e della sua radice (deviazione
standard):
1
s 
10
2
n
x
11
j 1
j
x 
n
2
 0,0147  sn  0,122
Infe 03 - 32 / 61
Esercizio 1
pertanto sostituendo nella:
sn
sn
tQ inf 
 xn  m  tQ sup 
n
n
otteniamo:
0,122
0,122
 1,812
 xn  m  1,812
3,316
3,316
da cui:
 0,07  xn  m  0,07
Infe 03 - 33 / 61
Esercizio 1
dalla:
 0,07  xn  m  0,07
è facile ottenere:
xn  0,07  m  xn  0,07
da cui:
m  17,97  0,07
che rappresenta l’intervallo di confidenza al 90% per la
media m della variabile casuale riferita all’intera popolazione
Infe 03 - 34 / 61
Esercizio 1
Questo risultato ci permette di affermare che, con una probabilità
del 90%, il valore medio della tensione di offset di ingresso della
intera popolazione degli OpAmp è compreso nell’intervallo di
estremi:
 17,90 μV
e
 18,04 μV
Infe 03 - 35 / 61
Esercizio 2
stima per intervalli
della media
Infe 03 - 36 / 61
Esercizio 2
costituiamo un campione con 16 propotipi di resistori di nuovo tipo e misuriamo
i valori delle resistenze in kW:
{ + 15,37 ; + 15,16 ; + 15,80 ; + 15,49 ; + 15,26 ;
+ 15,87 ; + 15,12 ; + 15,58 ; + 15,39 ; + 15,64 ;
+ 15,27 ; + 15,22 ; + 15,57 ; + 15,54 ; + 15,64 ; + 15,32 }
Data la molteplicità delle cause indipendenti che determinano la variabilità
della resistenza è plausibile ritenerla distribuita normalmente.
Costruita la variabile casuale X che assume per ciascun elemento valore pari
al valore in kW della sua resistenza elettrica
(è una trasformazione lineare quindi X conserva la distribuzione normale)
si individui l’intervallo di confidenza al 95% per il valore tipico della resistenza
della intera popolazione supponendo che la varianza della X per l’intera
popolazione sia s2 = 0,0256
Infe 03 - 37 / 61
Esercizio 2
risoluzione:
1
xn 
16
x
16
j
 15,46
j 1
dato che la X è distribuita normalmente
si costruisce la variabile
Z
Xn  m
s
n
che segue una distribuzione normale standardizzata
Infe 03 - 38 / 61
Esercizio 2
risoluzione (segue):
1
xn 
16

16
Z
x j  15,46
j 1
Xn  m
s
n
dalla tabella si ottiene:
zQ sup  1,96




s 2  0,0256
n  16
m  xn  zQ sup 
s
n
zQ inf   1,96

s 0,16

 0,04
4
n
 15,46  0,0784  15,46  0,08
Infe 03 - 39 / 61
Esercizio 2
Questo risultato ci permette di affermare che, con una
probabilità del 95%, il valore tipico della resistenza della
intera popolazione dei resistori è compreso nell’intervallo di
estremi:
 15,38 kW
e
 15,54 kW
Infe 03 - 40 / 61
Esercizio 1bis
stima della media
Infe 03 - 41 / 61
Esercizio 1bis
Sulla popolazione degli OpAmp definiamo una variabile aleatoria X
che assume, per ciascun elemento della popolazione, un valore x
coincidente con il valore in centesimi di mV della tensione di offset
dell’elemento diminuito di 1800 (trasformazione lineare):
X  1800
X  100  vos  18  vos 
100
A causa della molteplicità dei fattori del processo produttivo che condizionano
l’offset è plausibile ritenere che la X abbia distribuzione normale.
Le immagini dei componenti il campione sono pertanto
x1 = -15 ;
x2 = + 14 ;
x3 = -22 ;
x4 = - 3 ;
x5 = + 14 ;
x6 = - 5 ;
x7 = + 10 ;
x8 = - 4 ;
x9 = - 3 ;
x10 = - 18 ;
x11 = - 3 ;
Infe 03 - 42 / 61
Esercizio 1bis
utilizziamo questi valori per individuare la stima del valore medio
dell’offset per la intera popolazione mediante lo stimatore “media
campionaria”:
1
xn 
11
x
11
j
j 1
lo stimatore “media campionaria” ci fornisce il valore
xn   3,18
X  1800
X  100  vos  18  vos 
100
Questo risultato ci permette di affermare che la stima fatta del
valore medio della tensione di offset di ingresso per l’intera
popolazione di OpAmp risulta di +17,97 mV
Infe 03 - 43 / 61
Esercizio 1bis
dobbiamo ora trovare quanto il dato è “affidabile” stimando quanto
la casualità del campione può condizionarne il valore:
sn
sn
tQ inf 
 xn  m  tQ sup 
n
n
dato che non conosciamo la varianza della X per la popolazione
degli OpAmp costruiamo la variabile T che avrà una distribuzione
“t di Student”:
Xn m
T
Sn
n
Infe 03 - 44 / 61
Esercizio 1bis
il campione ha n = 11 quindi useremo la t di Student a 10 g.d.l.
e, se cerchiamo un intervallo di confidenza al 90%, dovremo
individuare i percentili 5% e 95% (cioè 0,05 e 0,95): in realtà ci
basta individuare il 95% in quanto l’altro percentile è simmetrico
rispetto a zero.
la tabella della t di Student ci fornisce il valore del percentile:
tQ sup  1,812
da cui:
tQ inf   1,812
Infe 03 - 45 / 61
Esercizio 1bis
ricordando che vogliamo applicare la:
sn
sn
tQ inf 
 xn  m  tQ sup 
n
n
notiamo che ora è necessario stimare la varianza della media
campionaria X
mediante la varianza campionaria corretta
n
1
S 
n 1
2
n
 X
n
j
 Xn 
2
j 1
Dai valori della X del campione individuiamo quindi il valore della
varianza campionaria corretta e della sua radice (deviazione
standard):
11
1
2
sn2   x j  xn   148,2  sn  12,17
10 j 1
Infe 03 - 46 / 61
Esercizio 1bis
pertanto sostituendo nella:
sn
sn
tQ inf 
 xn  m  tQ sup 
n
n
otteniamo:
12,17
12,17
 1,812
 xn  μ  1,812
3,316
3,316
da cui:
 6,65  xn  μ  6,65
Infe 03 - 47 / 61
Esercizio 1bis
dalla:
 6,65  xn  m  6,65
 6,65  xn  μ  6,65
è facile ottenere:
xn  6,65  μ  xn  6,65
da cui:
μ   3,18  6,65
che rappresenta l’intervallo di confidenza al 90% per la
media m della variabile casuale X riferita all’intera popolazione
Infe 03 - 48 / 61
Esercizio 1bis
μ   3,18  6,65
X  100  vos  18  vos 
vosinf 
X  1800
100
 9,83  1800
3,47  1800
 17,9017 ; vossup 
 18,0347
100
100
Questo risultato ci permette di affermare che, con una probabilità
del 90%, il valore tipico della tensione di offset di ingresso della
intera popolazione degli OpAmp è compreso nell’intervallo di
estremi:
 17,90 μV
e
 18,04 μV
Infe 03 - 49 / 61
Esercizio 2bis
stima per intervalli
della media
Infe 03 - 50 / 61
Esercizio 2bis
costituiamo un campione con 16 propotipi di resistori di nuovo tipo e misuriamo
i valori delle resistenze in kW:
{ + 15,37 ; + 15,16 ; + 15,80 ; + 15,49 ; + 15,26 ;
+ 15,87 ; + 15,12 ; + 15,58 ; + 15,39 ; + 15,64 ;
+ 15,27 ; + 15,22 ; + 15,57 ; + 15,54 ; + 15,64 ; + 15,32 }
Data la molteplicità delle cause indipendenti che determinano la variabilità
della resistenza è plausibile ritenerla distribuita normalmente.
Costruita la variabile casuale X che assume per ciascun elemento valore pari
a…
(è una trasformazione lineare quindi X conserva la distribuzione normale)
si individui l’intervallo di confidenza al 95% per il valore tipico della resistenza
della intera popolazione supponendo che la varianza della X per l’intera
popolazione sia s2 = 0,0256 * ?
X 1  b  X  a   s 21  b 2 s 2
Infe 03 - 51 / 61
Esercizio 2
Questo risultato ci permette di affermare che, con una
probabilità del 95%, il valore tipico della resistenza della
intera popolazione dei resistori è compreso nell’intervallo di
estremi:
 15,37 kW
e
 15,55 kW
Infe 03 - 52 / 61
Esercizio 3
stima per intervalli
della media
Infe 03 - 53 / 61
Esercizio 3
Si è definita su di una popolazione di sfere da cuscinetto una variabile
casuale avente, per ciascuna sfera prodotta, valore uguale al valore
del diametro misurato in centimetri.
Un campione casuale costituito da 200 sfere mostra un valore
della media campionaria di 0,824 e
della deviazione standard campionaria corretta di 0,042.
Determinare l’intervallo di confidenza al 99% per la media della
variabile casuale relativa all’intera popolazione.
Infe 03 - 54 / 61
Esercizio 3
risoluzione:
Dato che la varianza della X per l’intera popolazione è sconosciuta si
dovrebbe costruire una variabile casuale T definita:
Xn  m
T
s
n
per determinare la risposta al problema mediante la
tQ inf 
xn  m
s
s
 tQ sup  xn  tQ inf  n  m  xn  tQ sup  n
sn
n
n
n
Infe 03 - 55 / 61
Esercizio 3
risoluzione (segue): :
tQ inf
xn  m
sn
sn

 tQ sup  xn  tQ inf 
 m  xn  tQ sup 
sn
n
n
n
dato che n = 200 la distribuzione della t di Student (con 199 gdl) è
approssimabile con la distribuzione normale standardizzata:
sn
sn
xn  zQ inf 
 m  xn  zQ sup 
n
n
0,042
0,042
0,824  2,575 
 m  0,824  2,575 
200
200
Infe 03 - 56 / 61
Esercizio 3
risoluzione (segue):
0,042
0,042
0,824  2,575 
 m  0,824  2,575 
200
200
0,824  0,00765  m  0,824  0,00765
E’ quindi possibile affermare che, con una probabilità del 99%, il
valore tipico del diametro per l’intera popolazione è compreso fra i
valori:
 0,816 cm
e
 0,832 cm
Infe 03 - 57 / 61
Esercizio 4
stima per intervalli
della media
Infe 03 - 58 / 61
Esercizio 4
Ricalcolare l’intervallo di confidenza dell’esercizio precedente
nell’ipotesi che il campione sia costituito da 20 sfere.
Un campione casuale costituito da 20 sfere mostra un valore
della media campionaria di 0,824 e
della deviazione standard campionaria corretta di 0,042.
Determinare l’intervallo di confidenza al 99% per la media della
variabile casuale relativa all’intera popolazione.
Infe 03 - 59 / 61
Esercizio 4
risoluzione:
A causa della molteplicità dei fattori del processo produttivo che condizionano il
diametro di ciascuna sfera è plausibile ritenere che la popolazione abbia distribuzione
normale.
sn
sn
xn  tQ inf 
 m  xn  tQ sup 
n
n
0,824  2,861 
0,042
0,042
 m  0,824  2,861 
20
20
0,824  0,027  m  0,824  0,027
E’ quindi possibile affermare che, con una probabilità del 99%, il valore
medio del diametro per l’intera popolazione è compreso fra i valori:
 0,797 cm
e
 0,851 cm
Infe 03 - 60 / 61
Esercizio 5
stima per intervalli
della media
Infe 03 - 61 / 61
Esercizio 5
Che risultato si sarebbe ottenuto nell’esercizio precedente
usando, erroneamente, la teoria dei campioni numerosi?
Un campione casuale costituito da 20 sfere mostra un valore
della media campionaria di 0,824 e
della deviazione standard campionaria corretta di 0,042.
Determinare l’intervallo di confidenza al 99% per la media della
variabile casuale relativa all’intera popolazione.
Infe 03 - 62 / 61
Esercizio 5
risoluzione:
sn
sn
xn  zQ inf 
 m  xn  zQ sup 
n
n
0,042
0,042
0,824  2,575 
 m  0,824  2,575 
20
20
0,824  0,024  m  0,824  0,024
mentre abbiamo visto che il risultato corretto è:
0,824  0,027  m  0,824  0,027
Infe 03 - 63 / 61
Tecnica delle misurazioni applicate – Esame del 27 marzo 2008
Problema 1.
Microlè SpA è un’impresa che costruisce relè per la commutazione di segnali.
Essa dichiara sul suo catalogo che la resistenza parassita dei contatti (chiusi) dei propri relè è garantita,
tramite un controllo di qualità sul 100% della produzione, non superiore a 10,2 mW.
Un nuovo progetto di un modello di relè in produzione da tempo sembra poter apportare benefici, ma
l’ing. Tizio, Responsabile della Produzione, teme che la resistenza parassita dei contatti dei nuovi relè possa
avere una elevata variabilità: ciò potrebbe riflettersi in un aumento della percentuale di dispositivi “fuori
tolleranza” che dovranno pertanto essere scartati durante il controllo di qualità del prodotto.
L’ing. Tizio decide di condurre una valutazione, su di una preserie campione, del valore dello “scarto per fuori
tolleranza” che il nuovo progetto potrebbe determinare.
Realizzata una preserie di 16 elementi Tizio misura con uno strumento di elevata qualità
(tanto da poter ritenere trascurabile la incertezza di misura)
la resistenza parassita Rp dei contati chiusi di ciascun relè ottenendo i seguenti risultati:
Rp1 = 9,5 mW
Rp2 = 9,6 mW
Rp3 = 9,6 mW
Rp4 = 9,7 mW
Rp5 = 9,7 mW
Rp6 = 9,7 mW
Rp7 = 9,8 mW
Rp8 = 9,8 mW
Rp9 = 9,8 mW
Rp10 = 9,8 mW
Rp11 = 9,9 mW
Rp12 = 9,9 mW
Rp13 = 9,9 mW
Rp14 = 10,0 mW
Rp15 = 10,0 mW
Rp16 = 10,1 mW
Si chiede al candidato di determinare, sulla base dei risultati sopra riportati:
1.
l’intervallo di valori della Rp che corrisponde all’intervallo di confidenza al 90% per la media della
variabile casuale che si è adottata.
2.
Il valore massimo e minimo dello scarto che può essere atteso per l’intera popolazione dei relè
eventualmente prodotti in base al nuovo progetto (si operi con una confidenza del 90% nella
determinazione della varianza della variabile casuale che si è adottata).
Scarica

Esercizi sulla stima della media