Num 02 - 1 / 40
Lezione 8
Numerosità del campione
Num 02 - 2 / 40
parte 2
la numerosità
minima
del campione
nei test di ipotesi
Num 02 - 3 / 40
gli strumenti di inferenza
• Dato un campione con immagini { X1, X2, …, Xn } proveniente da
una popolazione su cui è definita una variabile casuale X avente
densità f (x) qualsiasi con media m e varianza s2 si possono
usare la media campionaria e la varianza campionaria corretta
per stimare i valori dei parametri della popolazione.
1
Xn 
n
n

Xj
j 1
1
S 
n 1
2
n
n
 X
 Xn 
2
j
j 1
• come tutti gli strumenti di misura, anche gli stimatori
sono imperfetti e la loro stima del parametro presenta
un’incertezza che viene quantificata attraverso l’intervallo di
confidenza:
m  X n  m
Sn2  vi  s2  Sn2  vs
Num 02 - 4 / 40
la numerosità
minima
del campione
nei test
sulla media
Num 02 - 5 / 40
azioni decisionali sull’ipotesi H0
Come è facile vedere se il test a cui è stata sottoposta l’ipotesi
H0 ha avuto esito positivo ed ha fornito informazioni sufficienti
(potremmo dire: “se il test è stato utile”) l’azione decisionale è
la
j cioè il rifiuto di H0 :
j
si rifiuta H0 poiché si dispone di informazioni sufficienti a
giustificare la decisione;
k
non si può escludere che H0 sia vera, ma non si dispone di
informazioni sufficienti per esprimere un giudizio;
Num 02 - 6 / 40
azioni decisionali sull’ipotesi H0
esempio 1:
preso un campione di n elementi da una popolazione su cui è
definita una variabile casuale X con media m incognita e
varianza s2 conosciuta posso esprimere una decisione in merito
all’ipotesi H0 : m  m0 ?
le premesse a questo test sono le seguenti:
– si estrae un campione casuale dalla popolazione e si
misurando i valori della caratteristica comune
– si definisce la variabile casuale X,
– si individuano i valori assunti dalla variabile casuale X in
corrispondenza degli elementi che compongono il
campione,
Num 02 - 7 / 40
azioni decisionali sull’ipotesi H0
esempio 1:
preso un campione di n elementi da una popolazione su cui è
definita una variabile casuale X con media m incognita e
varianza s2 conosciuta posso esprimere una decisione in merito
all’ipotesi H0 : m  m0 ?
questo test si conduce:
– definendo una opportuna variabile casuale a partire dagli
stimatori campionari e fissando un valore “critico” (cioè un
discriminante),
– calcolando il valore della variabile prescelta,
– confrontando tale valore con quello critico fissato e
decidendo, in base al confronto, se è possibile rifiutare
oppure se non è possibile rifiutare H0 : m  m0
Num 02 - 8 / 40
azioni decisionali sull’ipotesi H0
esempio 1:
I tecnici del Dipartimento R&D di una azienda produttrice di
OpAmp affermano di avere messo a punto un nuovo layout del
circuito in grado di aumentare lo slew-rate della tensione di
uscita. A loro dire il nuovo valore tipico sarà
maggiore o uguale a 80 mV/ns.
1) Come definiamo la variabile casuale X ?
La variabile casuale X associa a ciascun punto campione un
numero positivo ed adimensionale di valore uguale al valore
dello slew-rate misurato in mV/ns .
Num 02 - 9 / 40
azioni decisionali sull’ipotesi H0
esempio 1:
I tecnici del Dipartimento R&D di una azienda produttrice di
OpAmp affermano di avere messo a punto un nuovo layout del
circuito in grado di aumentare lo slew-rate della tensione di
uscita. A loro dire il nuovo valore tipico sarà
maggiore o uguale a 80 mV/ns.
2) Come valutare la affermazione dei tecnici del dR&D?
Dato che non sarà possibile provare l’intera popolazione (non
ancora prodotta) sarà necessario agire tramite un gruppo di
prototipi, cioè un campione, ed accettare l’incertezza insita
nel trasferire informazioni ricavate dal campione alla intera
popolazione: ovviamente si userà la media campionaria come
stimatore di m.
Num 02 - 10 / 40
azioni decisionali sull’ipotesi H0
esempio 1:
I tecnici del Dipartimento R&D di una azienda produttrice di
OpAmp affermano di avere messo a punto un nuovo layout del
circuito in grado di aumentare lo slew-rate della tensione di
uscita. A loro dire il nuovo valore tipico sarà
maggiore o uguale a 80 mV/ns.
3) Come definire il valore discriminante per la media campionaria?
Si fissa il discriminante ad un valore diverso da m0 , tale da
individuare un campo di valori in cui, se m fosse realmente uguale
a m0 , il valore della media campionaria (aleatorio a causa della
aleatorietà del campione) avrebbe probabilità molto bassa di
entrare.
Num 02 - 11 / 40
azioni decisionali sull’ipotesi H0
(approccio pessimistico)
esempio 1:
Il responsabile del Laboratorio Prove e Misure decide pertanto
di adottare un test che prevede le seguenti fasi:
1. si costituirà un campione composto da un prestabilito numero di
OpAmp, ad esempio 49 OpAmp;
2. mediante appositi strumenti si misurerà lo slew-rate di ciascun
elemento del campione per ricavare i valori della X;
3. se il valore della media campionaria
risulterà inferiore a 78,5 si rifiuterà
l’affermazione dei tecnici del dR&D
circa il preteso miglioramento;
se invece tale soglia verrà
uguagliata o superata
non si contesterà
la loro affermazione.
Num 02 - 12 / 40
criterio decisionale sull’ipotesi H0
esempio 1:
Il criterio decisionale adottato è quindi il seguente:
j se X 49  78,5 rifiuto H 0

k se X 49  78,5 non rifiuto H 0
Num 02 - 13 / 40
Effetto della numerosità del campione
Se il campione è “fedele” il valore della media campionaria non
dipende dalla numerosità
j se X 49  78,5 rifiuto H 0

k se X 49  78,5 non rifiuto H 0
Num 02 - 14 / 40
Effetto della numerosità del campione
Al contrario, la incertezza dello stimatore campionario dipende
dalla numerosità del campione!
j se X 49  78,5 rifiuto H 0

k se X 49  78,5 non rifiuto H 0
?
Num 02 - 15 / 40
Effetto della numerosità del campione
Al contrario, la incertezza dello stimatore campionario dipende
dalla numerosità del campione!
j se X 49  78,5 rifiuto H 0

k se X 49  78,5 non rifiuto H 0
Num 02 - 16 / 40
i test
sulla media:
H0
Num 02 - 17 / 40
formulazione di un test sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;
5. scelta dello stimatore campionario e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Num 02 - 18 / 40
formulazione di un test sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;
5. scelta dello stimatore campionario e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Num 02 - 19 / 40
formulazione di un test sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test:
se la varianza s2 è nota e se il campione è numeroso (n > 30)
si potrebbero usare indifferentemente:
- la media campionaria
1
Xn 
n
n

j 1
Xj
che ha distribuzione normale
con media m e varianza s2 / n;
- la variabile
X n  m0
Z
s
n
che ha distribuzione normale standard.
Num 02 - 20 / 40
formulazione di un test sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test:
se la varianza s2 è nota e se il campione è numeroso (n > 30)
si potrebbero usare indifferentemente:
- la media campionaria
1
Xn 
n
n

j 1
che ha distribuzione normale
con media m e varianza s2 / n;
- la variabile
Xj
Problema:
non dispongo di
valori tabulati !
X n  m0
Z
s
n
che ha distribuzione normale standard.
Num 02 - 21 / 40
formulazione di un test sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test:
se la popolazione ha distribuzione normale con varianza s2 incognita
si usa la variabile
X n  m0
T
Sn
n
che ha distribuzione t di Student con n - 1 g.d.l.
se n > 30 la variabile T può essere approssimata con la:
X n  m0
Z
Sn
n
che ha distribuzione normale standard
Num 02 - 22 / 40
numerosità del campione: normale standard
1.
si stabilisce la numerosità n del campione con cui si vuole
condurre il test.
per comprendere l’effetto di un aumento della numerosità del
campione si può fare la seguente considerazione:
supponiamo di avere scelto come variabile campionaria la:
Z
X n  m0
s
n
che, per n sufficientemente grande, sappiamo avere
distribuzione normale standardizzata
Num 02 - 23 / 40
numerosità del campione: normale standard
Z
X n  m0
s
n
X n  mX0 n  m0
Z
 Z
s
n
s
n
Num 02 - 24 / 40
numerosità del campione: normale standard
Z
X n  m0
s
n
 Z
X n  m0
s
n
Num 02 - 25 / 40
numerosità del campione: normale standard
Z=
Xn - m0
s
n
X n  mX0 n - m0
X n  m 0 Xn - m 0
ZÞ
 Z=
 Zn Þ zc = n
s
n
s
s
s
nmin
Num 02 - 26 / 40
numerosità del campione: normale standard
Z=
Xn - m0
s
Þ Z=
Xn - m0
s
n Þ zc =
Xn - m 0
s
n
zc =
Xn - m 0
s
nmin Þ
nmin =
æ zc ö 2
³ç
÷ s
è Xn - m0 ø
2
nmin
zc
s
Xn - m0
nmin
Num 02 - 27 / 40
numerosità del campione: t di Student
Qualora la varianza della X per l’intera popolazione non sia
conosciuta si può condurre il calcolo della numerosità richiesta
al campione mediante lo stimatore “varianza campionaria
n
corretta”:
1
S 
n 1
2
n
 X
j
 Xn

2
j 1
Sappiamo che se n è sufficientemente grande la variabile
casuale
T
Xn  m
S n2
n
segue una distribuzione “ t di Student con n-1 g.d.l ”.
Num 02 - 28 / 40
numerosità del campione: t di Student
T=
Xn - m0
X - m0
Þ T= n
Sn
Sn
n
n Þ tc =
Xn - m0
Sn
nmin
Num 02 - 29 / 40
numerosità del campione: t di Student
T=
Xn - m0
X - m0
Þ T= n
Sn
Sn
n
tc =
Xn - m 0
Sn
nmin Þ
n Þ tc =
nmin =
æ tc ö 2
³ç
÷ Sn
è Xn - m0 ø
2
nmin
Xn - m0
Sn
tc
Sn
Xn - m 0
nmin
Num 02 - 30 / 40
numerosità del campione: t di Student
Un problema da considerare è rappresentato dal fatto che il
valore critico t1- a/2 della t di Student dipende da n
Num 02 - 31 / 40
numerosità del campione: t di Student
Se n’min > 30 sappiamo che la distribuzione t di Student non
differisce in maniera evidente dalla distribuzione normale
standard.
Un primo calcolo approssimato può essere condotto
sostituendo al quantile della T il corrispondente
quantile di una variabile Z normale standard.
æ zc ö 2
³ç
÷ Sn
è Xn - m0 ø
2
n'min
Individuato così un primo valore approssimato si può
proseguire cercando il valore corretto di nmin mediante un
procedimento iterativo:
Num 02 - 32 / 40
numerosità del campione: t di Student
partendo da una prima valutazione del quantile della
t di Student calcolato per un numero di g.d.l. pari a n’min - 1
si calcola:
æ tc ö 2
³ç
÷ Sn
è Xn - m0 ø
2
nmin
Con un ragionevole numero di iterazioni si può quindi
individuare la numerosità richiesta al campione.
Num 02 - 33 / 40
numerosità del campione: t di Student
Se pensiamo di dover operare con un campione di numerosità
ridotta n < 30 dobbiamo ricordare che la distribuzione della
media campionaria può essere considerata normale
solamente se anche la X segue la distribuzione normale!!!
Se ciò si verifica possiamo individuare il valore della
numerosità richiesta nmin con un procedimento uguale a
quello già mostrato per n > 30.
Num 02 - 34 / 40
numerosità del campione: t di Student
Partiamo da una prima valutazione condotta con la:
æ zc ö 2
³ç
÷ Sn
è Xn - m0 ø
2
n'min
per poi ricalcolare iterativamente il valore di nmin partendo da
una prima valutazione del quantile della t di Student calcolato
per un numero di g.d.l. pari a n’min - 1
æ tc ö 2
³ç
÷ Sn
è Xn - m0 ø
2
nmin
Con un ragionevole numero di iterazioni si può quindi
individuare la numerosità richesta al campione.
Num 02 - 35 / 40
la numerosità
minima
del campione
nel test
sulla varianza
Num 02 - 36 / 40
distribuzione della
varianza campionaria corretta
• dato un campione con immagini { X1, X2, …, Xn } proveniente
da una popolazione infinita su cui è definita una variabile
casuale X con distribuzione normale, media m e varianza s2,
la varianza campionaria corretta divisa per s02
æ X j - Xn ö
S
1
=
ç
÷
å
s
n -1 j=1 è s 0 ø
2
n
2
0
n
2
"n >1
fornisce una variabile casuale che segue una
distribuzione C 2 con n - 1 gradi di libertà
Num 02 - 37 / 40
Quantili critici nel test sulla varianza
a/2
a/2
P
æ 2
ö
Sn2
2
ç ca/2 £ 2 £ c1-a/2 ÷ =1- a
s0
è
ø
Num 02 - 38 / 40
numerosità del campione nel test sulla varianza
P
 2

Sn2
2
 c a / 2  2  c 1 a / 2   1  a
s


Nei vari casi le regioni di rifiuto sono:
Num 02 - 39 / 40
Consistenza della varianza campionaria corretta
Sappiamo che Sn2 è uno stimatore
corretto e consistente della varianza
quindi, al crescere della numerosità n
del campione, il suo valore si
distribuisce in modo sempre più
“concentrato in prossimità” di s2
E’ pertanto possibile ipotizzare che, per valori di n
sufficientemente elevati, la casualità con cui viene
estratto il campione non faccia variare in modo
significativo il valore della varianza campionaria Sn2.
Num 02 - 40 / 40
numerosità del campione ed ampiezza
dell’intervallo di confidenza per la varianza
il valore di nmin non compare in modo esplicito,
ma deve essere individuato attraverso i gradi di
libertà della C 2
il più basso valore dei gradi di libertà per cui i valori
critici della C 2 soddisfano la forma corrispondente:
è pari a nmin - 1
Scarica

Numerosità del campione nei test di ipotesi