Test 02 - 1 / 53
Lezione 6
i Test
statistici
Test 02 - 2 / 53
Nella parte 1 …
test sull’ipotesi principale H0:
prestazioni del
criterio decisionale
rischio di errore di 1 specie;
fiducia del criterio decisionale
significatività del test
Test 02 - 3 / 53
parte 2
i test
sulla media:
H0 e H1
Test 02 - 4 / 53
formulazione di test con H0 e H1 sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 5 / 53
formulazione di test con H0 e H1 sulla media
3. si individua l’ipotesi H0 (ipotesi principale) che deve essere
sottoposta a test.
esempio:
H0 : m = m0 ;
oppure:
H0 : m  m0 ;
4. si definisce, in contrasto alla ipotesi principale, una (o più di una)
“ipotesi alternativa” H1 (, H2 );
esempio:
H1 : m  m1 ;
oppure:
H1 : m = m1 ;
Test 02 - 6 / 53
formulazione di test con H0 e H1 sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 7 / 53
formulazione di test con H0 e H1 sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test:
se la varianza s2 è nota e se il campione è numeroso (n > 30) si
possono usare indifferentemente:
- la media campionaria
1
Xn =
n
n

j =1
Xj
che ha distribuzione normale
con media m e varianza s2 / n;
- la variabile
X n  m0
Z=
s
n
che ha distribuzione normale standard.
Test 02 - 8 / 53
formulazione di test con H0 e H1 sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test:
se la distribuzione è normale e la varianza s2 è incognita si usa:
- la variabile
X n  m0
T=
Sn
n
che ha distribuzione t di Student con n - 1 g.d.l.
se il campione è numeroso ( n > 30) la T può essere
approssimata con la:
X n  m0
Z=
Sn
n
che ha distribuzione normale standard
Test 02 - 9 / 53
formulazione di test con H0 e H1 sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 10 / 53
formulazione di test con H0 e H1 sulla media
6. si stabiliscono i valori
a del rischio di errore di 1ª specie che si è disposti a correre
e
1 - a del livello di fiducia richiesto.
criterio di scelta:
la scelta del valore di rischio accettabile richiede
considerazioni di vario tipo, non solamente tecniche ma,
molto spesso, economiche, di politica aziendale, di
immagine, ecc.
La probabilità a di commettere un errore di 1ª specie viene
chiamata “livello di significatività” al quale si intende condurre il
test.
Test 02 - 11 / 53
formulazione di test con H0 e H1 sulla media
6. si stabiliscono i valori
a del rischio di errore di 1ª specie che si è disposti a correre
e
1 - a del livello di fiducia richiesto.
Test 02 - 12 / 53
formulazione di test con H0 e H1 sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 13 / 53
Significato della “potenza contro H1”
regione di
rifiuto per H0
regione di
non accettazione
per H1
100
Test 02 - 14 / 53
Significato della “potenza contro H1”
regione di
rifiuto per H0
regione di
esclusione per H1
Test 02 - 15 / 53
ipotesi H0 e alternativa H1
in alternativa all’ipotesi H0 , che prende anche il nome di
“ipotesi principale” si può definire una “ipotesi alternativa” H1
per esempio:
H0 : m  m0

H1 : m  m1
notiamo il fatto che si esclude a priori l’ipotesi:
m0  m  m1
questo perché si considerano possibili unicamente l’ipotesi principale
e quella ( o quelle ) alternativa.
Test 02 - 16 / 53
ipotesi H0 e alternativa H1
con riferimento alla sola H0 : m  m0 il criterio decisionale è:
 se X n > xc rifiuto H0
P
  sbagliato  = a
rischio di errore di 1ª specie
Test 02 - 17 / 53
ipotesi H0 e alternativa H1
considerando anche la H1 : m  m1 il criterio decisionale diviene:
 se X n > xc rifiuto H0

 se X n  xc non accetto H1
P
  sbagliato  = 
Test 02 - 18 / 53
ipotesi H0 e alternativa H1
il criterio decisionale complessivo adottato è quindi:
 se X n > xc rifiuto H 0

 se X n  xc non accetto H1 (quindi non rifiuto H 0 )
P
  sbagliato  = a
rischio di errore di 1ª specie
P
  sbagliato  = 
rischio di errore di 2ª specie
Test 02 - 19 / 53
ipotesi H0 e alternativa H1
il criterio decisionale complessivo adottato è quindi:
 se X n > xc rifiuto H 0

 se X n  xc non accetto H1 (quindi non rifiuto H 0 )
1-a:
affidabilità del criterio
decisionale nel rifiuto di H0
1-:
potenza contro H1
Test 02 - 20 / 53
ipotesi H0 e alternativa H1
Reiezione :
al disturbo,
alla
1. reiezione
Il ripudiare,
respingere
qc.tensione di modo comune,
(rapporto
di reiezione
di modo
comune) …
2. CMRR
Atto con
cui un Organo
giudiziario
o amministrativo
respinge una domanda…
1-a:
affidabilità del criterio
decisionale nel rifiuto di H0
1-:
potenza contro H1
Test 02 - 21 / 53
Significato della “potenza contro H1”
1 novembre 2011
Consumo 100 W
Consumo 75 W
Test 02 - 22 / 53
Significato della “potenza contro H1”
regione di
rifiuto per H0
75
regione di
non accettazione
per H1
100
Test 02 - 23 / 53
Significato della “potenza contro H1”
regione di
rifiuto per H0
75
regione di
esclusione per H1
100
Test 02 - 24 / 53
formulazione di test con H0 e H1 sulla media
7. si stabilisce il valore minimo accettabile della potenza contro
l’ipotesi alternativa che si vuole contrapporre alla ipotesi
fondamentale (nel caso di più ipotesi alternative si stabilisce la
potenza contro ciascuna di esse).
Questa scelta equivale a fissare il massimo valore  del rischio di
errore di 2ª specie che si intende accettare nella conduzione del
test.
Il valore  del rischio di errore di 2ª specie risulta funzione:
– della differenza fra le due ipotesi H0 e H1,
– di a (valore del rischio di errore di 1ª specie)
– della numerosità del campione su cui è stato condotto il test.
Test 02 - 25 / 53
formulazione di test con H0 e H1 sulla media
7. si stabilisce il valore minimo accettabile della potenza contro
l’ipotesi alternativa che si vuole contrapporre alla ipotesi
fondamentale (nel caso di più ipotesi alternative si stabilisce la
potenza contro ciascuna di esse).
Questa scelta
equivale a fissare
il massimo valore
 del rischio di
errore di 2ª specie
che si intende
accettare nella
conduzione
del test.
Test 02 - 26 / 53
formulazione di test con H0 e H1 sulla media
7. aumentare la numerosità
del campione provoca
una riduzione della
varianza dello stimatore
media campionaria che
consente di aumentare la
potenza del test senza
diminuire la sua
affidabilità.
Test 02 - 27 / 53
formulazione di test con H0 e H1 sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 28 / 53
formulazione di test con H0 e H1 sulla media
8. in base a ciò che si è stabilito nei punti precedenti, si identifica il
valore critico (o la coppia di valori critici) del parametro
campionario che
individua nel
dominio la
“regione di rifiuto”
dell’ipotesi
principale H0
Test 02 - 29 / 53
formulazione di test con H0 e H1 sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 30 / 53
formulazione di test con H0 e H1 sulla media
9. si stimano quindi i valori del rischio di errore di seconda specie a
cui il test verrà condotto e, se tali valori non rispettano le scelta
fatte per la potenza
del test si modificano
i parametri del test
da cui tale rischio
dipende
(in particolare
la numerosità
minima
del campione. )
Test 02 - 31 / 53
conduzione di test con H0 e H1 sulla media
10. dopo aver formulato il test:
si procede alla composizione del campione con numerosità
pari a quella stabilita,
si conducono le prove sperimentali,
si determina il valore dello stimatore campionario precelto,
Test 02 - 32 / 53
conduzione di test con H0 e H1 sulla media
10. se la stima cade nella regione di rifiuto si respinge l’ipotesi
principale H0 con un rischio pari ad a di commettere un errore:
-
il valore 1 -  della probabilità di non accettare
le ipotesi alternative H1 quando esse sono realmente false
viene detto: “ potenza del test ”
Test 02 - 33 / 53
la determinazione
di a e 
usando la
variabile casuale Xn
Test 02 - 34 / 53
la determinazione di a e  con Xn
Per meglio comprendere il significato ed il metodo di calcolo
del rischio di errore di seconda specie esaminiamo il caso di
una ipotesi fondamentale H0 e di due ipotesi alternative: H1 e H2
H0 : m = m0 ;
H1 : m = m1 ;
con
m2 < m0 < m1
H2 : m = m2
Come è semplice notare le tre ipotesi sono formalmente
identiche: in tutti i casi si ipotizza che la media della variabile
casuale X possa assumere un prestabilito valore. Come
vedremo fra poco, però, l’ipotesi fondamentale H0 viene trattata
in maniera ben diversa dalle due ipotesi alternative H1 e H2
Test 02 - 35 / 53
la determinazione di a e  con Xn
La figura mostra la distribuzione della media campionaria nel
caso in cui l’ipotesi fondamentale H0 : m = m0 sia vera:
Le due regioni “campite” (cioè colorate) in giallo individuano la
regione di rifiuto per H0 :
X n  xci  X n > xcs
Test 02 - 36 / 53
la determinazione di a e  con Xn
Se lo stimatore campionario risulta
X n  xci
X n > xcs
rifiuteremo l’ipotesi principale H0
oppure se risulta
Test 02 - 37 / 53
la determinazione di a e  con Xn
Se lo stimatore campionario risulta
X n  xci
X n > xcs
oppure se risulta
rifiuteremo l’ipotesi principale H0
Sappiamo però che, qualora H0 sia vera, c’è una probabilità
pari ad a/2 che lo stimatore campionario risulti
X n > xcs
per effetto del caso con cui si estrae il campione dalla
popolazione (regione 1).
Test 02 - 38 / 53
la determinazione di a e  con Xn
Se lo stimatore campionario risulta
X n  xci
X n > xcs
oppure se risulta
rifiuteremo l’ipotesi principale H0
Analogamente sappiamo che, con H0 vera, c’è una probabilità
pari ad a/2 che lo stimatore campionario risulti
X n  xci
per effetto del caso con cui si estrae il campione dalla
popolazione (regione 2).
Test 02 - 39 / 53
la determinazione di a e  con Xn
Se lo stimatore campionario risulta
xci  X n  xcs
il test non fornisce informazioni tali da consentirci di rifiutare H0
Chiediamoci però, nel caso in cui H0 sia falsa ed H1 sia vera, quale
sia la probabilità di trovare un valore dello stimatore compreso
nell’intervallo xc  X n
i
cui si estrae il campione.
 xcs
a causa della aleatorietà con
Test 02 - 40 / 53
la determinazione di a e  con Xn
La regione 3 campita in viola rappresenta la probabilità che,
malgrado sia vera l’ipotesi alternativa H1 : m = m1 , il valore
della media campionaria risulti
X n  xcs
.
Test 02 - 41 / 53
la determinazione di a e  con Xn
E’ evidente che, anche se l’ipotesi fondamentale H0 : m = m0
e l’ipotesi alternativa H1 : m = m1 sono espresse nella stessa
forma, lo studio che si conduce è diverso tra l’una e l’altra.
Test 02 - 42 / 53
la determinazione di a e  con Xn
Un analogo ragionamento viene poi condotto in relazione alla
seconda ipotesi alternativa: H2 : m = m2
Chiediamoci, nel caso in cui H0 sia falsa ed H2 sia vera, quale
sia la probabilità di trovare un valore dello stimatore compreso
nell’intervallo xc  X n 
i
con cui si estrae il campione.
xcs
a causa della aleatorietà
Test 02 - 43 / 53
la determinazione di a e  con Xn
Un analogo ragionamento viene poi condotto in relazione alla
seconda ipotesi alternativa: H2 : m = m2
La regione 4 campita in viola nella figura successiva
rappresenta la probabilità che, malgrado sia vera
l’ipotesi alternativa H2 : m = m2 , il valore della
media campionaria risulti
xci  X n  xcs
Test 02 - 44 / 53
la distribuzione di Xn per H0, H1, H2
se H0 : m = m0 vera
se H1 : m = m1 vera
se H2 : m = m2 vera
Test 02 - 45 / 53
la determinazione
di a e 
usando la
variabile casuale T
Test 02 - 46 / 53
la determinazione di a e  con T
se H0 : m = m0 vera
se H1 : m = m1 vera
Test 02 - 47 / 53
la determinazione di a e  con T
Facciamo due considerazioni generali:
1)
T=
Xn  m
Sn n
•
dal valore di a desiderato si ricava il valore critico T0c
•
dal valore critico T0c si ricava il corrispondente valore critico
per la media campionaria:
T0c =
0,05
X nc  m
Sn n

X nc = m 
che individua la regione di rifiuto della H0
-1,753
1,753
Sn
T0c
n0,05
Test 02 - 48 / 53
la determinazione di a e  con T
La seconda considerazione generale è la seguente:
2)
Xn  m
T=
Sn n


X n  m0
T
=
 0 S
n
n



X  m1
T1 = n

Sn n
il valore assunto da T
per uno stesso valore della media campionaria
dipende dal valore ipotizzato per la media della popolazione.
Test 02 - 49 / 53
la determinazione di a e  con T
di conseguenza: il valore critico assunto da T in corrispondenza
del valore critico per la media campionaria dipende dal valore
ipotizzato per la media della popolazione.
Xn  m
Tc =
Sn n


X nc  m0
T0c =
Sn n



X  m1
T1c = nc

Sn n
Test 02 - 50 / 53
la determinazione di a e  con T
di conseguenza: il valore assunto da T in corrispondenza del
valore critico per la media campionaria dipende dal valore
ipotizzato per la media della popolazione.
ˆ m
X
Tˆ = n
Sn n
T1c =
X nc  m1
Sn n

ˆ m X m

X
0
Tˆ0 = Tn0c = 0 nc
Sn n Sn n




ˆ
Tˆ = X n  m1
1 S
n
n

Test 02 - 51 / 53
la determinazione di a e  con T
dato che :

X nc  m0
T
=
 0c
Sn n


X nc  m1

T1c = S
n
n

Sn

X
=
m

T0c
0
 nc
n

 
T = X nc  m1
 1c
Sn n Sn n

possiamo anche scrivere:
T1c =
Sn
T0c
m0
S
m1
n

=
 n
Sn n
Sn n
Sn n Sn
m0 
T1c = T0c 
m0  m1
Sn
n
n
m1
T0c 
n
Sn n
Test 02 - 52 / 53
la determinazione di a e  con T
dal valore che si è stabilito di poter accettare per
il rischio di errore di prima specie:
a
TT00cc 
m0  m1
Sn
n
= T1c

0,015
0,05
0,05
- 2,387
-1,753
1,753
Test 02 - 53 / 53
la determinazione di a e  con Z (s2 nota)
dato che :
ì
ì
Xnc - m 0
s
Z
=
X
=
m
+
Z 0c
ï 0c
nc
0
ï
ï
s n
ï
n
Þ í
í
ï Z = Xnc - m1
ï Z = Xnc - m1
ïî 1c s n
ïî 1c s n s n
possiamo anche scrivere:
Z1c =
m0 +
s
Z 0c
n
s n
-
m1
s
n
=
Z1c = Z0c +
m0
s
s
+
n s
m0 - m1
s n
n
m1
Z 0c n
s n
Scarica

Test di ipotesi sulla media - ipotesi principale e alternativa