Test 02 - 1 / 83
Lezione 6
i Test
statistici
Test 02 - 2 / 83
Nella parte 1 e 2 …
test sull’ipotesi principale H0:
prestazioni del
criterio decisionale
rischio di errore di 1 specie;
fiducia del criterio decisionale
significatività del test
test sull’ipotesi principale H0
con alternative H1, H2
rischio di errore
di 2 specie;
potenza del test
Test 02 - 3 / 83
H0 : la ipotesi “nulla”
Test 02 - 4 / 83
H0 : la ipotesi “nulla”
Test 02 - 5 / 83
i test
sulla
differenza
fra medie:
H0
Test 02 - 6 / 83
formulazione di un test sulla differenza fra le medie
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità dei campioni;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;
5. scelta dello stimatore campionario e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 7 / 83
formulazione di un test sulla differenza fra le medie
1.
si stabilisce la numerosità n del campione con cui si vuole
condurre il test (nel caso occorrano più campioni si stabilisce
la numerosità di ciascuni di essi).
ricordiamo che se n è grande
si può invocare il teorema
limite centrale per affermare
che la media campionaria è
distribuita in modo normale
qualunque sia la
distribuzione della X
Test 02 - 8 / 83
formulazione di un test sulla differenza fra le medie
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità dei campioni;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;
5. scelta dello stimatore campionario e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 9 / 83
formulazione di un test sulla differenza fra le medie
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità dei campioni;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;
5. scelta dello stimatore campionario e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 10 / 83
formulazione di un test sulla differenza fra le medie
3. si individua l’ipotesi H0 (ipotesi principale) che deve essere
sottoposta a test.
esempio:
H0 : m0 - m1 = 0;
oppure:
H0 : m0 - m1 > 1
il test non ci porta a determinare quanto valga la probabilità
che l’ipotesi H0 sia vera oppure falsa, ma ci dice solamente
se possiamo escludere, con il rischio di errore prefissato,
che l’ipotesi H0 sia vera.
Test 02 - 11 / 83
formulazione di un test sulla differenza fra le medie
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità dei campioni;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;
5. scelta dello stimatore campionario e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 12 / 83
formulazione di un test sulla differenza fra le medie
5. si sceglie la variabile campionaria idonea a svolgere il test:
•
le varianze s21 e s22 delle due popolazioni sono note
e i due campioni sono numerosi (n1 > 30 e n2 > 30)
•
le due popolazioni hanno distribuzione normale
con varianze s21 e s22 incognite ma UGUALI
•
le due popolazioni hanno distribuzione normale
con varianze s21 e s22 incognite
e i due campioni sono MOLTO numerosi (n1 > 120 e n2 > 120)
•
I dati sono appaiati
Test 02 - 13 / 83
formulazione di un test sulla differenza fra le medie
5. si sceglie la variabile campionaria idonea a svolgere il test:
se le varianze s21 e s22 delle due popolazioni sono note e se i due
campioni sono numerosi (n1 > 30 e n2 > 30)
si può usare la variabile campionaria
X
(
Z=
1n1
- X2n2 ) - ( m1 - m 2 )
s
2
1
n1
+
s
2
2
n2
che ha distribuzione normale standard.
Test 02 - 14 / 83
formulazione di un test sulla differenza fra le medie
5. si sceglie la variabile campionaria idonea a svolgere il test:
se le due popolazioni hanno distribuzione normale con varianze
s21 e s22 incognite ma UGUALI si può usare la variabile
X
(
T=
1n1
- X2n2 ) - ( m 0 - m1 )
æ1 1ö
Smp ç + ÷
è n1 n2 ø
2
che ha distribuzione t di Student con (n1 + n2 – 2) gdl
Smp
2
n1 -1) S + ( n2 -1) S
(
=
2
1
n1 + n2 - 2
2
2
Test 02 - 15 / 83
formulazione di un test sulla differenza fra le medie
5. si sceglie la variabile campionaria idonea a svolgere il test:
se le due popolazioni hanno distribuzione normale con
varianze s21 e s22 incognite ma UGUALI
e se
n1 >> n2
si può usare la variabile
X
(
T=
1n1
- X2n2 ) - ( m 0 - m1 )
S12
n2
che ha distribuzione t di Student con (n1 + n2 – 2) gdl
Test 02 - 16 / 83
formulazione di un test sulla differenza fra le medie
5. si sceglie la variabile campionaria idonea a svolgere il test:
se le due popolazioni hanno distribuzione normale con varianze
s21 e s22 incognite ed i campioni sono MOLTO numerosi
(n1 > 120 e n2 > 120) si può usare la variabile
X
(
Z=
1n1
- X2n2 ) - ( m0 - m1 )
S1 S
+
n1 n2
2
2
2
che ha distribuzione approssimabile con la normale standard
Test 02 - 17 / 83
formulazione di un test sulla differenza fra le medie
5. si sceglie la variabile campionaria idonea a svolgere il test:
se la popolazione ha distribuzione normale
ed i due campioni non sono indipendenti
si può usare la variabile
T=
Dx - ( m1 - m2 )
SD
n
2
che ha distribuzione approssimabile con la t di Student a n-1 gdl
Test 02 - 18 / 83
formulazione di un test sulla differenza fra le medie
Di = Xi - Yi
1
1
Dx = å Di = å ( Xi -Yi )
n
n
2
1
S =
( Di _ Dx )
å
n -1
2
d
T=
Dx - ( m1 - m2 )
S 2D
n
Test 02 - 19 / 83
parte 2
i test
sulla media:
H0 e H1
Test 02 - 20 / 83
formulazione di test con H0 e H1 sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 21 / 83
formulazione di test con H0 e H1 sulla media
3. si individua l’ipotesi H0 (ipotesi principale) che deve essere
sottoposta a test.
esempio:
H0 : m = m0 ;
oppure:
H0 : m  m0 ;
4. si definisce, in contrasto alla ipotesi principale, una (o più di una)
“ipotesi alternativa” H1 (, H2 );
esempio:
H1 : m  m1 ;
oppure:
H1 : m = m1 ;
Test 02 - 22 / 83
formulazione di test con H0 e H1 sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 23 / 83
formulazione di test con H0 e H1 sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test:
se la varianza s2 è nota e se il campione è numeroso (n > 30) si
possono usare indifferentemente:
- la media campionaria
1
Xn =
n
n

j =1
Xj
che ha distribuzione normale
con media m e varianza s2 / n;
- la variabile
X n  m0
Z=
s
n
che ha distribuzione normale standard.
Test 02 - 24 / 83
formulazione di test con H0 e H1 sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test:
se la distribuzione è normale e la varianza s2 è incognita si usa:
- la variabile
X n  m0
T=
Sn
n
che ha distribuzione t di Student con n - 1 g.d.l.
se il campione è numeroso ( n > 30) la T può essere
approssimata con la:
X n  m0
Z=
Sn
n
che ha distribuzione normale standard
Test 02 - 28 / 83
formulazione di test con H0 e H1 sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 29 / 83
Affidabilità per H0 e Potenza contro H1
in alternativa all’ipotesi H0 , che prende anche il nome di
“ipotesi principale” si può definire una “ipotesi alternativa” H1
per esempio:
H0 : m  m0

H1 : m  m1
notiamo il fatto che si esclude a priori l’ipotesi:
m0  m  m1
questo perché si considerano possibili unicamente l’ipotesi principale
e quella ( o quelle ) alternativa.
Test 02 - 30 / 83
Significato della “potenza contro H1”
regione di
rifiuto per H0
regione di
non accettazione
per H1
100
Test 02 - 31 / 83
Significato della “potenza contro H1”
regione di
rifiuto per H0
regione di
esclusione per H1
Test 02 - 32 / 83
ipotesi H0 e alternativa H1
con riferimento alla sola H0 : m  m0 il criterio decisionale è:
 se X n > xc rifiuto H0
P
  sbagliato  = 
rischio di errore di 1ª specie
Test 02 - 33 / 83
ipotesi H0 e alternativa H1
considerando anche la H1 : m  m1 il criterio decisionale diviene:
 se X n > xc rifiuto H0

 se X n  xc non accetto H1
P
  sbagliato  = 
Test 02 - 34 / 83
ipotesi H0 e alternativa H1
il criterio decisionale complessivo adottato è quindi:
 se X n > xc rifiuto H 0

 se X n  xc non accetto H1 (quindi non rifiuto H 0 )
P
  sbagliato  = 
rischio di errore di 1ª specie
P
  sbagliato  = 
rischio di errore di 2ª specie
Test 02 - 35 / 83
ipotesi H0 e alternativa H1
il criterio decisionale complessivo adottato è quindi:
 se X n > xc rifiuto H 0

 se X n  xc non accetto H1 (quindi non rifiuto H 0 )
1-:
affidabilità del criterio
decisionale nel rifiuto di H0
1-:
potenza contro H1
Test 02 - 39 / 83
Significato della “potenza contro H1”
regione di
rifiuto per H0
75
regione di
esclusione per H1
100
Test 02 - 40 / 83
formulazione di test con H0 e H1 sulla media
7. si stabilisce il valore minimo accettabile della potenza contro
l’ipotesi alternativa che si vuole contrapporre alla ipotesi
fondamentale (nel caso di più ipotesi alternative si stabilisce la
potenza contro ciascuna di esse).
Questa scelta equivale a fissare il massimo valore  del rischio di
errore di 2ª specie che si intende accettare nella conduzione del
test.
Il valore  del rischio di errore di 2ª specie risulta funzione:
– della differenza fra le due ipotesi H0 e H1,
– di  (valore del rischio di errore di 1ª specie)
– della numerosità del campione su cui è stato condotto il test.
Test 02 - 41 / 83
formulazione di test con H0 e H1 sulla media
7. si stabilisce il valore minimo accettabile della potenza contro
l’ipotesi alternativa che si vuole contrapporre alla ipotesi
fondamentale (nel caso di più ipotesi alternative si stabilisce la
potenza contro ciascuna di esse).
Questa scelta
equivale a fissare
il massimo valore
 del rischio di
errore di 2ª specie
che si intende
accettare nella
conduzione
del test.
Test 02 - 42 / 83
formulazione di test con H0 e H1 sulla media
7. aumentare la numerosità
del campione provoca
una riduzione della
varianza dello stimatore
media campionaria che
consente di aumentare la
potenza del test senza
diminuire la sua
affidabilità.
Test 02 - 43 / 83
formulazione di test con H0 e H1 sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 44 / 83
formulazione di test con H0 e H1 sulla media
8. in base a ciò che si è stabilito nei punti precedenti, si identifica il
valore critico (o la coppia di valori critici) del parametro
campionario che
individua nel
dominio la
“regione di rifiuto”
dell’ipotesi
principale H0
Test 02 - 45 / 83
formulazione di test con H0 e H1 sulla media
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 46 / 83
formulazione di test con H0 e H1 sulla media
9. si stimano quindi i valori del rischio di errore di seconda specie a
cui il test verrà condotto e, se tali valori non rispettano le scelta
fatte per la potenza
del test si modificano
i parametri del test
da cui tale rischio
dipende
(in particolare
la numerosità
minima
del campione. )
Test 02 - 47 / 83
conduzione di test con H0 e H1 sulla media
10. dopo aver formulato il test:
si procede alla composizione del campione con numerosità
pari a quella stabilita,
si conducono le prove sperimentali,
si determina il valore dello stimatore campionario precelto,
Test 02 - 48 / 83
conduzione di test con H0 e H1 sulla media
10. se la stima cade nella regione di rifiuto si respinge l’ipotesi
principale H0 con un rischio pari ad  di commettere un errore:
-
il valore 1 -  della probabilità di non accettare
le ipotesi alternative H1 quando esse sono realmente false
viene detto: “ potenza del test ”
Test 02 - 49 / 83
la determinazione
di  e 
usando la
variabile casuale Xn
Test 02 - 50 / 83
la determinazione di  e  con Xn
Per meglio comprendere il significato ed il metodo di calcolo
del rischio di errore di seconda specie esaminiamo il caso di
una ipotesi fondamentale H0 e di due ipotesi alternative: H1 e H2
H0 : m = m0 ;
H1 : m = m1 ;
con
m2 < m0 < m1
H2 : m = m2
Come è semplice notare le tre ipotesi sono formalmente
identiche: in tutti i casi si ipotizza che la media della variabile
casuale X possa assumere un prestabilito valore. Come
vedremo fra poco, però, l’ipotesi fondamentale H0 viene trattata
in maniera ben diversa dalle due ipotesi alternative H1 e H2
Test 02 - 51 / 83
la determinazione di  e  con Xn
La figura mostra la distribuzione della media campionaria nel
caso in cui l’ipotesi fondamentale H0 : m = m0 sia vera:
Le due regioni “campite” (cioè colorate) in giallo individuano la
regione di rifiuto per H0 :
X n  xci  X n > xcs
Test 02 - 52 / 83
la determinazione di  e  con Xn
Se lo stimatore campionario risulta
X n  xci
X n > xcs
rifiuteremo l’ipotesi principale H0
oppure se risulta
Test 02 - 53 / 83
la determinazione di  e  con Xn
Se lo stimatore campionario risulta
X n  xci
X n > xcs
oppure se risulta
rifiuteremo l’ipotesi principale H0
Sappiamo però che, qualora H0 sia vera, c’è una probabilità
pari ad /2 che lo stimatore campionario risulti
X n > xcs
per effetto del caso con cui si estrae il campione dalla
popolazione (regione 1).
Test 02 - 54 / 83
la determinazione di  e  con Xn
Se lo stimatore campionario risulta
X n  xci
X n > xcs
oppure se risulta
rifiuteremo l’ipotesi principale H0
Analogamente sappiamo che, con H0 vera, c’è una probabilità
pari ad /2 che lo stimatore campionario risulti
X n  xci
per effetto del caso con cui si estrae il campione dalla
popolazione (regione 2).
Test 02 - 55 / 83
la determinazione di  e  con Xn
Se lo stimatore campionario risulta
xci  X n  xcs
il test non fornisce informazioni tali da consentirci di rifiutare H0
Chiediamoci però, nel caso in cui H0 sia falsa ed H1 sia vera, quale
sia la probabilità di trovare un valore dello stimatore compreso
nell’intervallo xc  X n
i
cui si estrae il campione.
 xcs
a causa della aleatorietà con
Test 02 - 56 / 83
la determinazione di  e  con Xn
La regione 3 campita in viola rappresenta la probabilità che,
malgrado sia vera l’ipotesi alternativa H1 : m = m1 , il valore
della media campionaria risulti
X n  xcs
.
Test 02 - 57 / 83
la determinazione di  e  con Xn
E’ evidente che, anche se l’ipotesi fondamentale H0 : m = m0
e l’ipotesi alternativa H1 : m = m1 sono espresse nella stessa
forma, lo studio che si conduce è diverso tra l’una e l’altra.
Test 02 - 58 / 83
la determinazione di  e  con Xn
Un analogo ragionamento viene poi condotto in relazione alla
seconda ipotesi alternativa: H2 : m = m2
Chiediamoci, nel caso in cui H0 sia falsa ed H2 sia vera, quale
sia la probabilità di trovare un valore dello stimatore compreso
nell’intervallo xc  X n 
i
con cui si estrae il campione.
xcs
a causa della aleatorietà
Test 02 - 59 / 83
la determinazione di  e  con Xn
Un analogo ragionamento viene poi condotto in relazione alla
seconda ipotesi alternativa: H2 : m = m2
La regione 4 campita in viola nella figura successiva
rappresenta la probabilità che, malgrado sia vera
l’ipotesi alternativa H2 : m = m2 , il valore della
media campionaria risulti
xci  X n  xcs
Test 02 - 60 / 83
la distribuzione di Xn per H0, H1, H2
se H0 : m = m0 vera
se H1 : m = m1 vera
se H2 : m = m2 vera
Test 02 - 61 / 83
la determinazione
di  e 
usando la
variabile casuale T
Test 02 - 62 / 83
la determinazione di  e  con T
se H0 : m = m0 vera
se H1 : m = m1 vera
Test 02 - 63 / 83
la determinazione di  e  con Xn
regione di
rifiuto per H0
75
regione di
esclusione per H1
100
Test 02 - 64 / 83
la determinazione di  e  con T
Facciamo due considerazioni generali:
1)
T=
Xn  m
Sn n
•
dal valore di  desiderato si ricava il valore critico T0c
•
dal valore critico T0c si ricava il corrispondente valore critico
per la media campionaria:
T0c =
0,05
X nc  m
Sn n

X nc = m 
che individua la regione di rifiuto della H0
-1,753
1,753
Sn
T0c
n0,05
Test 02 - 65 / 83
la determinazione di  e  con T
La seconda considerazione generale è la seguente:
2)
Xn  m
T=
Sn n


X n  m0
T
=
 0 S
n
n



X  m1
T1 = n

Sn n
il valore assunto da T
per uno stesso valore della media campionaria
dipende dal valore ipotizzato per la media della popolazione.
Test 02 - 66 / 83
la determinazione di  e  con T
di conseguenza: il valore critico assunto da T in corrispondenza
del valore critico per la media campionaria dipende dal valore
ipotizzato per la media della popolazione.
Xn  m
Tc =
Sn n


X nc  m0
T0c =
Sn n



X  m1
T1c = nc

Sn n
Test 02 - 67 / 83
la determinazione di  e  con Xn
regione di
rifiuto per H0
75
regione di
esclusione per H1
100
Test 02 - 68 / 83
la determinazione di  e  con T
di conseguenza: il valore assunto da T in corrispondenza del
valore critico per la media campionaria dipende dal valore
ipotizzato per la media della popolazione.
ˆ m
X
Tˆ = n
Sn n
T1c =
X nc  m1
Sn n

ˆ m X m

X
0
Tˆ0 = Tn0c = 0 nc
Sn n Sn n




ˆ
Tˆ = X n  m1
1 S
n
n

Test 02 - 69 / 83
la determinazione di  e  con T
dato che :

X nc  m0
T
=
 0c
Sn n


X nc  m1

T1c = S
n
n

Sn

X
=
m

T0c
0
 nc
n

 
T = X nc  m1
 1c
Sn n Sn n

possiamo anche scrivere:
T1c =
Sn
T0c
m0
S
m1
n

=
 n
Sn n
Sn n
Sn n Sn
m0 
T1c = T0c 
m0  m1
Sn
n
n
m1
T0c 
n
Sn n
Test 02 - 70 / 83
la determinazione di  e  con T
dal valore che si è stabilito di poter accettare per
il rischio di errore di prima specie:

TT00cc 
m0  m1
Sn
n
= T1c

0,015
0,05
0,05
- 2,387
-1,753
1,753
Test 02 - 71 / 83
la determinazione di  e  con Z
dato che :

X nc  m0
Z
=
 0c
Sn n


X nc  m1

Z1c = S
n
n

Sn

X
=
m

Z 0c
0
 nc
n

 
Z = X nc  m1
 1c
Sn n Sn n

possiamo anche scrivere:
Z1c =
Sn
Z 0c
m0
S
m1
n

=
 n
Sn n
Sn n
Sn n Sn
m0 
Z1c = Z 0c 
m0  m1
Sn
n
n
m1
Z 0c 
n
Sn n
Test 02 - 72 / 83
formulazione di un test sulla differenza fra le medie
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;
5. scelta dello stimatore campionario e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 73 / 83
formulazione di un test sulla differenza fra le medie
6. si stabiliscono i valori
 del rischio di errore di 1ª specie che si è disposti a correre e
1 -  della affidabilità richiesta.
La probabilità  di commettere un errore di 1ª specie viene
chiamata “livello di significatività” al quale si intende condurre il
test.

Test 02 - 74 / 83
formulazione di un test sulla differenza fra le medie
6. si stabiliscono i valori
 del rischio di errore di 1ª specie che si è disposti a correre e
1 -  della affidabilità richiesta.
La probabilità  di commettere un errore di 1ª specie viene
chiamata “livello di significatività” al quale si intende condurre il
test.
criterio di scelta:
la scelta del valore di rischio accettabile richiede
considerazioni di vario tipo, non solamente tecniche ma,
molto spesso, economiche, di politica aziendale, di
immagine, ecc.
Test 02 - 75 / 83
formulazione di un test sulla differenza fra le medie
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ;
5. scelta dello stimatore campionario e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 76 / 83
formulazione di un test sulla differenza fra le medie
8. in base a ciò che si è stabilito nei punti precedenti, si identifica il
valore critico (o la coppia di valori critici) della statistica
campionaria che individua nel dominio la “regione di rifiuto”
dell’ipotesi principale H0 .

Test 02 - 77 / 83
formulazione di un test sulla differenza fra le medie
8. in base a ciò che si è stabilito nei punti precedenti, si identifica il
valore critico (o la coppia di valori critici) della statistica
campionaria che individua nel dominio la “regione di rifiuto”
dell’ipotesi principale H0 .
/2
/2
Test 02 - 78 / 83
formulazione di un test sulla differenza fra le medie
Dopo aver formulato il test:
si procede alla composizione del campione con numerosità
pari a quella stabilita,
si conducono le prove sperimentali,
si determina il valore della variabile campionaria precelta,
/2
/2
Test 02 - 79 / 83
conclusione del test
Se il valore della variabile cade nella regione di rifiuto di H0
si respinge l’ipotesi principale H0
con un rischio pari ad  di commettere un errore:
-
il rifiuto di H0 avviene con una “fiducia” pari a 1 - 
corrispondente alla probabilità di avere correttamente
respinto H0 quando essa è realmente falsa
Test 02 - 80 / 83
5° test sulla media: H0 con H1
varianza nota,
rischio di errore di seconda specie 
Test 02 - 81 / 83
Test di ipotesi sulla media (con s2 nota)
• Si è riprogettato un OpAmp in produzione da tempo e si è realizzata
una preserie del nuovo dispositivo.
• Ci si interroga sulla possibilità che il valore tipico della corrente di
offset sia passato dai 50 nA del “vecchio” progetto a meno di 40 nA.
Test 02 - 82 / 83
formulazione del test
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 83 / 83
Test di ipotesi sulla media (con s2 nota)
1. Stabiliamo di operare con un campione di 36 amplificatori.
2. Costruiamo la variabile casuale X stabilendo che essa assuma
valore uguale a quello della corrente di offset di ciascun elemento
della popolazione misurata in nA.
La varianza s2 della X per l’intera popolazione si suppone nota:
s2 = 225
3. H0 : m < m0 = 40 ;
4. H1 : m = m1 = 50 ;
5. scegliamo come variabile campionaria
la media campionaria che, se n è sufficientemente elevato,
segue la distribuzione normale con varianza pari a s2 / n;
Test 02 - 84 / 83
Test di ipotesi sulla media (con s2 nota)
6. fissiamo il livello accettabile per il rischio di errore di prima specie:
 = 0,10 ( che comporta un “livello di fiducia” del 90% );;
7. stabiliamo un valore richiesto della potenza non inferiore a 99% ;
8. calcoliamo il valore critico della variabile campionaria che
individua la regioni di rifiuto della ipotesi principale H0 in funzione
del valore di  prestabilito (0,10);
0,10
Test 02 - 85 / 83
Test di ipotesi sulla media (con s2 nota)
abbiamo utilizzato la distribuzione a una coda in quanto l’ipotesi
principale viene rigettata solo se la media è maggiore di m0 ;
0,10
Test 02 - 86 / 83
Test di ipotesi sulla media (con s2 nota)
regione di rifiuto di H0 :
X 36 > 43,204
0,10
Test 02 - 87 / 83
Test di ipotesi sulla media (con s2 nota)
regione di rifiuto di H0 :
X 36 > 43,204
quale è il valore del rischio di errore di II specie 
determinato da H1 : m = m1 = 50
Test 02 - 88 / 83
Test di ipotesi sulla media (con s2 nota)
regione di rifiuto di H0 :
X 36 > 43,204
rischio di errore di II specie  :
0,003
potenza contro H1 :
99,7%
0,003
Test 02 - 89 / 83
Test di ipotesi sulla media (con s2 nota)
riassumendo:
regione di rifiuto di H0 :
X 36 > 43,204
rischio di errore di I specie  : 0,10
rischio di errore di II specie  : 0,003
0,003
0,10
Test 02 - 90 / 83
Test di ipotesi sulla media (con s2 nota)
riassumendo:
X 36 = 43,0
regione di rifiuto di H0 : X > 43,204
36
rischio di errore di I specie  : 0,10
rischio di errore di II specie  : 0,003
0,003
0,10
Test 02 - 91 / 83
Test di ipotesi sulla media (con s2 nota)
X 36 = 43,0 non cade nella
regione di rifiuto di H0 : X 36 > 43,204
0,003
0,10
Test 02 - 92 / 83
Test di ipotesi sulla media (con s2 nota)
X 36 = 43,0 non cade nella
regione di rifiuto di H0 : X 36 > 43,204
devo non rifiutare l’ipotesi principale: H0 : m  40,0 ;
0,003
0,10
Test 02 - 93 / 83
Test di ipotesi sulla media (con s2 nota)
X 36 = 43,0 non cade nella
regione di rifiuto di H0 : X 36 > 43,204
devo non rifiutare l’ipotesi principale: H0 : m  40,0 ;
il test ha un livello di fiducia del 90% per H0
0,003
0,10
Test 02 - 94 / 83
Test di ipotesi sulla media (con s2 nota)
X 36 = 43,0 non cade nella
regione di rifiuto di H0 : X 36 > 43,204
devo non rifiutare l’ipotesi principale: H0 : m  40,0 ;
il test ha un livello di fiducia del 90% per H0
ed una potenza del 99,7% nei confronti di H1
0,003
0,10
Test 02 - 95 / 83
Test di ipotesi sulla media (con s2 nota)
X 36 = 43,0 non cade nella
regione di rifiuto di H0 : X 36 > 43,204
devo non rifiutare l’ipotesi principale: H0 : m  40,0 ;
il test ha un livello di fiducia del 90% per H0
ed una potenza del 99,7% nei confronti di H1
Ripetiamo il test imponendo un livello di fiducia più alto per
esaminare le conseguenze di questa scelta.
0,003
0,10
Test 02 - 96 / 83
6° test sulla media: H0 con H1
varianza nota,
rischio di errore di seconda specie 
Test 02 - 97 / 83
formulazione del test
per formulare correttamente un test di ipotesi si devono seguire
alcuni passi ben precisi:
1. scelta della numerosità del campione;
2. costruzione della variabile casuale X
3. individuazione della “ipotesi principale” H0 ;
4. eventuale definizione di ipotesi alternative H1 , H2 ;
5. scelta della variabile campionaria e
determinazione della sua distribuzione ;
6. definizione della affidabilità richiesta ;
7. definizione della eventuale potenza minima richiesta ;
8. determinazione del valore del/dei discriminanti ;
9. verifica della potenza ottenuta:
se inferiore a quanto richiesto si torna all’inizio
e si aumenta la numerosità del campione ;
Test 02 - 98 / 83
Test di ipotesi sulla media (con s2 nota)
1. Stabiliamo di operare con un campione di 36 amplificatori.
2. Costruiamo la variabile casuale X stabilendo che essa assuma
valore uguale a quello della corrente di offset di ciascun elemento
della popolazione misurata in nA.
La varianza s2 della X per l’intera popolazione si suppone nota:
s2 = 225
3. H0 : m < m0 = 40 ;
4. H1 : m = m1 = 50 ;
5. scegliamo come variabile campionaria
la media campionaria che, se n è sufficientemente elevato,
segue la distribuzione normale con varianza pari a s2 / n;
Test 02 - 99 / 83
Test di ipotesi sulla media (con s2 nota)
6. fissiamo il livello accettabile per il rischio di errore di prima specie:
 = 0,05 ( che comporta un “livello di fiducia” del 95% );
7. stabiliamo un valore richiesto della potenza non inferiore a 99% ;
8. calcoliamo il valore critico della statistica campionaria che
individua la regioni di rifiuto della ipotesi principale H0 in funzione
del valore di  prestabilito (0,05);
0,05
Test 02 - 100 / 83
Test di ipotesi sulla media (con s2 nota)
abbiamo utilizzato la distribuzione a una coda in quanto l’ipotesi
principale viene rigettata solo se la media è maggiore di m0 ;
0,05
Test 02 - 101 / 83
Test di ipotesi sulla media (con s2 nota)
regione di rifiuto di H0 :
X 36 > 44,112
0,05
Test 02 - 102 / 83
Test di ipotesi sulla media (con s2 nota)
regione di rifiuto di H0 :
X 36 > 44,112
quale è il valore del rischio di errore di II specie 
determinato da H1 : m = m1 = 50
Test 02 - 103 / 83
Test di ipotesi sulla media (con s2 nota)
regione di rifiuto di H0 :
X 36 > 44,112
rischio di errore di II specie  :
0,0093
potenza contro H1 :
99,07%
0,0093
Test 02 - 104 / 83
Test di ipotesi sulla media (con s2 nota)
riassumendo:
regione di rifiuto di H0 :
X 36 > 44,112
rischio di errore di I specie  : 0,05
rischio di errore di II specie  : 0,0093
0,0093
0,05
Test 02 - 105 / 83
Test di ipotesi sulla media (con s2 nota)
aver voluto portare il livello di fiducia del test dal 90% al 95% per
H0, senza cambiare il numero di elementi del campione,
ha fatto diminuire la potenza nei confronti di H1 ed aumentare il
rischio  di errore di II specie fino a sfiorare il limite prefissato!!!
0,0093
0,05
Test 02 - 106 / 83
Test di ipotesi sulla media (con s2 nota)
se invece aumentassi da 36 a 45 il numero degli elementi del
campione potrei portare il livello di fiducia del test al 95% per H0
senza diminuire la potenza nei confronti di H1 : il rischio  di
errore di II specie scenderebbe a meno di 0,0025
0,0093
0,0023
0,05
0,05
Test 02 - 107 / 83
7° test sulla media
varianza incognita
variabile T di Student
rischio di errore di seconda specie 
Test 02 - 108 / 83
Test di ipotesi sulla media ( s2 incognita )
•
In base alla scheda tecnica del costruttore, l’induttore HQL ha un
valore del fattore di merito Q maggiore di 75 (valore tipico).
•
Un altro costruttore afferma che tale valore non è raggiunto e
sostiene che il valore tipico dell’HQL prodotto dal suo concorrente
è uguale a quello tipico del modello “TL” da lui prodotto (Q = 60).
•
Dato che l’induttore “HQL” ha un prezzo di acquisto maggiore
del “TL”, si desidera verificare l’ipotesi che il valore tipico del
fattore di merito Q dell’induttore “HQL” sia effettivamente
“maggiore o uguale” di 75 contro l’ipotesi che sia uguale a 60.
Tramite un “”acquirente non conosciuto dal venditore” (per non
ricevere un campione selezionato ad hoc) si acquista un lotto di
induttori modello “HQL” per procedere ad un test di ipotesi sulla
media.
Test 02 - 109 / 83
Test di ipotesi sulla media ( s2 incognita )
1. costruiamo la variabile casuale X il cui valore coincide con quello
del fattore Q degli induttori Mod. HQL
2. H0 : m > m0 = 75 ;
3. H1 : m = m1 = 60 ;
4. dato che s2 è incognita si ricorre alla statistica
T=
Xn  m
Sn n
che segue la distribuzione t di Student con n -1 gradi di libertà;
Test 02 - 110 / 83
Test di ipotesi sulla media ( s2 incognita )
5. fissiamo il livello accettabile per il rischio di errore di prima specie:
 = 0,05 ( che comporta un “livello di fiducia” del 95% );
6. stabiliamo di operare con un campione di 16 induttori HQL ;
7. fissiamo il livello accettabile per  < 2%;
8. il nostro scopo è quello di individuare il valore critico della
statistica campionaria che individua la regione di rifiuto della
ipotesi principale H0 in funzione del valore di  che è stato
prestabilito (0,05);
per fare ciò utilizzeremo la t di Student “ad una coda” in quanto
l’ipotesi principale (H0 : m > m0 = 75) è falsa solamente se la
media della popolazione risulta minore di m0
Test 02 - 111 / 83
Test di ipotesi sulla media ( s2 incognita )
individuiamo, dai dati del problema, il valore critico della T:
•
n = 16
;
g.d.l. = 15
•
 = 0,05
;
distribuzione ad una coda ( inferiore )
dalle tabelle si ricava:
T0c =  1,753
Test 02 - 112 / 83
Test di ipotesi sulla media ( s2 incognita )
valore critico :
regione di rifiuto di H0 :
0,05
-1,753
Tˆ0 = 1,753
T  T̂0
Test 02 - 113 / 83
Test di ipotesi sulla media ( s2 incognita )
9. composto il campione si misura il valore del fattore di merito
Q degli induttori “Mod. HQL”
- si calcolano poi i valori degli stimatori campionari :
X 16 = 70,3
S 216 = 144
m0  m1
ˆ
ˆ
T1 = T0 
Sn n
75  60
15  4
Tˆ1 =  1,753 
=  1,753 
12
12 16
Tˆ1 =  1,753  5 =  3,247
Test 02 - 114 / 83
Test di ipotesi sulla media ( s2 incognita )
9. composto il campione si misura il valore del fattore di merito
Q degli induttori “Mod. HQL”
- si calcolano poi i valori degli stimatori campionari :
X 16 = 70,3
S 216 = 144
m0  m1
ˆ
ˆ
T1 = T0 
Sn n
3,247
Test 02 - 115 / 83
Test di ipotesi sulla media ( s2 incognita )
m0  m1
ˆ
T̂
T0 
= Tˆ1
Sn n
 = 0,05
  0,005
m  m1
75  60
Tˆ1 = Tˆ0  0
= 1,753 
16 = 3,247
12
Sn n
< 0,005
0,05
-1,753
3,247
Test 02 - 116 / 83
Test di ipotesi sulla media ( s2 incognita )
riassumendo:
regione di rifiuto di H0 : T0  1,753
regione di non accettazione di H1 : T1  3,247
rischio di errore di I specie  : 0,05
rischio di errore di II specie  : < 0,005
< 0,005
-1,753
3,247
Test 02 - 117 / 83
Test di ipotesi sulla media ( s2 incognita )
riassumendo:
regione di rifiuto di H0 : T0  1,753
regione di non accettazione di H1 : T1  3,247
rischio di errore di I specie  : 0,05
rischio di errore di II specie  : < 0,005
determiniamo infine il valore assunto dalla variabile T0 in
corrispondenza dei valori degli stimatori media campionaria
e varianza campionaria corretta:
X 16 = 70,3 
X n  m0 70,3  75
 T0 =
=
16 = 1,567

Sn n
144
S 216 = 144 
Test 02 - 118 / 83
Test di ipotesi sulla media ( s2 incognita )
T0 = 1,567
regione di rifiuto di H0 : T0  1,753
regione di non accettazione di H1 : T1  3,247
rischio di errore di I specie  : 0,05
rischio di errore di II specie  : < 0,005
< 0,005
-1,753
3,247
Test 02 - 119 / 83
Test di ipotesi sulla media ( s2 incognita )
non cade nella regione di rifiuto di H0 : T0  1,753
devo quindi astenermi dal rifiutare l’ipotesi principale: H0 : m  75 ;
il test ha un livello di significatività del 5% per H0
ed una potenza superiore al 99,5% nei confronti di H1
T0 = 1,567
< 0,005
-1,753
3,247
Scarica

H 0 - mks