Test 02 - 1 / 53 Lezione 6 i Test statistici Test 02 - 2 / 53 Nella parte 1 … test sull’ipotesi principale H0: prestazioni del criterio decisionale rischio di errore di 1 specie; fiducia del criterio decisionale significatività del test Test 02 - 3 / 53 parte 2 i test sulla media: H0 e H1 Test 02 - 4 / 53 formulazione di test con H0 e H1 sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 5 / 53 formulazione di test con H0 e H1 sulla media 3. si individua l’ipotesi H0 (ipotesi principale) che deve essere sottoposta a test. esempio: H0 : m = m0 ; oppure: H0 : m m0 ; 4. si definisce, in contrasto alla ipotesi principale, una (o più di una) “ipotesi alternativa” H1 (, H2 ); esempio: H1 : m m1 ; oppure: H1 : m = m1 ; Test 02 - 6 / 53 formulazione di test con H0 e H1 sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 7 / 53 formulazione di test con H0 e H1 sulla media 5. si sceglie la variabile campionaria idonea a svolgere il test: se la varianza s2 è nota e se il campione è numeroso (n > 30) si possono usare indifferentemente: - la media campionaria 1 Xn = n n j =1 Xj che ha distribuzione normale con media m e varianza s2 / n; - la variabile X n m0 Z= s n che ha distribuzione normale standard. Test 02 - 8 / 53 formulazione di test con H0 e H1 sulla media 5. si sceglie la variabile campionaria idonea a svolgere il test: se la distribuzione è normale e la varianza s2 è incognita si usa: - la variabile X n m0 T= Sn n che ha distribuzione t di Student con n - 1 g.d.l. se il campione è numeroso ( n > 30) la T può essere approssimata con la: X n m0 Z= Sn n che ha distribuzione normale standard Test 02 - 9 / 53 formulazione di test con H0 e H1 sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 10 / 53 formulazione di test con H0 e H1 sulla media 6. si stabiliscono i valori a del rischio di errore di 1ª specie che si è disposti a correre e 1 - a del livello di fiducia richiesto. criterio di scelta: la scelta del valore di rischio accettabile richiede considerazioni di vario tipo, non solamente tecniche ma, molto spesso, economiche, di politica aziendale, di immagine, ecc. La probabilità a di commettere un errore di 1ª specie viene chiamata “livello di significatività” al quale si intende condurre il test. Test 02 - 11 / 53 formulazione di test con H0 e H1 sulla media 6. si stabiliscono i valori a del rischio di errore di 1ª specie che si è disposti a correre e 1 - a del livello di fiducia richiesto. Test 02 - 12 / 53 formulazione di test con H0 e H1 sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 13 / 53 Significato della “potenza contro H1” regione di rifiuto per H0 regione di non accettazione per H1 100 Test 02 - 14 / 53 Significato della “potenza contro H1” regione di rifiuto per H0 regione di esclusione per H1 Test 02 - 15 / 53 ipotesi H0 e alternativa H1 in alternativa all’ipotesi H0 , che prende anche il nome di “ipotesi principale” si può definire una “ipotesi alternativa” H1 per esempio: H0 : m m0 H1 : m m1 notiamo il fatto che si esclude a priori l’ipotesi: m0 m m1 questo perché si considerano possibili unicamente l’ipotesi principale e quella ( o quelle ) alternativa. Test 02 - 16 / 53 ipotesi H0 e alternativa H1 con riferimento alla sola H0 : m m0 il criterio decisionale è: se X n > xc rifiuto H0 P sbagliato = a rischio di errore di 1ª specie Test 02 - 17 / 53 ipotesi H0 e alternativa H1 considerando anche la H1 : m m1 il criterio decisionale diviene: se X n > xc rifiuto H0 se X n xc non accetto H1 P sbagliato = Test 02 - 18 / 53 ipotesi H0 e alternativa H1 il criterio decisionale complessivo adottato è quindi: se X n > xc rifiuto H 0 se X n xc non accetto H1 (quindi non rifiuto H 0 ) P sbagliato = a rischio di errore di 1ª specie P sbagliato = rischio di errore di 2ª specie Test 02 - 19 / 53 ipotesi H0 e alternativa H1 il criterio decisionale complessivo adottato è quindi: se X n > xc rifiuto H 0 se X n xc non accetto H1 (quindi non rifiuto H 0 ) 1-a: affidabilità del criterio decisionale nel rifiuto di H0 1-: potenza contro H1 Test 02 - 20 / 53 ipotesi H0 e alternativa H1 Reiezione : al disturbo, alla 1. reiezione Il ripudiare, respingere qc.tensione di modo comune, (rapporto di reiezione di modo comune) … 2. CMRR Atto con cui un Organo giudiziario o amministrativo respinge una domanda… 1-a: affidabilità del criterio decisionale nel rifiuto di H0 1-: potenza contro H1 Test 02 - 21 / 53 Significato della “potenza contro H1” 1 novembre 2011 Consumo 100 W Consumo 75 W Test 02 - 22 / 53 Significato della “potenza contro H1” regione di rifiuto per H0 75 regione di non accettazione per H1 100 Test 02 - 23 / 53 Significato della “potenza contro H1” regione di rifiuto per H0 75 regione di esclusione per H1 100 Test 02 - 24 / 53 formulazione di test con H0 e H1 sulla media 7. si stabilisce il valore minimo accettabile della potenza contro l’ipotesi alternativa che si vuole contrapporre alla ipotesi fondamentale (nel caso di più ipotesi alternative si stabilisce la potenza contro ciascuna di esse). Questa scelta equivale a fissare il massimo valore del rischio di errore di 2ª specie che si intende accettare nella conduzione del test. Il valore del rischio di errore di 2ª specie risulta funzione: – della differenza fra le due ipotesi H0 e H1, – di a (valore del rischio di errore di 1ª specie) – della numerosità del campione su cui è stato condotto il test. Test 02 - 25 / 53 formulazione di test con H0 e H1 sulla media 7. si stabilisce il valore minimo accettabile della potenza contro l’ipotesi alternativa che si vuole contrapporre alla ipotesi fondamentale (nel caso di più ipotesi alternative si stabilisce la potenza contro ciascuna di esse). Questa scelta equivale a fissare il massimo valore del rischio di errore di 2ª specie che si intende accettare nella conduzione del test. Test 02 - 26 / 53 formulazione di test con H0 e H1 sulla media 7. aumentare la numerosità del campione provoca una riduzione della varianza dello stimatore media campionaria che consente di aumentare la potenza del test senza diminuire la sua affidabilità. Test 02 - 27 / 53 formulazione di test con H0 e H1 sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 28 / 53 formulazione di test con H0 e H1 sulla media 8. in base a ciò che si è stabilito nei punti precedenti, si identifica il valore critico (o la coppia di valori critici) del parametro campionario che individua nel dominio la “regione di rifiuto” dell’ipotesi principale H0 Test 02 - 29 / 53 formulazione di test con H0 e H1 sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 30 / 53 formulazione di test con H0 e H1 sulla media 9. si stimano quindi i valori del rischio di errore di seconda specie a cui il test verrà condotto e, se tali valori non rispettano le scelta fatte per la potenza del test si modificano i parametri del test da cui tale rischio dipende (in particolare la numerosità minima del campione. ) Test 02 - 31 / 53 conduzione di test con H0 e H1 sulla media 10. dopo aver formulato il test: si procede alla composizione del campione con numerosità pari a quella stabilita, si conducono le prove sperimentali, si determina il valore dello stimatore campionario precelto, Test 02 - 32 / 53 conduzione di test con H0 e H1 sulla media 10. se la stima cade nella regione di rifiuto si respinge l’ipotesi principale H0 con un rischio pari ad a di commettere un errore: - il valore 1 - della probabilità di non accettare le ipotesi alternative H1 quando esse sono realmente false viene detto: “ potenza del test ” Test 02 - 33 / 53 la determinazione di a e usando la variabile casuale Xn Test 02 - 34 / 53 la determinazione di a e con Xn Per meglio comprendere il significato ed il metodo di calcolo del rischio di errore di seconda specie esaminiamo il caso di una ipotesi fondamentale H0 e di due ipotesi alternative: H1 e H2 H0 : m = m0 ; H1 : m = m1 ; con m2 < m0 < m1 H2 : m = m2 Come è semplice notare le tre ipotesi sono formalmente identiche: in tutti i casi si ipotizza che la media della variabile casuale X possa assumere un prestabilito valore. Come vedremo fra poco, però, l’ipotesi fondamentale H0 viene trattata in maniera ben diversa dalle due ipotesi alternative H1 e H2 Test 02 - 35 / 53 la determinazione di a e con Xn La figura mostra la distribuzione della media campionaria nel caso in cui l’ipotesi fondamentale H0 : m = m0 sia vera: Le due regioni “campite” (cioè colorate) in giallo individuano la regione di rifiuto per H0 : X n xci X n > xcs Test 02 - 36 / 53 la determinazione di a e con Xn Se lo stimatore campionario risulta X n xci X n > xcs rifiuteremo l’ipotesi principale H0 oppure se risulta Test 02 - 37 / 53 la determinazione di a e con Xn Se lo stimatore campionario risulta X n xci X n > xcs oppure se risulta rifiuteremo l’ipotesi principale H0 Sappiamo però che, qualora H0 sia vera, c’è una probabilità pari ad a/2 che lo stimatore campionario risulti X n > xcs per effetto del caso con cui si estrae il campione dalla popolazione (regione 1). Test 02 - 38 / 53 la determinazione di a e con Xn Se lo stimatore campionario risulta X n xci X n > xcs oppure se risulta rifiuteremo l’ipotesi principale H0 Analogamente sappiamo che, con H0 vera, c’è una probabilità pari ad a/2 che lo stimatore campionario risulti X n xci per effetto del caso con cui si estrae il campione dalla popolazione (regione 2). Test 02 - 39 / 53 la determinazione di a e con Xn Se lo stimatore campionario risulta xci X n xcs il test non fornisce informazioni tali da consentirci di rifiutare H0 Chiediamoci però, nel caso in cui H0 sia falsa ed H1 sia vera, quale sia la probabilità di trovare un valore dello stimatore compreso nell’intervallo xc X n i cui si estrae il campione. xcs a causa della aleatorietà con Test 02 - 40 / 53 la determinazione di a e con Xn La regione 3 campita in viola rappresenta la probabilità che, malgrado sia vera l’ipotesi alternativa H1 : m = m1 , il valore della media campionaria risulti X n xcs . Test 02 - 41 / 53 la determinazione di a e con Xn E’ evidente che, anche se l’ipotesi fondamentale H0 : m = m0 e l’ipotesi alternativa H1 : m = m1 sono espresse nella stessa forma, lo studio che si conduce è diverso tra l’una e l’altra. Test 02 - 42 / 53 la determinazione di a e con Xn Un analogo ragionamento viene poi condotto in relazione alla seconda ipotesi alternativa: H2 : m = m2 Chiediamoci, nel caso in cui H0 sia falsa ed H2 sia vera, quale sia la probabilità di trovare un valore dello stimatore compreso nell’intervallo xc X n i con cui si estrae il campione. xcs a causa della aleatorietà Test 02 - 43 / 53 la determinazione di a e con Xn Un analogo ragionamento viene poi condotto in relazione alla seconda ipotesi alternativa: H2 : m = m2 La regione 4 campita in viola nella figura successiva rappresenta la probabilità che, malgrado sia vera l’ipotesi alternativa H2 : m = m2 , il valore della media campionaria risulti xci X n xcs Test 02 - 44 / 53 la distribuzione di Xn per H0, H1, H2 se H0 : m = m0 vera se H1 : m = m1 vera se H2 : m = m2 vera Test 02 - 45 / 53 la determinazione di a e usando la variabile casuale T Test 02 - 46 / 53 la determinazione di a e con T se H0 : m = m0 vera se H1 : m = m1 vera Test 02 - 47 / 53 la determinazione di a e con T Facciamo due considerazioni generali: 1) T= Xn m Sn n • dal valore di a desiderato si ricava il valore critico T0c • dal valore critico T0c si ricava il corrispondente valore critico per la media campionaria: T0c = 0,05 X nc m Sn n X nc = m che individua la regione di rifiuto della H0 -1,753 1,753 Sn T0c n0,05 Test 02 - 48 / 53 la determinazione di a e con T La seconda considerazione generale è la seguente: 2) Xn m T= Sn n X n m0 T = 0 S n n X m1 T1 = n Sn n il valore assunto da T per uno stesso valore della media campionaria dipende dal valore ipotizzato per la media della popolazione. Test 02 - 49 / 53 la determinazione di a e con T di conseguenza: il valore critico assunto da T in corrispondenza del valore critico per la media campionaria dipende dal valore ipotizzato per la media della popolazione. Xn m Tc = Sn n X nc m0 T0c = Sn n X m1 T1c = nc Sn n Test 02 - 50 / 53 la determinazione di a e con T di conseguenza: il valore assunto da T in corrispondenza del valore critico per la media campionaria dipende dal valore ipotizzato per la media della popolazione. ˆ m X Tˆ = n Sn n T1c = X nc m1 Sn n ˆ m X m X 0 Tˆ0 = Tn0c = 0 nc Sn n Sn n ˆ Tˆ = X n m1 1 S n n Test 02 - 51 / 53 la determinazione di a e con T dato che : X nc m0 T = 0c Sn n X nc m1 T1c = S n n Sn X = m T0c 0 nc n T = X nc m1 1c Sn n Sn n possiamo anche scrivere: T1c = Sn T0c m0 S m1 n = n Sn n Sn n Sn n Sn m0 T1c = T0c m0 m1 Sn n n m1 T0c n Sn n Test 02 - 52 / 53 la determinazione di a e con T dal valore che si è stabilito di poter accettare per il rischio di errore di prima specie: a TT00cc m0 m1 Sn n = T1c 0,015 0,05 0,05 - 2,387 -1,753 1,753 Test 02 - 53 / 53 la determinazione di a e con Z (s2 nota) dato che : ì ì Xnc - m 0 s Z = X = m + Z 0c ï 0c nc 0 ï ï s n ï n Þ í í ï Z = Xnc - m1 ï Z = Xnc - m1 ïî 1c s n ïî 1c s n s n possiamo anche scrivere: Z1c = m0 + s Z 0c n s n - m1 s n = Z1c = Z0c + m0 s s + n s m0 - m1 s n n m1 Z 0c n s n