Test 02 - 1 / 83 Lezione 6 i Test statistici Test 02 - 2 / 83 Nella parte 1 e 2 … test sull’ipotesi principale H0: prestazioni del criterio decisionale rischio di errore di 1 specie; fiducia del criterio decisionale significatività del test test sull’ipotesi principale H0 con alternative H1, H2 rischio di errore di 2 specie; potenza del test Test 02 - 3 / 83 H0 : la ipotesi “nulla” Test 02 - 4 / 83 H0 : la ipotesi “nulla” Test 02 - 5 / 83 i test sulla differenza fra medie: H0 Test 02 - 6 / 83 formulazione di un test sulla differenza fra le medie per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità dei campioni; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 7 / 83 formulazione di un test sulla differenza fra le medie 1. si stabilisce la numerosità n del campione con cui si vuole condurre il test (nel caso occorrano più campioni si stabilisce la numerosità di ciascuni di essi). ricordiamo che se n è grande si può invocare il teorema limite centrale per affermare che la media campionaria è distribuita in modo normale qualunque sia la distribuzione della X Test 02 - 8 / 83 formulazione di un test sulla differenza fra le medie per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità dei campioni; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 9 / 83 formulazione di un test sulla differenza fra le medie per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità dei campioni; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 10 / 83 formulazione di un test sulla differenza fra le medie 3. si individua l’ipotesi H0 (ipotesi principale) che deve essere sottoposta a test. esempio: H0 : m0 - m1 = 0; oppure: H0 : m0 - m1 > 1 il test non ci porta a determinare quanto valga la probabilità che l’ipotesi H0 sia vera oppure falsa, ma ci dice solamente se possiamo escludere, con il rischio di errore prefissato, che l’ipotesi H0 sia vera. Test 02 - 11 / 83 formulazione di un test sulla differenza fra le medie per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità dei campioni; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 12 / 83 formulazione di un test sulla differenza fra le medie 5. si sceglie la variabile campionaria idonea a svolgere il test: • le varianze s21 e s22 delle due popolazioni sono note e i due campioni sono numerosi (n1 > 30 e n2 > 30) • le due popolazioni hanno distribuzione normale con varianze s21 e s22 incognite ma UGUALI • le due popolazioni hanno distribuzione normale con varianze s21 e s22 incognite e i due campioni sono MOLTO numerosi (n1 > 120 e n2 > 120) • I dati sono appaiati Test 02 - 13 / 83 formulazione di un test sulla differenza fra le medie 5. si sceglie la variabile campionaria idonea a svolgere il test: se le varianze s21 e s22 delle due popolazioni sono note e se i due campioni sono numerosi (n1 > 30 e n2 > 30) si può usare la variabile campionaria X ( Z= 1n1 - X2n2 ) - ( m1 - m 2 ) s 2 1 n1 + s 2 2 n2 che ha distribuzione normale standard. Test 02 - 14 / 83 formulazione di un test sulla differenza fra le medie 5. si sceglie la variabile campionaria idonea a svolgere il test: se le due popolazioni hanno distribuzione normale con varianze s21 e s22 incognite ma UGUALI si può usare la variabile X ( T= 1n1 - X2n2 ) - ( m 0 - m1 ) æ1 1ö Smp ç + ÷ è n1 n2 ø 2 che ha distribuzione t di Student con (n1 + n2 – 2) gdl Smp 2 n1 -1) S + ( n2 -1) S ( = 2 1 n1 + n2 - 2 2 2 Test 02 - 15 / 83 formulazione di un test sulla differenza fra le medie 5. si sceglie la variabile campionaria idonea a svolgere il test: se le due popolazioni hanno distribuzione normale con varianze s21 e s22 incognite ma UGUALI e se n1 >> n2 si può usare la variabile X ( T= 1n1 - X2n2 ) - ( m 0 - m1 ) S12 n2 che ha distribuzione t di Student con (n1 + n2 – 2) gdl Test 02 - 16 / 83 formulazione di un test sulla differenza fra le medie 5. si sceglie la variabile campionaria idonea a svolgere il test: se le due popolazioni hanno distribuzione normale con varianze s21 e s22 incognite ed i campioni sono MOLTO numerosi (n1 > 120 e n2 > 120) si può usare la variabile X ( Z= 1n1 - X2n2 ) - ( m0 - m1 ) S1 S + n1 n2 2 2 2 che ha distribuzione approssimabile con la normale standard Test 02 - 17 / 83 formulazione di un test sulla differenza fra le medie 5. si sceglie la variabile campionaria idonea a svolgere il test: se la popolazione ha distribuzione normale ed i due campioni non sono indipendenti si può usare la variabile T= Dx - ( m1 - m2 ) SD n 2 che ha distribuzione approssimabile con la t di Student a n-1 gdl Test 02 - 18 / 83 formulazione di un test sulla differenza fra le medie Di = Xi - Yi 1 1 Dx = å Di = å ( Xi -Yi ) n n 2 1 S = ( Di _ Dx ) å n -1 2 d T= Dx - ( m1 - m2 ) S 2D n Test 02 - 19 / 83 parte 2 i test sulla media: H0 e H1 Test 02 - 20 / 83 formulazione di test con H0 e H1 sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 21 / 83 formulazione di test con H0 e H1 sulla media 3. si individua l’ipotesi H0 (ipotesi principale) che deve essere sottoposta a test. esempio: H0 : m = m0 ; oppure: H0 : m m0 ; 4. si definisce, in contrasto alla ipotesi principale, una (o più di una) “ipotesi alternativa” H1 (, H2 ); esempio: H1 : m m1 ; oppure: H1 : m = m1 ; Test 02 - 22 / 83 formulazione di test con H0 e H1 sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 23 / 83 formulazione di test con H0 e H1 sulla media 5. si sceglie la variabile campionaria idonea a svolgere il test: se la varianza s2 è nota e se il campione è numeroso (n > 30) si possono usare indifferentemente: - la media campionaria 1 Xn = n n j =1 Xj che ha distribuzione normale con media m e varianza s2 / n; - la variabile X n m0 Z= s n che ha distribuzione normale standard. Test 02 - 24 / 83 formulazione di test con H0 e H1 sulla media 5. si sceglie la variabile campionaria idonea a svolgere il test: se la distribuzione è normale e la varianza s2 è incognita si usa: - la variabile X n m0 T= Sn n che ha distribuzione t di Student con n - 1 g.d.l. se il campione è numeroso ( n > 30) la T può essere approssimata con la: X n m0 Z= Sn n che ha distribuzione normale standard Test 02 - 28 / 83 formulazione di test con H0 e H1 sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 29 / 83 Affidabilità per H0 e Potenza contro H1 in alternativa all’ipotesi H0 , che prende anche il nome di “ipotesi principale” si può definire una “ipotesi alternativa” H1 per esempio: H0 : m m0 H1 : m m1 notiamo il fatto che si esclude a priori l’ipotesi: m0 m m1 questo perché si considerano possibili unicamente l’ipotesi principale e quella ( o quelle ) alternativa. Test 02 - 30 / 83 Significato della “potenza contro H1” regione di rifiuto per H0 regione di non accettazione per H1 100 Test 02 - 31 / 83 Significato della “potenza contro H1” regione di rifiuto per H0 regione di esclusione per H1 Test 02 - 32 / 83 ipotesi H0 e alternativa H1 con riferimento alla sola H0 : m m0 il criterio decisionale è: se X n > xc rifiuto H0 P sbagliato = rischio di errore di 1ª specie Test 02 - 33 / 83 ipotesi H0 e alternativa H1 considerando anche la H1 : m m1 il criterio decisionale diviene: se X n > xc rifiuto H0 se X n xc non accetto H1 P sbagliato = Test 02 - 34 / 83 ipotesi H0 e alternativa H1 il criterio decisionale complessivo adottato è quindi: se X n > xc rifiuto H 0 se X n xc non accetto H1 (quindi non rifiuto H 0 ) P sbagliato = rischio di errore di 1ª specie P sbagliato = rischio di errore di 2ª specie Test 02 - 35 / 83 ipotesi H0 e alternativa H1 il criterio decisionale complessivo adottato è quindi: se X n > xc rifiuto H 0 se X n xc non accetto H1 (quindi non rifiuto H 0 ) 1-: affidabilità del criterio decisionale nel rifiuto di H0 1-: potenza contro H1 Test 02 - 39 / 83 Significato della “potenza contro H1” regione di rifiuto per H0 75 regione di esclusione per H1 100 Test 02 - 40 / 83 formulazione di test con H0 e H1 sulla media 7. si stabilisce il valore minimo accettabile della potenza contro l’ipotesi alternativa che si vuole contrapporre alla ipotesi fondamentale (nel caso di più ipotesi alternative si stabilisce la potenza contro ciascuna di esse). Questa scelta equivale a fissare il massimo valore del rischio di errore di 2ª specie che si intende accettare nella conduzione del test. Il valore del rischio di errore di 2ª specie risulta funzione: – della differenza fra le due ipotesi H0 e H1, – di (valore del rischio di errore di 1ª specie) – della numerosità del campione su cui è stato condotto il test. Test 02 - 41 / 83 formulazione di test con H0 e H1 sulla media 7. si stabilisce il valore minimo accettabile della potenza contro l’ipotesi alternativa che si vuole contrapporre alla ipotesi fondamentale (nel caso di più ipotesi alternative si stabilisce la potenza contro ciascuna di esse). Questa scelta equivale a fissare il massimo valore del rischio di errore di 2ª specie che si intende accettare nella conduzione del test. Test 02 - 42 / 83 formulazione di test con H0 e H1 sulla media 7. aumentare la numerosità del campione provoca una riduzione della varianza dello stimatore media campionaria che consente di aumentare la potenza del test senza diminuire la sua affidabilità. Test 02 - 43 / 83 formulazione di test con H0 e H1 sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 44 / 83 formulazione di test con H0 e H1 sulla media 8. in base a ciò che si è stabilito nei punti precedenti, si identifica il valore critico (o la coppia di valori critici) del parametro campionario che individua nel dominio la “regione di rifiuto” dell’ipotesi principale H0 Test 02 - 45 / 83 formulazione di test con H0 e H1 sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 46 / 83 formulazione di test con H0 e H1 sulla media 9. si stimano quindi i valori del rischio di errore di seconda specie a cui il test verrà condotto e, se tali valori non rispettano le scelta fatte per la potenza del test si modificano i parametri del test da cui tale rischio dipende (in particolare la numerosità minima del campione. ) Test 02 - 47 / 83 conduzione di test con H0 e H1 sulla media 10. dopo aver formulato il test: si procede alla composizione del campione con numerosità pari a quella stabilita, si conducono le prove sperimentali, si determina il valore dello stimatore campionario precelto, Test 02 - 48 / 83 conduzione di test con H0 e H1 sulla media 10. se la stima cade nella regione di rifiuto si respinge l’ipotesi principale H0 con un rischio pari ad di commettere un errore: - il valore 1 - della probabilità di non accettare le ipotesi alternative H1 quando esse sono realmente false viene detto: “ potenza del test ” Test 02 - 49 / 83 la determinazione di e usando la variabile casuale Xn Test 02 - 50 / 83 la determinazione di e con Xn Per meglio comprendere il significato ed il metodo di calcolo del rischio di errore di seconda specie esaminiamo il caso di una ipotesi fondamentale H0 e di due ipotesi alternative: H1 e H2 H0 : m = m0 ; H1 : m = m1 ; con m2 < m0 < m1 H2 : m = m2 Come è semplice notare le tre ipotesi sono formalmente identiche: in tutti i casi si ipotizza che la media della variabile casuale X possa assumere un prestabilito valore. Come vedremo fra poco, però, l’ipotesi fondamentale H0 viene trattata in maniera ben diversa dalle due ipotesi alternative H1 e H2 Test 02 - 51 / 83 la determinazione di e con Xn La figura mostra la distribuzione della media campionaria nel caso in cui l’ipotesi fondamentale H0 : m = m0 sia vera: Le due regioni “campite” (cioè colorate) in giallo individuano la regione di rifiuto per H0 : X n xci X n > xcs Test 02 - 52 / 83 la determinazione di e con Xn Se lo stimatore campionario risulta X n xci X n > xcs rifiuteremo l’ipotesi principale H0 oppure se risulta Test 02 - 53 / 83 la determinazione di e con Xn Se lo stimatore campionario risulta X n xci X n > xcs oppure se risulta rifiuteremo l’ipotesi principale H0 Sappiamo però che, qualora H0 sia vera, c’è una probabilità pari ad /2 che lo stimatore campionario risulti X n > xcs per effetto del caso con cui si estrae il campione dalla popolazione (regione 1). Test 02 - 54 / 83 la determinazione di e con Xn Se lo stimatore campionario risulta X n xci X n > xcs oppure se risulta rifiuteremo l’ipotesi principale H0 Analogamente sappiamo che, con H0 vera, c’è una probabilità pari ad /2 che lo stimatore campionario risulti X n xci per effetto del caso con cui si estrae il campione dalla popolazione (regione 2). Test 02 - 55 / 83 la determinazione di e con Xn Se lo stimatore campionario risulta xci X n xcs il test non fornisce informazioni tali da consentirci di rifiutare H0 Chiediamoci però, nel caso in cui H0 sia falsa ed H1 sia vera, quale sia la probabilità di trovare un valore dello stimatore compreso nell’intervallo xc X n i cui si estrae il campione. xcs a causa della aleatorietà con Test 02 - 56 / 83 la determinazione di e con Xn La regione 3 campita in viola rappresenta la probabilità che, malgrado sia vera l’ipotesi alternativa H1 : m = m1 , il valore della media campionaria risulti X n xcs . Test 02 - 57 / 83 la determinazione di e con Xn E’ evidente che, anche se l’ipotesi fondamentale H0 : m = m0 e l’ipotesi alternativa H1 : m = m1 sono espresse nella stessa forma, lo studio che si conduce è diverso tra l’una e l’altra. Test 02 - 58 / 83 la determinazione di e con Xn Un analogo ragionamento viene poi condotto in relazione alla seconda ipotesi alternativa: H2 : m = m2 Chiediamoci, nel caso in cui H0 sia falsa ed H2 sia vera, quale sia la probabilità di trovare un valore dello stimatore compreso nell’intervallo xc X n i con cui si estrae il campione. xcs a causa della aleatorietà Test 02 - 59 / 83 la determinazione di e con Xn Un analogo ragionamento viene poi condotto in relazione alla seconda ipotesi alternativa: H2 : m = m2 La regione 4 campita in viola nella figura successiva rappresenta la probabilità che, malgrado sia vera l’ipotesi alternativa H2 : m = m2 , il valore della media campionaria risulti xci X n xcs Test 02 - 60 / 83 la distribuzione di Xn per H0, H1, H2 se H0 : m = m0 vera se H1 : m = m1 vera se H2 : m = m2 vera Test 02 - 61 / 83 la determinazione di e usando la variabile casuale T Test 02 - 62 / 83 la determinazione di e con T se H0 : m = m0 vera se H1 : m = m1 vera Test 02 - 63 / 83 la determinazione di e con Xn regione di rifiuto per H0 75 regione di esclusione per H1 100 Test 02 - 64 / 83 la determinazione di e con T Facciamo due considerazioni generali: 1) T= Xn m Sn n • dal valore di desiderato si ricava il valore critico T0c • dal valore critico T0c si ricava il corrispondente valore critico per la media campionaria: T0c = 0,05 X nc m Sn n X nc = m che individua la regione di rifiuto della H0 -1,753 1,753 Sn T0c n0,05 Test 02 - 65 / 83 la determinazione di e con T La seconda considerazione generale è la seguente: 2) Xn m T= Sn n X n m0 T = 0 S n n X m1 T1 = n Sn n il valore assunto da T per uno stesso valore della media campionaria dipende dal valore ipotizzato per la media della popolazione. Test 02 - 66 / 83 la determinazione di e con T di conseguenza: il valore critico assunto da T in corrispondenza del valore critico per la media campionaria dipende dal valore ipotizzato per la media della popolazione. Xn m Tc = Sn n X nc m0 T0c = Sn n X m1 T1c = nc Sn n Test 02 - 67 / 83 la determinazione di e con Xn regione di rifiuto per H0 75 regione di esclusione per H1 100 Test 02 - 68 / 83 la determinazione di e con T di conseguenza: il valore assunto da T in corrispondenza del valore critico per la media campionaria dipende dal valore ipotizzato per la media della popolazione. ˆ m X Tˆ = n Sn n T1c = X nc m1 Sn n ˆ m X m X 0 Tˆ0 = Tn0c = 0 nc Sn n Sn n ˆ Tˆ = X n m1 1 S n n Test 02 - 69 / 83 la determinazione di e con T dato che : X nc m0 T = 0c Sn n X nc m1 T1c = S n n Sn X = m T0c 0 nc n T = X nc m1 1c Sn n Sn n possiamo anche scrivere: T1c = Sn T0c m0 S m1 n = n Sn n Sn n Sn n Sn m0 T1c = T0c m0 m1 Sn n n m1 T0c n Sn n Test 02 - 70 / 83 la determinazione di e con T dal valore che si è stabilito di poter accettare per il rischio di errore di prima specie: TT00cc m0 m1 Sn n = T1c 0,015 0,05 0,05 - 2,387 -1,753 1,753 Test 02 - 71 / 83 la determinazione di e con Z dato che : X nc m0 Z = 0c Sn n X nc m1 Z1c = S n n Sn X = m Z 0c 0 nc n Z = X nc m1 1c Sn n Sn n possiamo anche scrivere: Z1c = Sn Z 0c m0 S m1 n = n Sn n Sn n Sn n Sn m0 Z1c = Z 0c m0 m1 Sn n n m1 Z 0c n Sn n Test 02 - 72 / 83 formulazione di un test sulla differenza fra le medie per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 73 / 83 formulazione di un test sulla differenza fra le medie 6. si stabiliscono i valori del rischio di errore di 1ª specie che si è disposti a correre e 1 - della affidabilità richiesta. La probabilità di commettere un errore di 1ª specie viene chiamata “livello di significatività” al quale si intende condurre il test. Test 02 - 74 / 83 formulazione di un test sulla differenza fra le medie 6. si stabiliscono i valori del rischio di errore di 1ª specie che si è disposti a correre e 1 - della affidabilità richiesta. La probabilità di commettere un errore di 1ª specie viene chiamata “livello di significatività” al quale si intende condurre il test. criterio di scelta: la scelta del valore di rischio accettabile richiede considerazioni di vario tipo, non solamente tecniche ma, molto spesso, economiche, di politica aziendale, di immagine, ecc. Test 02 - 75 / 83 formulazione di un test sulla differenza fra le medie per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 76 / 83 formulazione di un test sulla differenza fra le medie 8. in base a ciò che si è stabilito nei punti precedenti, si identifica il valore critico (o la coppia di valori critici) della statistica campionaria che individua nel dominio la “regione di rifiuto” dell’ipotesi principale H0 . Test 02 - 77 / 83 formulazione di un test sulla differenza fra le medie 8. in base a ciò che si è stabilito nei punti precedenti, si identifica il valore critico (o la coppia di valori critici) della statistica campionaria che individua nel dominio la “regione di rifiuto” dell’ipotesi principale H0 . /2 /2 Test 02 - 78 / 83 formulazione di un test sulla differenza fra le medie Dopo aver formulato il test: si procede alla composizione del campione con numerosità pari a quella stabilita, si conducono le prove sperimentali, si determina il valore della variabile campionaria precelta, /2 /2 Test 02 - 79 / 83 conclusione del test Se il valore della variabile cade nella regione di rifiuto di H0 si respinge l’ipotesi principale H0 con un rischio pari ad di commettere un errore: - il rifiuto di H0 avviene con una “fiducia” pari a 1 - corrispondente alla probabilità di avere correttamente respinto H0 quando essa è realmente falsa Test 02 - 80 / 83 5° test sulla media: H0 con H1 varianza nota, rischio di errore di seconda specie Test 02 - 81 / 83 Test di ipotesi sulla media (con s2 nota) • Si è riprogettato un OpAmp in produzione da tempo e si è realizzata una preserie del nuovo dispositivo. • Ci si interroga sulla possibilità che il valore tipico della corrente di offset sia passato dai 50 nA del “vecchio” progetto a meno di 40 nA. Test 02 - 82 / 83 formulazione del test per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 83 / 83 Test di ipotesi sulla media (con s2 nota) 1. Stabiliamo di operare con un campione di 36 amplificatori. 2. Costruiamo la variabile casuale X stabilendo che essa assuma valore uguale a quello della corrente di offset di ciascun elemento della popolazione misurata in nA. La varianza s2 della X per l’intera popolazione si suppone nota: s2 = 225 3. H0 : m < m0 = 40 ; 4. H1 : m = m1 = 50 ; 5. scegliamo come variabile campionaria la media campionaria che, se n è sufficientemente elevato, segue la distribuzione normale con varianza pari a s2 / n; Test 02 - 84 / 83 Test di ipotesi sulla media (con s2 nota) 6. fissiamo il livello accettabile per il rischio di errore di prima specie: = 0,10 ( che comporta un “livello di fiducia” del 90% );; 7. stabiliamo un valore richiesto della potenza non inferiore a 99% ; 8. calcoliamo il valore critico della variabile campionaria che individua la regioni di rifiuto della ipotesi principale H0 in funzione del valore di prestabilito (0,10); 0,10 Test 02 - 85 / 83 Test di ipotesi sulla media (con s2 nota) abbiamo utilizzato la distribuzione a una coda in quanto l’ipotesi principale viene rigettata solo se la media è maggiore di m0 ; 0,10 Test 02 - 86 / 83 Test di ipotesi sulla media (con s2 nota) regione di rifiuto di H0 : X 36 > 43,204 0,10 Test 02 - 87 / 83 Test di ipotesi sulla media (con s2 nota) regione di rifiuto di H0 : X 36 > 43,204 quale è il valore del rischio di errore di II specie determinato da H1 : m = m1 = 50 Test 02 - 88 / 83 Test di ipotesi sulla media (con s2 nota) regione di rifiuto di H0 : X 36 > 43,204 rischio di errore di II specie : 0,003 potenza contro H1 : 99,7% 0,003 Test 02 - 89 / 83 Test di ipotesi sulla media (con s2 nota) riassumendo: regione di rifiuto di H0 : X 36 > 43,204 rischio di errore di I specie : 0,10 rischio di errore di II specie : 0,003 0,003 0,10 Test 02 - 90 / 83 Test di ipotesi sulla media (con s2 nota) riassumendo: X 36 = 43,0 regione di rifiuto di H0 : X > 43,204 36 rischio di errore di I specie : 0,10 rischio di errore di II specie : 0,003 0,003 0,10 Test 02 - 91 / 83 Test di ipotesi sulla media (con s2 nota) X 36 = 43,0 non cade nella regione di rifiuto di H0 : X 36 > 43,204 0,003 0,10 Test 02 - 92 / 83 Test di ipotesi sulla media (con s2 nota) X 36 = 43,0 non cade nella regione di rifiuto di H0 : X 36 > 43,204 devo non rifiutare l’ipotesi principale: H0 : m 40,0 ; 0,003 0,10 Test 02 - 93 / 83 Test di ipotesi sulla media (con s2 nota) X 36 = 43,0 non cade nella regione di rifiuto di H0 : X 36 > 43,204 devo non rifiutare l’ipotesi principale: H0 : m 40,0 ; il test ha un livello di fiducia del 90% per H0 0,003 0,10 Test 02 - 94 / 83 Test di ipotesi sulla media (con s2 nota) X 36 = 43,0 non cade nella regione di rifiuto di H0 : X 36 > 43,204 devo non rifiutare l’ipotesi principale: H0 : m 40,0 ; il test ha un livello di fiducia del 90% per H0 ed una potenza del 99,7% nei confronti di H1 0,003 0,10 Test 02 - 95 / 83 Test di ipotesi sulla media (con s2 nota) X 36 = 43,0 non cade nella regione di rifiuto di H0 : X 36 > 43,204 devo non rifiutare l’ipotesi principale: H0 : m 40,0 ; il test ha un livello di fiducia del 90% per H0 ed una potenza del 99,7% nei confronti di H1 Ripetiamo il test imponendo un livello di fiducia più alto per esaminare le conseguenze di questa scelta. 0,003 0,10 Test 02 - 96 / 83 6° test sulla media: H0 con H1 varianza nota, rischio di errore di seconda specie Test 02 - 97 / 83 formulazione del test per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 ; 5. scelta della variabile campionaria e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ; Test 02 - 98 / 83 Test di ipotesi sulla media (con s2 nota) 1. Stabiliamo di operare con un campione di 36 amplificatori. 2. Costruiamo la variabile casuale X stabilendo che essa assuma valore uguale a quello della corrente di offset di ciascun elemento della popolazione misurata in nA. La varianza s2 della X per l’intera popolazione si suppone nota: s2 = 225 3. H0 : m < m0 = 40 ; 4. H1 : m = m1 = 50 ; 5. scegliamo come variabile campionaria la media campionaria che, se n è sufficientemente elevato, segue la distribuzione normale con varianza pari a s2 / n; Test 02 - 99 / 83 Test di ipotesi sulla media (con s2 nota) 6. fissiamo il livello accettabile per il rischio di errore di prima specie: = 0,05 ( che comporta un “livello di fiducia” del 95% ); 7. stabiliamo un valore richiesto della potenza non inferiore a 99% ; 8. calcoliamo il valore critico della statistica campionaria che individua la regioni di rifiuto della ipotesi principale H0 in funzione del valore di prestabilito (0,05); 0,05 Test 02 - 100 / 83 Test di ipotesi sulla media (con s2 nota) abbiamo utilizzato la distribuzione a una coda in quanto l’ipotesi principale viene rigettata solo se la media è maggiore di m0 ; 0,05 Test 02 - 101 / 83 Test di ipotesi sulla media (con s2 nota) regione di rifiuto di H0 : X 36 > 44,112 0,05 Test 02 - 102 / 83 Test di ipotesi sulla media (con s2 nota) regione di rifiuto di H0 : X 36 > 44,112 quale è il valore del rischio di errore di II specie determinato da H1 : m = m1 = 50 Test 02 - 103 / 83 Test di ipotesi sulla media (con s2 nota) regione di rifiuto di H0 : X 36 > 44,112 rischio di errore di II specie : 0,0093 potenza contro H1 : 99,07% 0,0093 Test 02 - 104 / 83 Test di ipotesi sulla media (con s2 nota) riassumendo: regione di rifiuto di H0 : X 36 > 44,112 rischio di errore di I specie : 0,05 rischio di errore di II specie : 0,0093 0,0093 0,05 Test 02 - 105 / 83 Test di ipotesi sulla media (con s2 nota) aver voluto portare il livello di fiducia del test dal 90% al 95% per H0, senza cambiare il numero di elementi del campione, ha fatto diminuire la potenza nei confronti di H1 ed aumentare il rischio di errore di II specie fino a sfiorare il limite prefissato!!! 0,0093 0,05 Test 02 - 106 / 83 Test di ipotesi sulla media (con s2 nota) se invece aumentassi da 36 a 45 il numero degli elementi del campione potrei portare il livello di fiducia del test al 95% per H0 senza diminuire la potenza nei confronti di H1 : il rischio di errore di II specie scenderebbe a meno di 0,0025 0,0093 0,0023 0,05 0,05 Test 02 - 107 / 83 7° test sulla media varianza incognita variabile T di Student rischio di errore di seconda specie Test 02 - 108 / 83 Test di ipotesi sulla media ( s2 incognita ) • In base alla scheda tecnica del costruttore, l’induttore HQL ha un valore del fattore di merito Q maggiore di 75 (valore tipico). • Un altro costruttore afferma che tale valore non è raggiunto e sostiene che il valore tipico dell’HQL prodotto dal suo concorrente è uguale a quello tipico del modello “TL” da lui prodotto (Q = 60). • Dato che l’induttore “HQL” ha un prezzo di acquisto maggiore del “TL”, si desidera verificare l’ipotesi che il valore tipico del fattore di merito Q dell’induttore “HQL” sia effettivamente “maggiore o uguale” di 75 contro l’ipotesi che sia uguale a 60. Tramite un “”acquirente non conosciuto dal venditore” (per non ricevere un campione selezionato ad hoc) si acquista un lotto di induttori modello “HQL” per procedere ad un test di ipotesi sulla media. Test 02 - 109 / 83 Test di ipotesi sulla media ( s2 incognita ) 1. costruiamo la variabile casuale X il cui valore coincide con quello del fattore Q degli induttori Mod. HQL 2. H0 : m > m0 = 75 ; 3. H1 : m = m1 = 60 ; 4. dato che s2 è incognita si ricorre alla statistica T= Xn m Sn n che segue la distribuzione t di Student con n -1 gradi di libertà; Test 02 - 110 / 83 Test di ipotesi sulla media ( s2 incognita ) 5. fissiamo il livello accettabile per il rischio di errore di prima specie: = 0,05 ( che comporta un “livello di fiducia” del 95% ); 6. stabiliamo di operare con un campione di 16 induttori HQL ; 7. fissiamo il livello accettabile per < 2%; 8. il nostro scopo è quello di individuare il valore critico della statistica campionaria che individua la regione di rifiuto della ipotesi principale H0 in funzione del valore di che è stato prestabilito (0,05); per fare ciò utilizzeremo la t di Student “ad una coda” in quanto l’ipotesi principale (H0 : m > m0 = 75) è falsa solamente se la media della popolazione risulta minore di m0 Test 02 - 111 / 83 Test di ipotesi sulla media ( s2 incognita ) individuiamo, dai dati del problema, il valore critico della T: • n = 16 ; g.d.l. = 15 • = 0,05 ; distribuzione ad una coda ( inferiore ) dalle tabelle si ricava: T0c = 1,753 Test 02 - 112 / 83 Test di ipotesi sulla media ( s2 incognita ) valore critico : regione di rifiuto di H0 : 0,05 -1,753 Tˆ0 = 1,753 T T̂0 Test 02 - 113 / 83 Test di ipotesi sulla media ( s2 incognita ) 9. composto il campione si misura il valore del fattore di merito Q degli induttori “Mod. HQL” - si calcolano poi i valori degli stimatori campionari : X 16 = 70,3 S 216 = 144 m0 m1 ˆ ˆ T1 = T0 Sn n 75 60 15 4 Tˆ1 = 1,753 = 1,753 12 12 16 Tˆ1 = 1,753 5 = 3,247 Test 02 - 114 / 83 Test di ipotesi sulla media ( s2 incognita ) 9. composto il campione si misura il valore del fattore di merito Q degli induttori “Mod. HQL” - si calcolano poi i valori degli stimatori campionari : X 16 = 70,3 S 216 = 144 m0 m1 ˆ ˆ T1 = T0 Sn n 3,247 Test 02 - 115 / 83 Test di ipotesi sulla media ( s2 incognita ) m0 m1 ˆ T̂ T0 = Tˆ1 Sn n = 0,05 0,005 m m1 75 60 Tˆ1 = Tˆ0 0 = 1,753 16 = 3,247 12 Sn n < 0,005 0,05 -1,753 3,247 Test 02 - 116 / 83 Test di ipotesi sulla media ( s2 incognita ) riassumendo: regione di rifiuto di H0 : T0 1,753 regione di non accettazione di H1 : T1 3,247 rischio di errore di I specie : 0,05 rischio di errore di II specie : < 0,005 < 0,005 -1,753 3,247 Test 02 - 117 / 83 Test di ipotesi sulla media ( s2 incognita ) riassumendo: regione di rifiuto di H0 : T0 1,753 regione di non accettazione di H1 : T1 3,247 rischio di errore di I specie : 0,05 rischio di errore di II specie : < 0,005 determiniamo infine il valore assunto dalla variabile T0 in corrispondenza dei valori degli stimatori media campionaria e varianza campionaria corretta: X 16 = 70,3 X n m0 70,3 75 T0 = = 16 = 1,567 Sn n 144 S 216 = 144 Test 02 - 118 / 83 Test di ipotesi sulla media ( s2 incognita ) T0 = 1,567 regione di rifiuto di H0 : T0 1,753 regione di non accettazione di H1 : T1 3,247 rischio di errore di I specie : 0,05 rischio di errore di II specie : < 0,005 < 0,005 -1,753 3,247 Test 02 - 119 / 83 Test di ipotesi sulla media ( s2 incognita ) non cade nella regione di rifiuto di H0 : T0 1,753 devo quindi astenermi dal rifiutare l’ipotesi principale: H0 : m 75 ; il test ha un livello di significatività del 5% per H0 ed una potenza superiore al 99,5% nei confronti di H1 T0 = 1,567 < 0,005 -1,753 3,247