Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no. L’ipotesi che viene formulata è l’ipotesi nulla (Ho) e rappresenta di solito lo stato di fatto Se il campione fornisce risultati fortemente in contrasto con Ho, questa viene rifiutata a favore dell’ipotesi alternativa (H1). Test della media di una popolazione Eseguiamo il test H0:=0 Ipotesi nulla (H0): la media della popolazione da cui abbiamo estratto il campione è = 0 Ipotesi alternativa (H1): la media della popolazione è 0 Verifichiamo quindi se la deviazione della media campionaria da 0 è compatibile con l’ipotesi nulla. Confrontando la media del campione con 0 Test delle ipotesi Usando una distribuzione campionaria identifichiamo un range di valori che hanno bassa probabilità di accadere se l’ipotesi nulla è vera. Questo range di valori costituisce la cosiddetta regione critica o regione di rifiuto dell’ipotesi nulla. Dalla distribuzione campionaria della statistica posso conoscere le probabilità di ottenere determinati valori, e sulla base di queste definire la regione di rifiuto. ESEMPIO test media di una popolazione Ho: = o Popolazione: H1: o Medie campionarie: N ( 0 ; Distribuzione delle medie campionarie N ( 0 ; x ) Con: x N ( 0 ; ) n x Verifico l’ipotesi che o= 10 in una popolazione con = 6 estraendo a caso un campione di n = 9. n ) ESEMPIO test media di una popolazione Ho: =10 Popolazione: H1: 10 Medie campionarie: N (10; x ) N (10; ) Se = 0,05 N (10; x ) Rifiuto H0 se la media campionaria è al di fuori dei limiti 0 1.96 (/n) 10 x La regione di rifiuto ha probabilità (livello di significatività) È la probabilità di rifiutare H0 quando H0 è vera ESEMPIO test media di una popolazione Ho: = 10 Popolazione: N (10;6) H1: 10 Medie campionarie: N (10;2) (sono noti =6 e n=9) Distribuzione delle medie campionarie N (10;2) 10 x ESEMPIO test media di una popolazione Ho: =10 Se = 0,05 H1: 10 Rifiuto H0 se la media campionaria è al di fuori dei limiti 0 1.96 (/n) Quindi: 6,08 10 1.96·2 13,92 N (10;2) 6,08 10 13,92 x Esempio di fasi da seguire per un test delle ipotesi 1. Specificare Ho, H1 ed un livello 2. Definire una statistica per il test (statistica di cui sia definibile la distribuzione campionaria) e la zona di rifiuto per Ho (valori della statistica di probabilità< quando Ho è vera). 3. Eseguire il campionamento (o l’esperimento) e calcolare la statistica. 4. Se la statistica calcolata cade nella zona di rifiuto decido di rifiutare Ho, altrimenti decido di non rifiutare Ho. Test della media di una popolazione 1. Esempio. Ho: = 10 ; H1: 10; livello = 0,05 2. La statistica è z. Poiché P(z >1.96)=0,05, la zona di rifiuto è z< -1,96 o z>1,96 ovvero z >1.96 (test a 2 code) 3. Calcolo la media campionaria e la converto nella variabile standardizzata: z x x 4. Rifiuto l’ipotesi nulla se z >1.96. In questo modo si ha una probabilità di rifiuto di 0.05 quando H0 è vera (e quindi una probabilità di errore di 0,05). Test della media di una popolazione con p value In alternativa si può riportare direttamente il valore della probabilità p di commettere l’errore di I specie (livello di significatività osservato). Il p value è una misura di quanto i dati sono in disaccordo con Ho. Posso procedere come segue: 1. Definisco Ho: = 10 ; H1: 10 2.Calcolo la media campionaria e la converto nella variabile standardizzata: z x x 3. Calcolo la probabilità p di ottenere il valore di z calcolato: P(Z< -z) + P(Z>z) ovvero P(Z > z ) (test a 2 code) Significatività e potenza del test verità conclusione H0 vera H0 falsa GIUSTO ERRORE II specie H0 vera P = 1- P= livello di protezione ERRORE di I specie GIUSTO P= 1- H0 falsa P = potenza livello di significatività SIGNIFICATIVITÀ E POTENZA DEL TEST Ho: =10 H1: 10 N (0 ; n A parità di n (numerosità campionaria) se diminuisco la probabilità dell’errore di I specie () aumento la probabilità dell’errore di II specie (). Diminuisce la potenza del test (1-). ) 1- 1- 10 /2 /2 Test a una o due code Se siamo interessati a rifiutare Ho solo se la differenza è in un senso o nell’altro, eseguiamo il test ad una coda, o test unilaterale. L’ipotesi alternativa sarà H1: > o ovvero H1: < o Il vantaggio è che la potenza del test aumenta andando verso H1 ma è praticamente 0 dall’altra parte. 1- 1- Test della media di una popolazione ( ignoto) Se non è noto si utilizza la sua stima s e la relativa stima dell’errore standard: s sx n La statistica da usare per il test è t con (n-1) gradi di libertà (GL). x t sx - Rifiuto l’ipotesi nulla se t > t, (n-1) - Ovvero calcolo la probabilità p di trovare t Test della media di una popolazione ( ignoto) In pratica per il test al livello di significatività del 5%: L’ipotesi è sempre Ho: = o contro H1: o Calcolo t: t x sx - Rifiuto l’ipotesi nulla se t > t, (n-1) - Ovvero calcolo la probabilità p di trovare il t calcolato sotto ipotesi nulla Esempio test della media di una popolazione ( ignoto) Si afferma che con l’applicazione di una certa dieta dimagrante si perdono 3 kg in un mese. Vengono sottoposte a dieta 64 persone e dopo un mese si verificano i risultati: perdita di peso media = 2,6 kg deviazione standard del campione: 1,2 kg Al livello = 0.05, il campione è significativamente diverso dall’atteso? Soluzione Le ipotesi sono: H0 : = 3 H1 : 3 x 2,6 (test a due code) s sx 0,15 n x 2,6 3 t 2,667 sx 0,15 - Rifiuto Ho se t > t0,05;63 1,998 - P(t >2,667) = 0,0097 Rifiuto l’ipotesi nulla. Il metodo non funziona come promesso Esempio test della media di una popolazione ( ignoto) Un acquirente è interessato all’acquisto di grosse partite di formaggio provenienti dagli alpeggi, ma richiede che le forme siano di peso mediamente superiore ai 2.5 kg Viene scelto casualmente un campione di 12 forme che vengono pesate Media campionaria: m=2.758 Stima deviazione standard s=0.3942 Al livello di = 0.1, il campione è significativamente superiore (test a una coda) a 2.5 Kg? Soluzione Le ipotesi sono: H0: = 2,5 H1: > 2,5 (test a una coda) x 2,758 sx s 0.1138 n x 2,758 2,5 t 2,267 sx 0.1138 - Rifiuto Ho se t > t0, 2;11 1,363 P(t >2,267)=0,022 L’ipotesi nulla è rifiutata. Test di una proporzione Una distribuzione binomiale, se ci si riferisce alle proporzioni di successi, è caratterizzata da: Media (valore atteso): =p Varianza: 2= p(1-p) La proporzione di successi del campione, se n è sufficiente, è una variabile casuale con distribuzione approssimativamente normale e: Media = p Varianza = p(1-p)/n Test di una proporzione Posso definire le ipotesi: Ho:p=po e H1:ppo La statistica per il test sarà: z pˆ po p0 (1 p0 ) n Dove p̂ è la proporzione campionaria di successi, trovata con un campione di numerosità n. Se n è sufficientemente grande la distribuzione è proprio quella della normale standardizzata. Posso quindi calcolare i valori critici di z (per significatività prefissate) da confrontare con lo z trovato oppure il p value. Esempio test di una proporzione Ho:p=0,8 e H1:p0,8 In un campione di 100 osservazioni i successi risultano 75. Posso rifiutare l’ipotesi nulla a livello =0,05? z pˆ po 0,75 0,8 1,25 p0 (1 p0 ) n 0,8(1 0,8) 100 - Rifiuto l’ipotesi nulla se z >1.96. - P(Z > z )=P(Z>1,25) = 0,0528 L’ipotesi nulla non è rifiutata