Unità 5 Test di significatività e di ipotesi Ipotesi nulla e ipotesi alternativa Errore di I tipo e di II tipo Livello di significatività e potenza 1 DECISIONI STATISTICHE Spesso è necessario prendere decisioni relative a popolazioni sulla base di informazioni ottenute dall’analisi di un campione. Ad esempio, sulla base di dati campionari ci può interessare di decidere se una tecnica risulta migliore di un’altra per diagnosticare una malattia oppure se una nuova terapia è efficace per curare una determinata patologia. Decisioni di questo genere sono dette decisioni statistiche. 2 IPOTESI STATISTICHE Nel tentativo di pervenire ad una decisione statistica è utile fare assunzioni circa la popolazione presa in esame, ad esempio circa la sua densità di probabilità. Tali assunzioni, che possono risultare vere o false, sono dette ipotesi statistiche. Ad esempio, volendo decidere se una moneta è truccata si formula l’ipotesi che non lo sia ponendo uguali fra loro le probabilità che, lanciando la moneta, si presenti testa o croce (cioè P = 0,5). Allo stesso modo, quando si vuole decidere se una terapia dia risultati diversi da un’altra, si ipotizza che non vi sia differenza fra le due terapie, ovvero che le differenze che si osservano fra i campioni siano dovute al caso, cioè al campionamento operato su un’identica popolazione. 3 IPOTESI NULLA E IPOTESI ALTERNATIVA In termini tecnici l'ipotesi statistica da verificare si chiama ipotesi nulla e si indica con H0. Qualunque ipotesi che differisce dall’ipotesi statistica fatta è detta ipotesi alternativa e viene indicata con H1. Ad esempio, se facciamo l’ipotesi statistica che lanciando una moneta si presenti testa con probabilità P = 0,5 (ipotesi nulla), le ipotesi che P sia 0,8 oppure 0,3 o, più semplicemente, che P sia diversa da 0,5 sono alternative. 4 Quando si confrontano i dati ottenuti su campioni l’ipotesi nulla è in genere un’ipotesi di casualità. Esempio H0: le differenze di altezza osservate nei due campioni di piante sono dovute a variazioni casuali. H1: le differenze di altezza osservate nei due campioni di piante sono dovute alla “superiorità” dei semi ottenuti da impollinazione incrociata. 5 TEST DI IPOTESI E DI SIGNIFICATIVITÀ Se, supponendo che un’ipotesi statistica HO sia vera, si trova che i risultati osservati sui dati campionari sono fortemente in contrasto con quelli che, per puro effetto del caso, ci saremmo aspettati sulla base dell’ipotesi formulata, si dirà che le differenze osservate sono “significative” e si deciderà di rigettare l’ipotesi fatta. Così, ad esempio, se su 80 lanci di una moneta si ottiene 71 volte testa, saremo favorevoli a rifiutare l’ipotesi che la moneta non sia truccata, sebbene sia possibile che facendo tale scelta si stia sbagliando. Procedure che permettono di decidere se accettare o rigettare una certa ipotesi o di determinare se un campione osservato differisce in maniera significativa dai risultati attesi sono dette test di ipotesi, test di significatività o regole di decisione. 6 ERRORI DI I TIPO E DI II TIPO Se l’ipotesi fatta che avrebbe dovuto essere accettata viene rifiutata, si dirà di aver commesso un errore di I tipo o di I specie. Al contrario, quando si accetta un’ipotesi che avrebbe dovuto essere rigettata, si dirà di aver commesso un errore di II tipo o di II specie. In entrambi i casi si è presa una decisione sbagliata e quindi si è commesso un errore di giudizio. 7 Perché una regola di decisione sia buona, essa deve essere costruita in modo da minimizzare gli errori di decisione. Ciò non è semplice poiché, per una data grandezza del campione, i tentativi di diminuire gli errori di un tipo sono in genere accompagnati da un aumento di errori dell’altro tipo. Dal momento che in pratica un tipo di errore può essere più pericoloso di un altro, è naturale cercare il compromesso in modo da limitare l’errore più importante senza eccedere nell’altro senso. Il solo modo per ridurre entrambi gli errori è quello di aumentare la grandezza del campione. Ciò però non è sempre possibile. 8 LIVELLO DI SIGNIFICATIVITÀ Nell’operare un test di ipotesi, la massima probabilità con la quale si è disposti a rischiare un errore di I tipo è detta livello di significatività del test. Questa probabilità è spesso indicata con la lettera α. Di solito il livello di significatività α è scelto pari a 0,05 (cioè 5%) oppure 0,01 (cioè 1%). Ad esempio, scegliendo α = 0,05 ci saranno 5 probabilità su 100 di commettere un errore di I tipo, cioè di rigettare l’ipotesi statistica che avrebbe dovuto essere accettata. 9 IL CONCETTO DI POTENZA STATISTICA Si è visto che, nell’analizzare i risultati di uno studio, si può commettere un errore di II tipo. La probabilità di commettere questo tipo di errore è indicata con la lettera . La potenza dello studio è uguale 1-. Quindi un test di ipotesi è tanto più potente quanto più è in grado di minimizzare la probabilità di errore di II tipo, ovvero quanto più è in grado di evidenziare differenze significative tra piccole serie di dati. 10 ESEMPIO Si è visto che, data una variabile X normalmente distribuita con media e deviazione standard , la distribuzione campionaria della media di campioni di numerosità n segue la curva di Gauss con media e deviazione standard pari a n . Per quanto detto sulla curva di Gauss possiamo essere fiduciosi al 95% che la media m di un generico campione di numerosità n estratto dalla popolazione di studio cada dentro l’intervallo [ – 1,96 n , + 1,96 n ]. 11 Quindi: se analizzando un campione del quale non si conosce la provenienza troviamo che il corrispondente valore di m cade al di fuori di questo intervallo, concluderemo che un simile evento potrebbe verificarsi con una probabilità minore del 5% se il campione stesso fosse stato tratto dalla popolazione di studio (ipotesi nulla). Potremmo allora asserire che la media campionaria trovata differisce significativamente (con probabilità di errore di I tipo inferiore al 5%) da quello che ci aspettavamo sulla base dell’ipotesi nulla e saremmo propensi a rigettare l’ipotesi nulla stessa. 12 ALCUNE CONSIDERAZIONI L’esempio precedente ci dà lo spunto per fare alcune considerazioni sui test di ipotesi. Quando ci si propone di confrontare due o più campioni, si parte dall’ipotesi che essi differiscano solo per l’effetto del caso (ipotesi nulla). Il test statistico ci permetterà di verificare la validità di questa ipotesi, evidenziando quelle situazioni in cui è ragionevole (altamente probabile) che l’ipotesi nulla sia da rigettare. Per chiarire le idee si considerino due possibili esempi applicativi. 13 ESEMPIO A Presi due campioni di pazienti, prima di effettuare un trattamento terapeutico in fase di studio ed uno di controllo, si vuole valutare, per la corretta impostazione statistica, se le due casistiche di partenza sono omogenee, ossia se le differenze basali che si riscontrano sono con alta probabilità da imputarsi solo al caso (ipotesi nulla). Questo è un classico problema di verifica dell’omogeneità basale dei gruppi. In questo caso, se il test applicato non ci permette di rigettare l’ipotesi nulla, si può ragionevolmente supporre che i due campioni provengano dalla stessa popolazione e quindi, dopo il periodo di trattamento, si può passare al punto riportato nel successivo esempio B. 14 ESEMPIO B Considerati gli stessi campioni dopo il trattamento, si applica nuovamente il test per valutare se si può ancora ragionevolmente supporre che le due casistiche differiscano solo per effetto del caso (ipotesi nulla). In questo caso, se il test suggerisce di rigettare l’ipotesi nulla, si può ipotizzare che i due trattamenti analizzati diano risultati differenti. Al contrario, nel caso in cui il test non ci permetta di rifiutare l’ipotesi nulla, si potrà asserire che i due trattamenti non portano a risultati significativamente diversi. 15 NOTA BENE Comunque avvengano dette verifiche, l’ipotesi nulla sarà sempre respinta o non respinta con una certa probabilità. La decisione presa non sarà mai certa, dal momento che per avere la certezza occorrerebbe studiare l’intera popolazione e non campioni. Il rischio di sbagliare è comunque valutabile, in particolare: Il test permette di calcolare la probabilità di errore di I tipo. La probabilità di errore di II tipo è legata alla potenza del test. 16 CONCLUSIONE I test di ipotesi permettono di giungere ad una decisione statistica ragionevole, ma non certa. 17 TEST A UNA CODA E A DUE CODE Nell’esempio considerato in precedenza, per rigettare o meno l’ipotesi nulla, si è valutato se i valori del riassunto campionario m cadevano al di fuori o all’interno dell’intervallo [ –1,96 n , +1,96 n ], atteso con probabilità del 95%. Con riferimento alla figura sotto, si è quindi preso in esame le due code (quella di destra e quella di sinistra) della distribuzione campionaria del riassunto, a ciascuna delle quali corrisponde un’area pari a 0,025. Un test di questo tipo è detto test a due code o bidirezionale. 0,95 0,025 0,025 x 18 Alcune volte si è tuttavia interessati a valutare solo se il riassunto va a cadere in una delle code della distribuzione (coda di destra oppure di sinistra). Ciò può accadere, ad esempio, quando siamo certi che due terapie diano risultati diversi e sottoponiamo a test l’ipotesi che una terapia sia migliore di un’altra, che è una cosa diversa dal sottoporre a test l’ipotesi che una terapia sia diversa (migliore o peggiore) di un’altra. Test di questo genere sono detti test a una coda o unidirezionali (o monodirezionali), poiché in questo caso la regione critica è una regione posta da un solo lato (destro o sinistro) della distribuzione con un’area uguale al livello di significatività prescelto. 19