VERIFICA DELLE IPOTESI • Introduzione • Livelli di significatività • Verifica di ipotesi sulla media di una popolazione normale • Verifica di ipotesi sulla varianza di una popolazione normale • Verifica di ipotesi su una popolazione di Bernoulli • Ipotesi sulla media di una distribuzione di Poisson 290 Introduzione Come in precedenza, supponiamo di disporre di un campione aleatorio proveniente da una distribuzione che ci è nota tranne che per uno o più parametri incogniti. La nuova chiave di lettura non prevede più di stimare direttamente questi parametri, ma piuttosto di usare il campione raccolto per verificare qualche ipotesi che li coinvolga. Una ipotesi statistica è normalmente un’affermazione su uno o più parametri della distribuzione di popolazione. Si parla di ipotesi perché a priori non sappiamo se sia vera o meno: il problema primario è quello di sviluppare una procedura per determinare se i valori di un campione aleatorio e l’ipotesi fatta siano compatibili oppure no. Se è compatibile diremo che l’ipotesi è accettata, altrimenti è rifiutata. Si noti che quando accettiamo un’ipotesi non stiamo affermando che sia necessariamente vera, ma solo che i dati raccolti sono accettabilmente in accordo con essa. 291 Livelli di significatività Consideriamo una popolazione avente distribuzione Fθ che dipende da un parametro incognito θ e supponiamo di volere verificare una qualche ipotesi su θ, che chiameremo ipotesi nulla, e denoteremo con H0. Se Fθ è ad esempio una distribuzione normale con media θ e varianza 1, due possibili ipotesi nulle su θ sono: 1.H0: θ=1 2.H0: θ≤1 La prima di queste ipotesi afferma che la popolazione ha distribuzione N(1,1), mentre la seconda sostiene che essa è normale con varianza 1 e media non superiore a 1. Si noti che l’ipotesi nulla 1, quando è vera, caratterizza completamente la distribuzione della popolazione, mentre questo non è vero per l’ipotesi 2. Nel primo caso si parla di ipotesi semplice, mentre nel secondo di ipotesi composta. 292 Livelli di significatività Supponiamo di disporre di un campione aleatorio X1,..,Xn proveniente da questa popolazione e di volerlo usare per eseguire un test di una certa ipotesi nulla H0. Siccome dobbiamo decidere se accettare o meno H0 basandoci esclusivamente sugli n valori dei dati, il test sarà definito da una regione C nello spazio a n dimensioni, con l’intesa che se il vettore (X1,..,Xn) cade all’interno di C l’ipotesi viene rifiutata, mentre viene accettata in caso contrario. Una regione C con queste caratteristiche viene detta regione critica del test. 293 Livelli di significatività Schematizzando quanto detto, il test statistico determinato dalla regione critica C è quello che accetta H 0 se ( X1, X 2 ,..., X n ) ∉ C e rifiuta H 0 se ( X1, X 2 ,..., X n ) ∈ C In qualunque test per verificare una ipotesi nulla, il risultato può essere sbagliato in due modi differenti. Si ha infatti: • un errore di prima specie quando i dati ci portano a rifiutare una ipotesi H0 che in realtà è corretta, • un errore di seconda specie quando finiamo con l’accettare H0 ed essa è falsa. Non vi è simmetria tra i due tipi di errori. Ricordiamo infatti che l’obiettivo di una verifica di H0 non è quella di dire se questa ipotesi sia vera o falsa, ma piuttosto di dire se l’ipotesi fatta sia anche solo compatibile con i dati raccolti. In effetti vi è un ampio livello di tolleranza nell’accettare H0, mentre per rifiutarla occorre che i dati campionari siano molto improbabili quando H0 è soddisfatta. 294 Livelli di significatività Questo bilanciamento si ottiene specificando un valore α, detto livello di significatività, e imponendo che il test abbia la proprietà che quando l’ipotesi H0 è vera, la probabilità che venga rifiutata non possa superare α. Il livello di significatività del test viene normalmente fissato in anticipo, con valori tipici dell’ordine di 0.1, 0.05 o 0.005. Detto in altri termini, un test con livello di significatività α deve avere una probabilità di errore di prima specie minore o uguale ad α. 295 Livelli di significatività Per chiarire come viene costruita la regione critica, immaginiamo di volere verificare l’ipotesi nulla H 0: θ ∈ w dove con w stiamo indicando un insieme di valori possibili per il parametro. Un approccio naturale per formulare una verifica di H0 ad un livello di significatività α prescritto consiste nell’individuare uno stimatore puntuale di θ, che denotiamo con d(X), e quindi rifiutare l’ipotesi quando d(X) è lontano dalla regione w. Per capire quanto lontano deve essere per giustificare un rifiuto di H0 ad un livello di significatività pari a α occorre conoscere la distribuzione dello stimatore d(X) nel caso in cui H0 sia vera. Ad esempio la verifica dell’ipotesi che la media di una popolazione N(θ,1) sia pari a 1, impone di rifiutare l’ipotesi quando lo stimatore puntuale di θ (ovvero la media campionaria) dista da 1 più di 1.96/√n. Come vedremo quest’ultimo valore è stato scelto in modo da dare ai test un livello di significatività del 5%. 1 n 1.96 C = ( X1, X 2 ,..., X n ) : 1 − ∑ X i > n n i =1 296 Verifica di ipotesi sulla media di una popolazione normale Varianza nota Supponiamo che X1,..,Xn sia un campione aleatorio proveniente da una popolazione normale di parametri µ e σ2, con la varianza nota e media incognita. Fissata una costante µ0, vogliamo verificare l’ipotesi nulla H 0 : µ = µ0 contro l’ipotesi alternativa H1: µ ≠ µ0 Siccome ̅X =Σi Xi/n è lo stimatore puntuale per µ, sembra ragionevole accettare H0 quando ̅X non è troppo lontano da µ0. Perciò la regione critica del test sarà del tipo C = ( X1, X 2 ,..., X n ) : X − µ0 > c { } per una scelta opportuna della costante c. Se vogliamo che il test abbia livello di significatività α, dobbiamo individuare quel valore di c nell’equazione precedente che rende pari ad α la probabilità di errore di prima specie. Ciò significa che c deve soddisfare la relazione seguente α = P (errore di I specie) = Pµ 0 (| X − µ0 |> c) (*) dove scriviamo con Pµ0 per intendere che la probabilità precedente viene 297 calcolata con l’assunzione che µ=µ0. Verifica di ipotesi sulla media di una popolazione normale Varianza nota Quando però µ=µ0 sappiamo che ̅X ha distribuzione normale con media µ0 e varianza σ2/n e quindi se Z denota una variabile aleatoria N(0,1) allora X − µ0 µ ∼ Z σ/ n 0 dove la relazione ~ è condizionata all’ipotesi H0: µ=µ0. Possiamo allora riscrivere (*) nella forma X − µ0 c n c n c n > ) = 2 P( Z > ) α = Pµ 0 = P (| Z |> σ σ σ σ/ n e quindi P(Z>c√n/σ)=α/2. Siccome però per definizione di zα/2 vale P ( Z > zα /2 ) = α / 2 si deduce che c n σ = zα /2 ⇒ c = zα /2 σ n 298 Verifica di ipotesi sulla media di una popolazione normale Varianza nota Il test con livello di significatività α dovrà allora rifiutare H0 se | ̅X -µ0|> zα/2σ/√n, cioè X − µ0 si rifiuta H 0 se > zα /2 σ/ n (**) si accetta H 0 se X − µ0 ≤ zα /2 σ/ n La regione di accettazione per la statistica del test è un intervallo simmetrico rispetto allo zero, come è illustrato in figura, dove si è riportata in sovrapposizione la densità della distribuzione normale standard. 299 Verifica di ipotesi sulla media di una popolazione normale Varianza nota 300 Verifica di ipotesi sulla media di una popolazione normale Varianza nota 301 Verifica di ipotesi sulla media di una popolazione normale Varianza nota La regola fornita dall’equazione (**) può essere riformulata come segue. Dopo aver calcolato il valore assunto dalla statistica del test, √n| ̅X -µ0|/σ (che denotiamo con v), valutiamo la probabilità (condizionata alla validità di H0) che la statistica stessa assumesse un valore come v o più estremo ancora. Se tale probabilità è minore del livello di α, rifiutiamo l’ipotesi H0, altrimenti l’accettiamo. In altri termini dobbiamo calcolare prima il valore della statistica del test, poi la probabilità che una normale standard, in valore assoluto, superi tale quantità. Questa probabilità, detta il p-dei-dati del test, fornisce il livello di significatività critico, scendendo al di sotto del quale la decisione cambia da rifiuto ad accettazione. In pratica spesso non si fissa in anticipo il livello di significatività, ma si osservano i dati e si ricava il p-dei-dati corrispondente. Se esso risulta molto maggiore di quanto siamo disposti ad accettare come probabilità di un errore di prima specie, conviene accettare l’ipotesi nulla; se invece esso è molto piccolo, possiamo rifiutarla. 302 Verifica di ipotesi sulla media di una popolazione normale Varianza nota 303 Verifica di ipotesi sulla media di una popolazione normale Varianza nota Non abbiamo ancora discusso la probabilità degli errori di seconda specie, cioè la probabilità di accettare H0 quando in realtà essa non è valida. Tale probabilità dipende da µ e in particolare vale X − µ0 X − µ0 ≤ zα /2 = Pµ − zα /2 ≤ ≤ zα /2 β ( µ ) = Pµ (accettare H 0 ) = Pµ σ/ n σ/ n La funzione β(µ) è detta curva OC (curva operativa caratteristica) e rappresenta la probabilità di accettare H0 quando la media reale è µ. Per calcolare questa probabilità usiamo il fatto che ̅X ~N(µ,σ2/n) e quindi Z= da cui β ( µ ) = Pµ − zα /2 ≤ X −µ ∼ N (0,1) σ/ n µ −µ X − µ0 µ − µ X − µ0 µ0 − µ ≤ zα /2 = Pµ 0 − zα /2 ≤ 0 + ≤ + zα /2 = σ/ n σ/ n σ/ n σ/ n σ / n µ −µ µ −µ µ −µ µ −µ = Pµ 0 − zα /2 ≤ Z ≤ 0 + zα /2 = Φ 0 + zα /2 − Φ 0 − zα /2 σ/ n σ / n σ / n σ / n 304 Verifica di ipotesi sulla media di una popolazione normale Varianza nota Per un livello di significatività α fissato, la curva OC è simmetrica rispetto a µ0 e dipende da µ solo tramite √n|µ-µ0|/σ. In figura è rappresentata la curva OC per α=0.05, con l’ascissa trasformata da µ a d=√n|µ-µ0|/σ. N.B. La funzione 1-β(µ) è detta funzione di potenza del test. Per un valore di µ fissato, la potenza del test è la probabilità di rifiutare (correttamente) H0 quando µ è il valore vero. 305 Verifica di ipotesi sulla media di una popolazione normale Varianza nota 306 Verifica di ipotesi sulla media di una popolazione normale Test unilaterali Nel verificare l’ipotesi nulla µ=µ0 abbiamo costruito un test che porta ad un rifiuto quando ̅X è lontano da µ0, ovvero valori di ̅X troppo bassi o troppo alti rispetto a µ0 sembrano smentire che µ sia proprio uguale a µ0. Cosa accade se l’ipotesi alternativa a H0: µ=µ0 è H1: µ>µ0? Nel verificare l’ipotesi H 0 : µ = µ0 contro H1: µ > µ0 Dovremmo rifiutare l’ipotesi nulla quando ̅X, lo stimatore di µ, è molto più grande di µ0 e quindi la regione critica dovrebbe essere C = {( X 1, X 2 ,..., X n ) : X − µ0 > c} per una scelta opportuna della costante c. Siccome la probabilità di rifiuto dovrebbe essere α quando H0 è vera occorre che c soddisfi la relazione Pµ 0 ( X − µ0 > c ) = α Poiché stiamo supponendo che µ=µ0, ̅X ha media µ0 e quindi la statistica Z ha distribuzione normale standard Z= X − µ0 ∼ N (0,1) σ/ n 307 Verifica di ipotesi sulla media di una popolazione normale Test unilaterali Perciò la precedente è equivalente a c n P Z > =α σ che si risolve in funzione di c ricordando che P(Z>zα) =α ottenendo quindi c = zα /2 σ n Il test con livello di significatività α dovrà allora rifiutare H0 se ̅X- µ0>zασ/√n, cioè X − µ0 si rifiuta H 0 se > zα σ/ n X − µ0 si accetta H 0 se ≤ zα σ/ n (***) Quella trovata è detta regione critica unilaterale, o a una coda (a differenza delle regioni critiche trovate in precedenza che erano bilaterali o a due code). Anche il problema di verificare le ipotesi alternative H 0 : µ = µ0 si dice problema di test unilaterale. contro H1: µ > µ0 308 Verifica di ipotesi sulla media di una popolazione normale Test unilaterali Per ottenere il p-dei-dati di questo tipo di test si calcola innanzitutto il valore della statistica del test X − µ0 σ/ n in funzione dei dati raccolti; il p-dei-dati è quindi uguale alla probabilità che una normale standard superi questo valore. 309 Verifica di ipotesi sulla media di una popolazione normale Test unilaterali 310 Verifica di ipotesi sulla media di una popolazione normale Test unilaterali La curva OC del test unilaterale (***) si può ricavare come segue. Visto che per i=1,..,n si ha che Xi~N(µ,σ2/n) e quindi che ̅X~N(µ,σ2/n) se poniamo Z=√n(̅X-µ)/σ, questa statistica è normale standard per cui X −µ µ0 − µ σ β ( µ ) = Pµ (accettare H 0 ) = Pµ X ≤ µ0 + zα ≤ + zα = = Pµ n σ / n σ / n µ −µ µ −µ = Pµ Z ≤ 0 + zα = Φ 0 + zα σ/ n σ / n Siccome Φ, in quanto funzione di ripartizione, è crescente è chiaro che β(µ) è una funzione decrescente. Questo risultato appare incoraggiante, visto che è ragionevole che, al crescere di µ, sia sempre meno facile concludere che µ<µ0. Si noti anche che, siccome Φ(zα)=1-α, si ha che β ( µ0 ) = 1 − α 311 Verifica di ipotesi sulla media di una popolazione normale Test unilaterali La regola fornita dalla (***) vale anche per verificare, ad un livello di significatività α, l’ipotesi unilaterale H 0 : µ ≤ µ0 contro H1: µ > µ0 Per accertarsi che il livello di significatività sia rimasto α, dobbiamo dimostrare che la probabilità di un errore di prima specie non superi mai questo valore. Al variare di µ, la probabilità di rifiuto è data da 1-β(µ). Siccome si commette un errore di prima specie se H0 è vera e i dati ci impongono di rifiutarla, dobbiamo verificare che, per ogni µ compatibile con H0, quindi per ogni µ≤µ0, 1 − β ( µ ) ≤ α per ogni µ ≤ µ0 ⇒ β ( µ ) ≥ 1 − α per ogni µ ≤ µ0 N.B. E’ anche possibile verificare, ad un livello di significatività α, l’ipotesi H0: µ=µ0 contro l’ipotesi alternativa H1:µ<µ0 decidendo che X − µ0 si rifiuta H 0 se < − zα σ/ n X − µ0 si accetta H 0 se ≥ − zα σ/ n 312 Verifica di ipotesi sulla media di una popolazione normale Test unilaterali 313 Verifica di ipotesi sulla media di una popolazione normale Test unilaterali 314 Verifica di ipotesi sulla media di una popolazione normale Test unilaterali 315 Verifica di ipotesi sulla media di una popolazione normale Varianza non nota: test t Comunemente né la media né la varianza di una popolazione sono note. Supponiamo di essere in tale situazione e consideriamo di nuovo come si possa verificare l’ipotesi nulla che µ sia uguale ad un valore assegnato µ0, contro l’ipotesi alternativa che µ≠µ0. H 0 : µ = µ0 contro H1: µ ≠ µ0 Come in precedenza, sembra ragionevole rifiutare l’ipotesi nulla quando ̅X cade lontano da µ0: tuttavia la distanza a cui deve essere da µ0 per giustificare questo rifiuto dipende dalla deviazione standard che in quella sede era nota, ma qui non è conosciuta. Possiamo allora pensare di sostituirla con il suo stimatore, la deviazione standard campionaria S 1 n 2 S= ∑ (Xi − X ) n − 1 i =1 rifiutando l’ipotesi nulla quando X − µ0 S/ n è troppo grande. 316 Verifica di ipotesi sulla media di una popolazione normale Varianza non nota: test t Quanto grande è «troppo grande»? Sappiamo che la variabile aleatoria X −µ ∼ tn −1 S/ n ha distribuzione t. Se si denota con T la statistica di questo test, cioè X − µ0 T= S/ n allora quando H0 è vera, visto che µ=µ0, T ha distribuzione t con n-1 gradi di libertà. Imponiamo ora che la probabilità di errore di prima specie sia α, ovvero passando agli eventi complementari, che sia 1-α la probabilità di accettare l’ipotesi nulla quando µ=µ0: X − µ0 Pµ 0 −c ≤ ≤ c =1−α S/ n Per ricavare c, si noti che, siccome la densità della distribuzione t è simmetrica rispetto allo zero, α = 1 − P (−c < T < c) = P (T ≤ −c) + P (T ≥ c) = 2 P (T ≥ c) 317 Verifica di ipotesi sulla media di una popolazione normale Varianza non nota: test t Per cui P(T>c)=α/2 e quindi deve valere c=tα/2,n-1 per definizione di tα,k. Concludendo diamo la regola per usare il test: X − µ0 si rifiuta H 0 se > tα /2,n −1 S/ n si accetta H 0 se X − µ0 ≤ tα /2,n −1 S/ n Il test descritto è detto test t bilaterale ed è illustrato in figura. Se si denota con t il valore assunto da T, la statistica del test, calcolata in funzione dei dati del campione, il valore del p-dei-dati corrispondente è la probabilità che |T| superi |t|, quando H0 è vera. Si tratta quindi della probabilità che una t di Student con n-1 gradi di libertà abbia valore assoluto maggiore di |t|. Come nei casi precedenti, si deve rifiutare l’ipotesi nulla a tutti i livelli318di significatività maggiori del p-dei-dati, mentre la si accetta a tutti i livelli inferiori. Verifica di ipotesi sulla media di una popolazione normale Varianza non nota: test t 319 Verifica di ipotesi sulla media di una popolazione normale Varianza non nota: test t 320 Verifica di ipotesi sulla media di una popolazione normale Varianza non nota: test t Si può costruire un test t a una coda per verificare l’ipotesi H 0 : µ = µ0 (o H 0 : µ ≤ µ0 ) contro ad un livello di significatività α decidendo che X − µ0 si rifiuta H 0 se H1: µ > µ0 > tα ,n −1 S/ n X − µ0 si accetta H 0 se ≤ tα ,n −1 S/ n Se il valore di √n (̅X-µ)/S realizzato dai dati è v, allora il p-dei-dati corrispondente è la probabilità che una t di Student con n-1 gradi di libertà sia maggiore o uguale a v. Analogamente la verifica ad un livello α dell’ipotesi H 0 : µ = µ0 (o H 0 : µ ≥ µ0 ) si ottiene decidendo che contro X − µ0 < −tα ,n −1 S/ n X − µ0 si accetta H 0 se ≥ −tα ,n −1 S/ n H1: µ < µ0 si rifiuta H 0 se 321 Verifica di ipotesi sulla media di una popolazione normale Varianza non nota: test t 322 Verifica di ipotesi sulla media di una popolazione normale Varianza non nota: test t 323 Verifica di ipotesi sulla varianza di una popolazione normale Sia X1,..,Xn un campione proveniente da una popolazione normale con media incognita µ e varianza incognita σ2 e supponiamo di volere verificare l’ipotesi nulla H 0 : σ 2 =σ 02 contro H1: σ 2 ≠ σ 02 per un valore di σ02 fissato. Per ottenere un test ricordiamo che (n-1)S2/σ2 ha distribuzione chi-quadro con n-1 gradi di libertà così quando H0 è vera S2 S2 σ0 σ0 2 2 ( n − 1) ∼ χ ⇒ P ( χ n −1 H 0 1−α /2,n −1 ≤ 2 2 ( n − 1) ≤ χ α /2,n −1 ) = 1 − α 2 Perciò la regola da adattare è la seguente si accetta H 0 se χ12−α /2,n −1 ≤ S2 2 ( n − 1) ≤ χ α /2,n −1 2 σ0 si rifiuta H 0 negli altri casi 324 Verifica di ipotesi sulla varianza di una popolazione normale Il test precedente può anche essere implementato come segue: • si osservano i dati; • si calcola il valore c assunto dalla statistica del test, ovvero (n-1)S2/σ02; • si determina poi la probabilità che una chi-quadro con n-1 gradi di libertà sia (1) più piccola di c, (2) più grande di c. L’ipotesi nulla viene rifiutata se una di queste due probabilità è inferiore ad α/2. Altrimenti detto, il p-dei-dati è p -dei-dati = 2 min{P ( χ n2−1 ≤ c ),1 − P ( χ n2−1 ≤ c )} Il p-dei-dati per un test a una coda si trova analogamente. 325 Verifica di ipotesi sulla varianza di una popolazione normale 326 Verifica di ipotesi su una popolazione di Bernoulli Una ipotesi di lavoro che spesso viene assunta è che ogni oggetto prodotto sia difettoso in maniera indipendente da tutti gli altri con probabilità p. In questo modo il numero di difetti in un campione di n pezzi ha distribuzione binomiale di parametri (n,p). Consideriamo allora la verifica dell’ipotesi H 0 : p ≤ p0 H1: p > p0 contro dove p0 è un valore assegnato. Se denotiamo con X il numero di pezzi difettosi in un campione di n, dobbiamo certamente rifiutare H0 quando X è troppo grande. Per calcolare poi quanto grande deve essere per giustificare un rifiuto dell’ipotesi nulla ad un livello di significatività pari ad α, notiamo che n i P ( X ≥ k ) = ∑ P ( X = i ) = ∑ p (1 − p ) n −i i =k i=k i n n E’ intuitivo che P(X≥k) è una funzione crescente di p; infatti la probabilità che un campione contenga k o più pezzi difettosi cresce con p. Usando questo fatto, quando H0 è vera, quindi p≤p0 n n PH 0 ( X ≥ k ) ≤ ∑ p0i (1 − p0 ) n −i 327 i i =k Verifica di ipotesi su una popolazione di Bernoulli Per verificare le ipotesi suddette ad un livello di significatività α, si deve rifiutare H0 quando X≥k* dove con k* si è denotato il più piccolo numero intero k tale che n n i n −i k * = min k : ∑ p0 (1 − p0 ) ≤ α i =k i Un modo migliore per implementare il test consiste nel determinare prima il valore x della statistica del test, X, e poi calcolare il p-dei-dati come segue n i p -dei-dati = ∑ p0 (1 − p0 ) n −i i= x i n 328 Verifica di ipotesi su una popolazione di Bernoulli 329 Verifica di ipotesi su una popolazione di Bernoulli Quando la numerosità del campione è elevata, possiamo ottenere un test approssimativo con significatività α, usando la distribuzione normale. Poiché infatti quando n è molto grande X è approssimativamente normale, con media e varianza E[ X ] = np Var ( X ) = np (1 − p ) ne segue che X − np ∼ N (0,1) np (1 − p ) sarà approssimativamente normale standard e quindi per ottenete un test che confronti le ipotesi H0:p≤p0 e H1: p>p0 si deve rifiutare l’ipotesi nulla quando X − np0 ≥ zα np0 (1 − p0 ) 330 Verifica di ipotesi su una popolazione di Bernoulli 331 Verifica di ipotesi su una popolazione di Bernoulli In questo contesto è più frequente imbattersi in test a una coda, comunque quelli bilaterali non presentano difficoltà ulteriori. Proviamo a verificare H 0 : p = p0 contro H1: p ≠ p0 Se la variabile aleatoria X, che è binomiale con parametri n e p, viene osservata ed assume il valore x, sarà necessario rifiutare l’ipotesi nulla quando x cadrà molto lontano da quello che è il valore atteso quando p è uguale a p0. Più precisamente il test rifiuterà H0 quando Pp 0 ( X ≥ x ) ≤ α 2 oppure Pp 0 ( X ≤ x ) ≤ α 2 Il valore del p-dei-dati corrispondente è quindi p -dei-dati = 2 min{Pp 0 ( X ≥ x ), Pp 0 ( X ≤ x )} 332 Verifica di ipotesi su una popolazione di Bernoulli 333 Ipotesi sulla media di una distribuzione di Poisson Sia X una variabile aleatoria di Poisson con media λ e supponiamo di volere confrontare le ipotesi H 0 : λ = λ0 contro H1: λ ≠ λ0 Se x è il valore osservato per X, un test con livello di significatività α deve rifiutare l’ipotesi nulla se Pλ 0 ( X ≥ x ) ≤ α 2 o se Pλ 0 ( X ≤ x ) ≤ α 2 dove con Pλ0 intendiamo la probabilità calcolata assumendo che X abbia media λ0. Di conseguenza il p-dei-dati è dato da p -dei-dati = 2 min{Pλ 0 ( X ≤ x ), Pλ 0 ( X ≥ x )} N.B. Si tenga presente che una distribuzione di Poisson con media λ molto grande è approssimativamente normale con media e varianza entrambe pari a λ. 334 Ipotesi sulla media di una distribuzione di Poisson 335 Problemi 1. Una ditta fabbrica pneumatici asserendo che la loro durata media sia di 40200 km. In seguito all’estrazione casuale di un campione di 20 pneumatici si riscontra X͞ =40900 km e S=6000. Sottoporre a verifica, con un livello di significatività del 5%, l’ipotesi che la durata media dei pneumatici sia maggiore di 40200 km. Svolgimento H 0 :µ =40200 H1:µ >40200 X −µ T= ∼ tn−1 S/ n T = 0.521 tα ,n−1 = 1.729 essendo tα,n-1>T si accetta l’ipotesi H0. 336 Problemi 2. Una ditta fabbrica pneumatici asserendo che la loro durata media sia di 40200 km. In seguito all’estrazione casuale di un campione di 100 pneumatici si riscontra X͞ =40900 km e S=6500. Sottoporre a verifica, con un livello di significatività del 5%, l’ipotesi che la durata media dei pneumatici sia maggiore di 40200 km. Svolgimento H 0 :µ =40200 H1:µ >40200 X −µ T= ∼ tn−1 S/ n In virtù del teorema del limite centrale, data l’elevata numerosità del campione, T∼N(0,1). T = 1.076123 zα = 1.645 essendo zα>T si accetta l’ipotesi H0. 337 Problemi 3. In passato, la lunghezza media delle pannocchie di grano era uguale a 27cm con σ2=24. Si vuole sottoporre a test l’ipotesi che le pannocchie di un determinato anno abbiamo una lunghezza media diversa, sulla base di un campione di 20 elementi con α=0.04. 30, 29, 16, 19, 25, 23, 18, 17, 29, 30 29, 30, 23, 27, 22, 16, 28, 24, 26, 30 Svolgimento H 0 :µ =27 H1:µ ≠ 27 ∑ xi = 24.55 n X −µ Z= = −2.24 σ/ n zα /2 = ±2.05375 X= siccome -2.24<-2.05375 si rifiuta H0. 338 Problemi 4. Una società farmaceutica dichiara che dai test effettuati il 38% dei pazienti è intollerante ad un certo medicinale. Estratto un campione di 2500 pazienti con la stessa patologia, solo 900 sono risultati intolleranti. Si sottoponga a verifica l’ipotesi della società. Svolgimento H 0 :π =0.38 H1:π ≠ 0.38 900 p= = 0.36 2500 p −π Z= = −2.06 π (1 − π ) n Ponendo α=0.05 allora zα/2=±1.96. siccome -2.06<-1.96 si rifiuta H0. 339 Problemi 5. Una macchina produce sacchetti di patatine dal peso medio di 250g. In seguito ad un guasto elettrico si ritiene che il funzionamento della macchina sia stato alterato. Per verificare tale ipotesi vengono scelti a caso 7 sacchetti prodotti dopo il guasto e si misura il loro peso in grammi 220, 250, 210, 230, 240, 250, 210 Si può sostenere che il guasto abbia ridotto il peso medio? Svolgimento H 0 :µ =250 H1:µ < 250 Considerando α=0.05 allora tcrit=-1.943. X = 230, S = 16.04, n = 7 T= X −µ = −3.3 S/ n Essendo T<tcrit si rifiuta H0 e si conclude che il peso medio dei sacchetti è diminuito. 340