VERIFICA DELLE IPOTESI
• Introduzione
• Livelli di significatività
• Verifica di ipotesi sulla media di una
popolazione normale
• Verifica di ipotesi sulla varianza di una
popolazione normale
• Verifica di ipotesi su una popolazione di
Bernoulli
• Ipotesi sulla media di una distribuzione di
Poisson
290
Introduzione
Come in precedenza, supponiamo di disporre di un campione aleatorio
proveniente da una distribuzione che ci è nota tranne che per uno o più parametri
incogniti.
La nuova chiave di lettura non prevede più di stimare direttamente questi
parametri, ma piuttosto di usare il campione raccolto per verificare qualche ipotesi
che li coinvolga.
Una ipotesi statistica è normalmente un’affermazione su uno o più parametri della
distribuzione di popolazione.
Si parla di ipotesi perché a priori non sappiamo se sia vera o meno: il problema
primario è quello di sviluppare una procedura per determinare se i valori di un
campione aleatorio e l’ipotesi fatta siano compatibili oppure no. Se è compatibile
diremo che l’ipotesi è accettata, altrimenti è rifiutata.
Si noti che quando accettiamo un’ipotesi non stiamo affermando che sia
necessariamente vera, ma solo che i dati raccolti sono accettabilmente in accordo
con essa.
291
Livelli di significatività
Consideriamo una popolazione avente distribuzione Fθ che dipende da un
parametro incognito θ e supponiamo di volere verificare una qualche ipotesi su θ,
che chiameremo ipotesi nulla, e denoteremo con H0.
Se Fθ è ad esempio una distribuzione normale con media θ e varianza 1, due
possibili ipotesi nulle su θ sono:
1.H0: θ=1
2.H0: θ≤1
La prima di queste ipotesi afferma che la popolazione ha distribuzione N(1,1),
mentre la seconda sostiene che essa è normale con varianza 1 e media non
superiore a 1.
Si noti che l’ipotesi nulla 1, quando è vera, caratterizza completamente la
distribuzione della popolazione, mentre questo non è vero per l’ipotesi 2.
Nel primo caso si parla di ipotesi semplice, mentre nel secondo di ipotesi composta.
292
Livelli di significatività
Supponiamo di disporre di un campione aleatorio X1,..,Xn proveniente da questa
popolazione e di volerlo usare per eseguire un test di una certa ipotesi nulla H0.
Siccome dobbiamo decidere se accettare o meno H0 basandoci esclusivamente
sugli n valori dei dati, il test sarà definito da una regione C nello spazio a n
dimensioni, con l’intesa che se il vettore (X1,..,Xn) cade all’interno di C l’ipotesi
viene rifiutata, mentre viene accettata in caso contrario.
Una regione C con queste caratteristiche viene detta regione critica del test.
293
Livelli di significatività
Schematizzando quanto detto, il test statistico determinato dalla regione critica C
è quello che
accetta H 0 se ( X1, X 2 ,..., X n ) ∉ C
e
rifiuta H 0 se ( X1, X 2 ,..., X n ) ∈ C
In qualunque test per verificare una ipotesi nulla, il risultato può essere sbagliato in
due modi differenti.
Si ha infatti:
• un errore di prima specie quando i dati ci portano a rifiutare una ipotesi H0 che
in realtà è corretta,
• un errore di seconda specie quando finiamo con l’accettare H0 ed essa è falsa.
Non vi è simmetria tra i due tipi di errori.
Ricordiamo infatti che l’obiettivo di una verifica di H0 non è quella di dire se questa
ipotesi sia vera o falsa, ma piuttosto di dire se l’ipotesi fatta sia anche solo
compatibile con i dati raccolti. In effetti vi è un ampio livello di tolleranza
nell’accettare H0, mentre per rifiutarla occorre che i dati campionari siano molto
improbabili quando H0 è soddisfatta.
294
Livelli di significatività
Questo bilanciamento si ottiene specificando un valore α, detto livello di
significatività, e imponendo che il test abbia la proprietà che quando l’ipotesi H0 è
vera, la probabilità che venga rifiutata non possa superare α.
Il livello di significatività del test viene normalmente fissato in anticipo, con valori
tipici dell’ordine di 0.1, 0.05 o 0.005.
Detto in altri termini, un test con livello di significatività α deve avere una probabilità
di errore di prima specie minore o uguale ad α.
295
Livelli di significatività
Per chiarire come viene costruita la regione critica, immaginiamo di volere
verificare l’ipotesi nulla
H 0: θ ∈ w
dove con w stiamo indicando un insieme di valori possibili per il parametro.
Un approccio naturale per formulare una verifica di H0 ad un livello di significatività
α prescritto consiste nell’individuare uno stimatore puntuale di θ, che denotiamo
con d(X), e quindi rifiutare l’ipotesi quando d(X) è lontano dalla regione w. Per
capire quanto lontano deve essere per giustificare un rifiuto di H0 ad un livello di
significatività pari a α occorre conoscere la distribuzione dello stimatore d(X) nel
caso in cui H0 sia vera.
Ad esempio la verifica dell’ipotesi che la media di una popolazione N(θ,1) sia pari
a 1, impone di rifiutare l’ipotesi quando lo stimatore puntuale di θ (ovvero la media
campionaria) dista da 1 più di 1.96/√n. Come vedremo quest’ultimo valore è stato
scelto in modo da dare ai test un livello di significatività del 5%.

1 n
1.96 
C = ( X1, X 2 ,..., X n ) : 1 − ∑ X i >

n
n
i =1


296
Verifica di ipotesi sulla media di una popolazione normale
Varianza nota
Supponiamo che X1,..,Xn sia un campione aleatorio proveniente da una
popolazione normale di parametri µ e σ2, con la varianza nota e media incognita.
Fissata una costante µ0, vogliamo verificare l’ipotesi nulla
H 0 : µ = µ0
contro l’ipotesi alternativa
H1: µ ≠ µ0
Siccome ̅X =Σi Xi/n è lo stimatore puntuale per µ, sembra ragionevole accettare
H0 quando ̅X non è troppo lontano da µ0. Perciò la regione critica del test sarà
del tipo
C = ( X1, X 2 ,..., X n ) : X − µ0 > c
{
}
per una scelta opportuna della costante c.
Se vogliamo che il test abbia livello di significatività α, dobbiamo individuare quel
valore di c nell’equazione precedente che rende pari ad α la probabilità di errore
di prima specie. Ciò significa che c deve soddisfare la relazione seguente
α = P (errore di I specie) = Pµ 0 (| X − µ0 |> c)
(*)
dove scriviamo con Pµ0 per intendere che la probabilità precedente viene
297
calcolata con l’assunzione che µ=µ0.
Verifica di ipotesi sulla media di una popolazione normale
Varianza nota
Quando però µ=µ0 sappiamo che ̅X ha distribuzione normale con media µ0 e
varianza σ2/n e quindi se Z denota una variabile aleatoria N(0,1) allora
X − µ0 µ
∼ Z
σ/ n
0
dove la relazione ~ è condizionata all’ipotesi H0: µ=µ0. Possiamo allora riscrivere
(*) nella forma
 X − µ0 c n 
c n
c n
>
) = 2 P( Z >
)
α = Pµ 0 
 = P (| Z |>
σ 
σ
σ
 σ/ n
e quindi P(Z>c√n/σ)=α/2.
Siccome però per definizione di zα/2 vale
P ( Z > zα /2 ) = α / 2
si deduce che
c n
σ
= zα /2 ⇒ c = zα /2
σ
n
298
Verifica di ipotesi sulla media di una popolazione normale
Varianza nota
Il test con livello di significatività α dovrà allora rifiutare H0 se | ̅X -µ0|> zα/2σ/√n,
cioè
X − µ0
si rifiuta H 0 se
> zα /2
σ/ n
(**)
si accetta H 0 se
X − µ0
≤ zα /2
σ/ n
La regione di accettazione per la statistica del test è un intervallo simmetrico
rispetto allo zero, come è illustrato in figura, dove si è riportata in sovrapposizione
la densità della distribuzione normale standard.
299
Verifica di ipotesi sulla media di una popolazione normale
Varianza nota
300
Verifica di ipotesi sulla media di una popolazione normale
Varianza nota
301
Verifica di ipotesi sulla media di una popolazione normale
Varianza nota
La regola fornita dall’equazione (**) può essere riformulata come segue.
Dopo aver calcolato il valore assunto dalla statistica del test, √n| ̅X -µ0|/σ (che
denotiamo con v), valutiamo la probabilità (condizionata alla validità di H0) che la
statistica stessa assumesse un valore come v o più estremo ancora. Se tale
probabilità è minore del livello di α, rifiutiamo l’ipotesi H0, altrimenti l’accettiamo.
In altri termini dobbiamo calcolare prima il valore della statistica del test, poi la
probabilità che una normale standard, in valore assoluto, superi tale quantità.
Questa probabilità, detta il p-dei-dati del test, fornisce il livello di significatività
critico, scendendo al di sotto del quale la decisione cambia da rifiuto ad
accettazione.
In pratica spesso non si fissa in anticipo il livello di significatività, ma si osservano
i dati e si ricava il p-dei-dati corrispondente. Se esso risulta molto maggiore di
quanto siamo disposti ad accettare come probabilità di un errore di prima specie,
conviene accettare l’ipotesi nulla; se invece esso è molto piccolo, possiamo
rifiutarla.
302
Verifica di ipotesi sulla media di una popolazione normale
Varianza nota
303
Verifica di ipotesi sulla media di una popolazione normale
Varianza nota
Non abbiamo ancora discusso la probabilità degli errori di seconda specie, cioè la
probabilità di accettare H0 quando in realtà essa non è valida. Tale probabilità
dipende da µ e in particolare vale
 X − µ0



X − µ0
≤ zα /2  = Pµ  − zα /2 ≤
≤ zα /2 
β ( µ ) = Pµ (accettare H 0 ) = Pµ 
σ/ n


 σ/ n

La funzione β(µ) è detta curva OC (curva operativa caratteristica) e rappresenta la
probabilità di accettare H0 quando la media reale è µ.
Per calcolare questa probabilità usiamo il fatto che ̅X ~N(µ,σ2/n) e quindi
Z=
da cui

β ( µ ) = Pµ  − zα /2 ≤
X −µ
∼ N (0,1)
σ/ n

µ −µ

X − µ0
µ − µ X − µ0 µ0 − µ
≤ zα /2  = Pµ  0
− zα /2 ≤ 0
+
≤
+ zα /2  =
σ/ n
σ/ n σ/ n σ/ n

σ / n


µ −µ
µ −µ

µ −µ

µ −µ

= Pµ  0
− zα /2 ≤ Z ≤ 0
+ zα /2  = Φ  0
+ zα /2  − Φ  0
− zα /2 
σ/ n
σ / n

σ / n

σ / n

304
Verifica di ipotesi sulla media di una popolazione normale
Varianza nota
Per un livello di significatività α fissato, la curva OC è simmetrica rispetto a µ0 e
dipende da µ solo tramite √n|µ-µ0|/σ.
In figura è rappresentata la curva OC per α=0.05, con l’ascissa trasformata da µ a
d=√n|µ-µ0|/σ.
N.B. La funzione 1-β(µ) è detta funzione di potenza del test. Per un valore di µ
fissato, la potenza del test è la probabilità di rifiutare (correttamente) H0 quando µ
è il valore vero.
305
Verifica di ipotesi sulla media di una popolazione normale
Varianza nota
306
Verifica di ipotesi sulla media di una popolazione normale
Test unilaterali
Nel verificare l’ipotesi nulla µ=µ0 abbiamo costruito un test che porta ad un rifiuto
quando ̅X è lontano da µ0, ovvero valori di ̅X troppo bassi o troppo alti rispetto a
µ0 sembrano smentire che µ sia proprio uguale a µ0.
Cosa accade se l’ipotesi alternativa a H0: µ=µ0 è H1: µ>µ0? Nel verificare l’ipotesi
H 0 : µ = µ0
contro
H1: µ > µ0
Dovremmo rifiutare l’ipotesi nulla quando ̅X, lo stimatore di µ, è molto più grande
di µ0 e quindi la regione critica dovrebbe essere
C = {( X 1, X 2 ,..., X n ) : X − µ0 > c}
per una scelta opportuna della costante c. Siccome la probabilità di rifiuto
dovrebbe essere α quando H0 è vera occorre che c soddisfi la relazione
Pµ 0 ( X − µ0 > c ) = α
Poiché stiamo supponendo che µ=µ0, ̅X ha media µ0 e quindi la statistica Z ha
distribuzione normale standard
Z=
X − µ0
∼ N (0,1)
σ/ n
307
Verifica di ipotesi sulla media di una popolazione normale
Test unilaterali
Perciò la precedente è equivalente a

c n
P Z >
 =α
σ 

che si risolve in funzione di c ricordando che P(Z>zα) =α ottenendo quindi
c = zα /2
σ
n
Il test con livello di significatività α dovrà allora rifiutare H0 se ̅X- µ0>zασ/√n, cioè
X − µ0
si rifiuta H 0 se
> zα
σ/ n
X − µ0
si accetta H 0 se
≤ zα
σ/ n
(***)
Quella trovata è detta regione critica unilaterale, o a una coda (a differenza delle
regioni critiche trovate in precedenza che erano bilaterali o a due code).
Anche il problema di verificare le ipotesi alternative
H 0 : µ = µ0
si dice problema di test unilaterale.
contro
H1: µ > µ0
308
Verifica di ipotesi sulla media di una popolazione normale
Test unilaterali
Per ottenere il p-dei-dati di questo tipo di test si calcola innanzitutto il valore della
statistica del test
X − µ0
σ/ n
in funzione dei dati raccolti; il p-dei-dati è quindi uguale alla probabilità che una
normale standard superi questo valore.
309
Verifica di ipotesi sulla media di una popolazione normale
Test unilaterali
310
Verifica di ipotesi sulla media di una popolazione normale
Test unilaterali
La curva OC del test unilaterale (***) si può ricavare come segue.
Visto che per i=1,..,n si ha che Xi~N(µ,σ2/n) e quindi che ̅X~N(µ,σ2/n) se poniamo
Z=√n(̅X-µ)/σ, questa statistica è normale standard per cui
 X −µ

µ0 − µ
σ 

β ( µ ) = Pµ (accettare H 0 ) = Pµ  X ≤ µ0 + zα
≤
+ zα  =
 = Pµ 
n

σ / n σ / n

µ −µ


µ −µ

= Pµ  Z ≤ 0
+ zα  = Φ  0
+ zα 
σ/ n


σ / n

Siccome Φ, in quanto funzione di ripartizione, è crescente è chiaro che β(µ) è una
funzione decrescente.
Questo risultato appare incoraggiante, visto che è ragionevole che, al crescere di
µ, sia sempre meno facile concludere che µ<µ0.
Si noti anche che, siccome Φ(zα)=1-α, si ha che
β ( µ0 ) = 1 − α
311
Verifica di ipotesi sulla media di una popolazione normale
Test unilaterali
La regola fornita dalla (***) vale anche per verificare, ad un livello di significatività
α, l’ipotesi unilaterale
H 0 : µ ≤ µ0
contro
H1: µ > µ0
Per accertarsi che il livello di significatività sia rimasto α, dobbiamo dimostrare che
la probabilità di un errore di prima specie non superi mai questo valore.
Al variare di µ, la probabilità di rifiuto è data da 1-β(µ). Siccome si commette un
errore di prima specie se H0 è vera e i dati ci impongono di rifiutarla, dobbiamo
verificare che, per ogni µ compatibile con H0, quindi per ogni µ≤µ0,
1 − β ( µ ) ≤ α per ogni µ ≤ µ0 ⇒ β ( µ ) ≥ 1 − α per ogni µ ≤ µ0
N.B. E’ anche possibile verificare, ad un livello di significatività α, l’ipotesi H0: µ=µ0
contro l’ipotesi alternativa H1:µ<µ0 decidendo che
X − µ0
si rifiuta H 0 se
< − zα
σ/ n
X − µ0
si accetta H 0 se
≥ − zα
σ/ n
312
Verifica di ipotesi sulla media di una popolazione normale
Test unilaterali
313
Verifica di ipotesi sulla media di una popolazione normale
Test unilaterali
314
Verifica di ipotesi sulla media di una popolazione normale
Test unilaterali
315
Verifica di ipotesi sulla media di una popolazione normale
Varianza non nota: test t
Comunemente né la media né la varianza di una popolazione sono note.
Supponiamo di essere in tale situazione e consideriamo di nuovo come si possa
verificare l’ipotesi nulla che µ sia uguale ad un valore assegnato µ0, contro l’ipotesi
alternativa che µ≠µ0.
H 0 : µ = µ0
contro
H1: µ ≠ µ0
Come in precedenza, sembra ragionevole rifiutare l’ipotesi nulla quando ̅X cade
lontano da µ0: tuttavia la distanza a cui deve essere da µ0 per giustificare questo
rifiuto dipende dalla deviazione standard che in quella sede era nota, ma qui non è
conosciuta.
Possiamo allora pensare di sostituirla con il suo stimatore, la deviazione standard
campionaria S
1 n
2
S=
∑ (Xi − X )
n − 1 i =1
rifiutando l’ipotesi nulla quando
X − µ0
S/ n
è troppo grande.
316
Verifica di ipotesi sulla media di una popolazione normale
Varianza non nota: test t
Quanto grande è «troppo grande»?
Sappiamo che la variabile aleatoria
X −µ
∼ tn −1
S/ n
ha distribuzione t. Se si denota con T la statistica di questo test, cioè
X − µ0
T=
S/ n
allora quando H0 è vera, visto che µ=µ0, T ha distribuzione t con n-1 gradi di
libertà.
Imponiamo ora che la probabilità di errore di prima specie sia α, ovvero passando
agli eventi complementari, che sia 1-α la probabilità di accettare l’ipotesi nulla
quando µ=µ0:


X − µ0
Pµ 0  −c ≤
≤ c  =1−α
S/ n


Per ricavare c, si noti che, siccome la densità della distribuzione t è simmetrica
rispetto allo zero,
α = 1 − P (−c < T < c) = P (T ≤ −c) + P (T ≥ c) = 2 P (T ≥ c)
317
Verifica di ipotesi sulla media di una popolazione normale
Varianza non nota: test t
Per cui P(T>c)=α/2 e quindi deve valere c=tα/2,n-1 per definizione di tα,k.
Concludendo diamo la regola per usare il test:
X − µ0
si rifiuta H 0 se
> tα /2,n −1
S/ n
si accetta H 0 se
X − µ0
≤ tα /2,n −1
S/ n
Il test descritto è detto test t bilaterale ed è illustrato in figura.
Se si denota con t il valore assunto da T, la statistica del test, calcolata in
funzione dei dati del campione, il valore del p-dei-dati corrispondente è la
probabilità che |T| superi |t|, quando H0 è vera. Si tratta quindi della probabilità
che una t di Student con n-1 gradi di libertà abbia valore assoluto maggiore di |t|.
Come nei casi precedenti, si deve rifiutare l’ipotesi nulla a tutti i livelli318di
significatività maggiori del p-dei-dati, mentre la si accetta a tutti i livelli inferiori.
Verifica di ipotesi sulla media di una popolazione normale
Varianza non nota: test t
319
Verifica di ipotesi sulla media di una popolazione normale
Varianza non nota: test t
320
Verifica di ipotesi sulla media di una popolazione normale
Varianza non nota: test t
Si può costruire un test t a una coda per verificare l’ipotesi
H 0 : µ = µ0 (o H 0 : µ ≤ µ0 )
contro
ad un livello di significatività α decidendo che
X − µ0
si rifiuta H 0 se
H1: µ > µ0
> tα ,n −1
S/ n
X − µ0
si accetta H 0 se
≤ tα ,n −1
S/ n
Se il valore di √n (̅X-µ)/S realizzato dai dati è v, allora il p-dei-dati corrispondente
è la probabilità che una t di Student con n-1 gradi di libertà sia maggiore o uguale
a v.
Analogamente la verifica ad un livello α dell’ipotesi
H 0 : µ = µ0 (o H 0 : µ ≥ µ0 )
si ottiene decidendo che
contro
X − µ0
< −tα ,n −1
S/ n
X − µ0
si accetta H 0 se
≥ −tα ,n −1
S/ n
H1: µ < µ0
si rifiuta H 0 se
321
Verifica di ipotesi sulla media di una popolazione normale
Varianza non nota: test t
322
Verifica di ipotesi sulla media di una popolazione normale
Varianza non nota: test t
323
Verifica di ipotesi sulla varianza di una popolazione normale
Sia X1,..,Xn un campione proveniente da una popolazione normale con media
incognita µ e varianza incognita σ2 e supponiamo di volere verificare l’ipotesi nulla
H 0 : σ 2 =σ 02
contro
H1: σ 2 ≠ σ 02
per un valore di σ02 fissato.
Per ottenere un test ricordiamo che (n-1)S2/σ2 ha distribuzione chi-quadro con n-1
gradi di libertà così quando H0 è vera
S2
S2
σ0
σ0
2
2
(
n
−
1)
∼
χ
⇒
P
(
χ
n −1
H 0 1−α /2,n −1 ≤
2
2
(
n
−
1)
≤
χ
α /2,n −1 ) = 1 − α
2
Perciò la regola da adattare è la seguente
si accetta H 0 se χ12−α /2,n −1 ≤
S2
2
(
n
−
1)
≤
χ
α /2,n −1
2
σ0
si rifiuta H 0 negli altri casi
324
Verifica di ipotesi sulla varianza di una popolazione normale
Il test precedente può anche essere implementato come segue:
• si osservano i dati;
• si calcola il valore c assunto dalla statistica del test, ovvero (n-1)S2/σ02;
• si determina poi la probabilità che una chi-quadro con n-1 gradi di libertà sia
(1) più piccola di c,
(2) più grande di c.
L’ipotesi nulla viene rifiutata se una di queste due probabilità è inferiore ad α/2.
Altrimenti detto, il p-dei-dati è
p -dei-dati = 2 min{P ( χ n2−1 ≤ c ),1 − P ( χ n2−1 ≤ c )}
Il p-dei-dati per un test a una coda si trova analogamente.
325
Verifica di ipotesi sulla varianza di una popolazione normale
326
Verifica di ipotesi su una popolazione di Bernoulli
Una ipotesi di lavoro che spesso viene assunta è che ogni oggetto prodotto sia
difettoso in maniera indipendente da tutti gli altri con probabilità p. In questo modo
il numero di difetti in un campione di n pezzi ha distribuzione binomiale di
parametri (n,p).
Consideriamo allora la verifica dell’ipotesi
H 0 : p ≤ p0
H1: p > p0
contro
dove p0 è un valore assegnato.
Se denotiamo con X il numero di pezzi difettosi in un campione di n, dobbiamo
certamente rifiutare H0 quando X è troppo grande. Per calcolare poi quanto
grande deve essere per giustificare un rifiuto dell’ipotesi nulla ad un livello di
significatività pari ad α, notiamo che
n i
P ( X ≥ k ) = ∑ P ( X = i ) = ∑   p (1 − p ) n −i
i =k
i=k  i 
n
n
E’ intuitivo che P(X≥k) è una funzione crescente di p; infatti la probabilità che un
campione contenga k o più pezzi difettosi cresce con p. Usando questo fatto,
quando H0 è vera, quindi p≤p0
n n
PH 0 ( X ≥ k ) ≤ ∑   p0i (1 − p0 ) n −i
327
i
i =k  
Verifica di ipotesi su una popolazione di Bernoulli
Per verificare le ipotesi suddette ad un livello di significatività α, si deve rifiutare
H0 quando X≥k* dove con k* si è denotato il più piccolo numero intero k tale che
 n n i

n −i
k * = min  k : ∑   p0 (1 − p0 ) ≤ α 
 i =k  i 

Un modo migliore per implementare il test consiste nel determinare prima il valore
x della statistica del test, X, e poi calcolare il p-dei-dati come segue
n i
p -dei-dati = ∑   p0 (1 − p0 ) n −i
i= x  i 
n
328
Verifica di ipotesi su una popolazione di Bernoulli
329
Verifica di ipotesi su una popolazione di Bernoulli
Quando la numerosità del campione è elevata, possiamo ottenere un test
approssimativo con significatività α, usando la distribuzione normale.
Poiché infatti quando n è molto grande X è approssimativamente normale, con
media e varianza
E[ X ] = np
Var ( X ) = np (1 − p )
ne segue che
X − np
∼ N (0,1)
np (1 − p )
sarà approssimativamente normale standard e quindi per ottenete un test che
confronti le ipotesi H0:p≤p0 e H1: p>p0 si deve rifiutare l’ipotesi nulla quando
X − np0
≥ zα
np0 (1 − p0 )
330
Verifica di ipotesi su una popolazione di Bernoulli
331
Verifica di ipotesi su una popolazione di Bernoulli
In questo contesto è più frequente imbattersi in test a una coda, comunque
quelli bilaterali non presentano difficoltà ulteriori.
Proviamo a verificare
H 0 : p = p0
contro
H1: p ≠ p0
Se la variabile aleatoria X, che è binomiale con parametri n e p, viene osservata
ed assume il valore x, sarà necessario rifiutare l’ipotesi nulla quando x cadrà
molto lontano da quello che è il valore atteso quando p è uguale a p0. Più
precisamente il test rifiuterà H0 quando
Pp 0 ( X ≥ x ) ≤
α
2
oppure Pp 0 ( X ≤ x ) ≤
α
2
Il valore del p-dei-dati corrispondente è quindi
p -dei-dati = 2 min{Pp 0 ( X ≥ x ), Pp 0 ( X ≤ x )}
332
Verifica di ipotesi su una popolazione di Bernoulli
333
Ipotesi sulla media di una distribuzione di Poisson
Sia X una variabile aleatoria di Poisson con media λ e supponiamo di volere
confrontare le ipotesi
H 0 : λ = λ0
contro
H1: λ ≠ λ0
Se x è il valore osservato per X, un test con livello di significatività α deve rifiutare
l’ipotesi nulla se
Pλ 0 ( X ≥ x ) ≤
α
2
o se
Pλ 0 ( X ≤ x ) ≤
α
2
dove con Pλ0 intendiamo la probabilità calcolata assumendo che X abbia media
λ0.
Di conseguenza il p-dei-dati è dato da
p -dei-dati = 2 min{Pλ 0 ( X ≤ x ), Pλ 0 ( X ≥ x )}
N.B. Si tenga presente che una distribuzione di Poisson con media λ molto
grande è approssimativamente normale con media e varianza entrambe pari a λ.
334
Ipotesi sulla media di una distribuzione di Poisson
335
Problemi
1. Una ditta fabbrica pneumatici asserendo che la loro durata media sia di 40200
km. In seguito all’estrazione casuale di un campione di 20 pneumatici si riscontra
X͞ =40900 km e S=6000. Sottoporre a verifica, con un livello di significatività del
5%, l’ipotesi che la durata media dei pneumatici sia maggiore di 40200 km.
Svolgimento
H 0 :µ =40200
H1:µ >40200
X −µ
T=
∼ tn−1
S/ n
T = 0.521
tα ,n−1 = 1.729
essendo tα,n-1>T si accetta l’ipotesi H0.
336
Problemi
2. Una ditta fabbrica pneumatici asserendo che la loro durata media sia di 40200
km. In seguito all’estrazione casuale di un campione di 100 pneumatici si riscontra
X͞ =40900 km e S=6500. Sottoporre a verifica, con un livello di significatività del
5%, l’ipotesi che la durata media dei pneumatici sia maggiore di 40200 km.
Svolgimento
H 0 :µ =40200
H1:µ >40200
X −µ
T=
∼ tn−1
S/ n
In virtù del teorema del limite centrale, data l’elevata numerosità del campione,
T∼N(0,1).
T = 1.076123
zα = 1.645
essendo zα>T si accetta l’ipotesi H0.
337
Problemi
3. In passato, la lunghezza media delle pannocchie di grano era uguale a 27cm con
σ2=24. Si vuole sottoporre a test l’ipotesi che le pannocchie di un determinato
anno abbiamo una lunghezza media diversa, sulla base di un campione di 20
elementi con α=0.04.
30, 29, 16, 19, 25, 23, 18, 17, 29, 30
29, 30, 23, 27, 22, 16, 28, 24, 26, 30
Svolgimento
H 0 :µ =27
H1:µ ≠ 27
∑ xi
= 24.55
n
X −µ
Z=
= −2.24
σ/ n
zα /2 = ±2.05375
X=
siccome -2.24<-2.05375 si rifiuta H0.
338
Problemi
4. Una società farmaceutica dichiara che dai test effettuati il 38% dei pazienti è
intollerante ad un certo medicinale. Estratto un campione di 2500 pazienti con la
stessa patologia, solo 900 sono risultati intolleranti. Si sottoponga a verifica
l’ipotesi della società.
Svolgimento
H 0 :π =0.38
H1:π ≠ 0.38
900
p=
= 0.36
2500
p −π
Z=
= −2.06
π (1 − π )
n
Ponendo α=0.05 allora zα/2=±1.96.
siccome -2.06<-1.96 si rifiuta H0.
339
Problemi
5. Una macchina produce sacchetti di patatine dal peso medio di 250g. In seguito ad
un guasto elettrico si ritiene che il funzionamento della macchina sia stato
alterato. Per verificare tale ipotesi vengono scelti a caso 7 sacchetti prodotti dopo
il guasto e si misura il loro peso in grammi
220, 250, 210, 230, 240, 250, 210
Si può sostenere che il guasto abbia ridotto il peso medio?
Svolgimento
H 0 :µ =250
H1:µ < 250
Considerando α=0.05 allora tcrit=-1.943.
X = 230, S = 16.04, n = 7
T=
X −µ
= −3.3
S/ n
Essendo T<tcrit si rifiuta H0 e si conclude che il peso medio dei sacchetti è diminuito.
340
Scarica

40200 sacchetto