Intervalli di Confidenza
Sia X1,…Xn un campione di ampiezza n
estratto dalla popolazione X~(μ,σ2)
Per quanto accurato possa essere lo
stimatore T del parametro θ, la probabilità
che T assuma il valore T0= θ è quasi nulla.
P(T0= θ )=0
E’ preferibile individuare un intervallo di
valori all’interno del quale possa essere
compreso θ
Date due statistiche, T1,T2, con T1,<T2
Che variano al variare del campione.
L’intervallo T1 ≤θ ≤ T2 è chiamato intervallo di
confidenza ad un livello di probabilità 1-α
P(T1 ≤θ ≤ T2 )=1-α
ATTENZIONE
Una volta estratto il campione, non ha senso
parlare di probabilità perché i valori assunti
dalle statistiche T1eT2
t1et2 sono delle costanti e quindi la probabilità
che il parametro θ cada all’interno
dell’intervallo è 1 oppure 0.
Per la costruzione di un intervallo di
confidenza siamo interessati ad una
quantità che non dipenda dal parametro θ
(quantità pivot)
Intervalli di confidenza per la media di
una popolazione normale
σ2 nota
Sia X1,…Xn un campione di ampiezza n
estratto dalla popolazione X~(μ,σ2)
La quantità
X 
Z
N  0,1

A)
n

 

conf  X  z
   X  z
 1 

2
2
n
n

Un laboratorio analizza una certa quantità di
un prodotto farmaceutico per determinare
la concentrazione di principio attivo in
esso presente. Tali analisi non sono
perfettamente precise; se vengono
ripetute per altre quantità del medesimo
prodotto i risultati seguono una
distribuzione normale con media μ,
concentrazione del principio attivo del
prodotto incognita e deviazione standard
σ=0,19gr/l.
Il laboratorio analizza 4 quantità estratte dal
prodotto ottenedo i seguenti risultati
X=(2,066;2,187;1,893;2,009)gr/l
La casa farmaceutica è interessata a
conoscere un intervallo di confidenza al
90% del principio attivo del prodotto.
b) σ2 non nota
Molto spesso la quantità σ2 non è nota
Si utilizza la 2quantità
n
xi  x 

2
ˆ
S 
Stimatore corretto
n 1
i 1
Sia X1,…Xn un campione di ampiezza n
estratto dalla popolazione X~(μ,σ2) con σ2
incognito
X 
t

La v.c.
Si distribuisce come un t di
Sˆ
n
student con n-1 gradi di libertà

Sˆ
Sˆ 
conf  X  t ,n 1
   X  t ,n 1
  1 
2
2
n
n

Distribuzione t di student
Siano X1,…Xn n v.c. indipendenti con parametri μi e σ2i e
Zi=(Xi-μ)/ σi
n
la variabile casuale
Y  Z
i 1
2
i

2
Con n gradi di libertà.
Sia X~N(0,1) e Y~χ2 con n g.l. e se X e Y sono indipendenti,
La V.C
t
X
Y /n
student con n g.l.
si sidtribuisce come una t di
Una determinata società impiega i mulini per
frantumare minerali conteneti oro.
Prima di effettuare l’acquisto di un terreno
ricco di tale minerale, vengono prelevati
sedici campioni che presentano il seguente
contenuto del prezioso mierale
8,18; 8,72; 9,43; 10,00; 10,18;
10,80;10,94; 11,43; 11,52; 12,40; 12,78;
12,96; 13,73; 14,04; 15,53; 16,10
Si determini un intervallo di confidenza al
90% del contenuto medio di oro sotto
l’ipotesi di normalità.
Esercizio 1
Nell'ambito di un programma di monitoraggio
dell'inquinamento atmosferico in una grande città, è stata
rilevata la concentrazione di ossido di carbonio presente nell'aria in
25 punti della città.
In particolare, è risultato che la concentrazione media dell'inquinante è
pari a 12,5 mg/m3 mentre la deviazione standard (scostamento quadratico
medio corretto) è uguale a 3,5 mg/m3 . Supponendo che le osservazioni
siano indipendenti e che la variabile in esame sia normalmente distribuita,
determinare l'intervallo di confidenza al 95 % per il valore medio di
concentrazione dell'inquinante nell'aria.
Esercizio 2
Nel corso dell'anno 1999, in una stazione
meteorologica dell'Italia Settentrionale sono stati
registrati
1379 mm. di precipitazioni atmosferiche, con uno
scostamento quadratico medio (corretto)
giornaliero pari a 10 mm.
Supponendo che la quantità di precipitazione
atmosferica giornaliera sia normalmente distribuita,
determinare l'intervallo di confidenza al 90 % per il
livello medio di precipitazione giornaliero.
Intervalli di confidenza per la
differenza di due medie
 
2
1
2
2
non note, n,m piccoli
 X1  X 2   t / 2,nm2 Sˆc
1 1
1 1
  1  2   X1  X 2   t / 2,n m2 Sˆc

n m
n m
 X
n
Sˆc 
i 1
 X 1     X 2i  X 2 
2
1i
n
i 1
nm2
2
Esercizio 3
Un campione causale della marca A di lampadine ha media pari
a 4000 ore e scarto quadratico medio (corretto) pari a 200.
Un campione casuale di 8 lampadine della marca B ha media
4600 e scarto quadratico medio (corretto) 250. Si assume
che la durata delle lampadine delle due marche si
distribuisce normalmente con varianze uguali ma incognite.
Si calcoli l’intervallo di confidenza per la differenza della
media di A- media media ad un livello di errore pari al 10%.
Intervalli di confidenza per la
differenza di due medie
 ,
2
1
X
1
2
note, n ed m grandi
2
 X 2   z / 2
 12  22
 12  22

 1  2   X1  X 2   z / 2

n m
n m
Esercizio 4
Da un'indagine campionaria condotta sui laureati in Economia e Commercio presso un
certo ateneo durante un determinato anno accademico, è risultato che il voto medio di
laurea conseguito dai laureati di sesso femminile è stato uguale a 104,5 mentre il voto
medio conseguito dai laureati di sesso maschile è stato uguale a 101,9.
Sapendo che il campione dei laureati di sesso maschile e quello dei laureati di sesso
femminile hanno entrambi numerosità n = 120 e che i due campioni provengono da
popolazioni aventi varianza rispettivamente uguale a s2
F = 8,41 e a M = 5,61,
determinare gli intervalli di confidenza al 90 % per i seguenti parametri:
mF - mM ;
in cui mF e mM indicano il voto atteso per i laureati di sesso femminile e rispettivamente
per i laureati di sesso maschile.
Intervalli di Confidenza per la
proporzione π utilizzando la
distribuzione normale
f= stimatore di π
n sufficientemente grande
f  z / 2
f 1  f 
n
   f  z / 2
f 1  f 
n
Esercizio 1
Un’organizzazione di ricerche di mercato contatta un
campione casuale di 100 uomini appartenenti ad una
grande comunità e trova che la proporzione dello 0,4
del campione, preferisce le lamette dell’impresa
committente della ricerca. Si calcoli l’intervallo di
confidenza al 95% della proporzione di tutti gli
uomini della comunità che preferiscono le lamette
dell’impresa committente.
0,30    0,50
Intervalli di Confidenza per la di fferenza
di due proporzioni π1- π2 utilizzando la
distribuzione normale
f1= stimatore di π1
f2= stimatore di π2
n,m sufficientemente
grandi
 f1  f2   z / 2
f1 1  f1  f 2 1  f 2 
f1 1  f1  f 2 1  f 2 

 1   2   f1  f 2   z / 2

n
m
n
m
Esercizio 2
Si considerino i dati dell’esempio 1.
La società di ricerche di mercato, esegue la stessa indagine in
un’altra comunità, verificando che 60 uomini su 200
preferiscono le lamette dell’impresa committente.
Si calcoli l’intervallo di confidenza al 90% della differenza delle
proporzioni degli utilizzatori delle lamette dell’impresa
committente delle due comunità.
0,003  1   2  0,197
Intervalli di confidenze per la
varianza σ2
S2=stimatore di σ2
Popolazione normale, media non nota
2
ˆ
 n  1 S
y / 2,n 1
 
2
2
ˆ
 n  1 S
y1 / 2,n 1
Esercizio 3
Il responsabile acquisti di un certo supermercato,
analizza il contenuto di 12 scatole di fagioli di una
certa azienda produttrice. Le 12 scatole riportano i
seguenti pesi:
[15,7;15,8;15,8;15,9;15;9;16;16;16;16,1; 16,1; 16,1;16,2]
Si stimi al 90% l’intervallo di confidenza per la
varianza del peso delle scatole di fagioli prodotte da
quella determinata azienda.
[0,0125≤σ2≤0,0539]
Intervalli di confidenze per il
rapporto di due varianze, σ12 e σ22
S12=stimatore di σ12
S22=stimatore di σ22
2
2
2
ˆ
ˆ
S1
 1 S1
F


F
1


/
2,
n

1,
m

1
2
2
2  / 2, n 1, m 1
ˆ
ˆ
 2 S2
S2
F1 / 2,n 1,m1 
1
F / 2,m1,n 1
Esercizio 4
N° 6,21 D’Ambra (con opportune modifiche)
60
48
45
54
48
44
55
56
42
62
58
46
62
47
52


12
0,322  2  5, 25
1


Scarica

Intervalli di Confidenza