Intervalli di Confidenza Sia X1,…Xn un campione di ampiezza n estratto dalla popolazione X~(μ,σ2) Per quanto accurato possa essere lo stimatore T del parametro θ, la probabilità che T assuma il valore T0= θ è quasi nulla. P(T0= θ )=0 E’ preferibile individuare un intervallo di valori all’interno del quale possa essere compreso θ Date due statistiche, T1,T2, con T1,<T2 Che variano al variare del campione. L’intervallo T1 ≤θ ≤ T2 è chiamato intervallo di confidenza ad un livello di probabilità 1-α P(T1 ≤θ ≤ T2 )=1-α ATTENZIONE Una volta estratto il campione, non ha senso parlare di probabilità perché i valori assunti dalle statistiche T1eT2 t1et2 sono delle costanti e quindi la probabilità che il parametro θ cada all’interno dell’intervallo è 1 oppure 0. Per la costruzione di un intervallo di confidenza siamo interessati ad una quantità che non dipenda dal parametro θ (quantità pivot) Intervalli di confidenza per la media di una popolazione normale σ2 nota Sia X1,…Xn un campione di ampiezza n estratto dalla popolazione X~(μ,σ2) La quantità X Z N 0,1 A) n conf X z X z 1 2 2 n n Un laboratorio analizza una certa quantità di un prodotto farmaceutico per determinare la concentrazione di principio attivo in esso presente. Tali analisi non sono perfettamente precise; se vengono ripetute per altre quantità del medesimo prodotto i risultati seguono una distribuzione normale con media μ, concentrazione del principio attivo del prodotto incognita e deviazione standard σ=0,19gr/l. Il laboratorio analizza 4 quantità estratte dal prodotto ottenedo i seguenti risultati X=(2,066;2,187;1,893;2,009)gr/l La casa farmaceutica è interessata a conoscere un intervallo di confidenza al 90% del principio attivo del prodotto. b) σ2 non nota Molto spesso la quantità σ2 non è nota Si utilizza la 2quantità n xi x 2 ˆ S Stimatore corretto n 1 i 1 Sia X1,…Xn un campione di ampiezza n estratto dalla popolazione X~(μ,σ2) con σ2 incognito X t La v.c. Si distribuisce come un t di Sˆ n student con n-1 gradi di libertà Sˆ Sˆ conf X t ,n 1 X t ,n 1 1 2 2 n n Distribuzione t di student Siano X1,…Xn n v.c. indipendenti con parametri μi e σ2i e Zi=(Xi-μ)/ σi n la variabile casuale Y Z i 1 2 i 2 Con n gradi di libertà. Sia X~N(0,1) e Y~χ2 con n g.l. e se X e Y sono indipendenti, La V.C t X Y /n student con n g.l. si sidtribuisce come una t di Una determinata società impiega i mulini per frantumare minerali conteneti oro. Prima di effettuare l’acquisto di un terreno ricco di tale minerale, vengono prelevati sedici campioni che presentano il seguente contenuto del prezioso mierale 8,18; 8,72; 9,43; 10,00; 10,18; 10,80;10,94; 11,43; 11,52; 12,40; 12,78; 12,96; 13,73; 14,04; 15,53; 16,10 Si determini un intervallo di confidenza al 90% del contenuto medio di oro sotto l’ipotesi di normalità. Esercizio 1 Nell'ambito di un programma di monitoraggio dell'inquinamento atmosferico in una grande città, è stata rilevata la concentrazione di ossido di carbonio presente nell'aria in 25 punti della città. In particolare, è risultato che la concentrazione media dell'inquinante è pari a 12,5 mg/m3 mentre la deviazione standard (scostamento quadratico medio corretto) è uguale a 3,5 mg/m3 . Supponendo che le osservazioni siano indipendenti e che la variabile in esame sia normalmente distribuita, determinare l'intervallo di confidenza al 95 % per il valore medio di concentrazione dell'inquinante nell'aria. Esercizio 2 Nel corso dell'anno 1999, in una stazione meteorologica dell'Italia Settentrionale sono stati registrati 1379 mm. di precipitazioni atmosferiche, con uno scostamento quadratico medio (corretto) giornaliero pari a 10 mm. Supponendo che la quantità di precipitazione atmosferica giornaliera sia normalmente distribuita, determinare l'intervallo di confidenza al 90 % per il livello medio di precipitazione giornaliero. Intervalli di confidenza per la differenza di due medie 2 1 2 2 non note, n,m piccoli X1 X 2 t / 2,nm2 Sˆc 1 1 1 1 1 2 X1 X 2 t / 2,n m2 Sˆc n m n m X n Sˆc i 1 X 1 X 2i X 2 2 1i n i 1 nm2 2 Esercizio 3 Un campione causale della marca A di lampadine ha media pari a 4000 ore e scarto quadratico medio (corretto) pari a 200. Un campione casuale di 8 lampadine della marca B ha media 4600 e scarto quadratico medio (corretto) 250. Si assume che la durata delle lampadine delle due marche si distribuisce normalmente con varianze uguali ma incognite. Si calcoli l’intervallo di confidenza per la differenza della media di A- media media ad un livello di errore pari al 10%. Intervalli di confidenza per la differenza di due medie , 2 1 X 1 2 note, n ed m grandi 2 X 2 z / 2 12 22 12 22 1 2 X1 X 2 z / 2 n m n m Esercizio 4 Da un'indagine campionaria condotta sui laureati in Economia e Commercio presso un certo ateneo durante un determinato anno accademico, è risultato che il voto medio di laurea conseguito dai laureati di sesso femminile è stato uguale a 104,5 mentre il voto medio conseguito dai laureati di sesso maschile è stato uguale a 101,9. Sapendo che il campione dei laureati di sesso maschile e quello dei laureati di sesso femminile hanno entrambi numerosità n = 120 e che i due campioni provengono da popolazioni aventi varianza rispettivamente uguale a s2 F = 8,41 e a M = 5,61, determinare gli intervalli di confidenza al 90 % per i seguenti parametri: mF - mM ; in cui mF e mM indicano il voto atteso per i laureati di sesso femminile e rispettivamente per i laureati di sesso maschile. Intervalli di Confidenza per la proporzione π utilizzando la distribuzione normale f= stimatore di π n sufficientemente grande f z / 2 f 1 f n f z / 2 f 1 f n Esercizio 1 Un’organizzazione di ricerche di mercato contatta un campione casuale di 100 uomini appartenenti ad una grande comunità e trova che la proporzione dello 0,4 del campione, preferisce le lamette dell’impresa committente della ricerca. Si calcoli l’intervallo di confidenza al 95% della proporzione di tutti gli uomini della comunità che preferiscono le lamette dell’impresa committente. 0,30 0,50 Intervalli di Confidenza per la di fferenza di due proporzioni π1- π2 utilizzando la distribuzione normale f1= stimatore di π1 f2= stimatore di π2 n,m sufficientemente grandi f1 f2 z / 2 f1 1 f1 f 2 1 f 2 f1 1 f1 f 2 1 f 2 1 2 f1 f 2 z / 2 n m n m Esercizio 2 Si considerino i dati dell’esempio 1. La società di ricerche di mercato, esegue la stessa indagine in un’altra comunità, verificando che 60 uomini su 200 preferiscono le lamette dell’impresa committente. Si calcoli l’intervallo di confidenza al 90% della differenza delle proporzioni degli utilizzatori delle lamette dell’impresa committente delle due comunità. 0,003 1 2 0,197 Intervalli di confidenze per la varianza σ2 S2=stimatore di σ2 Popolazione normale, media non nota 2 ˆ n 1 S y / 2,n 1 2 2 ˆ n 1 S y1 / 2,n 1 Esercizio 3 Il responsabile acquisti di un certo supermercato, analizza il contenuto di 12 scatole di fagioli di una certa azienda produttrice. Le 12 scatole riportano i seguenti pesi: [15,7;15,8;15,8;15,9;15;9;16;16;16;16,1; 16,1; 16,1;16,2] Si stimi al 90% l’intervallo di confidenza per la varianza del peso delle scatole di fagioli prodotte da quella determinata azienda. [0,0125≤σ2≤0,0539] Intervalli di confidenze per il rapporto di due varianze, σ12 e σ22 S12=stimatore di σ12 S22=stimatore di σ22 2 2 2 ˆ ˆ S1 1 S1 F F 1 / 2, n 1, m 1 2 2 2 / 2, n 1, m 1 ˆ ˆ 2 S2 S2 F1 / 2,n 1,m1 1 F / 2,m1,n 1 Esercizio 4 N° 6,21 D’Ambra (con opportune modifiche) 60 48 45 54 48 44 55 56 42 62 58 46 62 47 52 12 0,322 2 5, 25 1