Inferenza statistica per un singolo campione 1 Lo scopo dell’inferenza statistica è quello di trarre delle conclusioni o assumere delle decisioni riguardanti una popolazione sulla base di un campione estratto dalla popolazione stessa Si definisce campione casuale di numerosità n, indicato con (x1, x2,…, xn) quello ottenuto in modo tale che le osservazioni {xi} sono selezionate in modo indipendente l’una dall’altra Campionatura (x1, x2, … , xn) f(x) f(x) 2 x x n x x i 1 n n i s 2 x x i 1 n 2 i n 1 s 2 x x i i 1 n 1 Distribuzioni campionarie 3 Se x variabile casuale è distribuita con legge normale avente media m e varianza s allora il campione casuale di numerosità n, indicato con (x1, x2,…, xn) ha distribuzione N(m, s2/√n) Distribuzione del c2 – Se le variabili x1, …xn sono distribuite normalmente e sono tra loro indipendenti con media 0 e varianza unitaria allora la variabile e y è distribuita con legge c2 con n gradi di libertà y x x x ...x 2 1 2 2 2 3 2 n Funzione distribuzione c2 La distribuzione è asimmetrica con media k e varianza 2k 4 Tabella distribuzione c2 5 Distribuzioni campionarie 6 Se x e y sono variabili casuali indipendenti distribuite rispettivamente con legge normale standardizzata e con legge chi quadrato, con k g.d.l. allora la variabile casuale t x y k Si distribuisce con legge t di Student con k g.d.l. Funzione distribuzione t - Student k 1 k 1 2 2 2 t 1 f t k k k 2 -∞ < t < +∞ 0,09 0,08 0,07 0,06 K=10 K=8 K=6 0,05 0,04 0,03 0,02 0,01 0 -10 -5 0 5 10 7 Tabella distribuzione t - Student 8 Distribuzioni campionarie 9 Se w e y sono variabili casuali indipendenti distribuite secondo legge chi quadrato, con u e v g.d.l. rispettivamente allora il rapporto Fu ,v w u y v Si distribuisce con legge F di Snedecor con u e v g.d.l. Funzione distribuzione F u v u 2 v f x u v 2 2 u 2 x u 21 u x 1 2 u v 2 Se x1 e x2 sono campioni casuali ottenuti da due processi normali ed indipendenti x1 ~ N(μ1,σ12) e x2 ~ N(μ2,σ22). Indicate con n1 le osservazioni della prima campionatura e n2 le osservazioni della seconda campionatura si avrà: S12 S 2 2 s 12 s 22 Fn1 1,n2 1 10 Tabella Riassuntiva 11 Inferenza sulla media- s nota 12 Se x è una variabile casuale con media m non nota e s nota si vuole verificare che tale media sia uguale ad un valore assunto m0 TEST DI IPOTESI H 0 : m m0 Z0 H1 : m m 0 Si rifiuta H0 se x m0 s n Z 0 Z 2 * Intervallo di confidenza 13 E’ l’intervallo tra due statistiche che include il vero valore del parametro con una assegnata probabilità PL m U 1 L m U L U 1- E’ detto intervallo di confidenza al livello 100(1-)% Limite inferiore Limite superiore Livello di confidenza Intervallo di confidenza Criteri per il rifiuto di H0 Intervallo di confidenza della media con s nota 16 Consideriamo x una variabile casuale con media m non nota e s nota. Sia dato un campione casuale di n osservazioni e sia x media campionaria. L’intervallo di confidenza bilaterale al livello 100(1-)% di m è dato da: x Z 2 s Z 2 * n m x Z 2 s n È il punto percentile di una normale standardizzata tale che Pz Z 2 2 Inferenza sulla media- s non nota 17 Se x è una variabile casuale con media m non nota e s non nota si vuole verificare che tale media sia uguale ad un valore assunto m0 TEST DI IPOTESI H 0 : m m0 H1 : m m 0 Si rifiuta H0 se t0 t 2,n1 x m0 t0 S n dove t 2,n 1 è il punto percentile superiore al livello /2 della distribuzione t di Student con n-1 g.d.l * Intervallo di confidenza della media con s non nota 18 Consideriamo x una variabile casuale con media m non nota e s non nota. Sia dato un campione casuale di n osservazioni e sia x media campionaria ed S dev. Standard. L’intervallo di confidenza bilaterale al livello 100(1-)% di m è dato da: x t 2,n1 S n m x t 2,n1 S n * Criteri per il rifiuto di H0 Inferenza sulla varianza di una distribuzione normale 20 Se il test sulla media m non particolarmente sensibile all’assunzione di distribuzione normale ciò non è vero nel test di ipotesi sulla varianza. TEST DI IPOTESI H0 :s s 0 H1 : s s 0 2 n 1 S c2 0 s 2 0 Dove S è la dev. Standard campionaria calcolata sui dati di un campione casuale di numerosità n Inferenza sulla varianza di una distribuzione normale 21 Si rifiuta H0 se c02 c2 2,n1 Oppure se c02 c12 2,n1 c 2,n1 2 c 2 1 2, n 1 Sono i punti percentili superiori al livello /2 e 1- /2 della distribuzione chi-quadrato con n-1 g.d.l * Intervallo di confidenza della s 22 Consideriamo x una variabile casuale con media m non nota e s non nota. Sia dato un campione casuale di n osservazioni e sia x media campionaria ed S dev. Standard. L’intervallo di confidenza bilaterale al livello 100(1-)% della varianza è dato da: n 1S 2 c2 2,n 1 c 2,n1 2 * 2 n 1 S s 2 c12 2,n 1 è il punto percentile superiore al livello 1-a/2 della distribuzione Chi-Q con n-1 g.d.l tale che: P c 02 c2 2,n1 2 Inferenza per la differenza tra medie 23 Inferenza per la differenza tra medie 24 Inferenza per la differenza tra medie 25 Inferenza per la differenza tra medie 26 Inferenza per la differenza tra medie Inferenza sulla varianza Inferenza sulla varianza