Inferenza statistica per un singolo
campione
1


Lo scopo dell’inferenza statistica è quello di trarre
delle conclusioni o assumere delle decisioni riguardanti
una popolazione sulla base di un campione estratto
dalla popolazione stessa
Si definisce campione casuale di numerosità n,
indicato con (x1, x2,…, xn) quello ottenuto in modo tale
che le osservazioni {xi} sono selezionate in modo
indipendente l’una dall’altra
Campionatura (x1, x2, … , xn)
f(x)
f(x)
2
x
x
n
x
x
i 1
n
n
i
s 
2
 x  x 
i 1
n
2
i
n 1
s
2


x

x
 i
i 1
n 1
Distribuzioni campionarie
3


Se x variabile casuale è distribuita con legge normale
avente media m e varianza s allora il campione
casuale di numerosità n, indicato con (x1, x2,…, xn) ha
distribuzione N(m, s2/√n)
Distribuzione del c2 – Se le variabili x1, …xn sono
distribuite normalmente e sono tra loro indipendenti
con media 0 e varianza unitaria allora la variabile e
y è distribuita con legge c2 con n gradi di libertà
y  x  x  x  ...x
2
1
2
2
2
3
2
n
Funzione distribuzione c2
La distribuzione è asimmetrica con media k e varianza
2k
4
Tabella distribuzione c2
5
Distribuzioni campionarie
6

Se x e y sono variabili casuali indipendenti distribuite
rispettivamente con legge normale standardizzata e
con legge chi quadrato, con k g.d.l. allora la variabile
casuale
t
x
y
k
Si distribuisce con legge t di Student con k g.d.l.
Funzione distribuzione t - Student
 k 1
 k 1 2

 2

2  t

  1
f t  
k  k

k  
2
-∞ < t < +∞
0,09
0,08
0,07
0,06
K=10
K=8
K=6
0,05
0,04
0,03
0,02
0,01
0
-10
-5
0
5
10
7
Tabella distribuzione t - Student
8
Distribuzioni campionarie
9

Se w e y sono variabili casuali indipendenti
distribuite secondo legge chi quadrato, con u e v g.d.l.
rispettivamente allora il rapporto
Fu ,v 
w
u
y
v
Si distribuisce con legge F di Snedecor con u e
v g.d.l.
Funzione distribuzione F
 u  v  u 

 
2
 v 
f x   
u v
  
 2 2
u 2
x u 21
u

 x  1
2

u  v  2
Se x1 e x2 sono campioni casuali ottenuti da due processi
normali ed indipendenti x1 ~ N(μ1,σ12) e x2 ~ N(μ2,σ22).
Indicate con n1 le osservazioni della prima campionatura
e n2 le osservazioni della seconda campionatura si avrà:
S12
S
2
2
s 12
s 22
 Fn1 1,n2 1
10
Tabella Riassuntiva
11
Inferenza sulla media- s nota
12
Se x è una variabile casuale con media m non nota e s
nota si vuole verificare che tale media sia uguale ad un
valore assunto m0
TEST DI IPOTESI
H 0 : m  m0
Z0 
H1 : m  m 0
Si rifiuta H0 se
x  m0
s
n
Z 0  Z 2
*
Intervallo di confidenza
13
E’ l’intervallo tra due statistiche che include il vero valore
del parametro con una assegnata probabilità
PL  m  U   1  
L  m U
L
U
1-
E’ detto intervallo di confidenza
al livello 100(1-)%
Limite inferiore
Limite superiore
Livello di confidenza
Intervallo di confidenza
Criteri per il rifiuto di H0
Intervallo di confidenza della media con
s nota
16
Consideriamo x una variabile casuale con media m non
nota e s nota. Sia dato un campione casuale di n
osservazioni e sia x media campionaria. L’intervallo di
confidenza bilaterale al livello 100(1-)% di m è dato
da:
x  Z 2 s
Z 2
*
n
 m  x  Z 2 s
n
È il punto percentile di una normale
standardizzata tale che Pz  Z 2    2
Inferenza sulla media- s non nota
17
Se x è una variabile casuale con media m non nota e s
non nota si vuole verificare che tale media sia uguale
ad un valore assunto m0
TEST DI IPOTESI
H 0 : m  m0
H1 : m  m 0
Si rifiuta H0 se
t0  t 2,n1
x  m0
t0 
S
n
dove
t 2,n 1
è il punto percentile superiore al livello /2 della
distribuzione t di Student con n-1 g.d.l
*
Intervallo di confidenza della media con
s non nota
18
Consideriamo x una variabile casuale con media m non
nota e s non nota. Sia dato un campione casuale di n
osservazioni e sia x media campionaria ed S dev.
Standard. L’intervallo di confidenza bilaterale al livello
100(1-)% di m è dato da:
x  t 2,n1 S
n
 m  x  t 2,n1 S
n
*
Criteri per il rifiuto di H0
Inferenza sulla varianza di una
distribuzione normale
20
Se il test sulla media m non particolarmente sensibile
all’assunzione di distribuzione normale ciò non è vero nel
test di ipotesi sulla varianza.
TEST DI IPOTESI
H0 :s  s 0
H1 : s  s 0
2


n

1
S
c2 
0
s
2
0
Dove S è la dev. Standard campionaria calcolata
sui dati di un campione casuale di numerosità n
Inferenza sulla varianza di una
distribuzione normale
21
Si rifiuta H0 se
c02  c2 2,n1
Oppure se
c02  c12 2,n1
c 2,n1
2
c
2
1 2, n 1
Sono i punti percentili superiori al livello /2 e 1- /2
della distribuzione chi-quadrato con n-1 g.d.l
*
Intervallo di confidenza della s
22
Consideriamo x una variabile casuale con media m non nota e s
non nota. Sia dato un campione casuale di n osservazioni e sia x
media campionaria ed S dev. Standard. L’intervallo di confidenza
bilaterale al livello 100(1-)% della varianza è dato da:
n  1S 2
c2 2,n 1
c 2,n1
2
*
2


n

1
S
s 2 
c12 2,n 1
è il punto percentile superiore al livello 1-a/2
della distribuzione Chi-Q con n-1 g.d.l tale che:


P c 02  c2 2,n1   2
Inferenza per la differenza tra medie
23
Inferenza per la differenza tra medie
24
Inferenza per la differenza tra medie
25
Inferenza per la differenza tra medie
26
Inferenza per la differenza tra medie
Inferenza sulla varianza
Inferenza sulla varianza
Scarica

Inferenza_statistica