“Teoria e metodi della ricerca sociale e organizzativa”
Corso di Laurea in Scienze dell’Organizzazione
Facoltà di Sociologia
Università Milano-Bicocca
2009
Simone Sarti
1
Elementi introduttivi di statistica
2
LA PROBABILITA’
Definizione classica (o frequentista):
la probabilità di evento è il rapporto tra la frequenza con cui un
evento accade e l’insieme degli eventi possibili.
La probabilità che dal lancio di una moneta otteniamo testa è 0,5.
eventi(testa)
1
p(testa) 
  0,5
eventi( possibili ) 2
La probabilità che dal lancio di un dado otteniamo 1 è 0,16.
eventi(1)
1
p(1) 
  0,16
eventi( possibili ) 6
3
LA PROBABILITA’
La probabilità che dal lancio di due dadi otteniamo 5 è 0,11.
eventi(5)
4
p(5) 

 0,11
eventi( possibili ) 36
D1
D2
Tot
D1
1
1
2
2
1
2
3
1
3
1
D2
Tot
D1
1
3
3
2
2
4
4
2
3
4
5
2
1
5
6
1
6
7
D2
Tot
D1
D2
Tot
D1
D2
Tot
D1
D2
Tot
1
4
4
1
5
5
1
6
6
1
7
3
2
5
4
2
6
5
2
7
6
2
8
5
3
3
6
4
3
7
5
3
8
6
3
9
4
6
3
4
7
4
4
8
5
4
9
6
4
10
2
5
7
3
5
8
4
5
9
5
5
10
6
5
11
2
6
8
3
6
9
4
6
10
5
6
11
6
6
12
4
DISTRIBUZIONE DI PROBABILITA’
La distribuzione di probabilità rappresenta come le probabilità sono
associate ai diversi eventi (discreti).
La somma delle probabilità da sempre 1.
0.6
Risultato del lancio di una moneta
0.5
0.4
0.3
0.2
0.1
0
o
x
5
DISTRIBUZIONE DI PROBABILITA’
Somma ricavata dal lancio di due dadi
0.18
0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02
0.00
2
3
4
5
6
Evento più probabile
7
8
9
10
11
12
6
pX x  P( X  x)
LA FUNZIONE DI PROBABILITA’
è una funzione algebrica che
descrive la forma della
distribuzione di probabilità
La funzione di probabilità assegna
una probabilità ad ogni
realizzazione x della variabile
casuale discreta X.
px(2)
=0.03
px(3)
=0.06
px(4)
=0.08
px(5)
=0.11
px(6)
=0.14
px(7)
=0.17
px(8)
=0.14
px(9)
=0.11
px(10) =0.08
px(11) =0.06
px(12) =0.03
 p x   1
X
Se invece di avere un numero discreto di eventi, ne avessimo
uno continuo le funzioni di probabilità sono funzioni di
densità di probabilità ed avrebbero la forma di una linea.
In tal caso l’area sottesa alla curva darebbe valore 1.
p
L’area è uguale a 1.
0
1300
Reddito
4000
8
Molti fenomeni hanno una distribuzione che approssima
una distribuzione nota detta curva normale o gaussiana.
p(Z)
L’area è uguale a 1.
Z
9
Somma ricavata dal lancio di due dadi
p
0,17
0,08
x
10
Statura in cm, maschi 20-64 anni
11
«E non è ingiusto, questo? Non è forse vero che chi si
comporta così, evidentemente vive tra gli uomini senza
averne nessuna esperienza? Se, infatti, li conoscesse
appena, saprebbe che son pochi quelli veramente buoni o
completamente malvagi e che per la maggior parte,
invece, sono dei mediocri.»
«In che senso?» feci.
«È lo stesso delle cose molto piccole e molto grandi. Credi
forse che sia tanto facile trovare un uomo o un cane o un
altro essere qualunque molto grande o molto piccolo o,
che so io, uno molto veloce o molto lento o molto brutto
o molto bello o tutto bianco o tutto nero? Non ti sei mai
accorto che in tutte le cose gli estremi sono rari mentre
gli aspetti intermedi sono frequenti, anzi numerosi?»
Platone, Fedone, XXXIX
12
La curva normale ha delle proprietà statistiche, per
cui ad un valore sull’asse delle ascisse corrisponde
un preciso valore dell’area della curva.
p x  x   
p(x)
1

X
x
Za
13
Quando la curva normale è standardizzata
(media=0, varianza=1) i valori in ascissa sono detti
punteggi ZETA (Z) e ai punti zeta è possibile
associare direttamente l’area sottesa alla curva in
base ad alcune tavole statistiche.
p(z)
Quando za>1
L’area vale 0,159
Z
za
14
ALTRI VALORI DI CORRISPONDENZA TRA Z
E LA DENSITA’ DI PROBABILITA’
0,500 = P{ z < 0 }
0,500 = P{ z > 0 }
0,900 = P{- 1,65 < z < +1,65 }
0,950 = P{- 1,96 < z < +1,96 }
0,955 = P{- 2 < z < + 2 }
0,990 = P{- 2,58 < z < + 2,58 }
0,997 = P{ - 3 < z < + 3 }
15
QUALSIASI DISTRIBUZIONE CONTINUA PUO’
ESSERE STANDARDIZZATA
Z
xi  x

Una distribuzione standardizzata ha media uguale
a 0 e deviazione standard (o varianza) uguale a 1.
16
Elementi introduttivi di statistica inferenziale
17
Elementi introduttivi di statistica inferenziale
Si usano le lettere latine per il campione,
quelle greche per la popolazione (o universo)
18
Statistica descrittiva e statistica inferenziale
La statistica descrittiva si propone di riassumere le proprietà di un
campione di osservazione (distribuzioni di frequenze, valori tipici).
Queste statistiche non offrono alcuna informazione diretta sulla
popolazione dalla quale è stato tratto il campione analizzato.
Per ottenere tali informazioni è necessario ricorrere alla statistica
inferenziale che, applicando la teoria matematica della
probabilità, desume le caratteristiche dell’intera popolazione sulla
base dell’evidenza campionaria disponibile.
Un’inferenza è una generalizzazione o conclusione riguardante una
data popolazione formulata sulla base di dati campionari.
Se un campione è altamente “rappresentativo” della popolazione di
riferimento, allora le inferenze relative a quest’ultima possono
essere formulate con un elevato livello di accuratezza (sebbene
mai con certezza).
19
Il fatto che ci rivolgiamo ad un campione, che è solo una
parte della popolazione, comporta che le “misure” che
effettuiamo sul campione sono in qualche modo sbagliate.
Più correttamente, le STIME che effettuiamo sul campione
hanno un certo grado di INCERTEZZA.
20
Quando parliamo di valori tipici della popolazione,
parliamo di PARAMETRI
Quando parliamo di valori tipici di un campione,
parliamo di STATISTICHE.
Quando facciamo inferenza, attribuiamo conclusioni fatte sul
campione alla popolazione, parliamo allora di STIME DI PARAMETRI,
e relativi INTERVALLI DI CONFIDENZA
(o di intervalli di credibilità nella statistica bayesiana)
Si usano le lettere latine per il campione (S, X, Y..)
quelle greche per la popolazione (μ, σ , …)
21
Teorema del limite centrale
Se tutti i possibili campioni casuali di numerosità n vengono estratti da
una data popolazione avente media mu e varianza sigma-quadro,
all’aumentare di n le medie di questi campioni approssimeranno una
distribuzione normale, con media mu e varianza sigma-quadro/N.
Indipendentemente dalla forma della distribuzione !
Y  Y
Media delle
medie
campionarie
Media della
popolazione
 
2
Y
Varianza
delle medie
campionarie

2
Y
n
Varianza della
popolazione
22
universo
Media, varianza
Y
 
Media, varianza
Media, varianza
Media, varianza
Media, varianza
………………
 Y2
Y  Y
2
Y
campioni
 Y2
n
Distribuzione delle medie campionarie
 Y2
Y
Teorema del limite centrale
 
2
Y

2
Y
n
La varianza delle medie campionarie diminuisce all’aumentare della
grandezza del campione (n). Si parla di ERRORE STANDARD.
e.s.   Y 

2
Y
n
Più grandi sono i campioni, minore è l’errore standard e più precisa è
la media campionaria nello stimare la media della popolazione.
24
Teorema del limite centrale
e.s. 

2
Y
n
Distribuendosi le medie campionarie secondo una curva normale,
possiamo conoscere la probabilità che le medie campionarie siano
comprese in un dato intervallo.
25
Teorema del limite centrale
Le medie campionarie (sotto) approssimano la media della
popolazione (174) a meno di un certo margine di incertezza
(che dipende dall’errore standard).
Media= 174
Dev.std.=15
UNIVERSO 100000 CASI
...
100
100
100
100
Campione 1 Campione 2 Campione 3 Campione 4
Media=173
Media=174
Media=176
Media=172
...
100
Campione t
Media=175
Teorema del limite centrale
n campionario
uguale a 100
e.s. 
Media= 174

2
Y

n
15
2
100
 1,5
Dev.std.=15
UNIVERSO 100000 CASI
...
100
100
100
100
Campione 1 Campione 2 Campione 3 Campione 4
Media=173
Media=174
Media=176
Media=172
...
100
Campione t
Media=175
27
Y  Z 2   Y
Il 95% di tutte le medie
campionarie sono comprese
nell’intervallo:
Z 2  1,96
  0,05
p(Z)
0,025
0,95
0,025
Z
 Z 2
 Z 2
28
Sappiamo che Z ritaglia un’area di 0,95 con valori corrispondenti
a più/meno 1,96.
Y  Z 2   Y
Y  1,96 1,5
Se consideriamo il primo campione estratto
abbiamo che l’incertezza della stima del valore
medio di questo campione riguarda l’intervallo:
173  1,96 1,5
170,1
176,9
29
Se stiamo lavorando sul primo campione estratto
abbiamo che l’incertezza della stima del valore medio
dell’altezza nella popolazione riguarda l’intervallo:
173  1,96 1,5
170,1
176,9
Estratti un numero molto elevato di campioni di
numerosità 100, l’altezza è nel 95% dei casi compresa
tra 170,1 e 176,9
30
173  1,96 1,5
0,025
170,1
0,95
173
0,025
176,9
31
Prendendo un campione più ampio… n=1000
174  1,96  0,47
0,95
0,025
0,025
173,1
174
174,9
Prendendo un campione più piccolo … n=30
170  1,96  2,74
0,95
0,025
0,025
164,6
170
175,4
Incertezza e numerosità campionaria
n=1000
Y  Z 2   Y
n=100
L’e.s. è funzione di n
n=50
Y
34
95%
0
270,6
300
•
•
•
• • •
•
•
•
•
•
• •
•
••
••
•
••
•
• •
•
• • •
•
•• •
••
•
•
•
•
• •
•
• •
•
•
•
•
•
•
•
•• •
•
•
•
10
•
18
•
329,4
270,6
•
300
^
• 27
329,4
1
Esempio tratto da M.Pisati, “Analisi dei dati”
Quando la deviazione standard della popolazione non è nota,
e la numerosità del campione è elevata, è possibile stimare
l’errore standard usando la deviazione standard del campione.
2
Y
s
Stima(e.s.)  ˆ Y 
n
IN TAL CASO PERO’ SI USA LA DISTRIBUZIONE t di Student,
una distribuzione che approssima la curva normale, ma che ha
errori standard più ampi (le code sono più lunghe) ed è
funzione anche della dimensione del campione.
Se n è molto grande T e Z convergono.
36
VALORI DI CORRISPONDENZA TRA T
E LA DENSITA’ DI PROBABILITA’:
PER n=100
0,500 = P{ t < 0 }
0,500 = P{ t > 0 }
0,900 = P{- 1,66 < t < +1,66 }
0,950 = P{- 1,98 < t < +1,98 }
0,990 = P{- 2,62 < t < + 2,62 }
PER n molto grande
(convergono con Z)
0,500 = P{ t < 0 }
0,500 = P{ t > 0 }
0,900 = P{- 1,65 < t < +1,65 }
0,950 = P{- 1,96 < t < +1,96 }
0,990 = P{- 2,57 < t < + 2,57 }
37
Test di significatività
Se testiamo un’ipotesi su un campione, quanto la risposta
che diamo a questa ipotesi è “vera” anche nella
popolazione?
38