Indici di Variabilità
•
•
•
•
•
NdE
Range (o campo di variabilità)
Scarto medio assoluto
Somma dei quadrati
Varianza e deviazione standard
Il concetto di variabilità
3
2,75
2,5
2,25
1,5
1,25
1
0,75
0,5
0,25
0
65
75
85
95
105
115
125
135
Q.I.
Elevata variabilità
10
9
8
7
N. studenti
• La variabilità è una
misura della dispersione
di una distribuzione di
frequenza
• La variabilità determina
il grado in cui una
singola
misura
è
rappresentativa
della
popolazione
N. studenti
2
1,75
6
5
4
3
2
1
0
65
75
85
95
105
115
125
135
Q.I.
Bassa variabilità
Variabilità e statistica inferenziale
10
3
9
2,75
2,5
8
2,25
2
6
5
Gruppo 1
Gruppo 2
4
N. studenti
N. Studenti
7
1,75
1,5
Gruppo 1
Gruppo 2
1,25
1
3
0,75
2
0,5
1
0,25
0
0
65
75
85
95
105 115 125 135
Q.I.
Nell’assenza di variabilità
all’interno dei gruppi è evidente
che i Q.I. del primo gruppo sono
più elevati rispetto a quelli del
secondo gruppo
65
75
85
95
105 115 125 135
Q.I.
Nella presenza di una forte
variabilità all’interno dei gruppi
non è evidente in quale gruppo
sono più elevati i Q.I.
Indici di variabilità
Due distribuzioni possono avere stessi indici di
centralità (media, mediana, moda) ma essere
diversamente dispersi.
Il campo di variazione o RANGE
Il campo di variazione di una
distribuzione è la differenza
fra il valore massimo e il
valore minimo rilevati.
Osservazioni: 1,2,5,7,8,9
Valore massimo:
9
Valore minimo:
1
Campo di variazione: 8
Range = Val max- Val min
Il campo di variazione come
misura della variabilità
Il campo di variazione si
esprime in valori assoluti.
Non dice nulla su come i
valori
assunti
dalla
variabile sono distribuiti.
Osservazioni di altezza
(mm):
1600,1520, 1720,1670, 1700
Osservazioni di peso (kg)
50, 70, 110, 73, 80 Kg.
Scarto medio assoluto dalla media aritmetica
Lo scarto medio assoluto dalla media aritmetica è
la somma degli scarti dei vari dati rispetto alla
loro media aritmetica considerati in valore
assoluto. Lo scarto medio assoluto non è altro che
la media aritmetica delle distanza di ciascun dato
dalla media.
Scarto medio assoluto dalla media aritmetica
Varianza e deviazione standard
Valore medio
3
2,75
2,5
2,25
N. studenti
2
1,75
1,5
1,25
1
0,75
0,5
0,25
0
65
75
85
95
105
Q.I.
Distanza rispetto
alla media
115
125
135
Definizione intuitiva della variabilità:
la variabilità come distanza media
di un’”osservazione tipo” rispetto
al valore medio per la popolazione
Alcune distanze sono negative, alcune
positive
La somma di tutte le distanze è pari a
zero
La media delle distanze è pari a zero
Non possiamo utilizzare la somma
delle distanza come misura di
dispersione
Somma dei quadrati
La somma dei quadrati della
distanza fra la media (µ) e il
valore dell’osservazione
L’utilizzo del quadrato
Elimina i valori negativi
Da maggior peso alle osservazioni
lontane dalla media
Il valore della somma dei
quadrati aumenta con il numero
delle osservazioni.
Osservazione1
2
3
4
5
6
7
8
9
10
X
¼
14
17
18
22
12
4
6
30
33
0
X-¼ (X-¼)^2
15,6 -1,6 2,56
15,6 1,4 1,96
15,6 2,4 5,76
15,6 6,4 40,96
15,6 -3,6 12,96
15,6 -11,6 134,56
15,6 -9,6 92,16
15,6 14,4 207,36
15,6 17,4 302,76
15,6 -15,6 243,36
( X  )
2
La varianza di una popolazione
• La varianza si calcola come la
media del quadrato della
distanza fra il valore della
singola osservazione e il valore
medio per l’insieme delle
osservazioni
• La varianza è una misura
finalizzata
alla
standardizzazione delle misure
di variabilità
• Il valore della varianza è
indipendente
rispetto
al
numero delle osservazioni
(X  )
2
N
Osservazione1
2
3
4
5
6
7
8
9
10
X
¼
14
17
18
22
12
4
6
30
33
0
X-¼
15,6
15,6
15,6
15,6
15,6
15,6
15,6
15,6
15,6
15,6
-1,6
1,4
2,4
6,4
-3,6
-11,6
-9,6
14,4
17,4
-15,6
Somma
N
Varianza
(X-¼)^2
2,56
1,96
5,76
40,96
12,96
134,56
92,16
207,36
302,76
243,36
1044,4
10
104,44
La deviazione standard

Osservazione1
2
3
4
5
6
7
8
9
10
(X  )
2
N
X
?
14
17
18
22
12
4
6
30
33
0
X-?
15,6
15,6
15,6
15,6
15,6
15,6
15,6
15,6
15,6
15,6
(X-?)^2
-1,6
2,56
1,4
1,96
2,4
5,76
6,4 40,96
-3,6 12,96
-11,6 134,56
-9,6 92,16
14,4 207,36
17,4 302,76
-15,6 243,36
Somma
N
Varianza
Dev. St.
1044,4
10
104,44
10,22
• La varianza non costituisce una
misura “intuitiva” dalla distanza
fra una “osservazione tipica” e
il valore medio
• Tale distanza è rappresentata
dalla deviazione standard
• La deviazione standard di una
popolazione è rappresentata dal
radice quadrata della varianza
della popolazione
Esempio
1. Calcolare la varianza e la deviazione
standard del seguente insieme di dati
–
10,10,10,10,10
2. Calcolare la varianza e la deviazione
standard del seguente insieme di dati
–
1,3,3,4,9
Prima esercitazione
Osservazione
X
1
2
3
4
5
Media=
Somma distanze^2
N
Varianza
Dev. St.
¼
10
10
10
10
10
X-¼
10
10
10
10
10
10
0
5
0
0
Completa assenza di variabilità
(X-¼)^2
0
0
0
0
0
0
0
0
0
0
Seconda esercitazione
Osservazione
X
1
2
3
4
5
Media=
Somma distanze^2
N
Varianza
Dev. St.
¼
1
3
3
4
9
4
36
5
7,2
2,68
X-¼
4
4
4
4
4
(X-¼)^2
-3
-1
-1
0
5
9
1
1
0
25
Visualizzare la deviazione standard
3
2,75
2,5
2,25
N. studenti
Questa osservazione è
2
distante 1 Dev. 1,75
St.
rispetto alla media
1,5
1,25
1
0,75
0,5
=17,2
0,25
0
65
75
85
95
105
Q.I.
115
125
135
La Varianza e la Deviazione Standard
La deviazione standard è l’indice normalmente
utilizzato per calcolare la dispersione di una
distribuzione di dati. Si può affermare che la
deviazione standard calcola la “quantità” media di
deviazione dalla media. E’ una misura lineare della
dispersione dei dati.
La varianza è invece una media di aree e non è mai
negativa.
La deviazione standard nella
letteratura scientifica
Forma standardizzata di
presentazione
forma breve
forma tabellare
Importante indicare la
numerosità di ciascuno
dei gruppi e sottogruppi
“I bambini che hanno
visionato il cartoon hanno
mostrato un indice di
aggressività (M=12,45, Dev
St.=3,7) superiore rispetto al
Gruppo di controllo (M=4,22,
Dev. St.=1,04)”
Cartoon
Violento
Maschi
Femmine
Controllo
M=15,72
M=6,92
Dev. St.=4,43 Dev.St.=2,26
M=3,47
M=2,61
Dev. St.=1,12 Dev.DSt=0,98
Esempio1: distribuzione poco dispersa
Peso (kg)
Fa
Fa*xi
scarto
Scarto quadrato
Scarto
quadrato
Ponderato
48
0
0,0
-19,7
388,7
0,0
53
0
0,0
-14,7
216,5
0,0
55
0
0,0
-12,7
161,7
0,0
60
0
0,0
-7,7
59,5
0,0
65
24
1560,0
-2,7
7,4
176,8
68
60
4080,0
0,3
0,1
4,9
70
21
1470,0
2,3
5,2
109,7
74
0
0,0
6,3
39,5
0,0
78
0
0,0
10,3
105,8
0,0
80
0
0,0
12,3
150,9
0,0
84
0
0,0
16,3
265,2
0,0
105
7110,0
Somma quadrati
291,4
Media
(kg)
67,7
Varianza
2,8
Dev. standard
(kg)
1,7
Grafico 1: distribuzione poco dispersa
Distribuzione "concentrata"
70
60
Frequenza
50
40
30
20
10
0
48
53
55
60
65
68
Peso (kg)
70
74
78
80
84
Esempio2: bassa dispersione
Peso (kg)
Fa
Fa*xi
Scarto
Scarto quadrato
Scarto quadrato
ponderato
48
0
0,0
-19,7
389,8
0,0
53
0
0,0
-14,7
217,4
0,0
55
2
110,0
-12,7
162,4
324,8
60
5
300,0
-7,7
60,0
299,8
65
17
1105,0
-2,7
7,5
127,9
68
54
3672,0
0,3
0,1
3,6
70
20
1400,0
2,3
5,1
101,9
74
5
370,0
6,3
39,2
195,8
78
2
156,0
10,3
105,2
210,4
80
0
0,0
12,3
150,2
0,0
84
0
0,0
16,3
264,3
0,0
Totale
105
7113,0
Somma quadrati
1264,1
Media (kg)
67,7
Varianza
12,0
Dev. Standard (kg)
3,5
Grafico2: bassa dispersione
Bassa dispersione
60
50
frequenza
40
30
20
10
0
48
53
55
60
65
68
peso (kg)
70
74
78
80
84
Esempio3: alta dispersione
Peso (kg)
Fa
Fa*xi
Scarto
Scarto quadrato
Scarto quadrato
ponderato
48
2
96,0
-19,7
389,0
778,1
53
5
265,0
-14,7
216,8
1084,0
55
7
385,0
-12,7
161,9
1133,3
60
10
600,0
-7,7
59,7
596,6
65
15
975,0
-2,7
7,4
111,3
68
22
1496,0
0,3
0,1
1,7
70
18
1260,0
2,3
5,2
93,3
74
7
518,0
6,3
39,4
275,7
78
10
780,0
10,3
105,6
1056,0
80
5
400,0
12,3
150,7
753,5
84
4
336,0
16,3
264,9
1059,7
Totale
105
7111,0
Somma quadrati
6943,0
Media
(kg)
67,7
Varianza
66,1
Dev. Standard
(kg)
8,1
Grafico3: alta dispersione
Alta dispersione
25
Frequenza
20
15
10
5
0
48
53
55
60
65
68
peso (kg)
70
74
78
80
84
Esempio4: dispersione molto elevata
Peso (kg)
Fa
Fa*xi
scarto
Scarto quadrato
Scarto quadrato
ponderato
48
6
288,0
-19,7
389,8
2338,7
53
8
424,0
-14,7
217,4
1738,8
55
8
440,0
-12,7
162,4
1299,0
60
9
540,0
-7,7
60,0
539,6
65
9
585,0
-2,7
7,5
67,7
68
15
1020,0
0,3
0,1
1,0
70
13
910,0
2,3
5,1
66,2
74
11
814,0
6,3
39,2
430,7
78
10
780,0
10,3
105,2
1052,1
80
8
640,0
12,3
150,2
1201,9
84
8
672,0
16,3
264,3
2114,4
Totale
105
7113,0
Somma quadrati
10850,1
Media
(kg)
67,7
Varianza
103,3
Dev. Standard (kg
10,2
Grafico4: dispersione molto elevata
Molto dispersa
16
14
Frequenza
12
10
8
6
4
2
0
48
53
55
60
65
68
peso (kg)
70
74
78
80
84
Confronto Range – Deviazione standard - Percentili
www.quadernodiepidemiologia.it
Scarica

Lezione del 3 Dicembre 2002