SCALA INTERVALLO / A RAPPORTO
STATISTICHE:
Moda - Mediana - Media
NdE – Quartili – Quantili – Range – Varianza –
Deviazione standard
Difficoltà nel riassumere i dati a causa di un numero di
categorie elevato (nel caso di valori discreti NdE>18) o
perché la variabile è di tipo continuo.
Raccogliere i valori in Intervalli di Classe
SCALA INTERVALLO / A RAPPORTO
• Possibili rapporti di uguaglianza (livello nominale).
• Possibili rapporti di ordine (livello ordinale).
• Esiste un’unità di misura (intervallo) che permette di
stabilire la distanza fra 2 categorie.
• Per definire le statistiche bisogna definire se le variabili
sono di tipo discreto o continuo.
STATISTICHE:
• Moda - Mediana – Media
• Quartili – Quantili
• NdE –– Range – Varianza – Deviazione standard
Tre misure di tendenza centrale
MEDIA
MEDIANA
MODA
Indici di tendenza centrale
5
4,5
4
3,5
Casi
Casi
3
2,5
6
12
5,5
11
5
10
4,5
9
4
8
3,5
7
3
6
2,5
f
2
f
5
2
4
1,5
1,5
3
1
1
2
0,5
1
0,5
0
0
1
2
3
4
5
Voto
6
7
8
9
0
1
2
3
4
5
6
7
8
9
Voto
Qual è il punto centrale della distribuzione?
1
2
3
4
5
Voto
6
7
8
9
Indici di tendenza centrale:
la media aritmetica
Maritmetica =  xi / n
M aritmetica Ponderata
Xf

X=
n
Indici di tendenza centrale:
la media aritmetica
Allora potremmo estrapolare una grandezza M tale che
Xtot = M + M + M + ….. + M
Per cui
M + M + M + ….. + M = x1 + x2 + x3 +……+ xn
Da qui:
nM =  xi
 Maritmetica=  xi / n
La media
• La media di una distribuzione è la somma
dei valori osservati divisa dal numero delle
osservazioni
=
X
N
X=
X
n
Popolazione
Campione
N: La grandezza della
popolazione
n: La grandezza del
campione
La media
Codice_studente
(25  25  25  26  26  27  27  29  29  30)
10
269
=
= 26,9
10
X=
7
8
9
3
5
1
6
10
4
2
Voto
25
25
25
26
26
27
27
29
29
30
Indici di tendenza centrale:
la media aritmetica
Perché si chiama così?
Essa si chiama aritmetica perché se applicata ad una progressione
aritmetica, costituita da un numero dispari di elementi, ne costituisce
l’elemento centrale.
Esempio: 13, 16, 19, 22, 25
Media = (13+16+19+22+25)/5= 19 (valore centrale della progressione)
Indici di tendenza centrale:
la media aritmetica
Il concetto di SCARTO:
Data una successione di dati x1, x2, x3, x4, ….. , xn si chiamano scarti dalla
media i valori pari a
l = x i- M
(scarto semplice dalla media)
Indici di tendenza centrale:
la media aritmetica
PROPRIETA’ IMPORTANTE DELLA MEDIA ARITMETICA
DIMOSTRAZIONE:
Indici di tendenza centrale:
la media aritmetica ponderata
Media aritmetica ponderata
Quando i dati statistici si ripetono allora succede che
x1, x1, x1, x1
n1 volte
Valori
Frequenze
x1
x2
x3
……
xi
n1
n2
n3
…….
ni
x2, x2, x2, x2, x2, x2
n2 volte
Xf  Xf

X=
=
n
f
Indici di tendenza centrale:
la media aritmetica ponderata
Esempio: Media aritmetica di voti di esami
Voti di esame: 18; 22: 22; 24; 24; 24; 25; 25; 25;25; 27; 27.
Potrei fare:
Media aritmetica = (18+22+22+24+24+24+25+25+25+25+27+27) / 12 = 24
Però è più semplice e veloce fare:
Media aritmetica ponderata = (18 + 222 +243+ 254+ 272) / 12 = 24
Indici di tendenza centrale:
la media aritmetica ponderata
Media aritmetica ponderata per dati continui suddivisi in
intervalli di classi.
La media
X = 5,21
5
4,5
4
3,5
3
Casi
• La media è una buona
misura di tendenza di
misura centrale per le
distribuzioni
“normalmente”
distribuite
2,5
f
2
1,5
1
0,5
0
1
2
3
4
5
Voto
6
7
8
9
La media
La media è una misura
inadatta
per
le
distribuzioni
che
contengono un numero
esiguo di valori estremi
Media = 88.72
MEDIANA
MEDIE DI POSIZIONE
MODA
La moda per variabili intervallari
La moda il valore x cui
corrisponde la massima
frequenza.
Esistono
distribuzioni
di
frequenza che, oltre
alla moda principale,
hanno una o più mode
secondarie.
La mediana per variabili intervallari discreti
Mediana: data una successione ordinata crescente (che va dal valore più
piccolo a quello più grande) si chiama Mediana, o termine centrale, quel
valore che è preceduto o seguito dallo stesso numero di dati.
Determinazione della mediana per i valori discreti di x.
Numero dei valori DISPARI:
x1, x2, x3, x4, x5, x6, x7 Mdn = x4
Numero dei valori PARI:
per convenzione è definita mediana la semisomma dei due termini
centrali.
x1, x2, x3, x4, x5, x6, x7,x8 Mdn= (x4+x5)/2
La mediana per variabili intervallari discreti
Mediana: data una successione ordinata crescente (che va dal valore più piccolo a
quello più grande) si chiama Mediana, o termine centrale, quel valore che è
preceduto o seguito dallo stesso numero di dati.
Determinazione della mediana per i valori discreti di x.
x1, x2, x3, x4, x5, x6, x7
Mdn = x4
Esempio:
Valori: 18, 21, 3, 7, 35.
Serie ordinata: 3, 7, 18, 21, 35.
Mediana: 18.
Questo è valido quando il numero dei termini è dispari per cui si può scrivere:
N = 2n + 1 = n + 1 + n
E quindi il termine mediano è n + 1.
La mediana per variabili intervallari discreti
Qualora il numero dei termini sia pari:
N= n + n
Per cui non esiste un termine mediano, ma per convenzione è definita mediana la
semisomma dei due termini centrali.
Esempio.
Valori: 23, 35, 11, 7
Serie ordinata: 7, 11, 23, 35
Mediana = (11+23) / 2 = 17
La mediana per variabili intervallari continui
(cenni)
Per calcolare indici di posizione con variabili intervallari continue si usa
l’interpolazione lineare: le ferquenze che cadono in un intervallo si
considerano “uniformemente distribuite” all’interno dell’intervallo. Ogni
valore xi che cade all’interno dell’intervallo occupa uno spazio pari a 1/fi.
X
F
Fc
Lim.inf
Lim.sup
A
1-3
6
6
0.5
3.5
B
4-6
6
12
3.5
6.5
C
7-9
8
20
6.5
9.5
D
10-12
7
27
9.5
12.5
E
13-15
3
30
12.5
15.5
N
30
La mediana si trova in posizione 15
ossia in classe C (tra la 13ima e la
20ima posizione). La classe C è
costituita da 8 elementi per cui
l’ampiezza di ogni elemento è pari a
1/8 (1/fi) che è 0.375.
La posizione 15 è la terza all’interno
dell’intervallo
(15-12) per cui:
0.375+0.375+0.375=1.125.
Questo
valore va sommato al limite inferiore
della classe C:
6.5 + 1.125 = 7.625 - Posizione 15 o
MEDIANA
La moda per variabili intervallari
La moda il valore x cui
corrisponde la massima
frequenza.
Esistono
distribuzioni
di
frequenza che, oltre
alla moda principale,
hanno una o più mode
secondarie.
Confronto Media – Mediana – Moda
Confronto Media – Mediana – Moda
www.quadernodiepidemiologia.it
Scarica

Media aritmetica