STATISTICHE
DESCRITTIVE
Parte I
ARGOMENTI
DELLA LEZIONE
• concetti introduttivi
• indici di tendenza centrale
2
concetti introduttivi
Unità statistiche
elementi che costituiscono l’oggetto
dell’osservazione e le cui proprietà vengono
rilevate;
Popolazione
insieme delle unità statistiche oggetto
dell’osservazione;
Variabili
proprietà, caratteristiche, attributi delle unità
di analisi che variano da caso a caso
Modalità
ogni diversa presentazione della variabile
osservata su ciascuna unità di analisi
3
distribuzione di frequenza
Le distribuzioni di frequenza dipendono dal
tipo di dati che vengono raccolti
ESEMPIO
X = { 2, 1, 1, 1, 2, 2, 3, 3, 3, 4, 3, 4,
4, 5, 4, 4, 5, 5, 6, 7, 5, 5, 6, 7, 8}
x 1 2 3 4 5 6 7 8
f
3 3 4 5 5 2 2 1
4
INDICI DI
TENDENZA CENTRALE
Si tratta di statistiche che consentono di
rappresentare, con un unico valore, un insieme
di misure.
SOMMARIO
• Moda
• Mediana
• Media
- media aritmetica
- media geometrica
- media armonica
5
moda
• La moda di un insieme di dati è il
valore che si presenta con la
massima frequenza
• Si indica con il simbolo Mo.
ESEMPIO
Dato l’insieme
A = 2, 3, 4, 5, 6, 8, 7, 8, 5, 8, 11
si ha
Mo = 8
in quanto 8 è il valore che si presenta
più frequentemente.
6
mediana
• Se abbiamo un insieme di dati ordinati,
definiamo mediana il dato che occupa la
posizione centrale nella distribuzione dei
dati stessi
• si indica con il simbolo Mdn o Me
• il calcolo della mediana differisce a
seconda se si hanno dati non raggruppati
in classi oppure dati raggruppati in
classi
7
mediana
Dati non raggruppati
• se n è dispari la mediana è il valore
centrale della serie stessa; il numero
i fornisce la posizione del dato
all’interno della serie con la seguente
formula
n 1
i
2
8
mediana
Dati non raggruppati
ESEMPIO
Consideriamo la serie
A = 3, 5, 9, 12, 15, 17, 18, 23, 24,
31, 34}
abbiamo n = 11 e
11  1
i
6
2
pertanto Mdn = 17, ossia il sesto
dato della serie.
9
mediana
Dati non raggruppati
• se n è pari nessuno dei valori è il
valore centrale della serie stessa; la
mediana si trova fra i due valori
centrali e la sua posizione i sarà
n
n
 i  1
2
2
10
mediana
Dati non raggruppati
ESEMPIO
Consideriamo la serie
A = 1, 5, 8, 12, 23, 35}
abbiamo n = 6 e
6
6
 i  1  3  i  4
2
2
pertanto la mediana è compresa tra 8
e 12, ossia tra il terzo ed il quarto
dato della serie.
11
mediana
Dati non raggruppati
Si tenga presente che, se i dati sono in
scala a intervalli, è possibile definire il
valore esatto della mediana come
valore medio fra i due dati centrali:
Mdn 
x n  x n 1
2
2
2
Nell’Esempio precedente il valore esatto
della mediana sarà :
Mdn = (8 + 12)/2 = 10
12
mediana
Dati raggruppati
Se i dati sono continui, discretizzati
e raggruppati in classi di frequenza
la
mediana
si
calcola
per
interpolazione lineare:
n
 Finf
2
Mdn  Linf 

fm
dove Linf, fm e  sono rispettivamente
limite inferiore, frequenza e ampiezza
della classe mediana; n la numerosità dei
casi e Finf la frequenza cumulata fino al
limite inferiore della classe.
13
Esempio[1]
Nella seguente tabella sono raccolti i dati
relativi al peso dei giocatori di una rosa di una
squadra di calcio (n=23).
Indice i
Peso
in Kg
fi
Fi
1
60 - 65
1
1
2
65 - 70
2
3
3
70 - 75
4
7
4
75 - 80
6
13
5
80 - 85
6
19
6
85 - 90
2
21
7
90 - 95
1
22
8
95 - 100
1
23
Calcolare la mediana della distribuzione data.
Nota: gli intervalli di frequenza si intendono del tipo “primo valore incluso –
secondo valore escluso”.
14
Esempio[2]
• Per prima cosa, identifichiamo la classe
mediana.
posizione mediana 
23  1
 12
2
• Quindi la classe che contiene la mediana è la
quarta ( i=4 ).
• Applicando infine la formula per il calcolo
della mediana otteniamo:
23
7
Mdn  75  2
5  78.75
6
Si può quindi affermare che il 50% dei
calciatori della squadra pesa meno di 78.75 Kg.
15
media aritmetica
• La media aritmetica è una
funzione che associa ad ogni insieme
di n dati un valore numerico pari alla
somma dei dati diviso il numero n
dei dati stessi.
x1  x2  ...  xn
x
n
• il calcolo della media ha procedure
diverse a seconda che i dati siano o
meno raggruppati in classi
16
media aritmetica
Dati non raggruppati
n
x
x
i 1
i
n
ESEMPIO
Dato l’insieme
A = 2, 3, 4, 5, 6, 8, 7, 8, 5, 8
si ha
2  3  ...  8
x
 5 .6
10
17
media aritmetica
Dati raggruppati
se i dati sono raggruppati in una
tabella del tipo
xi
x1
x2
…
xj
…
xn
fi
f1
f2
…
fj
…
fn
la media si calcola con
n
x
fx
i 1
n
i i
f
i 1
i
18
media aritmetica
Dati raggruppati
ESEMPIO
sia data la seguente tabella di frequenza
xi
3
7
10
22
30
fi
2
3
4
2
1
la media sarà
3  2  7  3  ...  30 1
x
 11.75
12
19
Esempio[1]
- dati raggruppati in classi Nella seguente tabella sono raccolti i dati
relativi al peso dei giocatori di una rosa di una
squadra di calcio (n=23).
Indice i
Peso
in Kg
fi
Fi
1
60 - 65
1
1
2
65 - 70
2
3
3
70 - 75
4
7
4
75 - 80
6
13
5
80 - 85
6
19
6
85 - 90
2
21
7
90 - 95
1
22
8
95 - 100
1
23
Calcolare la media della distribuzione data.
Nota: gli intervalli di frequenza si intendono del tipo “primo valore incluso –
secondo valore escluso”.
20
Esempio[2]
- dati raggruppati in classi Per calcolare la media dei dati si dovrà
ricorrere alla seguente formula:
n
x
fx
i vc i
i 1
n
f
i 1
i
Dove xvci rappresenta il valore centrale
della classe i-esima.
(Per valore centrale di una classe di frequenza, si intende
la media tra il limite inferiore e il limite superiore della
classe stessa).
Ad esempio il valore centrale della
seconda classe ( i=2 ) sarà:
xvc2
65  70

 67.5
2
21
Esempio[3]
- dati raggruppati in classi -
Applicando la formula per il calcolo della media
si ottiene:
62.5 1  67.5  2  72.5  4...  97.5 1
x
 78.80
23
Il peso medio dei calciatori e quindi pari 78.8 Kg.
22
media geometrica
• La media geometrica si usa
quando le grandezze si susseguono
in progressione geometrica o per
grandezze che misurano variabili
relative
• per dati non raggruppati si usa
G  n x1  x2  ...  xn  n
n
x
i
i 1
• per dati raggruppati
G  n x1f1  x2f 2  ...  xkf k  n
k
fi
x
i
i 1
23
media armonica
• La media armonica si definisce
con la seguente relazione:
• se i dati non sono raggruppati in
classi
H
n
1 1
1
  ... 
x1 x2
xn

n
n
1

i 1 xi
• se i dati sono raggruppati
f1  f 2  ...  f k
n
H
 k
fk
f1 f 2
fi
  ... 
x1 x2
xk 
i 1 xi
24
Moda, Mediana, Media
- considerazioni finali • Sia la moda, sia la mediana, sia la media
sono dette misure di tendenza centrale,
ossia sono considerate un indice
dell'andamento della parte centrale della
distribuzione; tali indici differiscono fra
loro in vari modi.
• La moda è significante a livello della
scala nominale, la mediana è significante
a livello della scala ordinale e la media a
livello della scala ad intervalli.
25
Scarica

m01