Corso di
Analisi Statistica per le Imprese
Sintesi della distribuzione di un
carattere: indici di posizione
Prof. L. Neri
a.a. 2014-2015
1
Indice di tendenza centrale:
la media aritmetica
Si può calcolare solo per variabili quantitative
È una media analitica cioè è funzione di tutti i valori
della distribuzione
E’ il punto di equilibrio o baricentro della
distribuzione
E’ l’indice più intuitivo per sintetizzare un insieme di
valori
2
Calcolo della media dei ricavi
• Conoscendo i ricavi dei 9 punti
vendita dell’azienda, posso calcolare
il ricavo medio, un unico valore
rappresentativo dell’intero insieme
• Si sommano i ricavi di tutti i punti
vendita e il risultato si divide per il
numero delle osservazioni (n=9)
3
Calcolo della media
Punti
vendita
Ricavi
1
350
2
200
3
600
4
500
5
270
6
180
7
205
8
340
9
280
Somma dei ricavi (Intensità totale del
carattere) = 350 + 200 + 600 + 500 + 270 +
180 + 205 + 340 + 280 = 2925
Media dei ricavi = 2925:9=325
9
1
8
2
7
L’intera torta
rappresenta la somma
dei ricavi di tutti i
punti vendita
3
6
5
4
La singola fetta
rappresenta la media dei
ricavi
Σ=2925
4
Formula della media
100
200
300
400
500
600
700
Media = 325
• Dati n valori osservati x1, x2,…, xn di un carattere
quantitativo X
1
1 n
xa  (x1  x 2  ...  xn )   xi
n
n i1
5
Effetto dei valori estremi
Se il valore estremo fosse 800 invece di 600
la media aumenterebbe
(il punto di equilibrio si sposta verso destra)
100
200
300
400
500
600
700
800
Media = 347,22
La media aritmetica risente fortemente dei valori estremi
6
Media di una distribuzione di
frequenza
Addetti
(valori xj)
Numero punti
vendita
(frequenze nj)
xj*nj
3
2
3*2=6
4
1
4*1=4
6
3
6*3=18
7
1
7*1=7
10
2
10*2=20
K
x 
x
j 1
K
j
K
nj
 nj

x
j 1
j
n
K
n
j1
j
K
x
j1
nj

j
n9
 nj  55
55
 6,11
9
j 1
7
Media di una distribuzione di
frequenza con classi di valori
Classi di
superficie
(in ettari)
Numero
aziende
cj*nj
(nj)
Valore
centrale
classi (cj)
0-1
120
0,5
60
1-2
160
1,5
240
2-3
220
2,5
550
3-5
212
4
848
5-10
205
7,5
1537,5
10-20
110
15
1650
20-40
65
30
1950
40-80
21
60
1260
n
K
n
j1
j
 1113
K
K
c n
j1
j
j
xa 
c n
j 1
j
j

n
8095,5

 7,27
1113
La superficie
media di una
azienda agricola
è di 7,27 ettari
 8095,5
Fonte: Borra-Di Ciaccio, pag. 71
8
Media ponderata
• Uno studente ha sostenuto i seguenti
esami del I anno del corso di laurea di EA.
• Come calcola la media dei voti?
N.
Esame
voto
cfu
1 Economia Aziendale
27
9
2 Ist. diritto pubblico
3 Metodi di matematica applicata
4 Macroeconomia
22
25
20
6
9
6
5 Ragioneria
28
9
9
Media ponderata: calcolo
N.
Esame
1
2
3
4
5
voto
(xi)
27
cfu
(pi)
9
voto*cfu
(xi*pi)
243
22
25
20
6
9
6
132
225
120
28
9
252
n
pi

i1
n
xa 
xipi

i1
n
pi

i1

972
 24,92
39
 39
n
xipi

i1
 972
Il voto medio (su 39 cfu) è pari a
24,92
10
Media ponderata
i due voti più bassi pesano di meno nel calcolo
della media perché sono due esami da 6 cfu
18
19
20
21
22
23
24
25
26
27
28
29
30
Media ponderata = 24,92
11
Mediana
E’ un indice di posizione
•Può essere calcolata per caratteri che
siano almeno ordinabili (qualitativi su
scala ordinale o quantitativi)
•E’ un indice indicato per distribuzioni che
presentano valori estremi (molto grandi o
molto piccoli).
•E’ un particolare quantile (2° quartile, 50°
percentile)
•
12
Mediana
• È il valore che occupa la posizione
centrale nell’insieme ordinato di tutti i
valori x  x   x   ...  x   x
min
1
Tra x(1) e Me è
contenuto il 50%
dei valori
X(1)
2
n
max
Tra Me e x(n) è
contenuto il restante
50% dei valori
Me
X(n)
13
Mediana da una distribuzione di
frequenza (con le freq. rel. cum.)
Addetti
(xj)
Numero
punti vendita
(nj)
Frequenze
cumulate
Nj
Frequenze
rel cum.
Fj
3
2
2
0,22
4
1
3
0,33
6
3
6
0,67
7
1
7
0,78
10
2
9
1,00
Sulla colonna delle frequenze relative cumulate si
individua la prima Fj che è uguale o maggiore di 0,5
Il corrispondente valore xj è la mediana della distribuzione
Mediana=6
14
Mediana di una distribuzione di
frequenza con classi di valori
Classi di
superficie
(in ettari)
Numero
aziende
Freq.
cum.
Freq. rel.
cum.
(nj)
(Nj)
(Fj)
0-1
120
120
0,108
1-2
160
280
0,252
2-3
220
500
0,449
3-5
212
712
0,640
5-10
205
917
0,824
10-20
110
1027
0,923
20-40
65
1092
0,981
Oltre 40
21
1113
1,000
15
La scelta tra media e mediana
Fonte: Walter Kramer (2009), Le bugie della statistica, Nimesis
16
Quartili
• Sono 3 indici di posizione, Q1 Q2 e Q3
xmin  x1  x2   ...  xn  xmax
Tra x(1) e Q1 è
contenuto il 25% dei
valori (più bassi)
X(1)
Tra Q1 e Q2 è
contenuto il 25%
dei valori
Q1
Tra Q3 e x(n) è
contenuto il 25% dei
valori (i più alti)
Q2=Me
Q3
X(n)
Tra Q2 e Q3 è
contenuto il
25% dei valori
17
Primo quartile Q1
• Q1 Primo quartile: è preceduto dal 25% dei
termini (e seguito dal 75%)
• Q1 è il primo valore xi in corrispondenza del
quale la frequenza cumulata relativa
Fj  0,25
18
Terzo quartile Q3
• Q3 Terzo quartile: è preceduto dal 75%
dei termini (e seguito dal 25%)
• Q3 è il primo valore xi in corrispondenza
del quale la frequenza cumulata relativa
Fj  0,75
19
Calcolo dei quartili
Ricavi
Ricavi
(valori
ordinati)
Freq.
cum. rel.
350
X(1)=180
1/9=0,11
200
X(2)=200
2/9=0,22
600
X(3)=205
3/9=0,33
500
X(4)=270
4/9=0,44
270
X(5)=280
5/9=0,56
180
X(6)=340
6/9=0,67
205
X(7)=350
7/9=0,78
340
X(8)=500
8/9=0,89
280
X(9)=600
9/9=1
La prima Fi ad essere maggiore
o uguale a 0,25 è la terza
Q1  x(3)  205
Il 25% dei punti vendita con i ricavi
più bassi registrano ricavi che non
superano 205 mila euro
La prima Fi ad essere maggiore o
uguale a 0,75 è la settima
Q3  x(7)  350
Per essere nel 25% dei
punti vendita con i ricavi
più alti si devono superare
350 mila euro di ricavi
20
Percentili
Sono quei valori che dividono la distribuzione
in cento parti di uguale numerosità
Mediana=50-esimo percentile
Q3= 75-esimo percentile
P10 = decimo percentile: lascia alla sua
sinistra il 10% dei valori
P90 = novantesimo percentile: lascia alla sua
destra il 10% dei valori
21
Moda
• È un indice di posizione
• Può essere calcolata per qualsiasi tipo di
carattere
• E’ la modalità più frequente
• In una distribuzione di frequenza con classi
di valori: è la modalità con più alta densità di
frequenza
22
Moda di un insieme di valori
Punti
vendita
Genere
respons.
1
maschio
2
maschio
3
femmina
4
femmina
5
maschio
6
maschio
7
maschio
8
femmina
9
femmina
La modalità del carattere
“Genere del responsabile”
che si ripete più volte (5
volte ) è “maschio”
Moda=“maschio”
La maggioranza dei punti
vendita ha come
responsabile un uomo
23
Moda di una distribuzione di
frequenza
Addetti
(valori
distinti)
Numero
punti
vendita
(frequenze)
3
2
4
1
6
3
7
1
10
2
La frequenza maggiore è 3
La modalità del carattere
“Numero di addetti” cui è
associata la frequenza
maggiore è 6
Moda=6
La maggioranza dei punti
vendita ha un numero di
addetti pari a 6
24
Moda di una distribuzione di
frequenza con classi di valori
Classi di
superficie
(in ettari)
Numero
aziende
Ampiezza
classe
Densità di
freq
(nj)
(aj)
(dj)
0-1
120
1
120
1-2
160
1
160
2-3
220
1
220
3-5
212
2
106
5-10
205
5
41
10-20
110
10
11
20-40
65
20
3,25
40-80
21
40
0,525
In presenza di
classi di ampiezza
diversa,
la classe modale è
quella che ha la
densità di
frequenza
maggiore
La classe modale è 2-3
25
Moda
• Può non esistere
• Può non essere unica
• Può essere una modalità “poco
rappresentativa” del fenomeno
26
La scelta tra
media, moda e
mediana
Fonte: Magnello e Van Loon (2011), La statistica a fumetti,
Raffaello Cortina Editore
27
Calcolo dei valori medi in base
al tipo di carattere
Caratteri
Quantitativi
Qualitativi
ordinati
Media

Mediana


Moda


Qualitativi
sconnessi

28
Scarica

Rip3