Corso di
Analisi Statistica per le Imprese
Rappresentazione dei dati
Prof. L. Neri
a.a. 2014-2015
1
La rappresentazione dei dati
Il manager è consapevole che presentare le
informazioni raccolte in forma di matrice dei
dati non ha senso
È utile invece rappresentarle in forma
organizzata e sintetica allo scopo di:
• evidenziarne le caratteristiche principali
• facilitarne la lettura e l’interpretazione
Rappresentazione tabellare
Rappresentazione grafica
2
Rappresentazioni tabellari
Distribuzione di frequenze
Distribuzione di quantità
Serie storica
Serie territoriale
3
Distribuzione di frequenze
Organizzazione dei dati mediante una tabella
risultante dalle operazioni di:
• Classificazione
• Conteggio
Ad ogni modalità di un carattere (qualitativo
o quantitativo) si fa corrispondere il numero
di volte che esso si presenta nel collettivo (la
sua frequenza assoluta)
4
Distribuzione di frequenze
Punti
vendita
Addetti
1
6
2
6
3
10
4
10
5
7
6
3
7
3
8
6
9
4
Addetti
(valori
distinti)
Quanti
Quanti
Quanti
Quanti
Quanti
Numero punti
vendita
(frequenze)
3
2
4
1
6
3
7
1
10
2
sono
sono
sono
sono
sono
i
i
i
i
i
punti
punti
punti
punti
punti
vendita
vendita
vendita
vendita
vendita
con
con
con
con
con
3 addetti?
4 addetti?
6 addetti?
7 addetti?
10 addetti?
2
1
3
1
2
5
Distribuzione semplice di frequenze
X
x1
Freq.
n1
x2
n2
…
xj
…
nj
…
xk
Totale
…
nk
n
x1, x2,…,xK
sono le modalità
distinte che
assume il
carattere X nel
collettivo di n
unità esaminato
La somma delle frequenze
assolute è uguale al numero
totale di unità del collettivo
K
n
j1
j
n1, n2,…,nK
sono le freq.
assolute
associate a
ciascuna
modalità
n1 indica
quante unità
presentano la
modalità x1 del
carattere X
n
6
Frequenze relative e frequenze
relative percentuali
La frequenza relativa è data dal rapporto
tra frequenza assoluta e numero totale di
unità del collettivo
nj
per la j-esima modalità fj 
K
n
Vale che  fj  1
j1
La frequenza relativa percentuale altro non
è che la frequenza relativa moltiplicata per
K
100
nj
p  100
p j  fj  100 
n
 100

j1
j
7
Calcolo delle frequenze relative e
percentuali
Addetti
Frequenze
assolute
Frequenze
relative
Frequenze
rel. perc.
3
2
2/9=0,22
22,2
4
1
1/9=0,11
11,1
6
3
3/9=0,34
33,3
7
1
1/9=0,11
11,1
10
2
2/9=0,22
22,2
Tot
n=9
1,00
100,0
La somma delle freq.
rel. perc. è pari a
100 (in questo caso
è stata arrotondata
perché risultava pari
a 99,9)
I punti vendita con 3 addetti sono 2 (freq. ass.)
Rappresentano il 22% del totale dei punti vendita
8
Perché si calcolano le frequenze
relative e percentuali?
Le frequenze assolute dipendono da n
Quindi non possono essere utilizzate per
effettuare confronti tra collettivi con diversa
numerosità
Al contrario, le frequenze relative e quelle
percentuali sono numeri puri
Si utilizzano per confrontare distribuzioni di
frequenza riferite a collettivi di diversa
numerosità
9
Esempio di utilizzo
delle freq. rel. perc.
Supponiamo che il manager dell’azienda
debba valutare se la distribuzione dei punti
vendita per numero di addetti in Campania è
diversa da quella di una regione spagnola, la
Catalogna
Si sospetta che in Campania ci siano più
punti vendita con pochi addetti rispetto alla
Catalogna
10
Confronto tra distrib. di frequenze
Campania
Catalogna
Addetti
Freq
ass.
Addetti
Freq.
ass.
3
2
3
4
4
1
4
4
6
3
5
11
7
1
6
15
10
2
8
8
Tot
n=9
10
6
Tot
n=48
Confrontando le freq. ass., si conclude che il numero dei punti
vendita con 3 addetti è minore in Campania rispetto alla Catalogna
(2 contro 4) e lo stesso vale per i p.v. con 4 addetti (1 contro 4)
Questo risultato sembra ribaltare le supposizioni iniziali
Ma il confronto fatto in questo modo è errato!
11
Confronto tra distrib. di frequenze
Campania
Catalogna
Addetti
Freq
ass.
Freq. rel.
perc.
Addetti
Freq.
ass.
Freq. rel.
perc.
3
2
22,2
3
4
8,3
4
1
11,1
4
4
8,3
6
3
33,3
5
11
22,9
7
1
11,1
6
15
31,3
10
2
22,2
8
8
16,7
Tot
n=9
100
10
6
12,5
Tot
n=48
100,0
In termini di freq. rel. perc., i 2 p.v. con 3 addetti costiituiscono il
22,2 % del totale dei p.v. in Campania e solo l’8,3% del totale dei
p.v. in Catalogna
L’incidenza dei p.v. con pochi addetti è maggiore in Campania,
come si supponeva
12
Frequenze cumulate
Addetti
(valori
distinti)
Numero punti frequenze
vendita
cumulate
(frequenze)
3
2
2
4
1
3
6
3
6
7
1
7
10
2
9
Le freq. cum.
si definiscono
solo se le
modalità del
carattere sono
ordinate
Quanti sono i punti vendita con al max 3 addetti?
Quanti sono i punti vendita con al max 4 addetti?
2
2+1
Quanti sono i punti vendita con al max 6 addetti?
Quanti sono i punti vendita con al max 7 addetti?
2+1+3
2+1+3+1
Quanti sono i punti vendita con al max 10 addetti?
2+1+3+1+2
13
Frequenze cumulate
Addetti
Freq.
ass. nj
Freq. ass. Freq. rel. Freq. perc.
cum. Nj
cum. Fj
cum. Pj
3
2
2
0,22
22,2
4
1
3
0,33
33,3
6
3
6
0,67
66,6
7
1
7
0,78
77,7
10
2
9
1,00
100,0
Dalla lettura delle freq. perc. cum. Pj,
si ricava che il 66,6% dei punti vendita (cioè i 2/3)
ha un numero di addetti inferiore o uguale a 6
14
Distribuzione in classi di valori
Una variabile quantitativa continua
usualmente viene rappresentata mediante
una tabella di frequenze associate a classi
di valori
• Le classi sono formate da gruppi contigui di
modalità
• Le classi non devono sovrapporsi
• Una modalità deve appartenere ad una
sola classe
15
Distribuzione di frequenze in classi
della variabile Ricavi
Ricavi (valori
ordinati)
180
200
205
270
280
340
350
500
Per ricavare la corrispondente
distribuzione in classi di valori, potremmo
pensare di definire classi tali che:
• abbiano più o meno la stessa frequenza
• abbiano più o meno la stessa ampiezza
• corrispondano a livelli del fenomeno
che possiamo individuare come (basso,
medio, alto) oppure (basso, alto) avendo
in mente specifiche soglie
600
16
Distribuzione di frequenze in classi
della variabile Ricavi
Ricavi (valori
ordinati)
180

200

205

270

280

340

350

500

600

Scelgo di formare 3 classi di ricavi:
-Fino a 250 (incluso)
-Da 250 (escluso) a 350 (incluso)
-Oltre 350
Classi di
ricavo
Freq.
ass.
(0 – 250]
3
(250 – 350]
4
Oltre 350
2
Qual è la frequenza associata alla
prima classe?
Quanti sono i p.v. i cui ricavi sono
al massimo 250?
17
Distribuzione di quantità
Organizzazione dei dati mediante una tabella
risultante dalle operazioni di:
• Classificazione
• Misurazione di un fenomeno
Ad ogni modalità di un carattere si fa
corrispondere una misurazione (per es. una
somma o una media) di un carattere
quantitativo
18
Esempio distribuzione di quantità
Punti
vendita
Addetti
Ricavi
1
6
350
2
6
200
3
10
600
4
10
500
5
7
6
Classifico in base agli addetti
Per ogni modalità del
carattere “Addetti” calcolo la
somma e la media dei ricavi
Addetti
Ricavo
totale
Ricavo
medio
270
3
385
192,5
3
180 
4
280
280
7
3
205 
6
890
296,7
8
6
340
7
270
270
9
4
280
10
1100
550
Come si ricava la quantità 385 (ricavo totale) in
corrispondenza del numero di addetti pari a 3?
Dalla somma di 180 e 205, i ricavi dei p.v. che hanno 3 addetti
19
Serie storica
Tabella che ad ogni riferimento temporale
(ad esempio, l’anno, il mese, il giorno)
associa l’ammontare del carattere X in
esame
Evidenzia la dinamica di un certo fenomeno
nel tempo
Esempi:
il valore aggiunto di un’azienda negli ultimi
cinque anni
l’indice S&P/Mib alla Borsa di Milano
nell’ultima settimana
20
Serie storica (esempio)
Facendo riferimento
al nostro esempio
base, la banca può
richiedere il R.O.
(risultato operativo)
di ogni punto vendita
degli ultimi quattro
anni
Per ogni punto
vendita si ha una
serie storica del tipo:
anni
R.O.
(migliaia euro)
2004
85
2005
120
2006
215
2007
161
21
Serie territoriale
Tabella che ad ogni unità territoriale
(ad esempio paese, regione, distretto
industriale)
fa corrispondere l’ammontare del carattere X
in esame
Mostra la distribuzione del fenomeno in
rapporto al territorio
Esempi:
il tasso di inflazione nei paesi UE
le emissioni di CO2 nei capoluoghi di regione
italiani
22
Serie territoriale (esempio)
Valori del PIL pro-capite in alcuni Paesi
(Dati del Fondo Monetario Internazionale 2007)
Paese
PIL nominale
(in dollari USA)
Italia
Spagna
Regno Unito
31.802
27.951
39.681
Svezia
43.190
23
Esercizi di riepilogo
Esercizio 1.
Supponete di disporre dei seguenti dati del
fatturato in migliaia di euro di un’azienda
120 123 221 135 146 123 167 123 123 121
135 136 136 221 222 223 167 135 135 121
Costruire la tabella di frequenza in classi.
• Decidete di costruire tre classi
24
Distribuzione in classi del fatturato
Classi di
fatturato
nj
fj
pj
(110-130]
7
0.35
35%
(130-200]
9
0.45
45%
(200+
4
0.20
20%
25
Rappresentazioni grafiche
Grafici a barre o a nastri
Grafici a torta
Diagrammi cartesiani (per serie storiche)
Cartogrammi (per serie territoriali)
Istogrammi
26
Grafici a barre o a nastri
Generalmente si utilizzano per caratteri
qualitativi e quantitativi discreti
Ad ogni modalità corrisponde un nastro o
una barra
Le altezze delle barre o le larghezze dei
nastri sono proporzionali alla frequenza o alla
quantità (totale, media, proporzione di un
carattere) che si vuole rappresentare
Si usano anche per evidenziare graduatorie
tra Paesi, regioni, città,…
27
Grafico a barre
28
Grafico a nastri
29
Grafico a barre
30
Grafici a torta
Si utilizzano per caratteri qualitativi per
evidenziare la composizione di un fenomeno
A ciascuna modalità del carattere
corrisponde una fetta della torta
proporzionale alla corrispondente frequenza
o intensità
Generalmente il numero delle modalità è
limitato
31
Grafici a torta
32
Grafici a torta
33
Grafici a torta
34
Grafici di serie temporali
Sono diagrammi cartesiani
In ascissa viene riportato il tempo di
riferimento (anno, mese, giorno) e in
ordinata il carattere osservato
35
Grafici di serie temporali
36
Grafici di serie territoriali
Utilizzano una mappa geografica
Ad ogni area territoriale (provincia, regione,
nazione,…) corrisponde una colorazione
differente a seconda della frequenza o della
quantità del fenomeno
Una legenda aiuta la lettura del grafico,
attribuendo ad ogni colore un valore o una
classe di valori
37
Grafici di serie territoriali
38
Grafici di serie territoriali
39
Istogramma per caratteri
quantitativi continui
Composto da una serie di rettangoli
affiancati, uno per ogni classe di valori
Rappresentazione areale:
L’area di ogni rettangolo deve essere uguale
(o proporzionale) alla frequenza di ciascuna
classe di valori in modo che l’area
complessiva di tutti i rettangoli sia uguale (o
proporzionale) alla numerosità n del collettivo
40
Istogramma per caratteri
quantitativi continui
classe
frequenza
ampiezza
classe aj
densità di
frequenza hj
…
…
…
…
(xj; xj+1)
…
nj
…
xj+1 - xj
…
nj/(xj+1 – xj)
…
Base del rettangolo = Ampiezza della classe (in
ascissa)
Altezza del rettangolo = Densità di frequenza
(in ordinata)
41
Costruzione dell’istogramma 1
Classi di
superficie
(in ettari)
Numero
aziende
Ampiezza
classe
Densità di
freq
(nj)
(aj)
(hj)
0-1
120
1
120
1-2
160
1
160
2-3
220
1
220
3-5
212
2
106
5-10
205
5
41
10-20
110
10
11
20-40
65
20
3,25
40-80
21
40
0,525
Base del rettangolo
Altezza del rettangolo
42
Istogramma
dj
5
10
20
40
80
Superficie
43
Istogramma per le prime 5 classi
(precedente esempio)
220
Classi di
superf.
Freq.
Ampiezza
(aj)
Dens di freq
(hj)
0-1
120
1
120
1-2
160
1
160
2-3
220
1
220
160
3-5
212
2
106
120
106
5-10
205
5
41
hj
212 è l’area
di questo
rettangolo
41
0
1
2
3
5
10
Superficie
44
Scarica

Rip2 - Italiano