Le rappresentazioni grafiche
Distribuzione di un carattere e sua
rappresentazione:
Distribuzioni unitarie e distribuzioni di
frequenza
Frequenze relative, percentuali, cumulate
Rappresentazione delle distribuzioni
semplici
Grafici a barre o a nastri, Istogrammi
Grafici ad aree, a torta, radar
Cartogrammi e diagrammi cartesiani
Le Distribuzioni Statistiche
Le distribuzioni statistiche descrivono il modo in
cui uno o più caratteri si manifestano
(distribuiscono) in un dato collettivo.
un singolo carattere -> distribuzioni semplici
due caratteri -> distribuzioni doppie
più di due caratteri -> distribuzioni multiple.
L’elenco delle modalità osservate, unità per
unità si chiama distribuzione unitaria.
3/2
Distribuzione di Frequenze assolute
Frequenza assoluta nj
Numero di volte che la modalità di un carattere
viene osservata nel collettivo (N)
Distribuzione di frequenze assolute
Associa alle modalità che può assumere un
carattere X le corrispondenti frequenze assolute
4/2
Frequenza relativa e percentuale
La frequenza relativa fi è la frazione di collettivo che
presenta la modalità j-esima ossia
fj 
nj
N
La frequenza percentuale pj è uguale alla frequenza
relativa moltiplicata per 100.
5/2
Esempio: distribuzione unitaria per il sesso
6/2
Codice intervista
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Sesso
F
F
M
F
M
M
M
F
F
M
F
F
F
F
M
M
F
M
F
F
Distribuz. assoluta, relativa percentuale
Sesso
M
F
Totale
Sesso
M
F
Totale
7/2
Frequenza assoluta
8
12
20
Frequenza
relativa
0,4
0,6
1
Frequenza
percentuale
40%
60%
100%
Frequenza cumulata
La frequenza cumulata di una classe è data dalla
somma della frequenza della classe con quella delle
classi precedenti.
Frequenza assoluta cumulata:
j
Nj   ni
i1
Frequenza relativa cumulata:
j
Fj   fi
8/2
i1
Esempi
9/2
Titolo di studio
frequenza assoluta
frequenza assoluta
cumulata
Lic. Media
Diploma
Laurea
Totale
3
6
11
20
3
9
20
-
Titolo di studio
frequenza relativa
Frequenza percentuale
Lic. Media
Diploma
Laurea
Totale
0,15
0,3
0,55
1
15%
30%
55%
100%
Titolo di studio
Frequenza relativa
cumulata
frequenza percentuale
cumulata
Lic. Media
Diploma
Laurea
Totale
0,15
0,45
1
-
15%
45%
100%
-
Rappresentazioni Grafiche
Grafici a barre o a nastri
4. 000
Grafici ad aree
3. 500
3. 000
2. 500
2. 000
1. 500
1. 000
500
0
19 9 5
19 9 6
19 9 7
19 9 8
19 9 9
2000
2001
Istogramma
Grafici a torta
Gen.
50
Grafici Radar
Dic.
Feb.
40
30
Nov.
Mar.
20
10
0
Ott.
Apr.
Set.
Mag.
Ago.
Giu.
Lug.
Cartogramma
Diagramma
10/2
1995
1996
1997
1998
1999
2000
2001
In particolare…
Grafici a nastri per caratteri qualitativi non ordinati
Grafici a barre per caratteri qualitativi ordinati,
caratteri quantitativi discreti
Grafici ad aree per caratteri quantitativi continui nel
tempo
Istogrammi
per caratteri quantitativi continui
suddivisi in classi
Grafici a torta per caratteri qualitativi non ordinati o
ordinati ciclici
Grafici radar
per caratteri ciclici
Cartogrammi
per serie territoriali
Diagrammi cartesiani per serie storiche
11/2
Esempio di grafico a barre o a nastri
Nord
Centro
Mezzogiorno
0
100
200
300
400
500
m igliaia
600
700
800
60
50
40
30
%
20
10
12/2
0
Sottopeso
Normopeso
Sovrappeso
Obeso
900
Grafici a barre
8863
9. 000
8251
8. 000
7. 000
6119
6. 000
Grafico a barre
tridimensionale
5. 000
4. 000
3. 000
1895
2. 000
1176
1. 000
0
Laur ea
M at ur it à
Qualif .
Pr o f ess.
Licenz a
med ia
Lic.
Element ar e
70
60
50
1971
40
1981
1991
30
2001
20
10
0
Agricoltura
13/2
Industria
Servizi
Grafico a barre
multiple
Istogramma
L’istogramma è un grafico costituito da barre non
distanziate, dove ogni barra possiede un’area
proporzionale alla frequenza della classe.
8
7
6
5
4
nj
3
2
1
0
10
30
50
70
90
Istogramma con classi di uguale ampiezza
Istogramma
Ampiezza diversa delle classi:
h = densità  si ottiene come rapporto tra la
frequenza e l’ampiezza della classe.
classi di età
amp. classe aj
freq. % pj
densità hj
0-5
5
17,0
3,4
5-15
10
40,0
4,0
15-30
15
37,0
2,5
30-35
5
6,0
1,2
15/2
Istogramma
16/2
classi di età
amp. classe aj
freq. % pj
densità hj
0-5
5
17,0
3,4
5-15
10
40,0
4,0
15-30
15
37,0
2,5
30-35
5
6,0
1,2
Dati ordinali
Istogramma a basi uguali
Distribuzione di un campione di pazienti per tipo di sintomo
14
12
10
8
6
4
2
0
assente
lieve
moderato
normale
notevole
Esempio di cartogramma
Cartogramma: Tasso di disoccupazione per
regione, Italia, luglio 2003.
Tasso di disoccupazione per regione
luglio 2003
% forza lavoro.
2-3
3-6
6 - 15
15 - 22
18/2
Esempio di diagramma cartesiano
Serie storica dei Tassi di attività per ripartizione
geografica, 1995-2001, Italia.
69,0
67,0
65,0
NORD
CENTRO
SUD
63,0
61,0
59,0
57,0
1995
19/2
1996
1997
1998
1999
2000
2001
Dati nominali
Diagramma a colonne per un solo
carattere
HPV types in migrants from sub-Saharan Africa
0.12
0.1
0.08
0.06
0.04
0.02
0
16 18 31 33 35 39 45 51 52 53 56 58 66 68 6 11 40 43 44 54 70 74 81 83 84 89
sub-Saharan Africa
Nella versione orizzontale si ottiene il diagramma a barre o a
nastri per un solo carattere
Dati nominali
A colonne appaiate. Anche nella versione a nastri
HPV types in migrants from Eastern Europe and sub-Saharan Africa
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
16 18 31 33 35 39 45 51 52 53 56 58 66 68 6 11 40 43 44 54 70 74 81 83 84 89
Eastern Europe
sub-Saharan Africa
Dati nominali
A colonne composte. Anche nella versione a nastri
HPV types in migrants from Eastern Europe and sub-Saharan
Africa
0,2
0,15
0,1
0,05
0
16 18 31 33 35 39 45 51 52 53 56 58 66 68 6 11 40 43 44 54 70 74 81 83 84 89
Eastern Europe
sub-Saharan Africa
Dati nominali
A colonne percentuali. Anche nella versione a nastri
HPV types in migrants from Eastern Europe and sub-Saharan Africa
100%
80%
60%
40%
20%
0%
16 18 31 33 35 39 45 51 52 53 56 58 66 68 6 11 40 43 44 54 70 74 81 83 84 89
Eastern Europe
sub-Saharan Africa
Dati nominali
•Diagrammi a torta: Sono rappresentazioni grafiche
circolari e non rettangolari.
•Il cerchio viene suddiviso in settori circolari di ampiezza
proporzionale alle frequenze del carattere
•Sono particolarmente adatti a mutabili sconnesse o
rettilinee
America
centr/Sud
6%
Asia
7%
A.subsahariana
38%
E.orientale
41%
A. nord
8%
Per dati quantitativi
Istogramma a basi diverse
Si ottengono una serie di rettangoli contigui con basi diverse e pari
all’ampiezza delle classi e altezza da calcolare in modo che le
frequenze siano proporzionali alle aree dei rispettivi rettangoli.
Ascissa
Ordinata
ampiezza della classe
densità di frequenza
Classi
Frequenza
assoluta
Frequenza
relativa (b)
Ampiezza
classe (c)
Densità freq.
(d)=b/c
<1
27.901
0,351
1
0,351
1-2
16.542
0,208
1
0,208
2-5
19.888
0,250
3
0,083
5-10
8.947
0,112
5
0,022
Grafico
10-20
4.006
0,050
10
0,005
(segue)
20-50
1.781
0,022
30
0,001
50-100
385
0,005
50
0,000
100 e oltre
153
0,002
50
0,000
Totale
79.603
1
Istogramma a basi diverse
Poligono di frequenza
•E’ la linea spezzata che unisce tra loro i valori centrali delle classi
•L’area sottesa dall’istogramma delle frequenze relative ( e dal poligono
di frequenza) è pari ad 1
Grafico per una coppia di caratteri quantitativi
Diagramma di dispersione
E’ un diagramma cartesiano in cui sull’asse delle ascisse (x) e su quello
delle ordinate (y) si riportano i valori assunti da due variabili (X,Y). Ciascun
punto P del piano di coordinate (xi,yi) rappresenta l’unità statistica che ha
come valori delle due variabili le coordinate (xi,yi).
La nuvola dei punti evidenzia la dispersione tra le unità statistiche, ossia la
loro vicinanza o distanza, segno di somiglianza o dissomiglanza.
Es. Relazione tra reddito e consumi delle famiglie nelle regioni italiane nel 2006 (in
miliardi di euro)
180,0
Lombardia
160,0
140,0
spesa
120,0
100,0
Lazio
80,0
60,0
40,0
20,0
0,0
0,0
50,0
100,0
150,0
reddito disponibile
200,0
250,0
Scarica

lezione 2 - rappresentazioni grafiche