Le rappresentazioni grafiche Distribuzione di un carattere e sua rappresentazione: Distribuzioni unitarie e distribuzioni di frequenza Frequenze relative, percentuali, cumulate Rappresentazione delle distribuzioni semplici Grafici a barre o a nastri, Istogrammi Grafici ad aree, a torta, radar Cartogrammi e diagrammi cartesiani Le Distribuzioni Statistiche Le distribuzioni statistiche descrivono il modo in cui uno o più caratteri si manifestano (distribuiscono) in un dato collettivo. un singolo carattere -> distribuzioni semplici due caratteri -> distribuzioni doppie più di due caratteri -> distribuzioni multiple. L’elenco delle modalità osservate, unità per unità si chiama distribuzione unitaria. 3/2 Distribuzione di Frequenze assolute Frequenza assoluta nj Numero di volte che la modalità di un carattere viene osservata nel collettivo (N) Distribuzione di frequenze assolute Associa alle modalità che può assumere un carattere X le corrispondenti frequenze assolute 4/2 Frequenza relativa e percentuale La frequenza relativa fi è la frazione di collettivo che presenta la modalità j-esima ossia fj nj N La frequenza percentuale pj è uguale alla frequenza relativa moltiplicata per 100. 5/2 Esempio: distribuzione unitaria per il sesso 6/2 Codice intervista 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Sesso F F M F M M M F F M F F F F M M F M F F Distribuz. assoluta, relativa percentuale Sesso M F Totale Sesso M F Totale 7/2 Frequenza assoluta 8 12 20 Frequenza relativa 0,4 0,6 1 Frequenza percentuale 40% 60% 100% Frequenza cumulata La frequenza cumulata di una classe è data dalla somma della frequenza della classe con quella delle classi precedenti. Frequenza assoluta cumulata: j Nj ni i1 Frequenza relativa cumulata: j Fj fi 8/2 i1 Esempi 9/2 Titolo di studio frequenza assoluta frequenza assoluta cumulata Lic. Media Diploma Laurea Totale 3 6 11 20 3 9 20 - Titolo di studio frequenza relativa Frequenza percentuale Lic. Media Diploma Laurea Totale 0,15 0,3 0,55 1 15% 30% 55% 100% Titolo di studio Frequenza relativa cumulata frequenza percentuale cumulata Lic. Media Diploma Laurea Totale 0,15 0,45 1 - 15% 45% 100% - Rappresentazioni Grafiche Grafici a barre o a nastri 4. 000 Grafici ad aree 3. 500 3. 000 2. 500 2. 000 1. 500 1. 000 500 0 19 9 5 19 9 6 19 9 7 19 9 8 19 9 9 2000 2001 Istogramma Grafici a torta Gen. 50 Grafici Radar Dic. Feb. 40 30 Nov. Mar. 20 10 0 Ott. Apr. Set. Mag. Ago. Giu. Lug. Cartogramma Diagramma 10/2 1995 1996 1997 1998 1999 2000 2001 In particolare… Grafici a nastri per caratteri qualitativi non ordinati Grafici a barre per caratteri qualitativi ordinati, caratteri quantitativi discreti Grafici ad aree per caratteri quantitativi continui nel tempo Istogrammi per caratteri quantitativi continui suddivisi in classi Grafici a torta per caratteri qualitativi non ordinati o ordinati ciclici Grafici radar per caratteri ciclici Cartogrammi per serie territoriali Diagrammi cartesiani per serie storiche 11/2 Esempio di grafico a barre o a nastri Nord Centro Mezzogiorno 0 100 200 300 400 500 m igliaia 600 700 800 60 50 40 30 % 20 10 12/2 0 Sottopeso Normopeso Sovrappeso Obeso 900 Grafici a barre 8863 9. 000 8251 8. 000 7. 000 6119 6. 000 Grafico a barre tridimensionale 5. 000 4. 000 3. 000 1895 2. 000 1176 1. 000 0 Laur ea M at ur it à Qualif . Pr o f ess. Licenz a med ia Lic. Element ar e 70 60 50 1971 40 1981 1991 30 2001 20 10 0 Agricoltura 13/2 Industria Servizi Grafico a barre multiple Istogramma L’istogramma è un grafico costituito da barre non distanziate, dove ogni barra possiede un’area proporzionale alla frequenza della classe. 8 7 6 5 4 nj 3 2 1 0 10 30 50 70 90 Istogramma con classi di uguale ampiezza Istogramma Ampiezza diversa delle classi: h = densità si ottiene come rapporto tra la frequenza e l’ampiezza della classe. classi di età amp. classe aj freq. % pj densità hj 0-5 5 17,0 3,4 5-15 10 40,0 4,0 15-30 15 37,0 2,5 30-35 5 6,0 1,2 15/2 Istogramma 16/2 classi di età amp. classe aj freq. % pj densità hj 0-5 5 17,0 3,4 5-15 10 40,0 4,0 15-30 15 37,0 2,5 30-35 5 6,0 1,2 Dati ordinali Istogramma a basi uguali Distribuzione di un campione di pazienti per tipo di sintomo 14 12 10 8 6 4 2 0 assente lieve moderato normale notevole Esempio di cartogramma Cartogramma: Tasso di disoccupazione per regione, Italia, luglio 2003. Tasso di disoccupazione per regione luglio 2003 % forza lavoro. 2-3 3-6 6 - 15 15 - 22 18/2 Esempio di diagramma cartesiano Serie storica dei Tassi di attività per ripartizione geografica, 1995-2001, Italia. 69,0 67,0 65,0 NORD CENTRO SUD 63,0 61,0 59,0 57,0 1995 19/2 1996 1997 1998 1999 2000 2001 Dati nominali Diagramma a colonne per un solo carattere HPV types in migrants from sub-Saharan Africa 0.12 0.1 0.08 0.06 0.04 0.02 0 16 18 31 33 35 39 45 51 52 53 56 58 66 68 6 11 40 43 44 54 70 74 81 83 84 89 sub-Saharan Africa Nella versione orizzontale si ottiene il diagramma a barre o a nastri per un solo carattere Dati nominali A colonne appaiate. Anche nella versione a nastri HPV types in migrants from Eastern Europe and sub-Saharan Africa 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 16 18 31 33 35 39 45 51 52 53 56 58 66 68 6 11 40 43 44 54 70 74 81 83 84 89 Eastern Europe sub-Saharan Africa Dati nominali A colonne composte. Anche nella versione a nastri HPV types in migrants from Eastern Europe and sub-Saharan Africa 0,2 0,15 0,1 0,05 0 16 18 31 33 35 39 45 51 52 53 56 58 66 68 6 11 40 43 44 54 70 74 81 83 84 89 Eastern Europe sub-Saharan Africa Dati nominali A colonne percentuali. Anche nella versione a nastri HPV types in migrants from Eastern Europe and sub-Saharan Africa 100% 80% 60% 40% 20% 0% 16 18 31 33 35 39 45 51 52 53 56 58 66 68 6 11 40 43 44 54 70 74 81 83 84 89 Eastern Europe sub-Saharan Africa Dati nominali •Diagrammi a torta: Sono rappresentazioni grafiche circolari e non rettangolari. •Il cerchio viene suddiviso in settori circolari di ampiezza proporzionale alle frequenze del carattere •Sono particolarmente adatti a mutabili sconnesse o rettilinee America centr/Sud 6% Asia 7% A.subsahariana 38% E.orientale 41% A. nord 8% Per dati quantitativi Istogramma a basi diverse Si ottengono una serie di rettangoli contigui con basi diverse e pari all’ampiezza delle classi e altezza da calcolare in modo che le frequenze siano proporzionali alle aree dei rispettivi rettangoli. Ascissa Ordinata ampiezza della classe densità di frequenza Classi Frequenza assoluta Frequenza relativa (b) Ampiezza classe (c) Densità freq. (d)=b/c <1 27.901 0,351 1 0,351 1-2 16.542 0,208 1 0,208 2-5 19.888 0,250 3 0,083 5-10 8.947 0,112 5 0,022 Grafico 10-20 4.006 0,050 10 0,005 (segue) 20-50 1.781 0,022 30 0,001 50-100 385 0,005 50 0,000 100 e oltre 153 0,002 50 0,000 Totale 79.603 1 Istogramma a basi diverse Poligono di frequenza •E’ la linea spezzata che unisce tra loro i valori centrali delle classi •L’area sottesa dall’istogramma delle frequenze relative ( e dal poligono di frequenza) è pari ad 1 Grafico per una coppia di caratteri quantitativi Diagramma di dispersione E’ un diagramma cartesiano in cui sull’asse delle ascisse (x) e su quello delle ordinate (y) si riportano i valori assunti da due variabili (X,Y). Ciascun punto P del piano di coordinate (xi,yi) rappresenta l’unità statistica che ha come valori delle due variabili le coordinate (xi,yi). La nuvola dei punti evidenzia la dispersione tra le unità statistiche, ossia la loro vicinanza o distanza, segno di somiglianza o dissomiglanza. Es. Relazione tra reddito e consumi delle famiglie nelle regioni italiane nel 2006 (in miliardi di euro) 180,0 Lombardia 160,0 140,0 spesa 120,0 100,0 Lazio 80,0 60,0 40,0 20,0 0,0 0,0 50,0 100,0 150,0 reddito disponibile 200,0 250,0