Rappresentazioni grafiche Le rappresentazioni grafiche hanno lo scopo di visualizzare la composizione di un insieme di dati, cioè della variabile statistica. I vantaggi delle rappresentazioni grafiche sono fornire una visione sintetica ed essere di facilmente interpretabili, l’inconveniente è di mancare di precisione e soprattutto d’essere soggettive, cioè di permettere letture diverse degli stessi dati. Il giudizio su una rappresentazione grafica si può basare su 5 aspetti: 1. L’accuratezza → precisione nei dettagli 2. La semplicità → uso di soli elementi grafici 3. La chiarezza → capacità di comunicare senza ambiguità 4. L’aspetto → è necessario che sia il più possibile armonioso 5. La struttura → ben definita 1 Principali tipi di rappresentazioni grafiche • Grafici a barre → • Grafici a nastri per caratteri qualitativi ordinati,caratteri quantitativi discreti → per caratteri qualitativi non ordinati • Grafici a aree → • Istogrammi → tempo per caratteri quantitativi continui nel • Grafici radar per caratteri quantitativi continui suddivisi in classi → per caratteri qualitativi non ordinati o ordinati ciclici → per caratteri ciclici • Cartogrammi → per serie territoriali • Ideogrammi → per caratteri qualitativi e quantitativi • Grafici a torta • Diagrammi cartesiani → per serie temporali 2 Grafici a barre Nei diagrammi a barre e a nastri (ortogrammi) ogni frequenza o intensità della distribuzione viene rappresentata da una barra o da un nastro in modo da ottenere una successione di rettangoli con la stessa base (o altezza) e le altezza (o le basi) proporzionali alle frequenze o quantità. Quando il carattere è qualitativo ordinato o quantitativo, e preferibile utilizzare il grafico a barre poiché le barre poste sull’asse orizzontale permettono di cogliere meglio l’ordinamento delle modalità Es.: Valutazione della risposta all’applicazione di due farmaci antipiretici a 100 pazienti. Fa rma c o A Classificazione Fa rma c o B Farmaco A Farmaco B 60 Peggioramento 3 5 Nessuna Variazione 4 7 40 Lieve Miglioramento 15 16 30 Miglioramento 52 29 Guarigione 26 43 Totale 100 100 50 20 10 0 pe ggior. ne ssuna va r. lie ve miglior. migliora me nt o gua rigione 3 Grafici a nastri I grafici a nastri, così come quelli a barre, sono particolarmente adatti a rappresentare caratteri quantitativi discreti quali per esempio: n. di componenti del nucleo familiare o voto ad un certo esame. Quando per uno stesso carattere si osservano due o più distribuzioni semplici, relativamente a diversi collettivi, possiamo metterle a confronto riportandole in un unico grafico con i cosiddetti grafici a barre o a nastri multipli. Farmaco A Farmaco B g uarig io ne mig lio ramento lieve mig lio r. nes s una var. p eg g io r. 0 10 20 30 40 50 60 4 Grafici ad aree Mostra l'importanza relativa dei valori in un dato periodo di tempo. Sebbene sia simile al grafico a linee, il grafico ad aree evidenzia maggiormente l’andamento del fenomeno rispetto alle modalità di un carattere continuo quale il tempo. Consiste in una spezzata che unisce i punti che hanno come coordinate i valori delle frequenze corrispondenti ai valori di ascissa osservati. L’area sotto la spezzata viene colorata per evidenziare maggiormente l’andamento del fenomeno. 5 Es. Grafici ad aree: Vendite per regione Anno Veneto Valle d’Aosta Piemonte Lombardia Liguria 2003 45000 35000 37000 50000 56000 2004 68000 69000 70000 75000 68000 2005 145000 100000 123000 130000 150000 Vendite per regione 700000 600000 500000 Liguria 400000 Lombardia Piemonte 300000 Valle D'Aosta 200000 Veneto 100000 0 2003 2004 2005 6 Grafici radar Si utilizzano quando il carattere è ciclico: ad es. le nascite per mese, i matrimoni per mese, le vendite per mese. Per rappresentare un carattere attraverso un grafico a radar: 1. si suddivide l’angolo di 360° con tanti raggi quanti sono le modalità del carattere; 2. agli angoli compresi tra le coppie di raggi si attribuisce stessa ampiezza ad es. se le modalità sono i mesi dell’anno, si avranno 12 raggi distanziati da angoli di 30°; 3. su ogni raggio si calcola un segmento di lunghezza proporzionale o uguale alla corrispondente frequenza. Graficamente può essere efficace unire con una spezzata gli estremi dei segmenti e colorare l’area interna al poligono. 7 Esempio: Analisi nutrizionale dei cereali Vitamina A Vitamina B1 Vitamina B2 Vitamina C Vitamina D Vitamina E Tipo A 34 23 56 3 23 89 Tipo B 23 45 12 78 90 12 Tipo C 12 13 15 16 10 16 Vitamina A 100 80 Vitamina E 60 Vitamina B1 40 20 Tipo A 0 Tipo B Tipo C Vitamina D Vitamina B2 Vitamina C 8 Diagrammi a torta • Si usano in presenza di distribuzioni delle freq. relative percentuali di una variabile suddivisa in classi. • Evidenziano come sono distribuite le singole parti, rispetto all’intero: la torta (cerchio) rappresenta l’intero fenomeno ed i componenti (fette, spicchi) sono rappresentati dai settori. • Gli angoli () devono essere proporzionali alle percentuali (x%) che vogliono rappresentare, in accordo con la relazione: : 360 x% : 100 9 Esempio diagrammi a torta Consideriamo il numero d’allevamenti di daini per ripartizione geografica nel 2000 Aree n Nord est 50 Nord ovest 45 Centro 100 Sud 25 Isole 60 Totale 280 Per calcolare l’angolo 1 al centro corrispondente al numero d’allevamenti del Nord Est, basta moltiplicare 360° per il rapporto 50/280 1 360 50 64.285 280 e cosi via per gli altri angoli Nord est Isole Sud Nord ovest Centro Nord est Isole Sud Nord ovest Centro 10 Cartogrammi Si utilizzano per rappresentare le serie territoriali Hanno come base una mappa sulla quale sono visibili i contorni delle aree geografiche o territoriali rispetto alle quali vengono analizzate le frequenze o le intensità di un carattere ad es. popolazione residente, i nati, l’età media. I cartogrammi a ripartizioni colorate sono dei cartogrammi in cui ogni area della carta è colorata in base alla distribuzione di frequenza. Se il carattere è quantitativo o ordinale allora il colore avrà un’intensità crescente all’aumentare dell’intensità del fenomeno che si vuole rappresentare. 11 Esempio di cartogramma a mosaico. 12 Diagrammi cartesiani Si utilizzano per rappresentare le serie storiche, soprattutto più serie congiuntamente. È un grafico costituito da una serie di punti individuati su un piano cartesiano, in cui sull’asse delle ascisse è posto il tempo e su quello delle ordinate il carattere osservato. I punti tracciati sul piano vengono uniti da segmenti che nel loro insieme costituiscono una spezzata che rappresenta l’andamento del fenomeno. Vendite Trimestrali 80 70 60 I trim. Europa 40 II trim. 46 III trim. 57 IV trim. 50 50 40 Sud America 40 38 30 20 Estremo Oriente 48 50 59 69 Europa Sud America 30 Estremo Oriente 20 10 0 I trim. II trim. III trim. IV trim. 13 Ideogrammi I pictogrammi o ideogrammi sono rappresentazioni grafiche di carattere molto divulgativo poiché si avvalgono di figure, simboli, generalmente tutti simili tra loro, di immediata attinenza con il carattere considerato (figure umane, oggetti) e di grandezza o numero variabile per indicare l’entità della frequenza o dell’intensità del carattere rappresentato. Hanno scarsa utilità scientifica poiché si possono prestare ad equivoci non essendo sempre agevole l’esatta lettura della grandezza delle figure usate per spiegare l’entità del fenomeno. 14 Grafici per variabili continue:l’istogramma • È utilizzato quanto la distribuzione si riferisce ad un carattere quantitativo continuo. • In un sistema di assi cartesiani è composto da una serie di rettangoli che hanno come base l’ampiezza delle varie classi in cui è stata ripartita la variabile d’interesse, e come altezza le frequenze (assolute, relative semplici o percentuali). • Le basi dei rettangoli sono uguali; di conseguenza, le altezze sono proporzionali alle frequenze. È indifferente ragionare in termini di altezze o di aree di ogni rettangolo. 15 Istogrammi (… se le classi hanno la stessa ampiezza) Si rappresentino i dati della tabella successiva riferiti alla classificazione di 110 oggetti secondo il peso. 50 40 frequenze assolute Classi di peso (in Kg) Frequenza 30 15-24 25 25-34 18 35-44 39 10 45-54 20 0 55-64 8 20 15-24 25-34 35-44 45-54 55-64 Classi di peso 16 Istogrammi (… se le classi hanno ampiezza differente) Se le classi sono di ampiezza diversa, le frequenze non sono direttamente confrontabili ed è necessario rendere l’altezza proporzionale. Tale proporzione, è un rapporto tra la frequenza e l’ampiezza (indicata con Di) di una classe, è definita densità di frequenza. di fi Di Le densità di frequenza sono fra loro confrontabili. La densità di frequenza è assoluta o relativa a seconda del tipo di frequenza utilizzato nel calcolo. In un istogramma di frequenza ad ogni classe è associato un rettangolo con: • base pari all’ampiezza di classe; • l’altezza uguale alla densità di frequenza; • l’area, per costruzione, pari alla frequenza associata alla classe. 17 Es. Istogrammi (… se le classi hanno ampiezza diversa) La seguente tabella riporta la distribuzione della popolazione residente nella regione Umbria per fasce d’età al 1 gennaio 2001 (fonte ISTAT) 11000 di 10000 frequenze assolute Classi d’età Num. residenti Di 0-1 6774 1 6774 1–5 26305 4 6576.25 5 – 10 34003 5 6800.6 10 – 15 35706 5 7141.2 15-25 86958 10 8695.8 6000 25- 55 245991 30 8199.7 5000 45 -65 216973 20 10848.65 65-99 187772 34 5522.706 9000 8000 7000 0-1 1–5 5 – 10 10 – 15 15-25 25- 55 45 -65 65-99 Classi d'età 18