Liceo Classico Linguistico “D. Crespi” Corso di preparazione ai test universitari Elementi di STATISTICA DESCRITTIVA Lezione 1 28% 11% 22% 15% 24% ______________ anno scolastico 2001/2002 1 Che cos’è la statistica Nata per descrivere le caratteristiche demografiche, economiche, … degli stati, è l'insieme delle tecniche utilizzate per raccogliere, elaborare e interpretare i dati che riguardano collettività, al fine di studiare un fenomeno e poterne prevedere gli sviluppi. 2 Statistica descrittiva la ricerca statistica viene fatta sull’intera “popolazione” • censimento della popolazione italiana • rilevazione del gradimento della scuola Statistica Statistica inferenziale la ricerca viene fatta su un “campione casuale” della popolazione con lo scopo di ottenere informazioni relative all’intera popolazione • • verifica della durata delle batterie prodotte da una ditta proiezioni sull’esito delle elezioni politiche 3 Il primo passo da fare in un’indagine statistica è individuare il gruppo di persone o oggetti che dobbiamo studiare, cioè La “Popolazione”: insieme degli “individui” o “unità statistiche” che presentano caratteristiche comuni: • • • • appartengono alla stessa nazione, frequentano la stessa scuola, sono bovini allevati nella stessa stalla, batterie prodotte dalla stessa ditta…… Chiaramente la scelta della popolazione dipende dagli obiettivi dell’indagine. La rilevazione ed elaborazione statistica riguarda i “caratteri” o “argomenti” comuni agli individui della popolazione. 4 Qualitativi - “modalità” • colore degli occhi • religione Caratteri o tipi di dati Quantitativi - “valori” (espressi mediante numeri) • statura, peso, • durata delle batterie 5 • un carattere che assume valori diversi lo chiameremo variabile esempi 1. Il peso degli studenti di una classe varia (in generale) da soggetto a soggetto Il carattere “peso” è una variabile (quantitativa) 2. La temperatura esterna varia durante il giorno la “temperatura” è una variabile (quantitativa) 3. Il colore degli occhi varia da persona a persona il carattere “colore degli occhi” è una variabile (qualitativa) 6 Livelli di misurazione delle variabili • Le variabili differiscono anche per il tipo di misurazione che può essere fatta (tipi di scale). 1. La variabile “colore occhi” può assume le modalità: celeste, verde, marrone, nero …. 2. La variabile “titolo di studio” può assumere i valori: nessuno, lic. elementare, lic. media, lic. scuola superiore, laurea. 3. La variabile QI può assumere i valori: 100, 120, 150, 89, …… 4. La variabile stipendio può assumere i valori: 1 milione, 2 milioni, 40 milioni, …. 7 Si distinguono 4 livelli o scale di misurazione: 1. Scala nominale es. Colore degli occhi; sesso; nazionalità • è il livello più basso della misurazione, i dati non hanno alcun ordine precostituito • consente la comparazione in termini di uguale o diverso femmina = femmina, femmina maschio Scale di misurazione 2. Scala ordinale es. Titolo di studio • i valori possono esser ordinati secondo il criterio di “inferiore”, “superiore”, “migliore”; c’è un ordine logico nei dati. • lic elementare < lic media < ….< laurea 8 livelli o scale di misurazione: 3. Scala a intervalli es. QI, Temperatura Celsius, Fahrenheit. • è il primo livello propriamente quantitativo • consente il calcolo della distanza (o differenza) tra due valori, ma non il loro rapporto QI = 125– 100 =25 Scale di misurazione 4. Scala di rapporti es. Stipendio percepito, peso, età…..sono caratterizzati dall’avere uno Zero non convenzionale. • i valori possono esser rapportati tra loro nel senso che si può dire che un valore è doppio o triplo di un altro • 4 milioni = 4 • 1milione = 2 • 2 milioni 9 • Le differenti scale di misurazione delle variabili determinano il tipo di indice statistico calcolabile. Livello moda mediana media Nominale SI NO NO Ordinale SI SI NO Intervalli SI SI SI Rapporti SI SI SI 10 Le fasi di una ricerca statistica 1. Studio del problema e impostazione della ricerca statistica: • scopo della ricerca, definizione del fenomeno che vogliamo studiare, ipotesi che si vogliono provare • individuazione della popolazione. 2. Rilevamento, classificazione e tabulazione dei dati: • i dati raccolti vengono raggruppati in classi omogenee e riportati in tabelle 3. Rappresentazione grafica e analisi dei dati • Diagrammi: la rappresentazione grafica dei dati consente di rilevare più facilmente le loro caratteristiche, ma manca di precisione. 11 Le fasi di una ricerca statistica 3. _________ • Elaborazione: consiste nell’esaminare i dati mediante metodi matematici al fine di determinare alcuni indici rappresentativi del fenomeno 4. Conclusioni dell’indagine: relazione conclusiva in cui viene riportato quanto rilevato in relazione al fenomeno studiato: • il prodotto interno lordo è aumentato del 5% negli ultimi 10 anni • si è osservato un aumento della piovosità media nel mese di gennaio 12 Rappresentazioni grafiche di distribuzioni univariate Le rappresentazioni grafiche hanno lo scopo di rappresentare in modo semplice, a colpo d’occhio, le caratteristiche di una distribuzione di frequenza. Hanno l’inconveniente di mancare di precisione e di prestarsi a letture soggettive Sono di diverso tipo e vanno scelte in relazione al tipo di dati da rappresentare. 13 Rappresentazioni grafiche di distribuzioni univariate Vediamo alcuni esempi di rappresentazioni grafiche e utilizziamo come dati quelli della seguente tabella: Anno di corso frequenza freq.rel 1 5 0,11 2 7 0,15 3 11 0,24 4 10 0,22 5 13 0,28 Totale complessivo 46 1 freq.% 10,9 15,2 23,9 21,7 28,3 100,0 14 Rappresentazioni grafiche di distribuzioni univariate ISTOGRAMMI: sono grafici a barre verticali. Sull’asse orizzontale vengono riportati i valori della variabile, mentre sull’asse verticale le frequenze assolute, o relative, o percentuali con cui le variabili compaiono. Un istogramma è una rappresentazione areale, cioè l’area dei rettangoli, e non la loro altezza, è proporzionale alla frequenza del dato. 15 Rappresentazioni grafiche - ISTOGRAMMI frequenza assoluta ISTOGRAMMA dei dati 15 10 5 13 11 10 3 4 7 5 0 1 2 5 anno di corso 16 Rappresentazioni grafiche di distribuzioni univariate DIAGRAMMI a BARRE: i dati vengono rappresentati mediante linee continue più o meno spesse. L’altezza o lunghezza delle barre è proporzionale alla frequenza del dato. Negli Ortogrammi o grafici a nastri gli assi sono scambiati per consentire una lettura più facile: sull’asse x sono riportate le frequenze, sull’asse y i valori delle variabili 17 Rappresentazioni grafiche - Diagrammi a Barre - ORTOGRAMMI anno di corso Diagramma a barre (Ortogramma) 5 13 4 10 3 11 2 7 1 5 0 2 4 6 8 10 12 14 frequenze assolute 18 Rappresentazioni grafiche di distribuzioni univariate AEROGRAMMI: le frequenze di una variabile qualitativa vengono rappresentate mediante superfici di figure piane: quadrati rettangoli, cerchi.. Le frequenze dei dati sono proporzionale all’area delle superfici. del dato. Nei DIAGRAMMI CIRCOLARI o a TORTA si divide il cerchio in settori proporzionali alla frequenza del dato 19 Rappresentazioni grafiche - Diagrammi CIRCOLARI Aerogramma - Diagramma circolare o a torta 28% 11% 1 15% 2 3 4 22% 24% 5 20 Rappresentazioni grafiche di distribuzioni univariate DIAGRAMMA POLARE: viene utilizzato principalmente per rappresentare caratteri relativi a fenomeni ciclici (mensili, settimanali, giornalieri) Le frequenze dei dati sono proporzionale alla distanza dal centro 1 Diagramma Polare 5 5 13 2 7 10 4 11 3 21 Rappresentazioni grafiche di distribuzioni univariate CARTOGRAMMI: vengono utilizzati per rappresentare dati relativi a distribuzioni geografiche: densità di popolazione per regione, produzione agricola per regione, nazione ecc… 22 Rappresentazioni grafiche - CARTOGRAMMI 23