Orario giorno ore materia Martedì 8-10-02 14-17 Statistica Martedì 15-10-02 14-16 Statistica Martedì 22-10-02 14-16 Probabilità Martedì 29-10-02 14-16 Probabilità Venerdì 8-11-02 14-17 Probabilità Bibliografia Saggi curati da L.Bazzini,A.Pesci,M.Reggiani e altri. Statistica e Probabilità, su L’insegnamrnto della matemattica e delle scienze integrate Centro Ricerche Didattiche “Morin”, Collana di formazione professionale,N°4 A.Pesci, M.Reggiani Statistica e Probabilità. Una proposta didattica per la scuola media,Torino, S.E.I Motivazioni Motivazioni a favore dell’introduzione dell’insegnamento della statistica e della probabilità nella scuola primaria: • i metodi statistici e probabilistici hanno continuamente assunto maggiore importanza nelle scienze sia naturali che umane; • modelli statistici e probabilistici sono ormai fondamentali nelle ricerche sperimentali della fisica, della biologia, della medicina etc.; • nella opinione pubblica e nel linguaggio degli strumenti di comunicazione di massa sono presenti spesso pregiudizi e idee distorte riguardanti ad esempio inchieste, oppure vengono spesso scelti campioni inattendibili; • i metodi statistici e probabilistici diventano sempre più strumenti di cultura, cioè strumenti che aiutano ad analizzare, comprendere, descrivere la realtà che ci circonda; • ci si trova sempre più in situazioni di incertezza in cui è necessario esprimere giudizi, fare previsioni, prendere decisioni. Tutto ciò può essere fatto meglio dopo una analisi razionale delle situazioni di incertezza e dopo una valutazione ponderata delle informazioni possedute; • le attività di carattere probabilistico e statistico si intrecciano continuamente con concetti aritmetici e geometrici dei quali possono essere un nuovo modello, rispetto a quelli tradizionali o una significativa applicazione o un interessante sviluppo. •(Da :”L’insegnamento della matematica e delle scienze integrate”Collana di formazione professionale,N°4 “statistica e Probabilità .A cura di M.Ferrari) Obiettivi del lavoro di Statistica • far acquisire ai ragazzi la capacità di leggere correttamente i tipi di grafici più diffusi; • far conoscere gli indici statistici più utilizzati e confrontarli criticamente; • far capire ai ragazzi la necessità che in un’indagine si operi su campione; • renderli consapevoli delle difficoltà connesse all’uso del metodo di un’indagine su campione sia per la sua dimensione sia per la sua comprensione; • far comprendere il significato del termine “correlazione” e far acquisire senso critico nei confronti di alcune sue interpretazioni; • utilizzare nell’ambito della statistica semplici strumenti di geometria analitica e recuperare altri contenuti della matematica: percentuali, frazioni, calcolo approssimato; I contenuti Lettura e rappresentazione di dati statistici. Raccolta e ordinamento di dati mediante tabelle, istogrammi, grafici Introduzione dei concetti di moda e mediana ( quantili) ed esempi significativi Percentuali, variazioni percentuali. Problemi. Frequenze relative e concetto di media. Riesame dei concetti di moda, mediana e loro confronto critico Campione statistico:alcune considerazioni critiche La correlazione statistica Familiarizzare con tabelle e grafici E’ importante che gli alunni familiarizzino con tabelle e grafici Prima di saper costruire un grafico è opportuno saperlo leggere con occchio critico È necessario tenere presente che una rappresentazione grafica ha lo scopo di far cogliere a colpo d’occhio alcune caratteristiche di un fenomeno, che privilegia alcune notizie tralasciandone altre e che quindi, in alcuni casi, richiede una lettura molto attenta. Bisogna far nascere il desiderio di saper interpretare correttamente i risultati di inchieste già svolte Importante è la lettura critica dei grafici Come raggiungere gli obiettivi Si richiede di:svolgere una prima indagine statistica (la materia o lo sport preferiti) rielaborare in modo efficace i dati raccolti, utilizzando opportunamente gli indici statistici Per confrontare i risultati ottenuti da una stessa inchiesta su popolazioni diverse è del tutto naturale il passaggio dall’uso delle frazioni all’uso delle percentuali. Si può cogliere l’opportunità di far notare la relazione esistente fra frazioni, decimali e percentuali. Si può anche avviare il discorso dell’ approssimazione: Passando dalla frazione alla percentuale si può, ad esempio, quando occorra, troncare (o arrotondare) il quoziente alla seconda cifra decimale. (Senza la preoccupazione che la somma delle percentuali dia in generale un intero). La moda Si introduce come primo indice statistico la moda Si riflette che, in questa indagine, il termine “dato” non si riferisce sempre ad un numero Una prima indagine Scrivi la materia che preferisci tra le materie scolastiche indicate alla lavagna e lo sport che più ti piace tra i seguenti: automobilismo atletica calcio ciclismo motociclismo nuoto pallacanestro pallavolo sci tennis Per rispondere utilizza la parte finale della scheda Materia scolastica preferita.......................................... Sport preferito....................................... Scheda 7 Quale delle materie gode di maggior popolarità nella tua classe? La materia che gode di maggior popolarità è quella che si presenta con maggior frequenza. Il dato che si presenta con maggior frequenza si chiama moda 2) Qual è la moda nel caso degli sport? 3) Pensi che indagini di questo tipo potrebbe capitare di trovare due mode? E più di due? 4) Quando si usa il termine moda nel linguaggio comune? Scheda 12 Sport automobilismo atletica calcio ciclismo motociclismo nuoto pallacanestro pallavolo sci tennis Nostra classe Altra classe La seguente tabella riporta i voti ottenuti dagli sport nella nostra classe e in un’altra classe 1) E’ più popolare....nella nostra classe o...... nell’altra? 2)qual è la percentuale dei voti avuti da.....nella nostra classe? Nell’altra? Ordinare i dati Per poter studiare i dati e poter ricavare delle informazioni nasce la necessità di poterli ordinare Seconda indagine riguardante il numero di scarpa di ciascun alunno Organizzare opportunamente la raccolta dei dati numerici: esempio per fila di banchi o in ordine alfabetico I dati raccolti devono essere ordinati Far cogliere la diversità che c’è di scegliere un ordine prima di iniziare la raccolta dei dati e quella di ordinarli Costruzione istogramma relativo all’inchiesta svolta Scheda17 1) Calcola la percentuale di alunni che hanno il numero .........di scarpa 2) Riferendoti alla tabella della scheda 16, calcola quale percentuale di ragazzi ha il numero ....di scarpa e quale percentuale di ragazze ha lo stesso numero. Confronta i valori ottenuti. 3) Per ogni numero di scarpa calcola le percentuali degli alunni rispetto al totale e mettile in graduatoria. TERZA INDAGINE 1.35 1.43 1.48 1.35 1.37 1.38 1.38 1.40 1.42 1.42 1.43 1.44 1.44 1.46 1.46 1.47 1.47 1.48 1.50 1.50 1.51 1.53 1.55 1.55 Terza indagine in cui la moda non appare significativa La tabella si riferisce alle altezze in metri di 24 alunni 1) Trova la moda 2) Ce n’è una sola? 3) Ti sembra che la ricerca della moda sia importante come lo è stata nelle indagini precedenti? Classi di altezze 1,35x <40 1,40 x <1,45 1,45 x <1,50 1,50 x <1,55 1,55 x <1,60 Per vedere meglio come si distribuiscono gli alunni rispetto le altezze, converrà raccogliere in gruppi i valori della tabella. In modo che ti proponiamo per effettuare questi raggruppamenti è quello di fissare i seguenti intervalli di altezze, procedendo di 5cm in 5 cm 1) Conta quante altezze ci sono in ciascun intervallo e scrivi questo numero nella tabella a fianco di ciascun intervallo 2) Con i numeri che hai ottenuto costruisci un istogramma 3) Qual è il gruppo o meglio la classe di altezze più numerosa? Tabella 1,35 1,43 1,48 1,35 1,43 1,48 1,37 1,44 1,50 1,38 1,44 1,50 1,38 1,46 1,51 1,40 1,46 1,53 1,42 1,47 1,55 1,42 1,47 1,55 1) Trova un valore che divida a metà la tabella cioè, tale che sia più grande dei primi 12 dati e più piccolo degli altri 12 2) Supponi di togliere dalla tabella l’ultimo dato, cioè 1,55.Qual è ora un valore che lascia prima e dopo di sè un ugual numero di dati? Ce n’è uno solo? Mediana È il valore che occupa il posto centrale tra i dati ordinati. Se i dati sono in numero dispari x , x2,.......,x2n+1la mediana è xn+1 1 Se i dati sono in numero pari x ,x2,.......,x2nla mediana è per convenzione ½(xn+xn+1) 1 la mediana è un valore la mediana è uno dei valori e può non coincidere con un “dato”,come nel nostro caso in cui il numero dei dati è pari. Definizione di mediana: un valore che divide a metà una raccolta ordinata di dati la mediana nel secondo caso è 1,44m, nel primo caso qualsiasi valore compreso tra 1,44 e 1,46 divide a metà la tabella ciascuno di essi è mediana Per semplicità, si sceglie come mediana il valore che sta in mezzo a questi due, cioè: 1,44+1,46 —————=1,45 2 Scheda24 Con la mediana abbiamo suddiviso i 24 dati ordinati della scheda 21 in due gruppi di 12 dati ciascuno. Vogliamo ora, allo stesso modo, suddividere la medesima popolazione in quattro gruppi, ciascuno con un ugual numero di dati (nel nostro caso 6 per ogni gruppo). 1) Quanti valori occorrono per ottenere tale suddivisione? 2) Uno di questi valori lo conosci già. Qual è? 3) Quali sono gli altri? I numeri che hai trovato si chiamano quartili I quantili I quantili dividono in n parti una raccolta di dati. I quantili rispettano le stesse convenzioni della mediana INell’esempio fatto precedentemente q uil primo quantile è 1,40 + 1,42 a n ————————==1,41 t i l i d i v i d o n o i n n p a r t 2 Il secondo quantile è la mediana Il terzo quantile è 1,48 + 1,50 ————————==1,49 2 Media aritmetica Se abbiamo n dati che indichiamo, x1 , x2 , ........,xn la media aritmetica è: x1+ x2+.......+xn —————————— n Stipendi di 10 dipendenti Reddito Numero Qualifica mensile in euro dipendenti 646,00 800,50 1007,50 5 1 2 1524,00 1808,00 1 1 Impiegati Dirigenti I In una piccola azienda lavorano 10 dipendenti: loro redditi mensili netti(cioè gli stipendi) sono riportati nella tabella: Domande 1) Se lo stesso reddito totale dei dipendenti fosse suddiviso in parti uguali fra loro, cioè se tutti avessero lo stesso stipendio, quanto prenderebbe ciascun dipendente? 2) Come si chiama il valore che hai calcolato? Uso critico degli indici statistici La media aritmetica nel nostro esempio è di 937,75 euro Ti sembra esatto dire che la metà dei dipendenti percepisce meno di 937,75 e l’altra metà percepisce più di 937,75 euro? Se si decidesse di aumentare lo stipendio più elevato, questo cambiamento non altererebbe per nulla né la mediana ,né la moda della nostra popolazione , mentre avrebbe ovviamente influenza sulla media Nell’azienda di cui si parla, l’ultimo dipendente elencato riceve un aumento di stipendio e passa da 18008,00 a 2000,00 euro; tutti gli altri stipendi rimangono invariati. 1) E’ cambiata la mediana? 2) E’ cambiata la media? 3) E’ cambiata la moda? Discussione sulla diversa natura degli indici statistici Non ci sono regole meccaniche sulla scelta dell’indice da utilizzare Altezze in metri di 24 alunni 1,46 1,54 1,58 1,62 1,65 1,46 1,54 1,58 1,64 1,67 1,48 1,54 1,60 1,64 1,70 1,50 1,56 1,60 1,64 1,70 1,50 1.57 1,60 1,64 a) Costruisci una tabella con le frequenze relative.Come si potrebbe fare per dividere i ragazzi in “bassi “e “alti”? b) Un ragazzo alto 1,50m come è considerato? c) A quale indice statistico hai fatto riferimento? Perché? d) Ora considera la tabella ordinata delle altezze dei 24 ragazzi, se vuoi dividere i ragazzi in “bassi”, “medi” e “alti” a quali indici ti riferisci? Un ragazzo alto 1,62m come è considerato? e) Trova la moda, la mediana e la media giustificando e indicando i procedimenti anche generalizzando f) Costruisci una nuova tabella formata da 5 classi di altezze e le corrispondenti frequenze relative. Costruisci il relativo istogramma 1,46 1,54 1,58 1,62 1,65 1,46 1,54 1,58 1,64 1,67 1,48 1,54 1,60 1,64 1,70 g)Se alla tabella dei dati fossero aggiunte due nuove altezze 1,50m e 1,66m, quale degli indici statistici tra quelli calcolati precedentemente cambierebbe? Perché? 1,70 E se tutte e due le altezze introdotte fossero di 1,66m? 1,50 1,56 1,60 1,64 1,50 1.57 1,60 1,64 Campione Scelta del campione Indagine statistica sull’intera popolazione nella maggior parte dei casi non è possibile, è necessario, limitarsi all’esame di una parte della popolazione e cercare di trarre da questa informazioni Si dice che si lavora su “ campione”. Quella parte della Statistica che formula delle ipotesi sulla struttura di una popolazione a partire da un campione prende il nome di “Statistica inferenziale”. La maggior parte delle indagini viene svolta su un campione,è importante, che un ragazzo, al termine della scuola dell’obbligo, abbia qualche idea sul problema Campione attendibile e rappresentativo Un campione deve essere il più possibile “attendibile”, il campione deve essere “rappresentativo” E’ importante convincere i ragazzi che il campione è utile quando la popolazione non è conosciuta Tuttavia per introdurre il concetto di campione ai ragazzi affinché possano cogliere informazioni da un campione si può partire da una popolazione interamente conosciuta. Si propone di fare un’indagine sulla lunghezza delle parole di un brano di Calvino di 700 parole Si contano le lettere di ciascuna parola Si costruisce un istogramma con la frequenza delle lunghezze delle parole Il lavoro richiede molto tempo e suggerisce l’idea di esaminare un numero inferiore di parole Bisogna scegliere un campione Si pone il problema di decidere: Come estrarre il campione Quanto deve essere grande Primo punto: la scelta degli elementi che formeranno il campione deve essere casuale Secondo punto: dimensione del campione Si procede per tentativi: Si costruisce dapprima un campione di 10 parole non permette di farsi un’idea della frequenza delle lunghezze delle parole di tutta la popolazione Campioni di 50 parole Campioni di 50 parole e di 100 parole danno un’idea sempre “più precisa”dell’intera popolazione. Il campione per essere rappresentativo deve essere “abbastanza grande” Si potrà notare che un campione costruito per estrazione semplice per essere rappresentativo, dovrà essere, ad esempio,circa 1/10 della popolazione L’insegnante tuttavia farà notare come nelle indagini fatte da mass-media su popolazioni grandi non ricorra al 10% della popolazione. Ad esempio se ci interessa conoscere un dato sulla intera popolazione nazionale, si vede subito che 1/10 di 60milioni è ancora un numero troppo elevato Campione stratificato Il campionamento casuale è necessario quando la popolazione è completamente sconosciuta, ma quando si opera sulla popolazione nazionale non si lavora su una popolazione completamente sconosciuta, ma su una popolazione che precedenti rilevamenti hanno reso possibile di suddividerla in classi (strati:sesso,età,condizione sociale e così via). Si costruisce il così detto “campione stratificato” Si scelgono a caso un predeterminato numero di individui all’interno di opportuni “strati”nei quali si è suddivisa la popolazione. Le tecniche usate sono particolari e continuamente affinate. Punto di vista didattico Far sorgere il problema e far costruire il campione partendo da una popolazione interamente sconosciuta Dare l’idea che nelle indagini di cui si sente parlare i metodi seguiti sono diversi da quello usato da noi con il lavoro sulle parole Distorsione del campione Tipiche situazioni: intervistare amici o parenti, incontreremo più facilmente persone che hanno le nostre abitudini, gli amici che hanno la stessa età, non sarebbe un campione rappresentativo della popolazione italiana. Intervistare persone scegliendo dall’elenco telefonico si esclude chi non ha il telefono. Ogni campione scelto a caso per strada può non essere rappresentativo (a seconda del luogo, del giorno della settimana, dell’ora vi saranno rappresentate in maggioranza alcune categorie quali casalinghe, studenti, lavoratori,...e non altre) Esercizi 1) In un’altra classe hanno costruito il campione di 100 parole scegliendole puntando il dito a caso sulle pagine del racconto e hanno ottenuto che le parole di 7 lettere sono le più frequenti. Sai spiegare perché questo campione, pur essendo numeroso quanto il nostro, non è rappresentativo? 2) Per stabilire con quale frequenza gli abitanti di un paese vanno al cinema ci mettiamo all’uscita di una sala cinematografica e chiediamo a ciascuno di 130 spettatori scelti a caso di dire quante volte al mese va al cinema. Dai risultati della nostra inchiesta concludiamo che gli abitanti di quel paese vanno al cinema in media 5 volte al mese. E’ ben fatta questa inchiesta? correlazione Nelle indagini statistiche spesso si raccolgono dati relativi a due o più caratteri della stessa popolazione. Questi possono essere esaminati separatamente oppure ci si può chiedere se esistono legami tra di essi ossia se esiste una “correlazione statistica”. indagine Popolazione: un gruppo di adulti dello stesso sesso, che praticano la stessa attività sportiva. Rileviamo statura e peso. Riportiamo su piano cartesiano, in ascissa le altezze espresse in cm. in ordinata, i pesi in kg. Ogni individuo risulta rappresentato sul piano cartesiano da un punto che ha come ascissa la sua statura e come ordinata il suo peso statura peso 175 70 180 72 170 60 178 70 182 75 176 74 175 72 181 76 170 65 185 75 tabella statura peso 172 180 184 186 174 176 178 173 175 182 68 70 76 80 70 70 71 65 66 72 Nuvola L’orientamento della ”nuvola“ è da “sud-ovest” a “nord-est”o da ” sinistra in basso” a “destra-in alto” In quella popolazione tra le due caratteristiche prese in esame esiste una “correlazione positiva” Se l’orientamento della nuvola è quello opposto ”nord-ovest””sud-est” si dice che la “correlazione è negativa”. Se la nuvola non presenta alcun particolare orientamento si dice che non esiste correlazione Esempi Correlazione negativa fra: •Età di un’automobile e suo valore commerciale •Temperatura media annua e latitudine di una località (a parità di altre condizioni climatiche) •Spesa per consumi alimentari mensili pro capite e numero dei componenti di una famiglia Correlazione positiva fra: •Cilindrata di un’automobile e consumo a una prefissata velocità (a parità di altre condizioni, es.tipo di alimentazione) •Reddito familiare e spesa per consumi alimentari •Statura e apertura delle braccia (in individui adulti) Non esiste correlazione fra: •valore energetico di un alimento e suo prezzo sul mercato •colore degli occhi e peso di un individuo •numero di scarpa e numero dei fratelli Se esiste correlazione... Stabilito che tra due caratteri di una popolazione esiste correlazione si pongono due problemi: a) Come interpretarla ( Non va confusa con quella di un rapporto di causa-effetto) b) Come misurarla (Si calcola il così detto ”coefficiente di correlazione”) Rette di regressione statura peso 170 60 170 65 172 68 173 65 174 70 175 66 175 70 175 72 176 70 176 74 Ordiniamo la tabella per altezza,dividendo la popolazione in due parti. Primo gruppo a sinistra e secondo a destra. statura peso 178 70 178 71 180 70 180 72 181 76 182 72 182 75 184 76 185 75 186 80 Retta di previsione per prevedere il peso conoscendo l’altezza Determiniamo due punti rappresentativi: Il primo, in ascissa la media aritmetica delle altezze e in ordinata quella dei pesi del 1° gruppo, P di altezza 173,6 e peso 68 Il secondo, in ascissa la media aritmetica delle altezze e in ordinata quella dei pesi del 2° gruppo, Q di altezza 181,6 e peso 73,7 Congiungiamo i due punti P e Q otteniamo la nostra retta di previsione, possiamo utilizzarla per prevedere il peso data l’altezza di un individuo di una popolazione omogenea a quella di partenza. Retta di previsione per prevedere l’altezza conoscendo il peso Ordiniamo la popolazione in ordine crescente rispetto il peso, ripetiamo lo stesso procedimento e otteniamo: P’ di peso 67,4 e altezza 174,3 e Q’ di peso 74,3 e altezza 180,9 Congiungiamo i due punti P’ e Q’ otteniamo la nostra retta di previsione, possiamo utilizzarla per prevedere l’altezza, dato il peso, di un individuo di una popolazione omogenea a quella di partenza. misura Tracciando le due rette si vede che sono diverse: il loro angolo ci fornisce la “misura” della correlazione: Tanto più piccolo è l’angolo quanto maggiore sarà la correlazione Volendo avere a disposizione una sola retta che ci consenta, dato un peso di prevedere l’altezza e viceversa, data un’altezza prevedere il relativo peso, si può tracciare la bisettrice dell’angolo formato dalle due rette. Esercizio n°1 sezione A B C D E F G H I N°alunni 24 20 22 18 20 17 21 24 22 la tabella riporta il numero degli alunni delle classi seconde di una scuola media: a) determina moda, mediana e media. b) Calcola la percentuale delle classi con un n° di alunni non inferiore a 20 c) Spiega cosa suggerisce ciascun indice d) Quali contenuti del programma di matematica possono essere richiamati? Esercizio n°2 voto 3 4 5 6 7 8 9 N°alunni 2 6 5 10 3 1 1 In una prova di verifica i 28 alunni di una scuola superiore hanno riportato i seguenti voti a) Determina moda, media e mediana b) Ha senso parlare di mediana in questo caso? Perché? c) Quale percentuale di alunni ha superato il 5? d) Spiega cosa suggerisce ciascun indice Esercizio n°3 24 24 25 25 26 27 27 28 28 28 29 30 30 30 30 32 33 34 34 35 36 38 38 39 40 41 41 42 44 45 47 48 48 50 51 51 52 52 53 53 In tabella sono riportate l’età di 40 dipendenti di un’azienda; a) Trova, moda, mediana e media b) Se pensi di dividere i dipendenti in due gruppi: “giovani” e “anziani“a quale indice statistico ti puoi riferire? In base alla tua divisione un dipendente di 36 anni a quale gruppo appartiene? c) Successivamente la stessa azienda assume due nuovi dipendenti, uno di 29 e l’altro di 37, quali indici statistici cambiano quali rimangono invariati? E se tutti e due avessero 28 anni? Rispondi senza fare calcoli. Quale correlazione pensi esista tra a) temperatura del corpo e frequenza dei battiti del polso? b) Quantità di fragole raccolte e loro prezzo sul mercato? c) Numero di autovetture circolanti sull’Autostrada del Sole e numero di incidenti? d) Peso di un alunno e numero dei suoi fratelli?