Probabilità e statistica Veronica Gavagna Testa o croce? Immaginiamo di lanciare una moneta facendola cadere su un piano liscioβ¦ chiunque dirà che la probabilità dellβevento testa sarà del 50%, al pari della probabilità dellβevento croce. Potremo schematizzare dicendo Esiti possibili: T, C (2) Evento T: 1/2 (50%) Di qui la definizione classica di probabilità: Probabilità di un evento = P(E) = ππππππ ππππ ππππππππππ ππππππ ππππ πππππππππ Il numero di casi possibili è anche detto spazio degli eventi. La probabilità che esca 4 lanciando un dado cubico è La probabilità che si peschi una carta di spade in un 10 1 mazzo di carte è = = 0,25% 40 4 La probabilità di pescare una pallina rossa in un 10 sacchetto contenente 10 palline gialle e 3 rosse è 13 1 6 La probabilità di estrarre una pallina rossa da un 10 sacchetto contenente 10 palline rosse è = 1 10 (evento certo). La probabilità di estrarre una pallina verde da un 0 sacchetto contenente 10 palline rosse è = 0 10 (evento impossibile). La probabilità di un evento aleatorio è rappresentata da una frazione il cui numeratore è minore o uguale del denominatore, quindi π β€π· π¬ β€π Nella definizione classica è in realtà sottinteso che i «casi possibili» devono «pesare allo stesso modo», cioè essere equiprobabili! Dunque la definizione classica «riveduta e corretta» è la seguente: la probabilità di un evento in un esperimento è data dal rapporto tra il numero di casi favorevoli e il numero di casi possibili, purché essi siano equiprobabiliβ¦ è un circolo vizioso! Per di più è una definizione con una modesta applicabilità. Vediamo un esempio: «Qual è la probabilità che il 20 luglio a Firenze piova?» Probabilità: definizione frequentista Esistono definizioni alternative a quella classica, usate soprattutto in ambito commerciale ed economico Probabilità di un evento = ππππππ πππππππππππ ππππππππππ ππππππ πππππππππππ ππππππππππ Mentre la definizione classica prevede una stima a priori, quella frequentista si basa su una stima a posteriori: la probabilità che si verifichi un evento viene a coincidere con la frequenza relativa con cui si presenta in situazioni analoghe. Ma quanti esperimenti bisogna fare??? La probabilità di un evento, valutata in modo frequentistico dipende dal numero degli esperimenti effettuati: maggiore è questo numero, più attendibile è la stima. Nella situazione in cui è possibile ricorrere alla definizione classica β lancio di una moneta β è senza dubbio da preferire. Ci sono altre definizioni di probabilità, tuttavia varrà la pena rimarcare che esistono vari modi per definire e misurare la probabilità di un evento. Ciò che si conserva è il modo di misurare la probabilità di eventi complessi a partire da eventi semplici. Contare i casi possibili Talvolta la difficoltà nella stima della probabilità di un evento dipende dalla facilità con la quale si possono contare «tutti i casi i possibili». Per esempio, nel problema che segue, il calcolo della probabilità di uno due eventi diventa banale solo dopo che si sono enumerate tutte le possibilità. In questo caso è importante trovare una strategia per contare in modo efficace. Gli strumenti matematici che aiutano in tal senso fanno parte del calcolo combinatorio, ma esulano dagli argomenti di questo corso. Nel secondo e terzo esempio, invece, il problema non è di «contare» i casi possibili, ma «capire» quanti siano veramente. Eβ più probabile indovinare lβordine dβarrivo di 4 atleti sconosciuti a una gara campestre, oppure la seconda lettera della duecentoventisettesima parola del quarto capitolo del Promessi Sposi? Indichiamo con A, B, C e D i 4 atleti e vediamo i possibili ordini dβarrivo ABCD, ABDC, ACBD, ACDB, ADBC, ADCB, BACD, BADC, BCAD, BCDA, BDAC, BDCA, CABD, CADB, CBAD, CBDA, CDAB, CDBA, DABC, DACB, DBAC, DBCA, DCAB, DCBAβ¦. Sono 24 1 , 24 Quindi la possibilità di azzeccare lβordine dβarrivo è mentre la possibilità di indovinare la lettera, 1 1 1 appartenente allβalfabeto italiano è . Poiché > 21 21 24 è più probabile indovinare la lettera dei Promessi Sposi piuttosto che lβordine dβarrivo In unβurna sono contenute 1 pallina bianca (B), 1 rossa (R) e una verde (V) . Qual è la probabilità che in tre estrazioni successive esca la sequenza BRV? Il punto critico in questo caso è la determinazione dei casi possibili. Come si contano? BRV β BVR β RVB β RBV β VBR β VRB Nella prima posizione ho 3 scelte, per ognuna di queste, nella seconda posizione ho 2 scelte, mentre nellβultima posizione rimane unβunica possibilità. Ovvero Combinazioni possibili = 3×2×1=6 La probabilità dellβ evento atteso è dunque 1 6 In unβurna sono contenute 1 pallina bianca (B), 1 rossa (R) una verde (V) e una gialla (G). Qual è la probabilità che in tre estrazioni successive esca la sequenza BRVG? BRVG RBVG Per la prima posizione: 4 scelte BRGV RBGV Per la seconda posizione: 3 scelte BVRG RGBV BVGR RGVB Per la terza posizione: 2 scelte BGVR RVBG BGRV RVGD Per la quarta posizione: 1 scelta Le combinazioni possibili GBVR saranno VBRG GBRV VBGR GRVB 4×3×2×1=24 VGRB GRBV Quindi la probabilità è 1 24 VGBR VRBG VRGB GVRB GVBR Potremmo proseguire cosìβ¦ In quanti modi diversi possono disporsi in fila 5 bambini? 5 oggetti da permutare danno luogo a 5 ×4×3×2×1=120 permutazioni Quante puntate si dovrebbero fare per essere sicuri di azzeccare lβordine dβarrivo di 6 cavalli? 6× 5×4×3×2×1=720 In generaleβ¦ n oggetti da permutare danno luogo a 1×2×3×4×β¦. ×(n-1) ×n permutazioni Lβespressione 1×2×3×4×β¦. ×(n-1) ×n , che rappresenta il numero delle permutazioni su n oggetti si indica anche con n! e si dice n fattoriale o fattoriale di n. Lanciamo ora due monete: qual è la probabilità che escano due teste? Possiamo descrivere i casi possibili come: uscita di due teste, uscita di due croci, uscita di una testa e di una croce. E in questo caso la 1 probabilità dellβevento parrebbe . O no?? 3 In realtà lβevento «uscita di una testa e di una croce» non pesa come gli altri due, avendosi TT, CC, CT, TC (per convincervi immaginate di avere due monete di colore diverso.). Dunque i casi possibili sono 4 e la probabilità corretta 1 dellβevento è 4 Un mio amico ha due figli non gemelli. Sapendo che uno è maschio, qual è la probabilità che lβaltro sia femmina? Nei casi possibili bisogna anche considerare lβordine di nascita: MF, FM, MM. 1 2 Quindi la probabilità non è come si potrebbe pensare, ma 2 3 Abbiamo visto come dobbiamo comportarci quando dobbiamo valutare la probabilità che si verifichi un evento πΈ1 . Immaginiamo ora di considerare anche un evento πΈ2 . Come dobbiamo valutare la probabilità che si verifichi π¬π e contemporaneamente π¬π ? E come dobbiamo valutare la probabilità che si verifichi π¬π oppure π¬π ? (nel senso della disgiunzione inclusiva) Prima di dare risposte, premettiamo la distinzione tra eventi compatibili e incompatibili. Due eventi si dicono incompatibili se non possono verificarsi contemporaneamente. Estraendo una carta da un mazzo di 40, i due eventi: E1 = "Esce l'asso di cuori" E2 = "Esce una figura" sono incompatibili. Due eventi sono, invece, compatibili se cβè anche una sola possibilità che possano verificarsi simultaneamente, in una data prova. Estraendo una carta da un mazzo di 40, i due eventi: E1 = "Esce una figura" E2 = "Esce una carta di cuori" sono compatibili perché in una estrazione potrebbe uscire una figura di cuori. Prodotto logico di eventi evento intersezione Consideriamo 12 gettoni numerati e sia πΈ1 = esce un numero pari πΈ2 = esce un numero maggiore di 7 Casi favorevoli per πΈ1 ; A= 2, 4, 6, 8, 10, 12 β π(πΈ1 )=1/2 Casi favorevoli per πΈ2 ; B= 8, 9, 10, 11, 12 β π(πΈ2 )=5/12 πΈ= esce un numero pari e un numero maggiore di 7 Lβinsieme dei casi favorevoli, per definizione del connettivo logico e, è lβintersezione dei due insiemi precedenti π΄ β© π΅ = 8, 10, 12 Quindi π(E) = π πΈ1 β© πΈ2 = mentre π πΈ1 β π πΈ2 = 5/24 3 12 = 1 4 Prodotto logico di eventi evento intersezione Consideriamo 12 gettoni numerati e sia πΈ1 = esce un multiplo di 5 πΈ2 = esce un multiplo di 3 Casi favorevoli per πΈ1 ; A= 5, 10 β π(πΈ1 )=2/12=1/6 Casi favorevoli per πΈ2 ; B= 3, 6, 9, 12 β π(πΈ2 )=4/12=1/3 πΈ= esce un numero multiplo di 3 e di 5 Lβinsieme dei casi favorevoli, per definizione del connettivo logico e, è lβintersezione dei due insiemi precedenti Sempre? E se i gettoni π΄β©π΅ =β fossero 18? Quindi π πΈ1 β© πΈ2 = 0 mentre si ha π πΈ1 β π πΈ2 = 1 18 Nel caso dei 12 gettoni, i due eventi πΈ1 = esce un multiplo di 5 πΈ2 = esce un multiplo di 3 sono incompatibili. Di certo, nel caso di eventi incompatibili, non vale la regola del prodotto logico: π(πΈ1 β© πΈ2 ) = π πΈ1 β π πΈ2 Ma allora, quando rimane valida? Per dare una risposta dobbiamo fare unβulteriore distinzione negli eventi compatibili tra eventi indipendenti ed eventi dipendenti Eventi indipendenti Attenzione: Indipendenti non vuol dire incompatibili! Due eventi compatibili πΈ1 e πΈ2 si dicono indipendenti se il fatto che si verifichi πΈ1 non altera la probabilità che si verifichi πΈ2 . Ad es., se lanciamo due dadi, gli eventi πΈ1 = esce un 2 nel primo dado πΈ2 =esce un 5 nel secondo dado sono indipendenti. In questo casi vale il Teorema del prodotto per eventi compatibili e indipendenti (o Teorema della probabilità composta) Dati due eventi A e B compatibili tra loro e indipendenti, la probabilità dellβevento A e B (prodotto logico) è il prodotto della probabilità di A e della probabilità di B π π¨ π π© = π π¨ β π(π©) che si può scrivere anche come π(π¨ β© π©) = π π¨ β π(π©) Nota bene: il teorema si può estendere a un numero finito di eventi, purché siano compatibili e indipendenti. (1)Eβ possibile calcolare in questo modo la probabilità dellβevento «escono due teste» nel lancio di due monete? (2) Qual è la probabilità di fare 12 lanciando due dadi? (3) Abbiamo due mazzi di carte da 40. Estraendo una carta da ciascun mazzo, consideriamo i due eventi indipendenti: E1 = "La carta estratta dal primo mazzo è un asso" E2 = "La carta estratta dal secondo mazzo è una carta di fiori" Qual è la probabilità che si verifichino entrambi? p(E1) = 4/40 p(E2) = 10/40 p(E1 e E2) = 4/40 · 10/40 = 40/1600 = 1/40 Problema Anna vuole trovarsi un fidanzato che abbia come segno zodiacale un segno di terra (Toro, Vergine, Capricorno) e abbia gli occhi chiari. Nella sua città 1/3 dei ragazzi ha gli occhi neri, 1/3 ha gli occhi azzurri e 1/3 ha gli occhi verdi. Una sua amica le farà conoscere suo cugino Leo. Che probabilità ha Leo di rispondere ai desideri di Anna? La probabilità che Leo sia un segno di terra è 3 12 = 2 3 1 4 La probabilità che abbia gli occhi chiari è pari a Ma quale sarà la probabilità che sia un segno di terra e abbia contemporaneamente gli occhi chiari? Vediamo tutti i casi possibili ππππ Ariete π£ππππ ππ§π§π’πππ ππππ Gemelli π£ππππ ππ§π§π’πππ ππππ Leone π£ππππ ππ§π§π’πππ ππππ Bilancia π£ππππ ππ§π§π’πππ ππππ Sagittario π£ππππ ππ§π§π’πππ ππππ Acquario π£ππππ ππ§π§π’πππ ππππ Toro ππππ π πππππππ ππππ Cancro π£ππππ ππ§π§π’πππ ππππ Vergine ππππ π πππππππ ππππ Scorpione π£ππππ ππ§π§π’πππ ππππ Sagittario π£ππππ ππ§π§π’πππ ππππ Capricorno ππππ π πππππππ I casi possibili sono 12 × 3 = 36 e di questi quelli favorevoli sono 3 × 2 = 6 Dunque la probabilità che Leo sia lβuomo giusto è 6 3 2 pari a = × 36 12 3 Se consideriamo gli eventi A: Leo è un segno di terra; probabilità π π΄ = B:Leo ha gli occhi chiari; probabilità π π΅ = 2 3 3 12 Lβevento «Leo è un segno di terra con gli occhi chiari» si verifica quando si verificano contemporaneamente A e B (compatibili e indipendenti) e la sua probabilità si può calcolare con π π΄ π π΅ = π π΄ β π(π΅) Eventi dipendenti Due eventi compatibili πΈ1 e πΈ2 si dicono dipendenti se il fatto che si verifichi πΈ1 altera la probabilità che si verifichi πΈ2 . Abbiamo un mazzo di carte da 40. Estraendo due carte in successione, senza rimettere la prima carta estratta nel mazzo, i due eventi: E1 = "La prima carta estratta è un asso" E2 = "La seconda carta estratta è un asso" sono dipendenti. Per la precisione la probabilità di E2 dipende dal verificarsi o meno di E1. Infatti: a) la probabilità di E1 è 4/40 b) la probabilità di E2, se la prima carta era un asso, è 3/39 c) la probabilità di E2, se la prima carta non era un asso, è 4/39 Vediamo questo esempio. Nel portamonete ho 2 monete da 2 euro e 1 moneta da 1 euro. Qual è la probabilità di estrarre come prima e seconda moneta le due monete da 2 euro? πΈ1 : prima pesca di una moneta da 2 euro πΈ2 : seconda pesca di una moneta da 2 euro Per valutare la probabilità del primo evento, interviene la definizione classica 2 π πΈ1 = 3 Prima di precipitarsi ad affermare che la probabilità è la stessa per il secondo evento, bisogna riflettere un poco. Se suppongo che si sia verificato πΈ1 , nel mio portamonete sarà rimasta una moneta da 2 euro e una moneta da 1 euro, dunque la probabilità di pescare la moneta da 2 euro questa volta è 1/2 1 2 π πΈ2 = e non 2 più !! 3 In questo caso, per sottolineare la dipendenza di πΈ2 da πΈ1 , la notazione diventa 1 π πΈ2 /πΈ1 = 2 e si legge probabilità di πΈ2 condizionata a πΈ1 Quindi la probabilità composta sarà 2 3 1 × 2 1 3 = = 33% Quando gli eventi sono compatibili e dipendenti, il teorema del prodotto (o della probabilità composta) assume questa forma: La probabilità che si verifichino i due eventi A e B è il prodotto logico della probabilità che si verifichi A e della probabilità che si verifichi B, una volta verificatosi A (probabilità condizionata) π π¨ π π© = π π¨ β π(π©|π¨) Possiamo considerare la formula già vista π π΄ π π΅ = π π΄ β π(π΅) come un caso particolare della precedente? Certamente: se A e B sono indipendenti vale la relazione π(π΅|π΄) = π(π΅) dato che il verificarsi o meno di A non influenza il verificarsi di B. Possiamo dunque assumere il teorema precedente come teorema generale valido per eventi compatibili, che prevede come caso particolare il caso degli eventi indipendenti. Speriamo non capitiβ¦ Un oratore si appresta a fare il suo discorso di ben 5 cartelle, quando per una distrazione i fogli si sparpagliano a terra. I fogli vengono raccolti frettolosamente e alla rinfusa: qual è la probabilità che lβordine sia quello corretto?? 1 5 La probabilità che la prima pagina sia giusta è La probabilità (condizionata) che la seconda sia giusta, 1 è (perché ho già raccolto una pagina giusta e ne 4 sono rimaste 4 a terra) Proseguendo si trova che la probabilità richiesta è pari a 1 5 × 1 4 1 × 3 × 1 × 2 1= 1 120 = 0,0083 % Eventi contrari Dato un evento E, si dice evento contrario o complementare ad E lβevento che si verifica se e solo quando non si verifica E. Due eventi contrari sono incompatibili. Nel lancio di una moneta, lβevento complementare a «esce testa» è «non esce testa» che coincide β in questo caso βcon lβevento «esce croce». Se n è il numero dei casi possibili e m i casi favorevoli allβevento A π π π΄ = π Mentre la probabilità dellβevento complementare B=πA πβπ π π΅ = π(πA) = = 1 β π(π΄) π Eventi contrari Per valutare la probabilità di un evento, talvolta è più semplice calcolare la probabilità dellβevento contrario e ricordarsi la relazione precedente. Vediamo qualche esempio Trovare la probabilità che, lanciando due dadi, si ottenga come somma delle facce almeno 4. Dato che un punteggio maggiore o uguale di quattro (evento E) si può ottenere in molti modi, conviene pensare allβevento contrario (che si indica con βπΈ oppure πΈ ) πΈ = βsi ottiene un punteggio inferiore a quattroβ. Gli eventi favorevoli ad πΈ sono le tre coppie (1, 1), (1, 2), (2, 1) per cui: p(πΈ ) = 3/36 = 1/12 e la probabilità richiesta è: p(π¬ ) = 1 - 1/12 = 11/12 Un classico gioco dβazzardoβ¦ β¦ consisteva nel lanciare 4 dadi e scommettere sulla possibilità che apparisse almeno un sei. In questo caso è particolarmente conveniente ricorrere allβevento complementare, più semplice da valutare. Il complementare dellβevento «esce almeno un 6 nel lancio di 4 dadi» è (ricordare la negazione del quantificatore «esiste almeno»! ) «non esce mai 6 nel lancio di 4 dadi». Ragioniamo su questo evento: la probabilità di non far 6 con 5 un dado è , quindi β dato che gli eventi sono indipendenti β 6 5 5 5 5 la probabilità di non far 6 con 4 dadi è × × × = 6 6 6 6 625 = 0,482 β¦ 1296 La probabilità dellβevento complementare è dunque 1 β 0,482 = 0,518 Su mille lanci 518 sono favorevoli e 482 sono contrari alle aspettative. Il paradosso del compleanno Qual è la probabilità che in una partita di calcio tra i giocatori e lβarbitro (=23 persone) esistano due persone nate lo stesso giorno? Anche in questo caso ci conviene ragionare sullβevento complementare: tutti compiono gli anni in giorni diversi. La probabilità che la seconda delle 23 persone non abbia 364 lo stesso compleanno della prima è , che il 365 compleanno della terza non coincida con quello delle 363 prime due è etc Alla fine la probabilità che nessun 365 compleanno coincida è pari a 364 363 × 365 365 362 365 343 365 × β¦ =0,493 Quindi lβevento complementare ha una probabilità di verificarsi maggiore del 50% Somma logica di eventi evento unione Consideriamo 12 gettoni numerati e sia πΈ1 = esce un multiplo di 5 πΈ2 = esce un multiplo di 3 Casi favorevoli per πΈ1 ; A= 5, 10 β π(πΈ1 )=2/12=1/6 Casi favorevoli per πΈ2 ; B= 3, 6, 9, 12 β π(πΈ2 )=4/12=1/3 πΈ= esce un numero multiplo di 3 o di 5 Lβinsieme dei casi favorevoli, per definizione del connettivo logico o, è lβunione dei due insiemi precedenti π΄ βͺ π΅ = 3, 5, 6, 9, 10, 12 Quindi π(E)= 6 12 1 2 6 12 = Dal momento che allora = 2 4 + 12 12 , sembrerebbe ovvio dedurre che π πΈ = π πΈ1 + π(πΈ2 ) Ma è sempre così?? Vediamo un altro esempio Somma logica di eventi evento unione Consideriamo 12 gettoni numerati e sia πΈ1 = esce un numero pari πΈ2 = esce un numero maggiore di 7 Casi favorevoli per πΈ1 ; A= 2, 4, 6, 8, 10, 12 β π(πΈ1 )=6/12=1/2 Casi favorevoli per πΈ2 ; B= 8, 9, 10, 11, 12 β π(πΈ2 )=5/12 πΈ= esce un numero pari o un numero maggiore di 7 Lβinsieme dei casi favorevoli, per definizione del connettivo logico o, è lβunione dei due insiemi precedenti π΄ βͺ π΅ = 2,4,6,8,9,10,11,12 8 2 Quindi π(E)= = 12 3 Si noti che π πΈ β π πΈ1 + π πΈ2 Cosa cambia nei due esempi?? Vediamo un altro esempio Qual è la probabilità di estrarre una carta di spade oppure di bastoni da un mazzo di carte da 40? La risposta è semplice: 20 40 = 50% Si può ottenere applicando la definizione classica oppure sommando la probabilità dei due diversi eventi «estrarre bastoni», «estrarre spade» : 10 10 + 40 40 Ancora una volta saremmo tentati di generalizzare il ragionamento affermando La probabilità che si verifichi un evento complesso del tipo A oppure B è pari a π π΄ π π΅ = π π΄ + π(π΅) Consideriamo però anche questo esempio. Qual è la probabilità di estrarre una carta di spade oppure una figura? Dato che le figure sono 12, è corretto affermare che la probabilità dellβevento atteso è 10 12 + 40 40 ππ ππ = ? Proviamo a contare il numero dei casi favorevoli: tutte le 10 carte di spade e 9 figure rimanenti, dunque la ππ probabilità dellβevento atteso è . Come si giustifica ππ questa discrepanza? Il punto è che nella prima valutazione non si è tenuto conto che anche tra le spade ci sono delle figure e quindi abbiamo contato le figure delle spade due volte. Quindi la prima valutazione deve essere corretta in questo senso 10 40 12 + 40 β π ππ = 19 40 Questa volta possiamo generalizzare la formula della probabilità di un evento che è somma logica di due eventi π π¨ π π© = π π¨ + π π© β π(π¨ π π©) Teorema della π(π¨ βͺ π©) = π π¨ + π π© β π(π¨ β© π©) probabilità totale Se i due eventi sono incompatibili (come, nel primo caso, lβuscita delle spade e dei bastoni) allora π π΄ π π΅ = 0 e quindi vale il caso particolare π π΄ π π΅ = p A + p(B) Generalizzazione! Se π¨π , π¨π β¦ π¨π è un insieme di eventi incompatibili allora π π¨π βͺ π¨π βͺ. .βͺ π¨π = π π¨π + π π¨π +. . +π(π¨π ) Consideriamo unβurna contenente 10 palline bianche, 8 verdi, 6 rosse e 4 nere. Qual è la probabilità di estrarre una pallina non bianca? Lβevento atteso è «estrazione di una pallina verde» oppure «rossa» oppure «nera». Gli eventi sono incompatibili e quindi possiamo sommare le relative probabilità 8 6 4 18 + + = = 64% 28 28 28 28 Riproviamociβ¦ Consideriamo ancora i 12 gettoni numerati e sia πΈ1 = esce un numero pari πΈ2 = esce un numero maggiore di 7 Casi favorevoli per πΈ1 ; A= 2, 4, 6, 8, 10, 12 β π(πΈ1 )=6/12 Casi favorevoli per πΈ2 ; B= 8, 9, 10, 11, 12 β π(πΈ2 )=5/12 πΈ= esce un numero pari o un numero maggiore di 7 Possiamo valutare la probabilità dellβevento π πΈ = π πΈ1 βͺ πΈ2 ? Tenendo presente che la probabilità dellβevento π πΈ1 β© πΈ2 «esce un numero pari e maggiore di 7» 3 è (i numeri che soddisfano la richiesta sono 8, 10, 12 12) si ha π πΈ1 βͺ πΈ2 = π πΈ1 + π πΈ2 β π πΈ1 β© πΈ2 6 5 3 8 2 = + β = = 12 12 12 12 3 E si ritrova il valore che avevamo ottenuto contando gli elementi dellβintersezione. Per decidere se applicare il teorema della probabilità totale o quello della probabilità composta si operi come segue: - se l'evento composto è somma di due o più eventi, tra di loro collegati da "o", si ricorre alla probabilità totale [somma logica]; - se l'evento composto è intersezione di due o più eventi, tra di loro collegati da "e", si ricorre alla probabilità composta [prodotto logico]; - se nel testo compaiono sia "o" che "e", si applicheranno i due teoremi nel modo opportuno. Problemi-1 Consideriamo un sacchetto che contiene tre gettoni con i numeri 1, 2, 3. Dal sacchetto estraiamo un gettone e poi un secondo gettone, dopo che il primo è stato rimesso nel sacchetto. Qual è la probabilità che in due estrazioni successive vengano estratti due numeri dispari? Lβevento composto E «escono due numeri dispari» può essere visto come lβevento intersezione dei due eventi semplici: E1«il primo numero è dispari»; π πΈ1 = 2 3 2 E2«il secondo numero è dispari»; π πΈ2 = 3 E1 ed E2 sono indipendenti, perché dopo la prima estrazione il gettone è stato rimesso nel sacchetto 4 π πΈ1 β© πΈ2 = π πΈ1 × π πΈ2 = 9 Problemi-2 Consideriamo ancora il sacchetto con tre gettoni che hanno i numeri 1, 2, 3 e gli eventi E1«il primo estratto è dispari», E2«il secondo estratto è dispari», ma supponiamo che, dopo la prima estrazione, il gettone non venga rimesso nel sacchetto. Calcoliamo, ora, la probabilità dellβevento composto: E «i numeri estratti sono entrambi dispari». Questa volta il secondo evento dipende dal primo. In questo caso il prodotto logico si esprime così π πΈ1 β© πΈ2 = π πΈ1 × π πΈ2 πΈ1 Ma cosa significa π πΈ2 πΈ1 ? Eβ la probabilità che si estragga un numero dispari dopo che è già stato estratto un numero dispari (e sono quindi rimasti due numeri). Dunque π πΈ2 πΈ1 =1/2 2 1 1 π πΈ1 β© πΈ2 = π πΈ1 × π πΈ2 πΈ1 = × = 3 2 3 Problemi-3 Un dado (equo) viene lanciato due volte. Qual è la probabilità che il punteggio ottenuto nel secondo lancio sia minore di quello ottenuto nel primo? Sugg.:Consideriamo le coppie di numeri (p,s), dove p ed s sono due numeri naturali compresi tra 1 e 6, che rappresentano ordinatamente il punteggio conseguito nel primo e nel secondo lancio? Quante sono le coppie (p,s)? In quante di queste coppie p<s? Problemi-4 Nel lancio di un dado, si vuol calcolare la probabilità che esca un numero pari oppure un multiplo di 3. I due eventi A="esce un numero pari" B="esce un multiplo di 3" sono chiaramente compatibili. Si ha: P(A)=3/6, P(B)=2/6 e P(A e B)=1/6 dunque, per il th. della prob. totale P(A o B)= (3/6)+(2/6)- (1/6)=4/6=2/3. Problemi-5 Da un'urna contenente 5 palline rosse e 3 bianche si estraggono una alla volta due palline. Trovare la probabilità che siano entrambe rosse, sapendo che dopo la prima estrazione la pallina estratta viene rimessa nell'urna. A=esce una pallina rossa la prima volta B=esce una pallina rossa la seconda volta sono indipendenti, dato che dopo la prima estrazione, la pallina viene reimbussolata. Per il th. della prob. composta p(A)=5/8 e p(B)=5/8, quindi p(A e B)=25/64 Problemi-6 Da un'urna contenente 5 palline rosse e 3 bianche si estraggono una alla volta due palline. Trovare la probabilità che siano entrambe rosse, sapendo che dopo la prima estrazione la pallina estratta non viene rimessa nell'urna. A=esce una pallina rossa la prima volta B=esce una pallina rossa la seconda volta sono dipendenti, dato che dopo la prima estrazione, la pallina non viene reimbussolata. Per il th. della prob. composta p(A)=5/8 e p(B|A)=4/7, quindi p(A e B)=20/56 Problemi-7 In un cassetto cβè un paio di calzini gialli e un solo calzino blu. Prendendo senza guardare due calzini dal cassetto quale probabilità abbiamo di prenderli dello stesso colore? I modo: Si contano le possibili combinazioni. Detti G1, G2 e B i tre calzini, si hanno le 6 combinazioni G1G2, G1B, G2G1, G2B, BG1, BG2. Le combinazioni favorevoli sono 2, quindi la probabilità è 2/6 = 1/3 = 0,33% II modo A=estrazione di un calzino giallo B=estrazione del secondo calzino giallo p(A)=2/3 p(B|A)=1/2 p(A e B) = p(A) . p(B|A) = 1/3 Problemi-8 Qual è la probabilità di estrarre da un mazzo da briscola nellβordine un asso, un re e un cavallo? a) Se le carte non vengono rimesse nel mazzo la 4 4 4 16 probabilità è β β = 40 39 38 14820 b) Se le carte vengono rimesse nel mazzo, la 4 4 4 1 probabilità è β β = 40 40 40 1000 Problemi-9 Un professore ha una classe di 20 alunni. Per interrogare estrae a sorte un numero corrispondente allβordine alfabetico seguendo questo metodo: apre a caso un libro di 200 pagine e somma tra loro le cifre del numero della pagina. Se il numero ottenuto corrisponde a un alunno questo sarà interrogato, in caso contrario ripete lβestrazione. Gli alunni protestano dicendo che questo metodo di sorteggio non è equo. Hanno ragione? Problemi-9 Gli studenti hanno ragione. Consideriamo il primo alunno in ordine alfabetico. Secondo il metodo del docente può essere interrogato solo se apre alla pagina 1, 10, oppure 100, quindi la probabilità di essere chiamato è 3/200. Il secondo alunno sarà interrogato se escono le pagine 2, 11, 20, 101, 110, 200, cioè la sua probabilità è 6/200, certamente diversa dal primo. E proseguendo la probabilità cambia ancoraβ¦ quante probabilità avrà lβottavo studente di essere interrogato? Problemi di calzini -1 Possiedi 6 paia di calzini, 2 paia sono grigi e 4 paia sono neri. Li hai riposti separati e alla rinfusa in un cassetto. Quando ti alzi al mattino e ne prendi a caso due, che probabilità hai di ottenere un paio dello stesso colore? Per ottenere un paio dello stesso colore, o ne prendi due grigi o ne prendi due neri. La probabilità di prendere due grigi è (4·3)/(12·11) La probabilità di prendere due neri è (8·7)/ (12·11) La probabilità richiesta è (4·3)/(12·11) + (8·7)/ (12·11) = 68/132 = 17/33 Problemi di calzini -2 http://www.cdh.it/matematica/newp3.html In pieno inverno Mario deve vestirsi per andare a scuola ma al momento di prendere dal suo cassetto i 2 calzini che vuole indossare, va via la luce! Sapendo che il cassetto contiene 4 calzini rossi e 4 neri e che i calzini sono tra loro mescolati, quale è il numero minimo di calzini da prendere nel buio più assoluto in modo che almeno due siano indossabili (cioè del medesimo colore)? Indipendentemente dal colore del primo calzino estratto il secondo può essere nell'ipotesi più sfortunata dell'altro colore ma il terzo estratto farà sicuramente coppia con il colore del primo o del secondo! Il postino distratto http://www.cdh.it/matematica/newp3.html Un postino distratto deve consegnare quattro lettere indirizzate a quattro persone diverse ma, avendo dimenticato gli occhiali da vista, le inserisce a caso, una in ciascuna delle cassette postali delle persone in indirizzo. Quale è la probabilità che tutti e quattro ricevano la lettera a loro indirizzata? Questo problema si può risolvere con la stessa logica dellβordine dβarrivo della corsa campestre (primo problema delle slides), oppure osservando che: la probabilità che una persona riceva la lettera giusta è 1/4, in queste ipotesi la probabilità che una delle rimanenti tre persone riceva quella giusta è 1/3 e, sempre in queste ipotesi, la probabilità che le rimanenti due persone ricevano quella giusta è 1/2, quindi 1/4*1/3*1/2 = 1/24 Statistica La statistica si preoccupa si rendere fruibili dei dati dopo averli ordinati, catalogati, sintetizzati. Lβattività della statistica risponde a una duplice esigenza, di tipo (a) Descrittivo (b) Predittivo: aiuta a prevedere comportamenti futuri I valori di sintesi: la media aritmetica (semplice) Indice di posizione Esempio: indagine sul peso corporeo degli abitanti di Firenze (campione di 8 persone). Questi i dati: 50 54 56 60 61 70 73 80 La media aritmetica rappresenta un valore di sintesi, cioè un numero che riassume in sé lβinsieme dei valori registrati 50 + 54 + 56 + 60 + 61 + 70 + 73 + 80 = 63 8 Non è detto che la media sia in assoluto un valore particolarmente significativo, dipende dallo scopo dellβindagine. I valori di sintesi: la media aritmetica (semplice) In generale se abbiamo un certo numero n di dati π1, π2 , β¦ , ππ , si dice media aritmetica semplice, la loro somma divisa per n π1 + π2 + β― + ππ π= π Es. Anna ha sostenuto 5 esami, e ha ottenuto questi voti: 18, 22, 30, 24, 25. Per stabilire la media di Anna, ha senso fare la media aritmetica semplice di questi voti? la media aritmetica ponderata Quando non esisteva il meccanismo dei crediti e ogni esame aveva lo stesso βpesoβ era in effetti così che si sarebbe calcolata la media, ma oggi gli esami hanno pesi diversi e quindi bisogna calcolare la media aritmetica ponderata. Devo quindi sapere quanti crediti vale ciascuno esame Voto CFU 18 6 22 12 30 8 24 6 25 6 la media aritmetica ponderata In questo caso la media ponderata si calcola così: 18 β 6 + 22 β 12 + 30 β 8 + 24 β 6 + 25 β 6 906 = = 23.84 38 38 Ogni addendo della somma al numeratore è un prodotto i cui fattori sono il voto e il βpesoβ dellβesame in CFU; al denominatore troviamo invece il totale di CFU. Voto CFU 18 6 22 12 30 8 24 6 25 6 Uno studente nel corso dellβanno ha preso due volte 6 e dodici volte 4. Può ragionevolmente affermare che la sua media è 5, perché 5 è la media aritmetica tra 6 e4? In realtà anche in questo caso siamo di fronte a una media ponderata. Infatti, se considerassimo la media aritmetica, dovremmo prendere in considerazione due volte 6 e dodici volte 4: 6+6+4+4+4+4+4+4+4+4+4+4+4+4 14 6 β 2 + 4 β 12 = = 4,28 14 In questo caso, infatti, il 6 ha βpesoβ 2, mentre il 4 ha βpesoβ 12. Altri esempi In un palazzo abitano per 11 mesi lβanno 170 persone, mentre in agosto rimane solo il custode con la moglie. Ha qualche senso dire che nel palazzo risiedono mediamente nel corso dellβanno πππβππ+πβπ ππ =156 persone?? Se in unβazienda lavorano 10 dipendenti, di cui 9 hanno stipendio mensile di 1000 euro e 1 dipendente di 3500 euro, è sensato, in uno studio sulle piccole aziende, prendere in considerazione lo stipendio medio di πβππππ+πβππππ ππ =1250 euro?? Altri esempi Se in un negozio di abbigliamento vengono vendute in una settimana 4 paia di pantaloni taglia 42, 24 paia taglia 44, 22 paia taglia 46, 14 paia taglia 48 e 6 paia taglia 50, per un totale di 70 paia di pantaloni, la media tra le taglie vendute, cioè ππ β π + ππ β ππ + ππ β ππ + ππ β ππ + ππ β π = ππ, ππ. . ππ è di qualche utilità per le successive ordinazioni? Negli esempi precedenti la media aritmetica non dà informazioni adeguate e si deve ricorrere a valori di Indice di posizione sintesi diversi. In una successione di dati, si chiama valore normale o moda il valore che si presenta con maggiore frequenza. In un palazzo abitano per 11 mesi lβanno 170 persone, mentre in agosto rimane solo il custode con la moglie. Il valore normale degli abitanti del palazzo è 170 In unβazienda lavorano 10 dipendenti, di cui 9 hanno stipendio mensile di 1000 euro e 1 dipendente di 3500 euro. Il valore normale dello stipendio mensile è 1000 euro. Se in un negozio di abbigliamento vengono vendute in una settimana 4 paia di pantaloni taglia 42, 24 paia taglia 44, 22 paia taglia 46, 14 paia taglia 48 e 6 paia taglia 50, per un totale di 70 paia di pantaloni. Qui il valore normale non dice molto perché non cβè un valore che, per frequenza, si discosta nettamente da tutti gli altri. La mediana Se disponiamo i dati raccolti in ordine crescente, possiamo distinguere due casi: 1. I dati raccolti sono in numero dispari, e allora il valore centrale della successione si chiama mediana: 1 2 4 6 8 8 12 2. I dati raccolti sono in numero pari, e allora la mediana è data dalla media aritmetica tra i due valori centrali 1 2 4 6 8 8 12 12 La media aritmetica tra 6 e 8 è 7, e rappresenta il valore mediano o mediana Eβ un valore di sintesi che ha interesse quando si vuole studiare il comportamento del soggetto medio Una casa automobilistica vuole ingaggiare un pilota. I candidati sono A e B. Negli ultimi 12 Gran Premi si sono classificati A: 1° (3 volte), 5° (6 volte), 9° (3 volte) B: 4° (3 volte), 5° (6 volte), 6° (3 volte) Chi scegliereste? Media piazzamenti di Media piazzamenti di 1β3+5β6+9β3 A: =5 12 4β3+5β6+β6β3 B: =5 12 Moda (e mediana) dei dati di A: 5° posizione Moda (e mediana) dei dati di B: 5° posizione La variabilità di un insieme di dati è misurata dai cosiddetti indici di dispersione. Gli indici di posizione, infatti, non danno nessuna informazione su quanto i vari valori siano vicini tra loro: in altre parole, conoscere la dispersione è importante per sapere se la media è rappresentativa dell'insieme o meno. Lβintervallo (o campo) di variazione è la differenza tra il dato con valore massimo e il dato con valore minimo e misura lβampiezza dellβoscillazione, ovvero la distanza tra i valori estremi. Per il pilota A: intervallo di variazione 9-1= 8 Per il pilota B: intervallo di variazione 6-4=2 Vediamo un esempio simile: Voti di Massimo: 6, 8, 6, 4 Voti di Elena: 6, 6, 6, 6 Per entrambi la media è 6, la moda è 6, la mediana è 6, maβ¦ il campo di variazione per i dati di Massimo è 4, per Elena è 0. Ci sono indicatori più fini come lo scostamento (semplice) medio che dice quanto, mediamente, i dati si discostano dalla loro media. Vediamo cosa succede a Massimo (6, 8, 6, 4) La media M=6; lo scostamento dalla media è dato dal valore assoluto della differenza tra il valore e la media Scostamento semplice 0+2+0+2 4 =1 6β6 + 8β6 + 6β6 +|4β6| 4 = Per Elena lo scostamento è zero. In generale, se abbiamo π₯1 , π₯2 β¦ π₯π e M è la media aritmetica, allora lo scostamento è dato da 1 π π |π₯π β π| π=1 Lo scostamento (o scarto) quadratico medio è la radice quadrata della media aritmetica dei quadrati delle differenze tra ogni valore e la media (scarti). In generale 1 π π |π₯π β π|2 π=1 La speranza matematica La speranza matematica e' il prodotto fra la somma da vincere e la probabilita' di vincerla per indicarla useremo il simbolo: Speranza matematica = Sp essendo S la somma da vincere e p la probabilita' di vincerla Concettualmente la speranza matematica e' il valore che vincerei (o perderei) in media in ogni puntata se il gioco continuasse indefinitamente Lancio una moneta: se esce testa vinco 1 euro, se esce croce perdo 1 euro Speranza matematica per «uscita di testa» somma da vincere 1β¬ probabilita' di uscita di testa = 1/2 Speranza matematica = S1p1 = 1β¬ · 1/2 = 0,5β¬ Speranza matematica per «uscita di croce» somma da vincere -1β¬ (negativo perchélo perdo) probabilita' di uscita di croce = 1/2 Speranza matematica = S2p2 = -1β¬ · 1/2 = - 0,5β¬ Speranza matematica totale = S1p1 + S2p2 = + 0,5β¬ - 0,5β¬ = 0 La speranza matematica del gioco e' nulla: cioe' se giocassi all'infinito dovrei aspettarmi di vincere in media 0 euro per ogni puntata Estraggo una carta da un mazzo di 40: se esce un asso vinco 5 euro, se esce una figura vinco 1 euro Speranza matematica per «uscita di un asso» somma da vincere 5β¬ probabilità di uscita di un asso = 4/40 = 1/10 Speranza matematica = S1p1 = 5β¬ · 1/10 = 0,5β¬ Speranza matematica per "uscita di una figura" somma da vincere 1β¬ probabilità di uscita di croce = 12/40 = 3/10 Speranza matematica = S2p2 = 1β¬ · 3/10 ~ 0,33β¬ Speranza matematica totale = S1p1 + S2p2 ~ + 0,5β¬ + 0,33β¬ ~ 0,83β¬ La speranza matematica del gioco è 0,83 euro circa: cioè se giocassi all'infinito dovrei aspettarmi di vincere in media 0,83 euro per ogni giocata. Si tratta di un gioco sbilanciato, nel senso che posso solo vincere e non perdere Gioco equo Diremo che un gioco e' equo se la speranza matematica totale vale zero Sp = S1p1 + S2p2 + S3p3 + ....... + Snpn = 0 Lancio una moneta: se esce testa vinco 1 euro, se esce croce perdo 1 euro Speranza matematica totale = Sp1 + Sp2 = + 0,5β¬ - 0,5β¬ = 0 Essendo la speranza matematica totale uguale a zero il gioco e' equo Rappresentazione dei dati Per analizzarli e visualizzarli meglio, i dati si riportano in un grafico. In funzione del tipo di fenomeno da rappresentare vi sono diversi tipi di grafici: lβIstogramma, lβAerogramma (o grafico a torta), lβIdeogramma e il diagramma a linee. Grafico a torta http://www.virtualscience.it/statistica/4.html Eβ adatto sopratutto per tappresentare dati espressi in percentuale (%). Per rappresentare i dati grezzi in un grafico a torta, si devono elaborare e trasformare in percentuali. I valori in % si riportano poi nel grafico. Nei grafici a torta lβangolo di SPORT NUMERO DI ALUNNI ogni settore è direttamente CALCIO 7 proporzionale al valore espresso in percentuale NUOTO 4 DANZA 3 NESSUNO 2 Grafico a torta CALCOLO DELLE PERCENTUALI Per rappresentare questi dati in un grafico a torta si devono trasformare in percentuali e poi in gradi: 7:16=x:100 4:16=x:100 3:16=x:100 2:16=x:100 x=44% x=25% x=19% x=13% SPORT NUMERO DI ALUNNI CALCIO 7 NUOTO 4 DANZA 3 NESSUNO 2 Grafico a torta CALCOLO DEGLI ANGOLI DEI SETTORI 100% : 360° = 44% : x 100% : 360° = 25% : x 100% : 360° = 19% : x 100% : 360° = 13% : x x = 155° x = 90° x = 68 ° x = 47 SPORT NUMERO DI ALUNNI CALCIO 7 NUOTO 4 DANZA 3 NESSUNO 2 I diagrammi a barre rappresentano i dati mediante rettangoli le cui basi (o altezze, nel caso di diagrammi orizzontali) hanno una dimensione costante e, comunque, irrilevante. Ciò dipende dal fatto che essi rappresentano delle classi (ciascuna delle quali è contrassegnata da una βetichettaβ) che derivano da una catalogazione dei dati. Si sono intervistate 750 persone con età compresa tra i 18 e i 40 anni. Nella tabella 1 vengono riportati il numero di persone contattate suddivise per età (ossia la frequenza con cui si sono intervistate gli individui con la stessa data anagrafica). Tabella 1: Numero di persone intervistate per età Età 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 totale Tabella 1: Numero di persone intervistate per età frequ enza 25 41 23 45 52 35 16 24 49 27 40 35 24 31 45 39 32 34 24 25 31 27 26 750 In questo caso lβetà è una grandezza che è stata misurata utilizzando una scala metrica (discreta) e quindi sullβasse orizzontale non potrà avere una collocazione arbitraria o convenzionale, ma sarà rappresenta riportando tanti intervalli quante sono le età considerate e collocando ogni età lungo lβasse nel punto corrispondente al valore. Sullβasse verticale, invece, verrà conteggiata la frequenza. A questo punto si possono adottare due strade: 1. lβetà viene rappresentata considerando intervalli con ampiezze uguali pari ad 1 anno 2. lβetà viene rappresentata con intervalli con ampiezze non uguali, ma come viene richiesto nella tabella 2, ossia, il primo intervallo comprenderà due anni (dai 18 anni ai 19 compiuti), il secondo intervallo 11 anni (da chi ha 20 anni compiuti fino a chi ne ha 30 compiuti) e così via... Se si opta per la prima strada [lβetà viene rappresentata considerando intervalli con ampiezze uguali pari ad 1 anno], si costruirà un istogramma con classi uguali età 18 - 19 20 - 30 31 - 35 36 - 40 totale frequenza 66 370 181 133 750 lβetà viene rappresentata con intervalli con ampiezze non uguali, ma il primo intervallo comprenderà due anni (dai 18 anni ai 19 compiuti), il secondo intervallo 11 anni (da chi ha 20 anni compiuti fino a chi ne ha 30 compiuti) e così via... Si noti, però, come le altezze dei vari istogrammi nei due grafici siano cambiate. Ad esempio, nel grafico 1 lβaltezza dellβistogramma, corrispondente allβintervallo dei 18 anni, è 25 e quello dei 19 anni di età è 41. Se si va a vedere il grafico 2 lβaltezza dellβistogramma corrispondente allβintervallo 18-19 anni di età è 33, cioè la media delle persone intervistate che hanno 18 e 19 anni. Infatti, a differenza dei diagrammi a barre, quando si va ad osservare un istogramma, non si deve ragionare in termine di altezze, ma di aree. Se infatti si calcolano le superfici, queste sono proprio uguali al numero di persone che ricadono in quellβintervallo. Si noti, però, come le altezze dei vari istogrammi nei due grafici siano cambiate. Ad esempio, nel grafico 1 lβaltezza dellβistogramma, corrispondente allβintervallo dei 18 anni, è 25 e quello dei 19 anni di età è 41. Se si va a vedere il grafico 2 lβaltezza dellβistogramma corrispondente allβintervallo 18-19 anni di età è 33, cioè la media delle persone intervistate che hanno 18 e 19 anni. Infatti, a differenza dei diagrammi a barre, quando si va ad osservare un istogramma, non si deve ragionare in termine di altezze, ma di aree. Se infatti si calcolano le superfici, queste sono proprio uguali al numero di persone che ricadono in quellβintervallo. Per capire meglio, si segua questa veloce verifica: · nel grafico 1 lβarea del primo istogramma è 25 x 1= 25 che corrisponde proprio al numero di persone intervistate che hanno 18 anni compiuti. Lβarea del secondo istogramma è 41 x 1= 41, che corrisponde proprio al numero di persone intervistate che hanno 19 anni compiuti. · Nel grafico 2, lβarea del primo istogramma è 33 x 2= 66 che corrisponde al numero totale di persone che hanno 18 o 19 anni compiuti. Materiali per attività didattica Matematica 2001. I dati e le previsioni http://umi.dm.unibo.it/old/italiano/Matematica 2001/matematica2001.html B.dβAmore, Probabilità e statistica, FrancoAngeli 1986 Bibliografia G. Spirito, Matematica dellβincertezza, Tascabili Economici Newton M.Sciolis Marino, Probabilità e statistica, http://www.liceovallisneri.it/istituto/pubblicazioni/26_1matem.PDF F.Speranza, D.Medici Caffarra, P.Quattrocchi, Insegnare la matematica nella scuola elementare, Zanichelli 1986 http://online.scuola.zanichelli.it/bergaminifiles/Biennio/Capitoli/BLU/bergamini_capitolo_beta_blu.pdf http://utenti.quipo.it/base5/probabil/teoprobabil.htm