Pillole di Probabilitá Roberto Paoletti∗ Supponiamo di dover fare una previsione su un esito che puó avvenire all’interno di un certo insieme di eventi. Ad esempio, viene lanciato un dado e si vuole fare un pronostico su quale faccia puó uscire; oppure, vengono lanciati due dadi simultaneamente e si vuole fare un pronostico sulla somma delle facce uscite; ancora, si estraggono 5 carte da un mazzo e si vuole fare un pronostico sull’eventualitá che tra queste vi sia un asso; si sceglie a caso un campione di 10 persone da una popolazione data e si vuole fare un pronostico sull’eventualitá che 2 di queste abbiano i capelli turchini, eccetera. Un modo preciso di esprimere tale pronostico é associare a ogni possibile esito un numero reale ≥ 0 e ≤ 1, detto probabilitá. Dire che un dato evento ha probabilitá p di verificarsi come esito delle nostre prove significa che ci aspettiamo che eseguendo un gran numero, poniamo N , di prove, il numero di casi in cui si verifica tale evento é circa pN . Circa qui significa che il numero di casi favorevoli all’evento dato diviso per il numero totale di prove N si avvicina sempre piú, al crescere di N , a p. In termini percentuali, ci aspettiamo che per N molto grande l’evento dato si verifichi circa nel 100p% dei casi. Quindi a un esito é associata una probabilitá p = 1 se ci si aspetta che esso si verifichi nel 100% dei casi, ossia sempre (evento certo), una probabilitá p = 0 se ci si aspetta che esso non si verifichi mai, una probabilitá p = 21 se ci si aspetta che esso si verifichi in metá dei casi (ossia nel 50% dei casi), una probabilitá p = 0, 7 se ci si aspetta che esso si verifichi nel 70% dei casi. Sia Ω l’insieme degli eventi che si possono verificare come esito delle nostre prove. Ad esempio, nel caso del lancio di un dado Ω sará l’insieme degli interi 1, 2, 3, 4, 5, 6; nel caso del lancio di due dadi (che per semplicitá supporremo di colore diverso) sará l’insieme delle coppie ordinate (a, b) con ∗ Indirizzo. Dipartimento di Matematica e Applicazioni, Università degli Studi di Milano Bicocca, Via Bicocca degli Arcimboldi 8, 20126 Milano, Italy; e-mail: [email protected] 1 a, b ∈ {1, 2, 3, 4, 5, 6}; nel caso del lancio di due dadi in cui si prende la somma delle facce uscite Ω sará l’insieme degli interi tra 2 e 12. Diremo che Ω é l’insieme degli eventi. A ogni elemento a ∈ Ω associamo la sua probabilitá, p(a) ∈ [0, 1], che esprime la nostra valutazione di quante volte l’evento a si verificherá come esito di un numero molto grande di prove. Per esempio, supponiamo di lanciare un dado non truccato. La probabilitá a priori che esca la faccia 1 é 1/6, poiché il dado ha 6 facce e non c’é ragione di pensare che una di queste sia piú probabile delle altre. Ció significa che facendo un numero molto grande di lanci del dado ci aspettiamo che il numero di volte che esce la faccia 1 sia 1/6 del totale. In generale, il dado puó essere stato truccato. A ogni faccia del dado 1, 2, . . . , 6 possiamo ancora associare una probabilitá, ma queste non saranno in generale piú uguali. Se A ⊆ Ω é un sottoinsieme, possiamo associare una probabilitá anche ad A; questa é la somma delle probabilitá degli eventi in A, ed esprime la frazione di prove che hanno come esito un evento contenuto in A, quando il numero delle prove é molto grande. Per esempio, sia A l’insieme delle facce pari del dado, A = {2, 4, 6}. Supposto che il dado non sia truccato, la probabilitá di A é p(A) = 61 + 16 + 16 = 1 . In altri termini, ci aspettiamo che lanciando il dado molte volte, il numero 2 di volte che esce una faccia pari sia circa metá del totale (o il 50% dei casi). Poiché almeno uno degli eventi in Ω deve verificarsi, la probabilitá di Ω é 1: nel 100% dei casi si verifica uno degli eventi nell’insieme Ω di tutti gli eventi possibili. In altri termini, se Ω = {a1 , . . . , an }, ove n é il numero degli eventi possibili, abbiamo n X p(ai ) = p(a1 ) + · · · + p(an ) = 1. i=1 Esempio 1. Un dado é stato truccato in modo che la probabilitá che esca la faccia k sia proporzionale a k (k = 1, . . . , 6). Cosa é la probabilitá che esca una faccia pari? Sia x la probabilitá che esca la faccia 1; la probabilitá che esca la faccia k é allora p(k) = x · k. Qui ovviamente per semplicitá scriviamo k per l’evento ak : esce la k-ma faccia. La somma delle probabilitá di tutte le facce deve essere 1; quindi 1= 6 X i=1 p(i) = 6 X x · i = x(1 + 2 + 3 + 4 + 5 + 6) = 21 x, i=1 1 . 21 da cui x = Pertanto la probabilitá che esca una faccia pari é p(P ) = 4 6 12 2 + + = . Si noti che 12 > 12 . 21 21 21 21 21 2 Diamo ora una definizione formale. Si ricordi che [0, 1] = {x ∈ R : 0 ≤ x ≤ 1}. Definizione 1. Sia Ω = {a1 , . . . , an } un insieme finito non vuoto. Una funzione di probabilitá, o piú semplicemente una probabilitá, su Ω é una Pn funzione p : Ω → [0, 1] tale che i=1 p(ai ) = 1. La coppia (Ω, p) si dice uno spazio di probabilitá finito. Esempio 2. L’esempio di probabilitá piú ovvio é quello in cui tutti gli elementi di Ω sono ritenuti equiprobabili, ovvero p é la funzione costante. Chiaramente, deve essere p(a) = 1/|Ω| per ogni a ∈ Ω. In questo caso chiameremo spesso p probabilitá a priori. Esempio 3. Per esempio, nel caso del lancio di un dado non truccato l’insieme degli eventi é l’insieme F = {1, 2, 3, 4, 5, 6} delle facce del dado, e abbiamo posto p(i) = 1/6 per ogni faccia i = 1, 2, 3, 4, 5, 6. Nel caso dell’estrazione di una carta da un mazzo di 52, l’insieme degli eventi é l’insieme M delle carte del mazzo e supponendo il mazzo non truccato porremo p(a) = 1/52 per ogni carta a ∈ M . Nel caso del lancio di due dadi colorati diversamente, l’insieme degli eventi é F 2 = F × F , che ha cardinalitá 62 = 36. La coppia (i, j) ∈ F × F corrisponde all’evento: la faccia del primo dado uscita é i e la faccia del secondo dado uscita é j. La probabilitá a priori di ogni coppia (i, j) ∈ F × F é 1/36. Definizione 2. Sia (Ω, p) uno spazio di probabilitá finito. La funzione p determina una funzione, che denotiamo ancora p, X p(a). p : P(Ω) → [0, 1] data da p(A) = a∈A Si noti che p(Ω) = 1, p(∅) = 0 e p(B) ≤ p(A) se B ⊆ A ⊆ Ω. Inoltre, dati due qualsiasi sottoinsiemi A, B ⊆ Ω, abbiamo p(A ∪ B) = p(A) + p(B) − p(A ∩ B). In particolare, p(A ∪ B) = p(A) + p(B) se A e B sono disgiunti, cioé A∩B = ∅. Nel caso particolare di una probabilitá a priori, naturalmente, |A| . p(A) = |Ω| 3 Per ogni sottoinsieme A ⊆ Ω, abbiamo A ∩ Ac = ∅ e Ω = A ∪ Ac , onde 1 = p(Ω) = p(A) + p(Ac ). Quindi p(Ac ) = 1 − p(A) per ogni A ∈ P(Ω). Esempio 4. Ad esempio, nel lancio di due dadi (che supponiamo sempre distinguibili, per semplificare l’analisi) sia A ⊆ F × F l’insieme delle coppie (i, j) con i e j entrambi pari. In altri termini, A é l’insieme degli esiti per i quali entrambi le facce uscite sono pari. Quindi A = P × P , ove P é l’insieme delle facce pari del dado. Poiché |P | = 3, si ha |A| = 3 · 3 = 9 e pertanto 9 p(A) = 36 = 14 . Quindi lanciando due dadi distinguibili non truccati si ha una probabilitá 1/4 di avere due facce pari; in altri termini si avranno due facce pari nel 25% dei casi, per un numero molto grande di prove. Qual’é la probabilitá di avere almeno una faccia dispari? L’insieme dei lanci di due dadi con almeno una faccia dispari é chiaramente il complementare di A in F . Quindi tale probabilitá é p(Ac ) = 1 − p(A) = 3/4. Pertanto lanciando molte volte due dadi non truccati si ottiene almeno una faccia dispari nel 75% dei casi. Esempio 5. Ripetiamo il calcolo precedente supponendo peró che il secondo dado sia truccato come nell’esempio 1. La probabilitá di una coppia (a, b) é 1 b . Sommando su tutte le coppie (a, b) con a, b pari si ottiene p(P ×P ) = 27 . 6 21 Quindi in questo caso si ha una probabilitá pari a 72 di avere due facce pari. La probabilitá di avere almeno una faccia dispari é 1 − 27 = 57 . Esempio 6. Ancora, estraiamo due carte da un mazzo, senza reinserire la carta estratta. Con quale probabilitá almeno una delle due carte estratte é un asso? L’insieme degli eventi é M (2) , ove M é l’insieme delle carte del mazzo. Questo ha cardinalitá 52 · 51. L’insieme delle estrazioni nelle quali nessuna delle due carte estratte é un asso é N (2) , dove N ⊆ M é l’insieme delle carte che non sono assi. Questo ha cardinalitá 48 · 47. Quindi l’insieme delle estrazioni in cui almeno una carta estratta é un asso é il complementare (N (2) )c . Questo ha cardinalitá 52 · 51 − 48 · 47. Quindi la probabilitá cercata é 52 · 51 − 48 · 47 48 · 47 =1− . 52 · 51 52 · 51 4 Esempio 7. Estraiamo di nuovo due carte da un mazzo, ma questa volta reinserendo nel mazzo la carta estratta, e rimescolando le carte prima della seconda estrazione. Con quale probabilitá almeno una delle due carte estratte é un asso? L’insieme degli eventi questa volta é M 2 , ove M é l’insieme delle carte del mazzo. Questo ha cardinalitá 522 . L’insieme delle estrazioni nelle quali nessuna delle due carte estratte é un asso é N 2 , dove N ⊆ M é l’insieme delle carte che non sono assi. Questo ha cardinalitá 482 . Quindi l’insieme delle estrazioni in cui almeno una carta estratta é un asso é il complementare di N 2 in M 2 . Questo ha cardinalitá 522 − 482 . Quindi la probabilitá cercata é 2 522 − 482 482 12 =1− 2 =1− . 2 52 52 13 Esempio 8. In una stanza ci sono 12 persone, 7 sposate e 5 no. Vengono chiamate fuori dalla stanza a caso 6 persone. Qual’é la probabilitá che il numero di persone sposate tra le 6 chiamate sia 4? Chiamare 6 persone tra le 12 nella stanza vuol dire scegliere un sottoinsieme di cardinalitá 6 dell’insieme delle 12 persone nella stanza. Si puó fare in 12 12! = = 924 6 6! 6! modi. In quanti modi possiamo poi chiamare 6 persone tra le 12 totali in modo da includere esattamente 4 persone sposate ? Possiamo scegliere prima un sottoinsieme di cardinalitá 4 dell’insieme delle 7 persone sposate e poi un sottoinsieme di cardinalitá 6 − 4 = 2 dell’insieme delle 5 persone non sposate. Usando il principio di moltiplicazione, abbiamo in tutto 7 5 · = 35 · 10 = 350 4 2 modi. Quindi la probabilitá che il numero di persone sposate tra le 6 chiamate sia 4 é 350 . 924 Esempio 9. In un urna sono contenute 10 biglie, di cui 5 bianche e 5 nere. Ne vengono estratte 4. Calcolare la probabilitá che il numero di biglie bianche tra le 4 biglie estratte sia k, per ogni 0 ≤ k ≤ 4. Si supponga che le estrazioni siano tutte equiprobabili. Qui l’ordine dell’estrazione é irrilevante: possiamo quindi dimenticarci dell’ordine e pensare a un’estrazione semplicemente come una scelta di 5 biglie tra le 10 contenute nell’urna. 5 Sia Ω l’insieme delle possibili scelte di 5 biglie tra le 10 totali, Ak ⊆ Ω il sottoinsieme delle scelte che includono esattamente k biglie bianche. La probabilitá che il numero di biglie bianche tra le 5 biglie estratte sia k é allora p(Ak ) = |Ak | . |Ω| Cosa é |Ω|? Ovvero: quante sono le possibili scelte? Chiaramente, sono in numero pari ai sottoinsiemi di cardinalitá 5 in un insieme di cardinalitá 10. Quindi, 10 |Ω| = = 210. 4 Cosa é |Ak |? Un elemento di Ak si determina scegliendo prima un sottoinsieme di cardinalitá k dell’insieme B delle 5 biglie bianche, poi un sottoinsieme di cardinalitá 4 − k del sottoinsieme N delle 5 biglie bianche. Quindi, per il principio di moltiplicazione, ci sono 5 5 · |Ak | = k 4−k possibilitá. Pertanto, la probabilitá che il numero di biglie bianche tra le 5 biglie estratte sia k é 1 5 5 p(Ak ) = · . 210 k 4−k Quindi la probabilitá che il numero di biglie bianche tra le 5 biglie estratte sia 0 (cioé che tutte le biglie estratte siano nere) é 1 5 5 1 5 p(A0 ) = · = 1· 5= . 210 0 4 210 210 La probabilitá che il numero di biglie bianche tra le 5 biglie estratte sia 1 é 1 5 5 1 5 p(A1 ) = · = 5 · 10 = . 210 1 3 210 21 La probabilitá che il numero di biglie bianche tra le 5 biglie estratte sia 2 é 1 5 5 1 10 p(A2 ) = · = 10 · 10 = . 210 2 2 210 21 La probabilitá che il numero di biglie bianche tra le 5 biglie estratte sia 3 é 1 5 5 1 5 p(A3 ) = · = 10 · 5 = . 210 3 1 210 21 6 Infine, la probabilitá che il numero di biglie bianche tra le 5 biglie estratte sia 4 é 5 1 1 5 5 · = p(A4 ) = 5· 1= . 0 210 4 210 210 Si noti che p(A0 ) + p(A1 ) + p(A2 ) + p(A3 ) + p(A4 ) = 1. Esempio 10. In una stanza ci sono 2 coppie sposate. Delle 4 persone nella stanza, ne vengono chiamate a uscire 2 a caso. Qual’é la probabilitá che venga chiamata una coppia sposata? La probabilitá che venga chiamata una coppia non sposata? Vediamo la chiamata di due persone come la scelta di un sottoinsieme di ordine due dell’insieme delle quattro persone nella stanza. Questa scelta puó 4 essere fatta in 2 = 6 modi possibili. Le coppie sposate sono due, quindi la probabilitá é 2/6 = 1/3. La probabilitá che venga chiamata una coppia non sposata é 1 − 1/3 = 2/3. Esempio 11. In una stanza ci sono 3 coppie sposate. Delle 6 persone nella stanza, ne vengono chiamate a uscire 4 a caso. Qual’é la probabilitá che vengano chiamate due coppie sposate? La probabilitá che venga chiamata solo una coppia non sposata? Le possibili chiamate corrispondono alle possibili scelte di un sottoinsieme di cardinalitá 4 da un insieme di cardinalitá 6. Quindi, si hanno 64 = 15 possibili chiamate. Chiamare due coppie sposate significa scegliere 2 coppie sposate da un insieme di 3 e quindi si puó fare in 32 = 3 modi distinti. Quindi, abbiamo una probabilitá di 3/15 = 1/5. Calcoliamo la probabilitá che venga chiamata una sola coppia sposata. Chiamando quattro persone, almeno due di queste devono essere sposate. Quindi, o tra le 4 persone chiamate ci sono due coppie sposate, o ce n’é una sola. Pertanto, l’evento viene chiamata una sola coppia sposata é complementare all’evento vengono chiamate due coppie sposate. Quindi la probabilitá che venga chiamata una sola coppia sposata é 1 − 1/5 = 4/5. Equivalentemente, possiamo immaginare di scegliere prima una coppia sposata, poi una coppia non sposata tra le quattro persone rimaste e usare il principio di moltiplicazione per calcolare il numero di chiamate con una sola coppia sposata. Ora ci sono tre coppie sposate, quindi una coppia sposata puó essere scelta in 3 modi; una volta sceltala, tra le quattro persone rimaste, quante coppie non sposate ci sono? I sottoinsiemi di due elementi che si possono 7 scegliere sono 42 = 6, mentre tra questi le coppie sposate sono 2. Quindi tra le 4 persone rimaste si possono scegliere 6 − 2 = 4 coppie non sposate. In totale, usando il principio di moltiplicazione, le possibili scelte di 4 persone tra le 6 totali, di cui due sposate e due no, sono 3 · 4 = 12. Ricordando che il numero di possibili chiamate é 64 = 15, la la probabilitá che venga chiamata una sola coppia sposata é allora 12/15 = 4/5. Esempio 12. In una stanza ci sono 6 coppie sposate. Delle 12 persone nella stanza, ne vengono chiamate a uscire 5 a caso. Qual’é la probabilitá che vengano chiamate due coppie sposate? E quella che venga chiamata una sola coppia sposata? Quella che non venga chiamata nessuna coppia sposata? Il numero totale di possibili chiamate, cioé digruppi di 5 persone che possono essere estratti da un insieme di 12 é 12 = 792. Per contare le 5 possibili chiamate di 5 persone che includono due coppie sposate, immaginiamo di scegliere prima due coppie sposate, quindi un individuo spaiato tra le 12 − 4 = 8 persone rimaste. Contando il numero di scelte a ogni passo e applicando il principio di moltiplicazione otterremo il numero di scelte totali. Ora il numero totale di insiemi di due coppie sposate che si possono formare da 6 date é 62 = 15; scelte queste, si possono scegliere 12 − 4 = 8 possibili individui spaiati. Quindi le scelte di 5 persono tra le 12 date che comprendono due coppie sposate sono 15 · 8 = 120. La probabilitá che chiamando a caso 5 persone tra le date 12 vengano chiamate due coppie sposate é allora 120/792 = 5/33. Calcoliamo la probabilitá che venga chiamata una sola coppia sposata. Possiamo immaginare di scegliere prima una coppia sposata e poi chiamare 3 persone in modo che tra queste 3 nessuna sia sposata con un altra. Ci sono 6 coppie sposate, quindi la coppia sposata puó essere scelta in 6 modi diversi. Fatta questa scelta, possiamo scegliere la terza persona in 10 modi, la quarta in 8 modi, la quinta in 6 (a ogni passo non dobbiamo escludere solo le persone giá scelte, ma anche i rispettivi sposi) e poiché l’ordine non conta dobbiamo poi dividere per 3!. Otteniamo cosı́ 6 · 10 · 8 · 6/6 = 480 possibilitá. La probabilitá che venga chiamata una sola coppia sposata é allora 480/792 = 20/33. Il numero di coppie sposate chiamate é 0, 1 o 2. Quindi l’evento non viene chiamata nessuna coppia sposata é complementare agli eventi viene chiamata una coppia sposata e vengono chiamate due coppie sposate, e questi sono tra loro disgiunti. Quindi la probabilitá che non venga chiamata alcuna coppia sposata é 1 − 20/33 − 5/33 = 8/33. Spazi prodotto. Il principio di moltiplicazione ha in probabilitá la seguente manifestazione. 8 Supponiamo che gli esperimenti sui quali vogliamo esprimere un pronostico consistano ciascuno in r prove, che sono individualmente descritte dagli spazi di probabilitá (Ω1 , p1 ), . . . , (Ωr , pr ). Supponiamo anche che l’esito di una qualsiasi di queste r prove non abbia alcuna influenza sull’esito delle altre. L’insieme degli eventi del nostro esperimento é allora il prodotto Cartesiano Ω1 × · · · × Ωr e la probabilitá é la funzione prodotto p(a1 , . . . , ar ) = p1 (a1 ) · p2 (a2 ) · · · pr (ar ). Ad esempio, il nostro esperimento potrebbe essere il lancio di due dadi: l’esito di ogni lancio é una coppia di facce, e la faccia del primo dado non influisce sulla faccia del secondo dado. Lo spazio degli eventi del lancio di due dadi é F × F , e supposto ad esempio che questi non siano truccati la 1 probabilitá é p(a, b) = 61 · 16 = 36 per ogni a, b ∈ F = {1, 2, 3, 4, 5, 6}. Oppure, il nostro esperimento potrebbe consistere nel lancio di un dado e nell’estrazione di una carta da un mazzo di 52. L’esito del lancio non influisce su quello dell’estrazione e viceversa. Lo spazio degli eventi é in questo caso il prodotto cartesiano F × M , e la probabilitá - supposti il dado e il mazzo non truccati - é la funzione costante: p(a, x) = 1 1 1 · = (a ∈ F, x ∈ M ). 6 52 312 Ancora, il nostro esperimento potrebbe consistere nel lancio di due dadi, di cui uno non truccato e il secondo truccato in modo che la probabilitá di ottenere la k-ma faccia sia proporzionale a k (cfr esempio 1). Anche in questo caso la faccia di un dado non influisce sulla faccia dell’altro. Quindi lo spazio degli eventi é sempre F × F , e la probabilitá é p(a, b) = 1 b b = . 6 21 126 In altre parole, lo spazio di probabilitá che descrive il nostro esperimento é il prodotto degli spazi delle prove individuali, che ora definiamo formalmente. Cominciamo dal caso r = 2. Siano (Ω1 , p1 ) e (Ω2 , p2 ) spazi di probabilitá finiti. Lo spazio prodotto é la coppia (Ω1 × Ω2 , p), ove p(a, b) = p1 (a) · p2 (b) (a ∈ Ω1 , b ∈ Ω2 ). Supponiamo Ω1 = {a1 , · · · , am }, Ω2 = {b1 , . . . , bn }. Che (Ω1 × Ω2 , p) sia effettivamente uno spazio di probabilitá segue dalla X X X X p(ai , bj ) = p1 (ai )p2 (bj ) = p1 (ai ) p2 (bj ) = 1 · 1 = 1. i,j i,j i 9 j Analogamente si definisce il prodotto di r spazi di probabilitá finiti (Ω, p) = (Ω1 , p1 ) × · · · × (Ω2 , p2 ) (r ≥ 2): Ω = Ω 1 × · · · × Ωr , p(a1 , . . . , ar ) = p1 (a1 ) · p2 (a2 ) · · · pr (ar ). . Riepilogando: lo spazio prodotto (Ω1 , p1 )×· · ·×(Ωr , pr ) descrive i possibili esiti di insiemi di r prove indipendenti, di cui una ha esiti possibili in Ω1 , una in Ω2 , eccetera. Gli esempi 4, 7 sono esempi di spazi di probabilitá prodotto. Esempio 13. Cappuccetto Rosso deve attraversare il bosco. Puó scegliere tre sentieri, che numeriamo 1, 2 e 3. La probabilitá che scelga il sentiero k-mo é proporzionale a k. Un lupaccio affamato si apposta con uguale probabilitá su uno qualsiasi dei tre sentieri per sbranare le bambine di passaggio. Il lupo e Cappuccetto Rosso non sanno che scelta fará l’altro. Qual’é la probabilitá che Cappuccetto Rosso venga sbranata? Qual’é la probabilitá che Cappuccetto Rosso attraversi il bosco indenne? Sia (C, p1 ) lo spazio di probabilitá che descrive le scelte di Cappuccetto Rosso. Quindi C = {c1 , c2 , c3 }, ove c1 é l’evento Cappuccetto Rosso sceglie il primo cammino, c2 é l’evento Cappuccetto Rosso sceglie il secondo cammino, c3 é l’evento Cappuccetto Rosso sceglie il terzo cammino. La probabilitá p1 si determina scrivendo p1 (ck ) = xk (k = 1, 2, 3) e usando la condizione p(1) + p(2) + p(3) = 1 per determinare x. Si ha p(1) + p(2) + p(3) = 6x e quindi x = 1/6. Quindi p1 (c1 ) = 1/6, p1 (c2 ) = 1/3, p1 (c3 ) = 1/2. Sia poi (L, p2 ) lo spazio di probabilitá che descrive le scelte del lupo. Quindi L = {`1 , `2 , `3 }, ove `1 é l’evento il lupo si apposta sul primo cammino, l2 é l’evento il lupo si apposta sul secondo cammino, `3 é l’evento il lupo si apposta sul terzo cammino. Le tre scelte del lupo sono equiprobabili, quindi p2 é la funzione costante = 1/3, cioé p2 (`1 ) = 1/3, p2 (`2 ) = 1/3, p2 (`3 ) = 1/3. Poiché Cappuccetto Rosso e il lupo non sanno niente l’uno dell’altra, le loro scelte sono indipendenti. Quindi, lo spazio di probabilitá che descrive congiuntamente le scelte di Cappuccetto Rosso e del lupo é il prodotto (C, p1 ) × (L, p2 ). Pertanto, l’insieme degli eventi é il prodotto Cartesiano C×L, ove (ck , `i ) ∈ C × L é l’evento Cappuccetto Rosso sceglie il cammino k-mo e il lupo si apposta sul cammino i-mo. La funzione probabilitá é p(ck , `i ) = p1 (ck ) · p2 (`i ) = 10 k k 1 · = . 6 3 18 Cappuccetto Rosso verrá sbranata se sceglie lo stesso cammino sul quale si é appostato il lupo. Quindi la probabilitá che Cappuccetto Rosso venga sbranata é p(c1 , `1 ) + p(c2 , `2 ) + p(c3 , `3 ) = 1 2 3 1 + + = . 18 18 18 3 La probabilitá che Cappuccetto Rosso non venga sbranata é 1− 1 2 = . 3 3 Esempio 14. Come tanti altri giorni, Donna Giovanna va alla spiaggia con i suoi amici Gino, Rino e Pino. L’acuto bagnino Remo ha osservato da tempo che Donna Giovanna ha le sue preferenze: la probabilitá che si faccia spalmare la crema da Gino é il triplo di quella di Rino, che a sua volta é la metá di quella di Pino. Oggi Donna Giovanna, come sempre, si fará spalmare la crema 3 volte. Stabilire la probabilitá che oggi se la faccia spalmare sempre da Gino e quella che se la faccia spalmare almeno due volte da Gino, supponendo che ogni volta la scelta sia indipendente dalle precedenti. Sia C = {G, R, P }, ove R corrisponde all’evento Donna Giovanna si fa spalmare la crema da Rino, e cosı́ via. La funzione di probabilitá su C é determinata a partire dalle condizioni 3 p(G) = 3p(R) = p(P ) e p(G) + p(P ) + p(R) = 1. 2 In effetti, abbiamo 1 = 3 p(R) + 2 p(R) + p(R) = 6 p(R) e quindi p(R) = 1/6, p(P ) = 1/3, p(G) = 1/2. Lo spazio degli eventi per il nostro problema é allora lo spazio prodotto (C, p) × (C, p) × (C, p). Sia q la probabilitá prodotto su C × C × C. La probabilitá che Donna Giovanna si faccia spalmare la crema solo da Gino é allora q(G, G, G) = p(G)3 = 1/8. Quindi, su molte giornate passate in spiaggia, Gino spalmerá la crema a Giovanna tutte e tre le volte in circa il 12, 5% del casi. La probabilitá che Giovanna si faccia spalmare la crema da Gino solo la prima e la seconda volta é poi q(G, G, P ) + q(G, G, R) = 111 111 1 1 1 + = + = . 223 226 12 24 8 Ragionando allo stesso modo negli altri casi si vede che la probabilitá che Gino spalmi la crema esattamente 2 volte é 83 , e quindi quella che la spalmi almeno 2 volte é 83 + 81 = 12 . Quindi, su molte giornate passate in spiaggia, Gino spalmerá la crema a Giovanna almeno due volte in circa il 50% del casi. 11 Esempio 15. Riferendoci all’esempio 14, quale é la probabilitá che Gino spalmi la crema a Giovanna al piú una volta? E al piú due volte? Se la probabilitá che Gino spalmi la crema almeno due volte é 12 , quella che la spalmi al piú una volta é 1 − 12 = 12 . Analogamente, se la probabilitá che Gino spalmi la crema tre volte é 18 , quella che la spalmi al piú due volte é 1 − 81 = 78 . Quindi, su molte giornate passate in spiaggia, Gino spalmerá la crema a Giovanna al piú due volte in circa l’87, 5% del casi. Esempio 16. Reduci l’uno da una festa esagerata a casa di Biancaneve e l’altro da una serata in osteria, Ciuccolo e Sbronzolo si mettono alla guida avendo alzato un pó troppo il gomito. I due incoscienti sfrecciano sulla statale, altrimenti deserta, a fari spenti in una notte senza luna, viaggiando in direzioni opposte l’uno verso l’altro. Supponendo che Ciuccolo abbia una probabilitá del 30% di trovarsi sulla corsia opposta a quella di marcia e che tale probabilitá sia del 40% per Sbronzolo, calcolare la probabilitá che i due si scontrino l’uno contro l’altro. Sia ΩC = {Cm , Co }, ove Cm é l’evento Ciuccolo é sulla corsia di marcia quando incrocia Sbronzolo e Co é l’evento Ciuccolo é sulla corsia opposta a quella di marcia quando incrocia Sbronzolo. Su ΩC abbiamo la funzione di probabilitá pC : ΩC → [0, 1] definita da pC (Cm ) = 0, 7, pC (Co ) = 0, 3. Analogamente, sia ΩS = {Sm , So }, ove Sm é l’evento Sbronzolo é sulla corsia di marcia quando incrocia Ciuccolo e So é l’evento Sbronzolo é sulla corsia opposta a quella di marcia quando incrocia Ciuccolo. Su ΩS abbiamo la funzione di probabilitá pS : ΩS → [0, 1] definita da pS (Sm ) = 0, 6, pS (Co ) = 0, 4. Poiché i due viaggiano a fari spenti, non si accorgono l’uno dell’avvicinarsi dell’altro e quindi la corsia dove si trova l’uno non ha influenza sulla corsia sulla quale si trova l’altro al momento in cui si incrociano. Pertanto lo spazio di probabilitá che descrive la posizione di entrambi al momento in cui si incrociano é proprio il prodotto (ΩC , pC ) × (ΩS , pS ). Non si ha impatto tra Ciuccolo e Sbronzolo se quando i due si incrociano essi sono entrambi sulla corsia di marcia oppure sono entrambi sulla corsia opposta a quelle di marcia. Quindi se (ΩC × ΩS , q) é lo spazio di probabilitá prodotto, allora la probabilitá che non ci sia impatto é q(Cm , Sm ) + q(Co , So ) = pC (Cm ) pS (Sm ) + pC (Co ) pS (So ) = 0, 7 · 0, 6 + 0, 3 · 0, 4 = 0, 42 + 0, 12 = 0, 54. Quindi la probabilitá che ci sia impatto é 1 − 0, 54 = 0, 46. Si noti che é implausibile che Ciuccolo e Sbronzolo possano ripetere l’esperimento molte volte. Un’intepretazione frequenzistica di tale probabilitá é la seguente: se N 12 coppie di automobilisti dovessero trovarsi a guidare nelle medesime condizioni di Ciuccolo e Sbronzolo, per N molto grande si avrebbe impatto nel 46% dei casi. Esempio 17. Il prodotto degli spazi di probabilitá é una descrizione appropriata di un processo dato da r prove solo quando nessuna di queste prove influenza le altre. Per esempio, se estraiamo r carte da un mazzo senza reinserirle via via nel mazzo, lo spazio di probabilitá non é il prodotto di r copie dello spazio di una estrazione (come nel caso in cui si reiserisce la carta) ma 1 lo spazio (M (r) , p), ove p é la funzione costante = 52·51···(52−r+1) . Prove ripetute e indipendenti. Come caso particolare delle considerazioni precedenti, supponiamo che il nostro esperimento consista nella ripetizione di r prove indipendenti e che queste siano descritte individualmente dal medesimo spazio di probabilitá finito (Ω, p). Allora come si é detto lo spazio di probabilitá che descrive il nostro evento é il prodotto (Ω, p) × · · · × (Ω, p) (r volte). Se 1 ≤ k ≤ r e Ω = {a1 , . . . , an }, fissiamo un elemento aj ∈ Ω e chiediamoci qual’é la probabilitá di ottenere esattamente k volte l’esito aj in una sequenza di r prove. Ad esempio, il nostro esperimento potrebbe consistere in 5 lanci (ordinati: o 1 lancio, 2o lancio, eccetera) di un dado non truccato. In questo caso, lo spazio di probabilitá di ogni singola prova é (F, p), ove F = {1, 2, 3, 4, 5, 6} e p é la funzione costante = 1/6. Lo spazio di probabilitá che descrive le nostre 5 prove collettivamente é il prodotto (F 5 , q), ove q é la funzione costante = 1/65 . Ci possiamo chiedere, per dire, qual’é la probabilitá di ottenere 3 volte la faccia 2 lanciando 5 volte un dado. Oppure, il nostro esperimento potrebbe consistere in 4 estrazioni successive di una carta da un mazzo con reinserimento della carta estratta e rimescolamento del mazzo prima dell’estrazione successiva (o equivalentemente in 4 estrazioni di una carta ciascuna da un mazzo diverso). In questo caso, come si é detto, lo spazio di probabilitá di ogni singola prova é (M, p), ove M é l’insieme delle carte del mazzo e p é la funzione costante = 1/52, mentre quello che descrive collettivamente le 4 prove é (M 4 , q) ove q é la funzione costante = 1/524 . Ci possiamo allora chiedere qual’é la probabilitá di ottenere 3 volte un asso in un estrazione odinata di 4 carte. Ancora, l’esperimento potrebbe consistere nell’estrazione ordinata di 10 persone da una popolazione data, con reinserimento della persona dopo ogni sorteggio. Potremmo allora chiederci la probabilitá di ottenere 3 persone coi capelli rossi in un’estrazione siffatta. Torniamo alla formulazione generale del nostro problema: Se Ω = {a1 , . . . , an }, 13 fissiamo un elemento aj ∈ Ω e chiediamoci qual’é la probabilitá di ottenere esattamente k volte l’esito aj in una sequenza di r prove, con 1 ≤ k ≤ r fissato. Innanzitutto, qual’é la probabilitá di ottenere aj solo la prima, la seconda, · · · , la k-ma prova? Se q : Ωr → [0, 1] é la probabilitá prodotto, non é difficile vedere che la probabilitá di ottenere aj la prima, la seconda, n−k · · · , la k-ma prova e in nessun’altra prova é p(aj )k 1 − p(aj ) . Questa va moltiplicata per il numero di sottoinsiemi di {1, . . . , n} di cardinalitá k, n cioé k : in definitiva, la probabilitá di ottenere esattamente k volte l’esito aj in r prove ripetute e indipendenti é r−k r p(aj )k 1 − p(aj ) . k Niente paura se la dimostrazione non é chiarissima: quello che conta é il risultato. La stessa conclusione vale se ci chiediamo la probabilitá di ottenere esattamente k volte un esito appartenente a un dato sottoinsieme A ⊆ Ω, quando a p(aj ) si sostituisca p(A). In altre parole, se A ⊆ Ω allora la probabilitá di ottenere esattamente k volte un esito in A in r prove ripetute e indipendenti é r−k r . p(A)k 1 − p(A) k Possiamo ora ritornare sugli esempi citati qui sopra. Esempio 18. Il nostro esperimento consiste in 5 lanci successivi di un dado non truccato e ci chiediamo qual’é la probabilitá di ottenere esattamente 3 volte la faccia 2 lanciando 5 volte un dado. Allora r = 5, k = 3 e p = 1/6. Quindi la probabilitá di ottenere 3 volte la faccia 2 in 5 lanci di un dado non truccato é 5−2 3 5 1 1 1 1 1 125 1250 1− = 10 2 1 − = 10 = . 2 2 6 6 6 6 36 216 7776 Esempio 19. Il nostro esperimento consiste in 4 estrazioni successive di una carta da un mazzo con reinserimento della carta estratta e rimescolamento del mazzo prima dell’estrazione successiva. Ci chiediamo qual’é la probabilitá di ottenere esattamente 3 volte un asso in un’estrazione ordinata di 4 carte. In questo caso r = 4, k = 3 e A ⊆ M é l’insieme degli assi. Quindi, p(A) = 4/52 = 1/13. la probabilitá cercata é quindi 4−3 4 1 1 1 12 48 1− =4 3 = 4. 3 3 13 13 13 13 13 14 Esempio 20. Il nostro esperimento consiste in 6 estrazioni successive di una carta da un mazzo con reinserimento della carta estratta e rimescolamento del mazzo prima dell’estrazione successiva. Ci chiediamo qual’é la probabilitá di ottenere esattamente 3 volte una figura in una tale estrazione ordinata di 6 carte. In questo caso r = 6, k = 3 e se F ⊆ M é l’insieme delle figure dobbiamo calcolare 6−3 6 p(F )3 1 − p(F ) . 3 Abbiamo p(F ) = |F |/|M | = 12/52 = 3/13 e quindi otteniamo 27 103 540000 = . 133 133 136 Esempio 21. Il nostro esperimento consiste in 8 lanci successivi di un dado non truccato. Ci chiediamo qual’é la probabilitá di ottenere esattamente 4 volte una faccia pari. In questo caso r = 8, k = 4 e se P ⊆ F = {1, 2, 3, 4, 5, 6} é l’insieme delle facce pari dobbiamo calcolare 8−4 8 p(P )4 1 − p(P ) . 4 20 Abbiamo p(P ) = |P |/|F | = 1/2 e quindi otteniamo 35 1 1 = . 4 4 2 2 128 Esempio 22. Un dado é stato truccato in modo che la probabilitá di ottenere la faccia k sia proporzionale a k. Qual’é la probabilitá di ottenere esattamente 4 facce pari in 8 lanci del dado? Questa volta p(P ) = 12/21 (esempio 1). Quindi otteniamo 8−4 8 1084 p(P )4 1 − p(P ) = 70 8 . 4 21 70 Esempio 23. Un esame di Elementi di Matematica di una certa universitá consiste di un test a scelta multipla composto da 5 domande, per ciascuna delle quali sono proposte 4 possibili scelte. Uno studente si presenta all’esame senza avere studiato e rispondendo a caso. Calcolare la probabilitá che lo studente passi l’esame, sapendo che per la sufficienza occorrono almeno tre risposte corrette. Calcolare la probabilitá che lo studente sia bocciato. La probabilitá che lo studente risponda a una domanda correttamente é p = 1/4. Calcoliamo la probabilitá p(5) che lo studente risponda correttamente a tutte le domande: abbiamo r = k = 5, p = 1/4 e quindi p(5) = 15 1 . 45 Calcoliamo la probabilitá p(4) che lo studente risponda correttamente a 4 domande: abbiamo r = 5 e k = 4, p = 1/4 e quindi 5 1 3 15 p(4) = = 5. 4 4 4 4 4 Calcoliamo la probabilitá p(3) che lo studente risponda correttamente a 3 domande: abbiamo r = 5 e k = 3, p = 1/4 e quindi 5 1 9 90 p(4) = = 5. 3 3 4 16 4 La probabilitá che lo studente passi l’esame é allora p(3) + p(4) + p(5) = 13 . 128 13 La probabilitá che lo studente sia bocciato é invece 1 − 128 = 115 . 128 12,8 13 Si noti per inciso che 0, 1002 > 128 > 128 = 0, 1, quindi se un numero molto grande di studenti impreparati cerca di passare l’esame rispondendo a caso, circa il 10% di loro otterrá la sufficienza. Probabilitá condizionata. Consideriamo il seguente esperimento. In una stanza ci sono 6 persone, 4 donne e 2 uomini, di nome Lina, Tina, Pina, Gina, Gino, Lino. Viene chiamata a caso una di queste persone e le chiamate sono tutte equiprobabili. La probabilitá che la persona chiamata sia Lina é allora chiaramente 1/6. La probabilitá che la persona chiamata sia un uomo é 2/6 = 1/3. Supponiamo ora che la chiamata sia giá avvenuta e che vi venga detto soltanto che la persona chiamata é una donna. Qual’é la probabilitá che si tratti di Lina? Chiaramente, la risposta da dare adesso é 1/4, poiché ci sono 4 donne nella stanza e sono tutte equiprobabili. La probabilitá che la persona chiamata sia un uomo é ovviamente 0. In altri termini, supposto che si verifichi l’evento viene chiamata una donna la probabilitá che si verifichi l’evento viene chiamata Lina é 1/4, quella che si verifichi l’evento viene chiamato un uomo é 0. Supponiamo ora che Lina, Tina e Gino abbiano i capelli rossi, mentre Pina, Gina e Lino hanno i capelli neri. La chiamata é appena avvenuta e come unica informazione vi viene detto che la persona chiamata ha i capelli rossi. Qual’é la probabilitá che la persona chiamata sia Lina? Quella che la persona chiamata sia un uomo? Quella che sia una donna? Quella che sia Lino? Chiaramente, poiché le persone coi capelli rossi sono 3 e queste sono equiprobabili, la probabilitá che la persona chiamata sia Lina é 1/3, quella 16 che sia un uomo é 1/3 (Gino é l’unico uomo tra le tre persone rosse di capelli) e quella che sia una donna é 1 − 1/3 = 2/3. In altri termini, supposto che si verifichi l’evento viene chiamata una persona coi capelli rossi la probabilitá che si verifichi l’evento viene chiamata Lina é 1/3, quella che si verifichi l’evento viene chiamato un uomo é 1/3, quella che si verifichi l’evento viene chiamato una donna é 2/3. Queste semplici osservazioni ci portano alla seguente Definizione 3. Consideriamo un esperimento descritto da uno spazio di probabilitá (Ω, p). Siano A, B ⊆ Ω sottoinsiemi di Ω e supponiamo che p(B) > 0 (B non é impossibile). La probabilitá di avere come esito un evento in A supposto che si verifichi un evento in B, o come si dice spesso la probabilitá condizionata di A dato B, é: p(A|B) = p(A ∩ B) . p(B) Ad esempio, nella situazione precedente, Ω = {Lina, Tina, Pina, Gina, Gino, Lino} e p é la probabilitá costante = 1/6. Poniamo A = {Lina} e B = {Lina, Tina, Pina, Gina}. La probabilitá che verifichi l’evento viene chiamata Lina (cioé un evento in A), noto che é stata chiamata una donna (cioé che si é verificato un evento in B) é p(A ∩ B) 1 p(A|B) = = . p(B) 4 Se poniamo A = {Gino, Lino} e B = {Lina, Tina, Pina, Gina}, la probabilitá che venga chiamato un uomo (cioé che si verifichi un evento in A), noto che é stata chiamata una donna (cioé che si é verificato un evento in B) é p(A ∩ B) 0 p(A|B) = = = 0. p(B) 4 Se poniamo A = {Gino, Lino} e B = {Lina, Tina, Gino}, 17 la probabilitá che venga chiamato un uomo (cioé che si verifichi un evento in A), noto che é stata chiamata una persona coi capelli rossi (cioé che si é verificato un evento in B) é p(A|B) = p(A ∩ B) 1 = . p(B) 3 Esempio 24. Vengono lanciati due dadi. Vi viene detto che la somma delle facce uscite é 4. Qual’é la probabilitá che una delle facce uscite sia 2? In questo caso Ω = F × F , dove F = {1, 2, 3, 4, 5, 6}, p é la funzione costante = 1/6, B = {(i, j) ∈ F × F : i + j = 4} e A = {(i, j) ∈ F × F : almeno uno tra i e j é = 2 }; quindi A ∩ B = {(2, 2)} e B = {(1, 3), (2, 2), (3, 1)}. Pertanto p(A|B) = 13 . Esempio 25. Pino e Lino estraggono ciascuno 4 carte da un mazzo. Qual’é la probabilitá che Lino abbia estratto esattamente due carte di cuori? Qual’é la probabilitá che Lino abbia estratto esattamente due carte di cuori se siamo alle spalle di Pino e vediamo che Pino ha estratto due carte di cuori e due di fiori? Sia Ω l’insieme delle possibili estrazioni di Lino, se non sappiamo niente delle carte di Pino. Ora le possibili estrazioni di Lino, se non sappiamo niente delle carte di Pino, sono |Ω| = 52 . Sia A ⊆ Ω il sottoinsieme delle estrazioni 4 che includono esattamente due carte di cuori. La probabilitá cercata nella prima domanda é p(A) = |A| . Cosa é |A|? Le estrazioni che includono |Ω| esattamente due carte di cuori si possonoscegliere in due passi: i) scegliamo due qualsiasi carte di cuori: si hanno 13 possibilitá; ii): scegliamo 2 carte 2 39 qualsiasi tra le 52 − 13 = 39 carte non di cuori: si hanno 2 possibilitá. Quindi le estrazioni che includono esattamente due carte di cuori sono in numero di |A| = 13 · 39 e la probabilitá che Lino abbia estratto esattamente 2 2 due carte di cuori, se non sappiamo niente delle carte di Pino, é 39 13 · 2 |A| 2 . p(A) = = 52 |Ω| 4 Supponiamo ora di sapere che che Pino ha estratto due carte di cuori e due di fiori. Sia B ⊆ Ω l’insieme delle possibili estrazioni di Lino tra le carte rimaste nel mazzo. Queste sono ovviamente le scelte di sottoinsiemi di 4 elementi nell’insieme delle 52 − 4 = 48 carte non estratte da Pino: sono quindi in numero di |B| = 48 . Tra queste, quelle che includono esattamente 4 due carte di cuori sono gli elementi di A ∩ B e si possono scegliere in due passi: i) scegliamo due qualsiasi carte di cuori tra quelle non estratte da Pino: 18 si hanno 11 possibilitá; ii): scegliamo 2 carte qualsiasi tra le 48 2 − 11 = 37 37 carte non di cuori non estratte da Pino: si hanno |A ∩ B| = 2 possibilitá. La probabilitá che Lino abbia estratto esattamente due carte di cuori, con la data informazione sulle carte di Pino, é 37 11 · 2 |A ∩ B| 2 . = p(A|B) = 48 |B| 4 Probabilitá condizionata e partizioni. Talvolta sono note le probabilitá condizionate p(A|Bi ) di A rispetto a degli eventi Bi che formano una partizione ordinata di Ω e si vuole dedurne p(A). Consideriamo prima il caso di una partizione ordinata di Ω della forma Ω = B ∪ B c (cioé B1 = B e B2 = B c ). Sia allora (Ω, p) uno spazio di probabilitá e siano A, B ⊆ Ω. Supponiamo 1 > p(B) > 0; si ha allora anche p(B c ) = 1 − p(B) > 0. Abbiamo A = A ∩ Ω = A ∩ (B ∪ B c ) = (A ∩ B) ∪ (A ∩ B c ). Poiché (A ∩ B) ∩ (A ∩ B c ) = ∅, otteniamo (si ricordi che la probabilitá é additiva in unioni disgiunte): p(A) = p(A ∩ B) + p(A ∩ B c ) = p(A|B)p(B) + p(A|B c )p(B c ). (1) Esempio 26. Il grande capo Coniglio Ruggente é molto ghiotto di passato di carote. Coniglio Ruggente ha due squaw, Rana Pelosa e Imbuto Rovesciato, incaricate di preparare una scorta di passato. Rana Pelosa prepara il 60% delle porzioni e Imbuto Rovesciato il restante 40%. Ogni porzione viene cucinata singolarmente e poi messa nel freezer. Rana Pelosa imbrocca la ricetta del passato di carote il 70% delle volte che cucina, Imbuto Rovesciato il 50%. Calcolare la probabilitá che stasera Coniglio Ruggente, prendendo a caso una porzione dal freezer e riscaldandola nel microonde, mangi un buon passato di carote. Qui Ω é l’insieme delle porzioni di passato di carote preparate dalle due squaw, A ⊆ Ω il sottoinsieme di quelle preparate bene, B ⊆ Ω il sottoinsieme di quelle preparate da Rana Pelosa, B c ⊆ Ω il sottoinsieme di quelle preparate da Imbuto Rovesciato. Quindi vogliamo trovare p(A), conoscendo: i) la probabilitá che una porzione sia venuta bene, noto che l’ha preparata Rana Pelosa, cioé p(A|B) = 0, 7; ii): la probabilitá che una porzione sia venuta bene, noto che l’ha preparata Imbuto Rovesciato, cioé p(A|B c ) = 0, 5; iii): la probabilitá che una porzione sia stata preparata da Rana Pelosa, cioé 19 p(B) = 0, 6; iv): la probabilitá che una porzione sia stata preparata da Imbuto Rovesciato, cioé p(B c ) = 1 − 0, 6 = 0, 4. Applicando la nostra fida formuletta, troviamo: p(A) = 0, 7 · 0, 6 + 0, 5 · 0, 4 = 0, 42 + 0, 2 = 0, 62. Quindi, Coniglio Ruggente mangerá un buon passato il 62% delle volte. Esempio 27. Il tribunale di Giustonia condanna un imputato colpevole nel 90% dei casi e un imputato innocente nell’1% dei casi. L’80% degli imputati nel tribunale di Giustonia é colpevole, il restante 20% innocente. Calcolare la probabilitá che un imputato preso a caso venga condannato e quella che venga assolto. Sia Ω l’insieme degli imputati. Sia A ⊆ Ω l’insieme di quelli condannati. Sia B ⊆ Ω l’insieme di quelli colpevoli, B c l’insieme di quelli innocenti. Vogliamo calcolare p(A), sapendo che p(B) = 0, 8, p(B c ) = 0, 2, p(A|B) = 0, 9, p(A|B c ) = 0, 01. Si ha p(A) = p(A|B)p(B) + p(A|B c )p(B c ) = 0, 9 · 0, 8 + 0, 01 · 0, 2 = 0, 722. La probabilitá che un imputato preso a caso venga assolto é 1 − 0, 722 = 0, 278. Esempio 28. Il tribunale di Acchiappacitrulli condanna un imputato colpevole nel 10% dei casi e un imputato innocente nell’91% dei casi. Il 90% degli imputati nel tribunale di Acchiappacitrulli é innocente, il restante 10% colpevole. Calcolare la probabilitá che un imputato preso a caso venga condannato e quella che venga assolto. Sia Ω l’insieme degli imputati. Sia A ⊆ Ω l’insieme di quelli condannati. Sia B ⊆ Ω l’insieme di quelli colpevoli, B c l’insieme di quelli innocenti. Vogliamo calcolare p(A), sapendo che p(B) = 0, 1, p(B c ) = 0, 9, p(A|B) = 0, 1, p(A|B c ) = 0, 91. Si ha p(A) = p(A|B)p(B) + p(A|B c )p(B c ) = 0, 1 · 0, 1 + 0, 91 · 0, 9 = 0, 829. Le stesse considerazioni valgono in generale quando é data una partizione ordinata di Ω in un numero (intero) r ≥ 2 di insiemi B1 , . . . , Br a due a due disgiunti. Siano infatti A ⊆ Ω un sottoinsieme arbitraio e una (B1 , . . . , Br ) una partizione ordinata di Ω. Quindi, Ω= r [ Bi e Bi ∩ Bj = ∅ se i 6= j. i=1 20 Abbiamo allora A= r [ (A ∩ Bi ) e (A ∩ Bi ) ∩ (A ∩ Bj ) = ∅ se i 6= j. i=1 Quindi, p(A) = r X p(A ∩ Bi ), i=1 poiché la probabilitá é additiva in unioni disgiunte. Supponiamo ora anche che p(Bi ) > 0 per ogni i = 1, . . . , r. Allora p(A|Bi ) = p(A|Bi )p(Bi ) e quindi p(A) = r X p(A|Bi )p(Bi ). (2) i=1 Esempio 29. Un salvadanaio contiene monete, di cui il 20% sono da 10 lire, il 50% sono da 50 lire e il 30% sono da 100 lire, rispettivamente. Delle monete da 10 lire, il 20% sono false. Delle monete da 50 lire, il 10% sono false. Delle monete da 100% lire il 30% sono false. Calcolare che la probabilitá che una moneta presa a caso dal salvadanaio sia falsa, supponendo che tutte le monete abbiano la stessa probabilitá di essere prese. Sia Ω l’insieme delle monete, A ⊆ Ω l’insieme delle monete false. Sia B1 ⊆ Ω l’insieme delle monete da 10 lire, B2 ⊆ Ω quello delle monete da 50, B3 ⊆ Ω quello delle monete da 100 lire. Abbiamo la partizione ordinata Ω = B1 ∪ B2 ∪ B3 . Vogliamo determinare p(A), sapendo che p(A|B1 ) = 0, 2, p(A|B2 ) = 0, 1, p(A|B3 ) = 0, 3, p(B1 ) = 0, 2, p(B2 ) = 0, 5, p(B3 ) = 0, 3. Quindi, p(A) = 0, 2 · 0, 2 + 0, 1 · 0, 5 + 0, 3 · 0, 3 = 0, 18. Quindi, il 18% delle monete sono false. Esempio 30. Delle paia di scarpe prodotte da un calzaturificio, il 40% sono da uomo, il 45% sono da donna e il 15% sono da bambino. Sono difettose 3% delle scarpe da uomo, il 2% delle scarpe da donna e il 4% delle scarpe da bambino. Calcolare la probabilitá che un paio di scarpe scelto a caso sia difettoso. Sia Ω l’insieme delle paia di scarpe prodotte, A ⊆ Ω il sottoinsieme delle paia di scarpe difettose, B1 ⊆ Ω l’insieme delle paia di scarpe da uomo, B2 ⊆ Ω quello delle paia di scarpe da donna e B3 ⊆ Ω quello delle paia di scarpe da bambino. Allora (B1 , B2 , B3 ) é una partizione ordinata di Ω 21 e p(A|B1 ) = 0, 03, p(A|B2 ) = 0, 02, p(A|B3 ) = 0, 04. Inoltre p(B1 ) = 0, 4, p(B2 ) = 0, 45, p(B3 ) = 0, 15. Quindi p(A) = 0, 03 · 0, 4 + 0, 02 · 0, 45 + 0, 04 · 0, 15 = 0, 027. Pertanto sono difettose il 2, 7% delle paia di scarpe prodotte. Esempio 31. Rivediamo l’Esempio 13 usando la formula (1). Sia B1 = {(c1 , `i ) : i = 1, 2, 3}; in altri termini, B1 é l’insieme delle possibili scelte del lupo, posto che Cappuccetto Rosso sceglie il primo cammino. Sia analogamente B2 = {(c2 , `i ) : i = 1, 2, 3}; in altri termini, B2 é l’insieme delle possibili scelte del lupo, posto che Cappuccetto Rosso sceglie il secondo cammino. Sia infine B3 = {(c3 , `i ) : i = 1, 2, 3}; in altri termini, B3 é l’insieme delle possibili scelte del lupo, posto che Cappuccetto Rosso sceglie il terzo cammino. Abbiamo allora Ω = B1 ∪ B2 ∪ B3 (unione disgiunta). Calcoliamo p(B1 ): p(B1 ) = p(c1 , `1 ) + p(c1 , `2 ) + p(c1 , `3 ) = 1 1 1 1 1 1 1 · + · + · = , 6 3 6 3 6 3 6 (3) e analogamente p(B2 ) = 1/3, p(B3 ) = 1/2. La probabilitá che Cappuccetto Rosso attraversi il bosco indenne noto che ha scelto il cammino i-mo é ovviamente la probabilitá che il lupo si sia appostato su uno degli altri due sentieri, cioé 2/3. In altri termini, se A ⊆ Ω é l’insieme delle scelte per le quali Cappuccetto Rosso si salva, si ha p(A|Bi ) = 2/3 per ogni i = 1, 2, 3. Ne segue: p(A) = 3 X i=1 2 2 1 2 1 2 1 p(A|Bi )p(Bi ) = · + · + · = · 3 6 3 3 3 2 3 1 1 1 + + 6 3 2 2 = . 3 Esempio 32. In un’autofficina ci sono 3 scatole che contengono un certo di tipo di pezzi di ricambio. Sono difettosi il 10% dei pezzi di ricambio nella prima scatola, il 15% dei pezzi nella seconda, l’11% dei pezzi nella terza. Dovendo sostituire un pezzo di un’automobile, il meccanico sceglie a caso una della scatole e prende a caso uno dei pezzi nella scatola scelta. Calcolare la probabilitá che il pezzo preso dal meccanico sia difettoso. Siano Ω l’insieme di tutti i pezzi di ricambio, A ⊆ Ω il sottoinsieme di quelli difettosi, B1 , B2 , B3 ⊆ Ω i sottoinsiemi di quelli nella prima, nella seconda e nella terza scatola, rispettivamente. Quindi (B1 , B2 , B3 ) é una partizione ordinata di Ω. Sia p : Ω → [0, 1] la funzione di probabilitá che descrive il nostro esperimento: p(a) é la probabilitá che il meccanico scelga un dato pezzo a ∈ Ω. Vogliamo allora determinare p(A) sapendo che p(B1 ) = 22 p(B2 ) = p(B3 ) = 31 (il meccanico sceglie a caso una delle tre scatole e quindi possiamo supporre che le tre scelte siano equiprobabili) e che p(A|B1 ) = 0, 1, p(A|B2 ) = 0, 15, p(A|B3 ) = 0, 11. Si ha p(A) = 0, 1 · 1 1 1 0, 36 + 0, 15 · + 0, 11 · = = 0, 12. 3 3 3 3 Osservazione 1. L’aspetto interessante dell’esempio precedente é questo: non stiamo dicendo che il 12% dei pezzi di ricambio totali é difettoso; di fatto, con le informazioni in possesso non siamo in grado di determinare la percentuale di pezzi difettosi. Per farlo, occorre anche conoscere quanti pezzi ci sono in ciascuna scatola. Tuttavia la probabilitá che venga estratto un pezzo difettoso é il 12%. Il punto é che i vari pezzi di ricambio non hanno la stessa probabilitá di essere estratti: in presenza di eventi non equiprobabili, la probabilitá di un sottoinsieme non é in generale proporzionale alla sua cardinalitá. Determiniamo esplicitamente la funzione di probabilitá che descrive il nostro esperimento. Siano N1 , N2 , N3 il numero di pezzi nella prima, nella seconda e nella terza scatola, rispettivamente. Sappiamo che p é costante su B1 , B2 e B3 perché tutti i pezzi nella medesima scatola hanno la stessa probabilitá di essere scelti. Quindi esistono x, y, z ∈ [0, 1] tali che p(a) = x se a ∈ B1 , p(a) = y se a ∈ B2 , p(a) = z se a ∈ B3 . Poiché p(B1 ) = xN1 = 31 , si ha x = 3N1 1 ; analogamente, y = 3N1 2 , z = 3N1 3 . Quindi la probabilitá che un pezzo a ∈ Ω venga preso dal meccanico é 1 se a ∈ B1 3N1 1 se a ∈ B2 p(a) = 3N2 1 se a ∈ B3 . 3N3 Se quindi N1 , N2 , N3 non sono tutti uguali, vediamo che (Ω, p) non é uno spazio equiprobabile. Esempio 33. Nella situazione dell’esempio 32 supponiamo che il meccanico, per risparmiare spazio, metta tutti i pezzi nella medesima scatola. Quale é ora la probabilitá che venga preso un pezzo difettoso? Ora tutti i pezzi hanno la stessa probabilitá di essere presi: in altri termini lo spazio di probabilitá che descrive la situazione é ora (Ω, q), ove Ω é sempre l’insieme dei pezzi difettosi, ma q é adesso la probabilitá costante = N1 , ove N = N1 + N2 + N3 é il numero totale di pezzi. Quindi, la probabilitá che 23 venga preso un pezzo difettoso é ora q(A) = |A| . Cosa é q(A)? Denotiamo |Ω| ancora con Bi ⊆ Ω il sottoinsieme die pezzi che erano nella i-ma scatola. Abbiamo sempre q(A|B1 ) = 0, 1, q(A|B2 ) = 0, 15, q(A|B3 ) = 0, 11 ma adesso 1| 2| 3| q(B1 ) = |B = NN1 , q(B2 ) = |B = NN2 , q(B3 ) = |B = NN3 . Quindi |Ω| |Ω| |Ω| q(A) = 0, 1 · N2 N3 0, 1N1 + 0, 15N2 + 0, 11N3 N1 + 0, 15 · + 0, 11 · = . N N N N Chiaramente, adesso la risposta dipende da N1 , N2 , N3 . Teorema di Bayes. Consideriamo il seguente problema (simile all’esempio 32). La tale fabbrica produce pezzi di ricambio, usando tre linee di produzione. I pezzi prodotti dalla prima linea sono difettosi nel 20% dei casi, quelli prodotti dalla seconda linea nel 10% dei casi e quelli prodotti dalla terza linea nel 5% dei casi. Supponiamo che la prima linea produca il 30% dei pezzi totali, la seconda il 35% e la terza il restante 35%. I pezzi prodotti vengono accumulati in un magazzino comune senza tener conto della linea di produzione di origine. Abbiamo visto sopra come rispondere alla seguente domanda: Qual’é la probabilitá che un pezzo preso a caso all’interno del magazzino sia difettoso? Sia Ω l’insieme di tutti i pezzi prodotti. Denotiamo con B1 ⊆ Ω, B2 ⊆ Ω, B3 ⊆ Ω i sottoinsiemi dei pezzi prodotti dalla prima, dalla seconda e dalla terza linea di produzione rispettivamente. Allora (B1 , B2 , B3 ) é una partizione ordinata di Ω. Sia A ⊆ Ω l’insieme dei pezzi difettosi. La formula (2) ci dice che la probabilitá che un pezzo preso a caso tra quelli prodotti dalla fabbrica sia difettoso é: p(A) = 3 X p(A|Bi )p(Bi ) i=1 = p(A|B1 )p(B1 ) + p(A|B2 )p(B2 ) + p(A|B3 )p(B3 ) = 0, 2 · 0, 3 + 0, 1 · 0, 35 + 0, 05 · 0, 35 = 0, 1125. Quindi sono difettosi l’11, 25% dei pezzi totali. Vogliamo ora considerare il seguente problema. Immaginiamo di entrare nel magazzino, di scegliere un pezzo a caso e di constatare che questo pezzo é difettoso. Che probabilitá c’é che questo pezzo provenga dalla prima linea di produzione? In altri termini, qual’é la probabilitá che un pezzo difettoso provenga dalla prima linea di produzione? Detto in modo piú sintetico, cosa é p(B1 |A)? Abbiamo, ovviamente, p(B1 |A) = p(A ∩ B1 ) . p(A) 24 D’altra parte, p(A ∩ B1 ) = p(A|B1 )p(B1 ) e p(A) = 3 X p(A|Bi )p(Bi ); i=1 quindi, sostituendo, p(A|B1 )p(B1 ) 0, 2 · 0, 3 0, 06 p(B1 |A) = P3 = = = 0, 533, 0, 1125 0, 1125 i=1 p(A|Bi )p(Bi ) alla terza cifra decimale. Qual’é la probabilitá che un pezzo difettoso provenga dalla seconda linea di produzione? In altri termini, cosa é p(B2 |A)? Analogamente, é p(A|B2 )p(B2 ) 0, 1 · 0, 35 0, 035 p(B2 |A) = P3 = = = 0, 311, 0, 1125 0, 1125 i=1 p(A|Bi )p(Bi ) alla terza cifra decimale. Infine, qual’é la probabilitá che un pezzo difettoso provenga dalla terza linea di produzione? In altri termini, cosa é p(B3 |A)? Allo stesso modo, é 0, 05 · 0, 35 0, 035 p(A|B3 )p(B3 ) p(B3 |A) = P3 = = = 0, 155, 0, 1125 0, 1125 i=1 p(A|Bi )p(Bi ) alla terza cifra decimale. In generale, abbiamo il seguente Theorem 1. (Bayes) Sia (Ω, p) uno spazio di probabilitá. Sia (B1 , . . . , Br ) una partizione ordinata di Ω. Sia A ⊆ Ω un sottoinsieme. Suponiamo che p(A) > 0 e p(Bi ) > 0 per ogni i = 1, · · · , r. Allora per ogni i = 1, . . . , r abbiamo p(A|Bi )p(Bi ) p(Bi |A) = Pr . (4) j=1 p(A|Bj )p(Bj ) Esempio 34. Nella situazione dell’esempio 26, supponiamo che Coniglio Ruggente abbia trovato il passato di carote di ieri sera una vera schifezza. Qual’é la probabilitá che sia stato preparato da Rana Pelosa? E quella che sia stato preparato da Imbuto Rovesciato? Rammentiamo la notazione dell’esempio 26: Ω é l’insieme dei passati di carote preparati dalle due squaw, A ⊆ Ω l’insieme di quelli venuti bene, Ac l’insieme di quelli venuti male, B ⊆ Ω l’insieme di quelli preparati da Rana 25 Pelosa, B c l’insieme di quelli preparati da Imbuto Rovesciato. Vogliamo calcolare p(B|Ac ). Poniamo B1 = B e B2 = B c nella formula (4). Otteniamo p(Ac |B)p(B) p(B|A ) = p(B1 |A ) = p(Ac |B)p(B) + p(Ac |B c )p(B c ) 0, 3 · 0, 6 0, 18 = = = 0, 474, c p(A ) 0, 38 c c alla terza cifra decimale. La probabilitá che il passato sia stato preparato da Imbuto Rovesciato é ovviamente p(B c |Ac ) = 1 − p(B|Ac ) = 1 − 0, 474 = 0, 526. Esempio 35. Nella situazione dell’esempio 26, supponiamo che Coniglio Ruggente abbia trovato il passato di carote di ieri a pranzo una vera prelibatezza. Qual’é la probabilitá che sia stato preparato da Rana Pelosa? E quella che sia stato preparato da Imbuto Rovesciato? Ora vogliamo trovare p(B|A). Si ha p(B|A) = p(B1 |A) = p(A|B)p(B) p(A|B)p(B) + p(A|B c )p(B c ) 0, 7 · 0, 6 0, 42 = = 0, 676, = p(A) 0, 62 alla terza cifra decimale. La probabilitá che il passato sia stato preparato da Imbuto Rovesciato é ovviamente p(B c |A) = 1 − p(B|A) = 1 − 0, 676 = 0, 322 (alla terza cifra decimale). Esercizio 1. Un’imputato é condannato dal tribunale di Giustonia. Calcolare la probabilitá che l’imputato sia effettivamente colpevole. Esercizio 2. Un’imputato é condannato dal tribunale di Acchiappacitrulli. Calcolare la probabilitá che l’imputato sia effettivamente colpevole. 26