Università degli Studi di Torino Corso di Laurea in Medicina e Chirurgia Teorema di Bayes Milena Maule - AA 2011-12 1 Definizione di probabilità Esistono 3 definizioni del concetto di probabilità. Immaginiamo che ci sia una partita di calcio e che lo spazio dei tre eventi siano la vittoria della squadra di casa, la vittoria della squadra ospite e il pareggio. Vediamo cosa accade con i tre approcci: teoria classica: esiste 1 probabilità su 3 che avvenga il primo evento teoria frequentista: ci si può dotare di un almanacco e controllare tutte le partite precedenti e calcolare la frequenza di un evento teoria soggettiva (bayesiana): ci si può documentare sullo stato di forma dei calciatori, sul terreno di gioco e così via fino ad emettere una probabilità soggettiva (Esempio di Bruno de Finetti) Milena Maule - AA 2011-12 2 Bayes, Thomas (1702, London - 1761, Tunbridge Wells, Kent) Milena Maule - AA 2011-12 3 Ragionamento bayesiano Problema: L’1% delle donne di 40 anni che partecipa ad un programma di screening ha un tumore della mammella. L’80% delle donne con un tumore della mammella ha una mammografia positiva. Anche il 9.6% delle donne senza tumore della mammella ha una mammografia positiva. Una donna di 40 anni ha appena partecipato allo screening e ha avuto una mammografia positiva. Qual è la probabilità che abbia davvero un tumore della mammella? Milena Maule - AA 2011-12 4 Ragionamento bayesiano Soltanto il 15% dei medici a cui viene sottoposto questo problema risponde correttamente (Casscells, Schoenberger, and Grayboys 1978; Eddy 1982; Gigerenzer and Hoffrage 1995) La maggior parte stima una probabilità fra il 70% e l’80% Milena Maule - AA 2011-12 5 A cosa serve • Il teorema di Bayes ci dà la possibilità di calcolare P(E|F) quando conosciamo P(F|E) • Ricordiamo che P(F|E) = P(F E)/P(E) Esempio • T = evento: un test per individuare la presenza di steroidi anabolizzanti dà un risultato positivo S = evento: l’atleta fa uso di steroidi anabolizzanti • P(T|S) = probabilità che il test sia positivo per un atleta che usa steroidi • P(S|T) = probabilità che un atleta usi gli steroidi dato che il test è risultato positivo Milena Maule - AA 2011-12 6 Esempio Una casa farmaceutica dichiara che il test che produce è in grado di individuare l’uso di steroidi anabolizzanti (cioè il test risulta positivo sugli atleti che fanno uso di steroidi) il 95% delle volte. Un vostro amico che gioca nella squadra di rugby è appena risultato positivo a questo test. Qual è la probabilità che faccia uso di steroidi? a) b) c) d) 95% Al più 95% Almeno 95% Non è possibile rispondere Milena Maule - AA 2011-12 7 • T = un test per individuare la presenza di steroidi dà un risultato positivo • S = evento: l’atleta fa uso di steroidi anabolizzanti • Noi conosciamo P(T|S), la probabilità che il test sia positivo per un atleta che usa gli steroidi = 0.95. Tuttavia questo non ci dice nulla su P(S|T), la probabilità che un atleta usi gli steroidi una volta che è risultato positivo al test • P(S|T) potrebbe essere qualsiasi numero fra 0 and 1. Per esempio, se nessuno nella squadra utilizza steoridi, P(S|T) = 0, e il risultato positivo del test deve necessariamente essere un falso positivo • D’altro canto, se tutti nella squadra utilizzano steroidi, allora P(S|T) = 1 • Abbiamo bisogno di ulteriori informazioni per rispondere alla domanda Milena Maule - AA 2011-12 8 Domanda Di quali informazioni abbiamo bisogno per calcolare P(S|T) (= probabilità che un atleta usi gli steroidi una volta che è risultato positivo al test), se conosciamo P(T|S) (= probabilità che il test sia positivo per un atleta che usa gli steroidi)? Milena Maule - AA 2011-12 9 Domanda Di quali informazioni abbiamo bisogno per calcolare P(S|T) (= probabilità che un atleta usi gli steroidi una volta che è risultato positivo al test), se conosciamo P(T|S) (= probabilità che il test sia positivo per un atleta che usa gli steroidi)? Risposta Due informazioni: • P(S) (= probabilità che un atleta della squadra usi gli steroidi) • P(T|S) (= probabilità di un risultato falso positivo) Milena Maule - AA 2011-12 10 Una casa farmaceutica dichiara che il test che produce è in grado di individuare l’uso di steroidi anabolizzanti (cioè il test risulta positivo sugli atleti che fanno uso di steroidi) il 95% delle volte. Quello che la casa farmaceutica non ha dichiarato è che il 15% di tutti gli atleti “puliti” risulterà positivo (falsi positivi). Inoltre sappiamo che nella squadra di rugby il 10% degli atleti usa steroidi anabolizzanti. • T = un membro della squadra di rugby risulta positivo al test • S = un membro della squadra di rugby usa steroidi Proviamo a completare la seguente tabella: P(S)= P(S)= P(T|S)= P(T|S)= P(T|S)= P(T|S)= Milena Maule - AA 2011-12 11 Scegliere fra i seguenti 4 alberi di probabilità quello corretto: usa steroidi test positivo non usa steroidi test negativo Milena Maule - AA 2011-12 12 Una casa farmaceutica dichiara che il test che produce è in grado di individuare l’uso di steroidi anabolizzanti (cioè il test risulta positivo sugli atleti che fanno uso di steroidi) il 95% delle volte. Quello che la casa farmaceutica non ha dichiarato è che il 15% di tutti gli atleti “puliti” risulterà positivo (falsi positivi). Inoltre sappiamo che nella squadra di rugby il 10% degli atleti usa steroidi anabolizzanti. • T = un membro della squadra di rugby risulta positivo al test • S = un membro della squadra di rugby usa steroidi Proviamo a completare la seguente tabella: P(S)=0.10 P(S)=0.90 P(T|S)=0.95 P(T|S)=0.05 P(T|S)=0.15 P(T|S)=0.85 Milena Maule - AA 2011-12 13 Domanda Una casa farmaceutica dichiara che il test che produce è in grado di individuare l’uso di steroidi anabolizzanti il 95% delle volte. Anche il 15% di tutti gli atleti “puliti” risulta positivo (falsi positivi). Inoltre sappiamo che nella squadra di rugby il 10% degli atleti usa steroidi anabolizzanti. Un vostro amico che gioca nella squadra di rugby è appena risultato positivo a questo test. Qual è la probabilità che faccia uso di steroidi? a) b) c) d) 0.4130 0.8636 0.0950 0.2300 Milena Maule - AA 2011-12 14 Utilizziamo l’albero di probabilità e ricordiamo che P(T S) = P(T|S) P(S) P(TS) = P(T|S)P(S) = 0.095 P(TS) = P(T|S)P(S) = 0.005 P(TS) = P(T|S)P(S) = 0.135 P(TS) = P(T|S)P(S) = 0.765 Milena Maule - AA 2011-12 15 P(TS) = P(T|S)P(S) = 0.095 P(TS) = P(T|S)P(S) = 0.005 P(TS) = P(T|S)P(S) = 0.135 P(TS) = P(T|S)P(S) = 0.765 Probabilità di avere un test positivo: 0.095 + 0.135 = 0.23 Probabilità di test positivo e uso di steroidi: 0.095 Milena Maule - AA 2011-12 16 Ricapitolando: Il 23% di tutti i giocatori di rugby risulta positivo al test, ma soltanto il 9.5% usa davvero steroidi anabolizzanti. Quindi la probabilità che un giocatore che è risultato positivo al test usi davvero steroidi anabolizzanti è: P(S|T) = P(steroidi | test positivo) = = 0.095/(0.095 + 0.135) = = 0.095/0.23 = 41.3% Milena Maule - AA 2011-12 17 Teorema di Bayes Dati due eventi complementari e mutuamente esclusivi B e B P(A) P(B A) P(B A) P(B) P(A | B) P(B) P(A | B) P(B A) P(B) P(A | B) P(B | A) P(A) P(A) P(B) P(A | B) P(B) P(A | B) P(B) P(A | B) Milena Maule - AA 2011-12 18 Teorema di Bayes Notate come abbiamo appena calcolato P(S|T) (= probabilità che un atleta usi gli steroidi dato che è risultato positivo al test), a partire dalla conoscenza di P(T|S) (= probabilità che il test sia positivo per un atleta che usa gli steroidi), di P(T|S) (= probabilità che il test sia positivo per un atleta che non usa gli steroidi), e di P(S). Nel nostro esempio: P(T|S) = 0.95, P(T|S) = 0.15, P(S) = 0.1, P(S) = 0.9 P(S|T) = (0.95∙0.1)/(0.95∙0.1+0.15∙0.9) = 0.4130 Milena Maule - AA 2011-12 19