Università degli Studi di Torino
Corso di Laurea in Medicina e Chirurgia
Teorema di Bayes
Milena Maule - AA 2011-12
1
Definizione di probabilità
Esistono 3 definizioni del concetto di probabilità.
Immaginiamo che ci sia una partita di calcio e che lo spazio dei tre eventi
siano la vittoria della squadra di casa, la vittoria della squadra ospite e il
pareggio. Vediamo cosa accade con i tre approcci:
teoria classica: esiste 1 probabilità su 3 che avvenga il primo evento
teoria frequentista: ci si può dotare di un almanacco e controllare tutte le
partite precedenti e calcolare la frequenza di un evento
teoria soggettiva (bayesiana): ci si può documentare sullo stato di forma
dei calciatori, sul terreno di gioco e così via fino ad emettere una
probabilità soggettiva
(Esempio di Bruno de Finetti)
Milena Maule - AA 2011-12
2
Bayes, Thomas
(1702, London - 1761, Tunbridge Wells, Kent)
Milena Maule - AA 2011-12
3
Ragionamento bayesiano
Problema:
L’1% delle donne di 40 anni che partecipa ad un programma
di screening ha un tumore della mammella. L’80% delle
donne con un tumore della mammella ha una mammografia
positiva. Anche il 9.6% delle donne senza tumore della
mammella ha una mammografia positiva. Una donna di 40
anni ha appena partecipato allo screening e ha avuto una
mammografia positiva. Qual è la probabilità che abbia
davvero un tumore della mammella?
Milena Maule - AA 2011-12
4
Ragionamento bayesiano
Soltanto il 15% dei medici a cui viene sottoposto
questo problema risponde correttamente
(Casscells, Schoenberger, and Grayboys 1978;
Eddy 1982; Gigerenzer and Hoffrage 1995)
La maggior parte stima una probabilità fra il 70% e
l’80%
Milena Maule - AA 2011-12
5
A cosa serve
• Il teorema di Bayes ci dà la possibilità di calcolare P(E|F)
quando conosciamo P(F|E)
• Ricordiamo che P(F|E) = P(F  E)/P(E)
Esempio
• T = evento: un test per individuare la presenza di steroidi
anabolizzanti dà un risultato positivo
S = evento: l’atleta fa uso di steroidi anabolizzanti
• P(T|S) = probabilità che il test sia positivo per un atleta
che usa steroidi
• P(S|T) = probabilità che un atleta usi gli steroidi dato che
il test è risultato positivo
Milena Maule - AA 2011-12
6
Esempio
Una casa farmaceutica dichiara che il test che produce
è in grado di individuare l’uso di steroidi anabolizzanti
(cioè il test risulta positivo sugli atleti che fanno uso di
steroidi) il 95% delle volte. Un vostro amico che gioca
nella squadra di rugby è appena risultato positivo a
questo test. Qual è la probabilità che faccia uso di
steroidi?
a)
b)
c)
d)
95%
Al più 95%
Almeno 95%
Non è possibile rispondere
Milena Maule - AA 2011-12
7
• T = un test per individuare la presenza di steroidi dà un risultato
positivo
• S = evento: l’atleta fa uso di steroidi anabolizzanti
• Noi conosciamo P(T|S), la probabilità che il test sia positivo per
un atleta che usa gli steroidi = 0.95. Tuttavia questo non ci dice
nulla su P(S|T), la probabilità che un atleta usi gli steroidi una
volta che è risultato positivo al test
•
P(S|T) potrebbe essere qualsiasi numero fra 0 and 1. Per
esempio, se nessuno nella squadra utilizza steoridi, P(S|T) = 0, e
il risultato positivo del test deve necessariamente essere un falso
positivo
• D’altro canto, se tutti nella squadra utilizzano steroidi, allora
P(S|T) = 1
• Abbiamo bisogno di ulteriori informazioni per rispondere alla
domanda
Milena Maule - AA 2011-12
8
Domanda
Di quali informazioni abbiamo bisogno per
calcolare P(S|T) (= probabilità che un atleta
usi gli steroidi una volta che è risultato positivo
al test), se conosciamo P(T|S) (= probabilità
che il test sia positivo per un atleta che usa gli
steroidi)?
Milena Maule - AA 2011-12
9
Domanda
Di quali informazioni abbiamo bisogno per calcolare
P(S|T) (= probabilità che un atleta usi gli steroidi una
volta che è risultato positivo al test), se conosciamo
P(T|S) (= probabilità che il test sia positivo per un atleta
che usa gli steroidi)?
Risposta
Due informazioni:
• P(S) (= probabilità che un atleta della squadra usi gli
steroidi)
• P(T|S) (= probabilità di un risultato falso positivo)
Milena Maule - AA 2011-12
10
Una casa farmaceutica dichiara che il test che produce è in grado
di individuare l’uso di steroidi anabolizzanti (cioè il test risulta
positivo sugli atleti che fanno uso di steroidi) il 95% delle volte.
Quello che la casa farmaceutica non ha dichiarato è che il 15% di
tutti gli atleti “puliti” risulterà positivo (falsi positivi). Inoltre
sappiamo che nella squadra di rugby il 10% degli atleti usa steroidi
anabolizzanti.
• T = un membro della squadra di rugby risulta positivo al test
• S = un membro della squadra di rugby usa steroidi
Proviamo a completare la seguente tabella:
P(S)=
P(S)=
P(T|S)=
P(T|S)=
P(T|S)=
P(T|S)=
Milena Maule - AA 2011-12
11
Scegliere fra i seguenti 4 alberi di probabilità quello corretto:
usa steroidi
test positivo
non usa steroidi
test negativo
Milena Maule - AA 2011-12
12
Una casa farmaceutica dichiara che il test che produce è in grado
di individuare l’uso di steroidi anabolizzanti (cioè il test risulta
positivo sugli atleti che fanno uso di steroidi) il 95% delle volte.
Quello che la casa farmaceutica non ha dichiarato è che il 15% di
tutti gli atleti “puliti” risulterà positivo (falsi positivi). Inoltre
sappiamo che nella squadra di rugby il 10% degli atleti usa steroidi
anabolizzanti.
• T = un membro della squadra di rugby risulta positivo al test
• S = un membro della squadra di rugby usa steroidi
Proviamo a completare la seguente tabella:
P(S)=0.10
P(S)=0.90
P(T|S)=0.95
P(T|S)=0.05
P(T|S)=0.15
P(T|S)=0.85
Milena Maule - AA 2011-12
13
Domanda
Una casa farmaceutica dichiara che il test che produce è in
grado di individuare l’uso di steroidi anabolizzanti il 95%
delle volte. Anche il 15% di tutti gli atleti “puliti” risulta
positivo (falsi positivi). Inoltre sappiamo che nella squadra di
rugby il 10% degli atleti usa steroidi anabolizzanti. Un vostro
amico che gioca nella squadra di rugby è appena risultato
positivo a questo test. Qual è la probabilità che faccia uso di
steroidi?
a)
b)
c)
d)
0.4130
0.8636
0.0950
0.2300
Milena Maule - AA 2011-12
14
Utilizziamo l’albero di probabilità e ricordiamo che
P(T  S) = P(T|S) P(S)
P(TS) = P(T|S)P(S) = 0.095
P(TS) = P(T|S)P(S) = 0.005
P(TS) = P(T|S)P(S) = 0.135
P(TS) = P(T|S)P(S) = 0.765
Milena Maule - AA 2011-12
15
P(TS) = P(T|S)P(S) = 0.095
P(TS) = P(T|S)P(S) = 0.005
P(TS) = P(T|S)P(S) = 0.135
P(TS) = P(T|S)P(S) = 0.765
Probabilità di avere un test positivo: 0.095 + 0.135 = 0.23
Probabilità di test positivo e uso di steroidi: 0.095
Milena Maule - AA 2011-12
16
Ricapitolando:
Il 23% di tutti i giocatori di rugby risulta positivo
al test, ma soltanto il 9.5% usa davvero steroidi
anabolizzanti. Quindi la probabilità che un
giocatore che è risultato positivo al test usi
davvero steroidi anabolizzanti è:
P(S|T) = P(steroidi | test positivo) =
= 0.095/(0.095 + 0.135) =
= 0.095/0.23 = 41.3%
Milena Maule - AA 2011-12
17
Teorema di Bayes
Dati due eventi complementari e mutuamente esclusivi B e B
P(A)  P(B  A)  P(B  A)  P(B)  P(A | B)  P(B)  P(A | B)
P(B  A) P(B)  P(A | B)
P(B | A) 


P(A)
P(A)
P(B)  P(A | B)

P(B)  P(A | B)  P(B)  P(A | B)
Milena Maule - AA 2011-12
18
Teorema di Bayes
Notate come abbiamo appena calcolato P(S|T) (=
probabilità che un atleta usi gli steroidi dato che è
risultato positivo al test), a partire dalla conoscenza di
P(T|S) (= probabilità che il test sia positivo per un atleta
che usa gli steroidi), di P(T|S) (= probabilità che il test sia
positivo per un atleta che non usa gli steroidi), e di P(S).
Nel nostro esempio:
P(T|S) = 0.95, P(T|S) = 0.15, P(S) = 0.1, P(S) = 0.9
P(S|T) = (0.95∙0.1)/(0.95∙0.1+0.15∙0.9) = 0.4130
Milena Maule - AA 2011-12
19
Scarica

Università degli Studi di Torino Corso di Laurea in Medicina e