Sistemi di Supporto alle
Decisioni I
Lezione 7
Chiara Mocenni
Corso di laurea L1 in Ingegneria Gestionale e
L2 in Ingegneria Informatica
III ciclo
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Reti Bayesiane
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
• Le reti Bayesiane sono modelli grafici della
conoscenza in un dominio incerto. Basandosi
sulla regola di Bayes, esprimono relazioni di
dipendenza condizionale (archi) tra le variabili
in gioco (nodi).
Il vantaggio principale del ragionamento
probabilistico rispetto a quello logico sta nella
possibilità di giungere a descrizioni razionali
anche quando non vi è abbastanza
informazione di tipo deterministico sul
funzionamento del sistema.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
• Le reti bayesiane possono essere
utilizzate in ogni settore in cui sia
necessario modellare la realtà in situazioni
di incertezza, cioè in cui siano coinvolte
delle probabilità.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
La regola di Bayes
Spesso, nei ragionamenti probabilistici, capita
che si debba valutare una probabilità avendo già
delle informazioni su quanto è già accaduto in
precedenza.
Dati due eventi A e B, se questi sono in qualche
modo correlati, è ragionevole pensare che il
sapere che uno dei due è già avvenuto possa
migliorare la conoscenza della probabilità
dell'altro.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Dato uno spazio di probabilità (W,A, P[.]), dove
W : spazio campionario (insieme di tutti i
possibili risultati dell'esperimento)
A: spazio degli eventi (contenente W)
P[.]: funzione di probabilità con Dominio in A e
Codominio in [0,1]
dati due eventi A e B appartenenti ad A,
indichiamo con
P[A|B]
la probabilità che si verifichi A sapendo che si è
già verificato B, cioè la probabilità di A
condizionata a B.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Regola di Bayes
• P[A|B] = P[A,B] / P[B] (per P[B]≠0), dove
P[A,B]=P[B|A] P[A]
• Forma completa:
• dato lo spazio di probabilità ( W, A, P[.]), siano
B1,B2,...Bn appartenenti ad A;
• per ogni i P[Bi]>0; i≠i BiBj=0; W=UiBi; allora per
ogni A appartenente ad A
• P[Bk|A] = P[A|Bk] P[Bk] / (S i P[A|Bi] P[Bi] )
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
• Supponiamo che viviate a Londra e che abbiate
notato che in inverno piove (P) il 50% (p(P))
delle volte ed è nuvoloso (N) l’80% (p(N)) delle
volte (talvolta è nuvoloso ma non piove).
• D’altra parte, il 100% delle volte in cui piove è
anche nuvoloso (p(N|P)).
• Qual è la probabilità che oggi piova essendo
nuvoloso (p(P|N))?
• La regola di Bayes ci può aiutare in questo,
infatti
p(P|N) = p(P)p(N|P)/p(N) = 0.5 x 1.0 / 0.8 =
0.625 = 5/8.
Quindi 5/8 delle volte a Londra, quando è
nuvoloso, piove.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Le reti Bayesiane
• Si usa una struttura di dati chiamata rete
bayesiana (o rete di credenze) per
rappresentare la dipendenza fra le variabili
e per dare una specifica concisa della
distribuzione di probabilità congiunta.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Una rete Bayesiana è un grafo in cui valgono le
seguenti proprietà:
• 1)
Un insieme di variabili casuali
costituiscono i nodi della rete;
• 2)
Un insieme di archi con verso connette le
coppie di nodi (Il significato intuitivo di una
freccia dal nodo X al nodo Y è che X ha
un’influenza diretta su Y);
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
• 3)
Ogni nodo ha una tabella delle
probabilità condizionate che quantifica gli
effetti che i “genitori” hanno sul nodo, dove
per “genitori” si intendono tutti quei nodi
che hanno frecce che puntano al nodo;
• 4)
Il grafo non ha cicli diretti;
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
• Un nodo che non ha genitori diretti (cioè non ha
frecce che puntano verso di lui) contiene una
tabella di probabilità marginali.
• Se il nodo è discreto contiene una distribuzione
di probabilità sugli stati della variabile che
rappresenta.
• Se il nodo è continuo contiene una funzione
gaussiana di densità (definita da media e
varianza) della variabile casuale che
rappresenta.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
• Se un nodo ha parenti (cioè uno o più frecce che
puntano verso di lui) allora il nodo contiene una
tabella di probabilità condizionate.
• Se il nodo è discreto la funzione di probabilità
condizionata contiene la probabilità condizionata
del nodo data una configurazione dei suoi
parenti.
• Se il nodo è continuo, la funzione di probabilità
condizionata contiene media e varianza di ogni
configurazione degli stati dei suoi nodi parenti.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Esempio 1: Gestione del traffico
Un Comune può decidere se bloccare o no le
auto per una giornata nel caso in cui si verifichi
uno dei seguenti casi:
• viene raggiunto il livello massimo di
inquinamento,
• si verifica una congestione delle strade.
A seconda della situazione i cittadini dovranno
decidere se spostarsi con i mezzi pubblici o
prendere la macchina.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
• Una volta che la topologia della rete è
specificata dobbiamo solo specificare le
probabilità condizionate per i nodi che
partecipano nelle dipendenze dirette, usando
queste per il calcolo di qualunque altro valore di
probabilità. Ogni nodo è caratterizzato da una
tabella delle probabilità condizionate. Ogni riga
della tabella contiene la probabilità condizionata
del valore di ogni nodo per un caso
condizionante.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Esempio 2: L’albero di Jack
• Un giorno Jack si accorge che il suo
albero di mele perde le foglie.
• Jack sa che se l’albero è secco allora è
normale che perda le foglie.
• Ma Jack sa anche che la perdita delle
foglie può essere sintomo di malattia per il
suo albero.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
La rete per l’albero di Jack
secco
malato
perde le foglie
•
•
•
•
La rete consiste di 3 nodi:
Malato, Secco, e Perde le foglie
Malato può essere “malato" o "no"
Secco può essere “secco" o "no"
Perde le foglie può essere “si" o "no".
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
• La dipendenza casuale è tra Malato e Perde
le foglie e Secco e Perde le foglie.
• Ad ogni nodo è associata una tabella di
probabilità, che possono essere a priori o
condizionate. Ad esempio:
•
•
•
•
P(Malato=“malato“)=0.1
P(Malato="no“)=0.9
P(Secco=“secco“)=0.1
P(Secco="no“)=0.9
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Secco=“secco”
Secco=“No”
Malato=
“Malato”
Malato=
“No”
Malato=
“Malato”
Malato=
“No”
Perde=“si”
0.95
0.85
0.90
0.02
Perde=“no”
0.05
0.15
0.10
0.98
P(Perde le foglie | Malato, Secco)
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Esempio 3:
Diagnosi di un paziente che arriva in clinica
Supponiamo di avere di fronte un nuovo
paziente, di cui non sappiamo niente. Una
volta che avremo acquisito informazione
specifica su di lui la nostra rete bayesiana
riguardante il suo stato di salute potrà
essere aggiornato, fornendo risultati più
attendibili.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Diagnosi di una malattia polmonare
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
I dati
• Statisticamente, in un campione
rappresentativo di popolazione si
conoscono i seguenti dati.
•
•
•
•
Il 50% dei pazienti fuma.
Il 1% ha la tubercolosi.
Il 5.5% ha un cancro al polmone ().
Il 45% ha una qualche forma di bronchite.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Come si procede
Si costruisce la rete bayesiana e si
analizzano i sintomi mostrati dal paziente.
Ad esempio, supponiamo che:
• Il paziente lamenta dispnea.
• Il paziente è stato recentemente in Asia.
• Il paziente è un fumatore.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Inoltre
• Si effettua una radiografia da cui si vede che:
• 1. Risultato negativo
Sembra che la diagnosi migliore sia che il
paziente ha una semplice bronchite.
• 2. Risultato positivo
• La probabilità di un cancro o della tubercolosi
sono aumentate enormemente. E’ comunque
necessario effettuare nuovi esami.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Reti Bayesiane Statiche
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Reti Bayesiane Dinamiche
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Esempio 4: Il pozzo di petrolio
• Un agente deve decidere se perforare o
non perforare per trovare un pozzo di
petrolio. E’ incerto se il punto in cui vuole
perforare sia secco (dry), umido (wet) o
pieno (soaking). L’agente puo’ effettuare
una ricerca geologica che puo’ aiutarlo a
determinare la struttura geologica del sito.
La risposta dell’indagine puo’ essere:
molto petrolio (closed), poco petrolio
(open) o vuoto (diffuse).
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
•
•
•
•
Le decisioni sono 2:
1. Fare il test geologico (costo: 10 K$);
2. Perforare (costo: 70 K$).
L’utilita’ della perforazione e’ determinata
dal risultato: dry, wet o soaking.
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2006-2007
Scarica

Reti Bayesiane - Dipartimento di Ingegneria dell`informazione e