Intelligenza Artificiale 2
Metodologie di ragionamento
Prof. M.T. PAZIENZA
a.a. 2000-2001
Conoscenza e ragionamento con incertezza
• Problema reale dell’informazione incerta
• Teoria della probabilità fornisce le basi per il
trattamento di sistemi che ragionano con
incertezza
• Teoria dell’utilità per pesare la desiderabilità
degli obiettivi e la probabilità di raggiungerli
(in quanto le azioni non sono più certe del
raggiungimento degli obiettivi)
Incertezza
• Quando gli agenti non hanno accesso all’intera
conoscenza dell’ambiente (cartello VIETATO
FUMARE illeggibile)
• Quando gli agenti hanno una incompleta, o non
totalmente corretta, comprensione delle proprietà
dell’ambiente (simbolo nuovo di VIETATO
FUMARE).
Ciò si verifica anche quando le regole sul dominio
risultano incomplete in quanto ci sono “troppe”
condizioni da enumerare esplicitamente o perché
alcune condizioni sono ignorate. L’incertezza non è
evitabile in mondi complessi, dinamici o inaccessibili
Incertezza
• Massimizzare la misura delle prestazioni,
date le informazioni che si hanno
sull’ambiente.
• La cosa giusta da fare, la decisione
razionale, dipende sia dall’importanza
relativa degli obiettivi, che dalla probabilità
e dal grado con cui verranno raggiunti.
Conoscenza incerta
• Caso della diagnosi ( in qualunque settore)
Si è in una situazione di incertezza in quanto
la lista di situazioni e cause da descrivere
non può essere esaustiva (praticamente
infinita per la mancanza di conoscenza
universale)
Logica e conoscenza incerta
Non si può usare la logica del primo ordine per
gestire la diagnosi. Infatti:
• impossibilità di elencare l’insieme praticamente
infinito di antecedenti e conseguenti per evitare
eccezioni
• mancata conoscenza metodologica completa
• mancata conoscenza applicativa completa
L’agente non potrà mai agire con una piena
consapevolezza di verità e correttezza, avrà solo
un grado di credenza sulla bontà delle azioni da
intraprendere e dei risultati.
Teoria della probabilità
La teoria della probabilità assegna un valore
di credenza (tra 0 ed 1) che esprime
l’incertezza.
La probabilità esprime l’incapacità dell’agente
di raggiungere una decisione definita a
proposito della verità di una formula e
riassumere le credenze di un agente.
Teoria della probabilità
• Valore 0 <--> credenza non equivocabile
che la formula è falsa
• Valore 1 <--> credenza non equivocabile
che la formula è vera
• Valori 0,1..0,9 <--> gradi di credenza
intermedi
Teoria della probabilità
Un valore a% di probabilità esprime il valore
percentuale a% di casi indistinguisbili tra
loro e veri.
Il valore di probabilità è calcolato con:
• metodi statistici
• regole generali
• regole basate su informazioni ambientali
estemporanee
Semantica degli enunciati di probab.
Nella logica del primo ordine ed in quella
proposizionale, una formula è vera o falsa a
seconda dell’interpretazione.
Nella teoria della probabilità, la probabilità
che un agente si affidi ad una proposizione
dipende dalle percezioni ricevute sino a
quel momento (prova). Le probabilità
possono cambiare quando si acquisiscono
nuove prove
Teoria della probabilità
• Probabilità a priori o incondizionata (prima
della prova).
• Probabilità a posteriori o condizionata
(dopo l’acquisizione delle prove)
Incertezza e decisioni
• Un agente logico ha un solo obiettivo ed
esegue un piano che garantisce il suo
raggiungimento (indipendentemente da altre
azioni)
• Un agente probabilistico è certo di
raggiungere l’obiettivo con qualche
probabilità (ed avendo preferito alcune tra
le conseguenze possibili).
Teoria dell’utilità
La teoria dell’utilità permette di rappresentare le
preferenze.
Ogni stato ha un grado di utilità per un agente;
l’agente preferirà di volta in volta stati con
utilità più alta.
L’utilità non è una priorità dello stato.
Non c’è oggettività nella scelta delle preferenze;
soggettività rispetto a ciascun agente.
Teoria delle decisioni
Le preferenze (utilità) sono combinate con le
probabilità nella teoria delle decisioni.
Teoria delle decisioni = Teoria delle probabilità +
Teoria dell’utilità
Agente basato sulla teoria delle decis.
Probabilità a priori P(A)
P(A) è la probabilità incondizionata o a priori che
l’evento/proposizione A sia vera in mancanza di
altre informazioni
La proposizione che è il soggetto di un enunciato
di probabilità può essere rappresentata da un
simbolo proposizionale P(A).
Le proposizioni includono variabili casuli.
Variabili casuali
Ogni variabile casuale X ha un dominio di
valori possibili (x, y,…z), in genere discreti,
che può assumere.
Quando si ha un vettore di valori per le
probabilità di ogni singolo stato del tempo,
si parla di
distribuzione di probabilità.
Probabilità condizionata
P(A/B) è la probabilità condizionata o a posteriori
che l’evento/proposizione A sia vera dopo che si
sia verificato l’evento/proposizione B. In
generale
P(X,Y)=P(X/Y)P(Y)
fornisce la probabilità condizionale delle variabili
nei domini di variabilità delle variabili casuali.
La probabilità condizionale di una disgiunzione è
data da P(AvB)=P(A)+P(B)-P(A^B)
Probabilità
Distribuzione di probabilità congiunta
La distribuzione di probabilità congiunta
specifica completamente le assegnazioni di
probabilità per tutte le proposizioni nel
dominio di un agente.
Si ha un insieme di variabili casuali che possono
assumere determinati valori con certe
probabilità
Evento atomico
Un evento atomico è un’assegnazione di
valori particolari a tutte le variabili.
La distribuzione di probabilità congiunta
assegna probabilità a tutti gli eventi atomici.
La specifica delle probabilità di un evento
atomico può essere molto difficile se non si
dispone di grandi quantità di dati da cui
estrarre stime statistiche.
Probabilità congiunta
La probabilità congiunta è una tavola
n-dimensionale con un valore in ogni cella che
fornisce la probabilità che quello specifico
stato (rappresentato da quelle variabili casuali)
si verifichi
A
-A
B 0.04 0.06
-B 0.01 0.89
Sommando lungo la riga o la colonna si ha la
probabilità incondizionata di quella variabile
Probabilità condizionale
E’ possibile fare inferenze a proposito della
probabilità di una proposizione ignota A,
data prova di B, calcolando P(A/B).
Un’interrogazione ad un sistema di
ragionamento probabilistico chiederà di
calcolare il valore di una particolare
probabilità condizionata.
Regola di Bayes
Con variabili indipendenti si ha:
P(A^B)=P(A/B)P(B)
P(A^B)=P(B/A)P(A)
da cui
P(A/B)P(B)=P(B/A)P(A)
e quindi la regola di Bayes
P(B/A)=P(A/B)P(B)
P(A)
che permette di fare inferenza probabilistica
Regola di Bayes
• Le relazioni di indipendenza condizionale
fra le variabili possono semplificare il
calcolo dei risultati delle interrogazioni e
ridurre notevolmente il numero di
probabilità condizionate che devono essere
specificate.
Assegnazione di valori di probabilità
• Partendo da misure di frequenza (di valori
di variabili) effettuate su casi reali
• Analizzando aspetti reali per cui le misure
di probabilità sono valori intrinseci di un
oggetto
Ragionamento probabilistico
I sistemi di ragionamento probabilistico
permettono di prendere decisioni razionali
anche quando non vi è abbastanza informazione
per dimostrare che qualsiasi azione funzionerà.
Per rappresentare la dipendenza fra le variabili, si
usano le reti di credenza come struttura dati.
Permettono anche di specificare concisamente
le distribuzioni di probabilità congiunta.
Rete di credenza
Una rete di credenze è un grafo diretto
aciclico in cui:
• i nodi sono un insieme di di variabili casuali
• archi direzionali congiungenti coppie di
nodi rappresentano l’influenza di una
variabile su un’altra
• ad ogni nodo è associata una tabella di prob.
condizionata che esprime gli effetti dei nodi
che lo influenzano (nodi genitori)
Rete di credenza
• Si affida ad un esperto di dominio la definizione
della topologia della rete di credenze, poi si
calcolano le influenze dirette e le conseguenti
probabilità
• La topologia della rete è la base di conoscenza
generale ed astratta dell’ambiente in cui si
possono verificare gli eventi, e rappresenta la
struttura generale del processo causale nel
dominio, piuttosto che fornire dettagli su un
particolare elemento.
Rete di credenza
Rete di credenza
• Una volta definita la topologia bisogna
specificare la tabella delle probabilità
condizionate associata ad ogni nodo.
• Ogni riga della tabella esprime la probabilità
del valore di ogni nodo per un caso
condizionante (combinazione di valori dei
nodi genitori)
• Un nodo con nessun genitore è rappresentato
dalla probabilità a priori
Rete di credenze con le probabilità condizionate
Rete di credenza
• Una rete di credenze rappresenta una (tra le
varie possibili) descrizione completa del
dominio solo se ogni nodo è condizionalmente
indipendente dai suoi predecessori
nell’ordinamento dei nodi dati i suoi genitori.
• Un elemento della tabella congiunta è la
probabilità di una congiunzione di assegnazioni
particolari ad ogni variabile.
Costruz. incrementale rete di credenza
Identificare un insieme di variabili rilevanti Xi che
descrivano il dominio
Scegliere un ordinamento tra le variabili
Finché rimangono variabili:
1. Prendere una Xi ed aggiungere un nodo alla rete
2. Scegliere l’insieme di genitori di Xi indipendenti
condizionalmente
3. Definire la tabella delle proprietà condizionate per
Xi.
Garantire la compattezza della rete.
Costruz. incrementale rete di credenza
Causa  Effetto
L’ordine corretto per aggiungere nodi è quello
che prevede prima l’inserimento delle “cause
alla radice”, quindi delle variabili che
influenzano per arrivare poi alle foglie che
non hanno nessuna influenza causale sulle
altre variabili.
Strutture di una rete di credenze
La struttura della rete dipende dall’ordine di
inserimento dei nodi.
Inferenza nelle reti di credenze
Compito fondamentale per un sistema di inferenza
probabilistico è quello di calcolare la distribuzione
delle probabilità a posteriori per un insieme di
variabili di interrogazione, dati i valori esatti per
alcune variabili di prova: P(Interrogazione/Prova)
In ogni rete di credenza ogni nodo può servire sia
come variabile di prova che di interrogazione.
Un agente acquisisce valori per le variabili di prova
dalle proprie percezioni (o da altro ragionamento) e
si informa a proposito di valori possibili per altre
variabili per poter decidere quale azione compiere.
Reti di credenza a connessioni multiple
• Un grafo è a connessioni multiple se due nodi
sono connessi da più di un cammino. Ciò accade
quando vi è più di una causa per una qualche
variabile e le cause condividono un antenato.
• Oppure reti a connessioni multiple rappresentano
situazioni in cui una variabile può influenzare
un’altra attraverso più di un meccanismo causale.
Reti di credenza a connessioni multiple
Reti di credenza a connessioni multiple
Reti di credenza a connessioni multiple
Ragionamento con incertezza
1. Decider di cosa parlare
2. Decidere un vocabolario delle variabili
casuali
3. Codifica delle conoscenza generale per le
dipendenze fra le variabili
4. Descrivere l’istanza specifica del problema
5. Interrogare la procedura di inferenza ed
ottenere risposte
Scarica

4incertezza