Risoluzione e Programmazione Logica (Prolog) Risoluzione Abraham Robinson [1965] Se è noto che “P è vera o Q è vera” ed anche che “P è falsa o R è vera”, allora deve essere il caso che “Q è vera o è vera R ” “L’idea che sta alla base della risoluzione è piuttosto semplice” Logical Foundations of Artificial Intelligence Michael R. Genesereth Nils J. Nilsson P vQ P v R QvR Esempi di equivalenze valide a a (a ) a (a ) a a() (a ) (a ) ( x a ) x a (xa ) x a a Va a aF a a Forma normale congiuntiva e clausole Un letterale è una formula atomica o la negazione di una formula atomica. Una clausola è una disgiunzione di letterali: A1 ... An B1 ... Bm [con Ai , Bj atomi] equivalentemente, puo essere rappresentata in forma implicativa: B1 ... Bm A1 ... An Una formula in forma normale congiuntiva è una congiunzione di clausole. Qualsiasi formula proposizionale può essere convertita in una formula proposizionale in forma normale congiuntiva logicamente equivalente. Qualsiasi formula ben formata della logica dei predicati ø può essere convertita in una formula ben formata della logica dei predicati in forma normale congiuntiva ø’. Si osservi che, 1. 2. In generale ø non è logicamente equivalente a ø’, ma ø è insoddisfacibile sse ø’ è insoddisfacibile. Una Base della conoscenza (KB) è un insieme di clausole. Risoluzione [I] Caso proposizionale con con ( - { }) ( - { }) I simboli e indicano clausole, mentre è uno dei letterali che ne fanno parte (può naturalmente non essere l’unico). Esempio 1. {P, Q} 2. {P, R} 3. {Q, R} 1,2 Il simbolo indica le clausole presenti inizialmente della ase della conoscenza. Procedura per Risoluzione Prooposizionale Premesse... KB ⊦ φ sse KB ⊧ φ sse KB ∪ {⌝φ} insoddisfacibile sse KB ∪ {⌝φ} incoerente Come dimostriamo KB ⊦ φ ? KB ⊦ φ Esempio di Risoluzione Proposizionale (Brachman&Levesque) KB KB (clausole) Proving that Girl holds... KB ⊦ Girl ? KB ∪ {⌝Girl} unsatisfiable? Risoluzione [II] Caso predicativo (( - { }) ( - {})) con con dove ( )= (), è l’unificatore più generale per i due letterali Esempio 1. {P(x), Q(x,y)} 2. {P(a), R(b, z)} 3. {Q(a,y), R(b, z)} 1,2 Il simbolo indica le clausole presenti inizialmente della base della conoscenza. In questo caso, l’unificatore più generale è = {x / a}. Forme Canoniche per la Risoluzione k m A1 ... Am B1 ... Bn k=1 A1 ... Am B1 k=1 m=1 VF clausola clausola di Horn una calusola con al più un letterale positivo clausola vuota TRASFORMAZIONE IN CLAUSOLE Insieme finito di istruzioni per trasformare una qualunque fbf della logica dei predicati del primo ordine in un insieme di clausole (1) Trasformazione in fbf chiusa: ad esempio, la formula, è trasformata in: x (p(y) (y (q(x,y) p(y)))) [1] x y (p(y) (y (q(x,y) p(y)))) [2] (2) Applicazione delle equivalenze per i connettivi logici: ad esempio, A B è sostituito da A B, e la si riduce in forma and-or. La formula [2] diventa: x y ( p(y) (y (q(x, y) p(y)))) [3] (3) Applicazione della negazione ai soli atomi (e non a formule composte), tenendo presente che, x A equivale a X A X A equivale a x A (A1 A2 ... An) equivale a A1 A2 ... An (A1 A2 ... An) equivale a A1 A2 ... An [leggi di De Morgan] la [3] si modifica in: x y ( p(y) (y (q(x, y) p(y)))) [4] (4) Cambiamento di nomi delle variabili: nel caso di conflitti. In [4] la seconda variabile y viene rinominata z : x y ( p(y) (z (q(x, z) p(z)))) [5] (5) Spostamento dei quantificatori: in testa alla formula (forma prenessa). x y z ( p(y) (q(x, z) p(z))) [6] (6) Forma normale congiuntiva: cioè come congiunzione di disgiunzioni, con quantificazione in testa. x y z (( p(y) q(x, z)) ( p(y) p(z))) [7] (7) Skolemizzazione: ogni variabile quantificata esistenzialmente viene sostituita da una funzione delle variabili quantificate universalmente che eventualmente la precedono. Tale funzione è detta funzione di Skolem. Ad esempio, una formula del tipo: x y p(x, y), può essere espressa in modo equivalente come: x p(x, g(x)) . In [7] z è sostituita da f (x, y), perché z si trova nel campo di azione delle quantificazioni x e y: x y (( p(y) q(x, f (x, y))) ( p(y) p(f (x, y)))) [8] Nota Perdita in espressività. Non è la stessa cosa asserire, F: x p(x) oppure F’: p(f). Vale comunque la proprietà che F è inconsistente se e solo se F’ è inconsistente. (8) Eliminazione dei quantificatori universali: si ottiene una formula detta universale (tutte le sue variabili sono quantificate universalmente) in forma normale congiuntiva. (( p(y) q(x, f (x, y))) ( p(y) p(f (x, y)))) [9] Una formula di questo tipo rappresenta un insieme di clausole. La forma normale a clausole che si ottiene è la seguente: { p(y), q(x, f (x, y))} { p(y), p(f (x, y))} [10] [11] I letterali della seconda clausola possono essere riscritti rinominando le variabili (sostituendo cioè le formule con le loro varianti). { p(y), q(x, f (x, y))} { p(z), p(f (w, z))} [12] [13] Qualunque teoria del primo ordine T può essere trasformata in una teoria T’ in forma a clausole. Anche se T non è logicamente equivalente a T’ (a causa dell'introduzione delle funzioni di Skolem), vale comunque la seguente proprietà: Proprietà Sia T una teoria del primo ordine e T’ una sua trasformazione in clausole, allora T è insoddisfacibile se e solo se T’ è insoddisfacibile. Il Principio di Risoluzione è una procedura di dimostrazione che opera per contraddizione e si fonda sul concetto di insoddisfacibilità. UNIFICAZIONE L’unificazione è una nozione fondamentale, sulla quale sono basati molti metodi per la risoluzione e la deduzione automatica di teoremi. Per applicare il principio di risoluzione alle clausole non-ground della logica del primo ordine è necessario introdurre il concetto di unificazione [J.A. Robinson, 1965], e lo stesso vale per l’applicazione della regola di Modus Ponens Generalizzato, appena visto. Per unificazione si intende il procedimento di manipolazione formale utilizzato per stabilire quando due espressioni possono essere identificate procedendo a opportune sostituzioni delle loro sotto-espressioni con altre espressioni. Una sostituzione è un insieme finito di legami fra simboli di variabili xi ( i = 1, .., n) ed espressioni (termini) ti. = {x1/t1, x2/t2,..., xn/tn}, dove x1, x2,..., xn sono distinte. L’applicazione della sostituzione a un’espressione E, [E], produce una nuova espressione ottenuta sostituendo simultaneamente ciascuna variabile xi dell’espressione con il corrispondente termine ti . [E] è detta in questo caso istanza di E. Per renaming si intendono sostituzioni che cambiano semplicemente il nome ad alcune delle variabili di E. [E] è una variante di E. Esempio L’applicazione della sostituzione all’espressione produce l'istanza = {x/c, y/a, z/w} p (x, f (y), b, z) p(c, f (a), b, w). Analogamente, [C(y, z)]{y/t, z/neri} = C(t, neri) [e1] [C(t, neri)]{y/t, z/neri} = C(t, neri) [e2] [C(y, z)]{y /bianchi, t/bianchi, z/neri} = C(bianchi, neri) [e3] [C(t, neri)]{y /bianchi, t/bianchi, z/neri} = C(bianchi, neri) [e4] [C(y, z)]{y/t, z/bianchi} = C(t, bianchi) [e5] [C(t, neri)]{y/t, z/bianchi} = C(t, neri) [e6] [T(s(a), f(s(b), s(c)))]{c/s(a), y /s(b), z/s(s(a))} = T(s(a), f(s(b), s(s(a))) [e7] [T(q, h(y, z))]{q/p, y /x, z/w} = T(p, h(x, w)) [e8], variante della partenza. [c (t, neri)] e = c (t, neri) [e9] [p (x, y)]{x/a, y/x} = p (a, x) [e10] Combinazioni di sostituzioni Date due sostituzioni 1 e 2 1 ={x1/t1, x2/t2, ..., xn/tn} 2 ={y1/q1, y2/q2, ..., ym/qm} La composizione 1 ° 2 di 1 e 2 è la sostituzione {x1/[t1]2,..., xn/[tn]2, y1/q1 , y2/q1, ..., ym/qm} ottenuta cancellando le coppie xi/[ti]2 per le quali si ha xn=[tn]2 e le coppie yj/qj per le quali yj appartiene all’insieme {x1, x2,..., xn}. Se consideriamo, ad esempio, le sostituzioni 1 = {x/f (z), w/r, s/c} 2 = {y/x, r/w, z/b} la loro composizione produce, 3 = 1 ° 2 = {x/f (b), s/c, y/x, r/w, z/b}. Sostituzioni più generali Una sostituzione è più generale di una sostituzione se esiste una sostituzione tale che = . Ad esempio, la sostituzione = {y/t, z/neri} è più generale della sostituzione = {y/bianchi, t/bianchi, z/neri} in quanto si può ottenere attraverso la composizione {y/t, z/neri}°{t/bianchi}, ovvero, = , e = {t/bianchi}. Come abbiamo detto, l’unificazione rende identici due o più atomi (o termini) (o meglio le loro istanze) attraverso la scelta e l’applicazione di una opportuna sostituzione. Un insieme di atomi (o termini) A1, A2,..., An è unificabile se esiste una sostituzione tale che: [A1] = [A2] = .... = [An]. La sostituzione è detta sostituzione unificatrice (o, più semplicemente, unificatore) Nota Se si considerano solo due atomi (o termini), uno dei quali senza alcuna variabile, si ricade in un caso particolare di unificazione, detto pattern-matching. Esempio[1] Se si considerano gli atomi: A1 = C(y, z) e A2 = C(t, neri) possibili sostituzioni unificatrici sono: = {y/t, z/neri} = {y/bianchi, t/bianchi, z/neri} la loro applicazione produce la stessa istanza: [C(y, z)] = [C(t, neri)] = C(t, neri) [C(y, z)] = [C(t, neri)] = C(bianchi, neri) La sostituzione: a = {y/t, z/bianchi} è un unificatore ? Esempio[2] Per gli atomi: A3 = P(x, x, f (a,z)) e A4 = P(y, w, f (y,j)) possibili sostituzioni unificatrici sono: = {x/a, y/a, w/a, j/z} = {x/a, y/a, w/a, j/c, z/c} la loro applicazione ad A3 e A4 produce la stessa istanza: P(a, a, f (a,z)) nel caso della sostituzione P(a, a, f (a,c)) nel caso della sostituzione . Possono esistere più sostituzioni unificatrici, si vuole individuare quella più generale (mgu, most general unifier). Nota: MGU: si ottiene da componendola con: a = {z/c}. Risoluzione Abraham Robinson [1965] Se è noto che “P è vera o Q è vera” ed anche che “P è falsa o R è vera”, allora deve essere il caso che “Q è vera o è vera R ” “L’idea che sta alla base della risoluzione è piuttosto semplice” Logical Foundations of Artificial Intelligence Michael R. Genesereth Nils J. Nilsson P vQ P v R QvR Risoluzione [I] Caso proposizionale con con ( - { }) ( - { }) I simboli e indicano clausole, mentre è uno dei letterali che ne fanno parte (può naturalmente non essere l’unico). Esempio 1. {P, Q} 2. {P, R} 3. {Q, R} 1,2 Il simbolo indica le clausole presenti inizialmente della ase della conoscenza. Risoluzione [II] Caso predicativo (( - { }) ( - {})) con con dove ( )= (), è l’unificatore più generale per i due letterali Esempio 1. {P(x), Q(x,y)} 2. {P(a), R(b, z)} 3. {Q(a,y), R(b, z)} 1,2 Il simbolo indica le clausole presenti inizialmente della base della conoscenza. In questo caso, l’unificatore più generale è = {x / a}. Risoluzione [III] La nozione di fattore Se un sottoinsieme di letterali in una clausola possiede un unificatore più generale , allora la clausola ’ ottenuta applicando la sostituzione alla clausola è detta fattore di . Ovviamente ogni clausola è banalmente fattore di se stessa. Nota In genere, la fattorizzazione s’intende come un’operazione di eliminazione delle ridondanze all’interno delle clausole. Caso fattorizzato ((’ - { }) ( ’ - {})) ’ con ’ con dove ( )= (), è l’unificatore più generale per i due letterali Risoluzione Esempio (Brachman&Levesque) KB KB ⊦ HardWorker(sue) ? Risoluzione Esempio (Brachman&Levesque) KB KB ⊦ HardWorker(x) ? X X X X Risoluzione SLD e Programmazione Logica Esecuzione di un Programma [P] Una computazione corrisponde al tentativo di dimostrare, tramite la regola di risoluzione, che una formula (goal) segue logicamente da un insieme di formule (programma); cioè, che la formula e’ un teorema. Si deve determinare una sostituzione per le variabili del goal (detto anche “query”) per cui il goal segue logicamente dal programma. Dato un programma P e una query: :- S (t1, t2, …, tm) . se x1, x2, …, xn sono le variabili che compaiono in t1, t2, …, tm il significato logico della query e’: x1 x2 … xn S (t1, t2, …, tm) e l’obiettivo e’ quello di trovare una sostituzione = [x1 / a1, x2 / a2 , …, xn/an] dove ai sono termini tale per cui P [S (t1, t2, …, tm)] Risoluzione SLD Risoluzione Lineare per Clausole Definite con funzione di Selezione (completa per le clausole di Horn) Dato un programma logico P e una clausola goal G0 , ad ogni passo di risoluzione si ricava un nuovo risolvente Gi+1 , se esiste, dalla clausola goal ottenuta al passo precedente Gi e da una rinomina di una clausola appartenente a P Una rinomina per una clausola C e’ la clausola C’ ottenuta da C rinominando le sue variabili. Quello che segue è un esempio di rinomina: p(X) :- q (X, g(Z)) . p(X1) :- q (X1, g(Z1)) . Risoluzione SLD Operativamente... La Risoluzione SLD seleziona un atomo Am dal goal Gi secondo un determinato criterio, e lo unifica se possibile con la testa della clausola Ci attraverso la sostituzione più generale: MOST GENERAL UNIFIER (MGU) Il nuovo risolvente e’ ottenuto da Gi riscrivendo l’atomo selezionato con la parte destra della clausola Ci ed applicando la sostituzione i. Più in dettaglio: :- A1, …, Am-1, Am, Am+1, …,Ak . A :- B1, …, Bk . [Am] i = [A] i Risolvente, clausola del programma P, e allora la risoluzione SLD deriva il nuovo risolvente :- [A1, …, Am-1, B1, …, Bq , Am+1, …, Ak] i . Risoluzione SLD sum (0, X, X) . sum (s(X), Y, s(Z)) :- sum (X, Y, Z) . [CL1] [CL2] Goal sum (s(0), 0, W) . Al primo passo genero una rinomina della clausola [C2] sum (s(X1), Y1, s(Z1)) :- sum (X1, Y1, Z1) . Unificando la testa con il goal, ottengo la sostituzione MGU 1 = [X1/0, Y1/0, s(Z1)/W] Ottengo il nuovo risolvente [G1] :- [sum (X1, Y1, Z1)] 1 ossia, . . . :- sum (0, 0, Z1) . Derivazione SLD Una derivazione SLD per un goal G0 dall’insieme di clausole definite P e’ una sequenza di clausole goal G0 , …, Gn , una sequenza di rinomine di clausole del programma C1 , …, Cn , e una sequenza di sostituzioni MGU 1 ,…, n tali che Gi+1 è derivato da Gi e da Ci+1 attraverso la sostituzione n. La sequenza può essere anche infinita. Esistono tre tipi di derivazioni: SUCCESSO, se per n finito Gn è uguale alla clausola vuota Gn= :-– FALLIMENTO FINITO, se per n finito non è più possibile derivare un nuovo risolvente da Gn e Gn non è uguale a :-– FALLIMENTO INFINITO, se è sempre possibile derivare nuovi risolventi tutti diversi dalla clausola vuota. Derivazione di SUCCESSO sum (0, X, X) . sum (s(X), Y, s(Z)) :- sum (X, Y, Z) . Il goal G0 :- sum (s(0), 0, W) [CL1] [CL2] ha una derivazione di successo ! [C1] rinomina di [CL2] sum (s(X1), Y1, s(Z1)) :- sum (X1, Y1, Z1) . 1 = [X1/0, Y1/0, s(Z1)/W] [G1] :- sum (0, 0, Z1) . [C2] rinomina di [CL1] sum (0, X2, X2) . 2 = [Z1/0, X2/0] [G2] :- Derivazione di FALLIMENTO FINITA sum (0, X, X) . sum (s(X), Y, s(Z)) :- sum (X, Y, Z) . [CL1] [CL2] Il goal G0 :- sum (s(0), 0, 0) ha una derivazione di fallimento finito ! ... semplicemente, perché l’unico atomo del goal non è unificabile con alcuna clausola del programma. Derivazione di FALLIMENTO INFINITA sum (0, X, X) . sum (s(X), Y, s(Z)) :- sum (X, Y, Z) . [CL1] [CL2] Il goal G0 :-sum(A,B,C) ha una derivazione SLD infinita ! ... ottenuta applicando ripetutamente varianti della seconda clausola di P [C1] rinomina di [CL2] sum (s(X1), Y1, s(Z1)) :- sum (X1, Y1, Z1) . 1 = [A/s(X1),B/Y1,C/s(Z1)] [G1] :- sum(X1, Y1, Z1) . [C2] rinomina di [CL2] sum (s(X2), Y2, s(Z2)) :- sum (X2, Y2, Z2) . 2 = [X1/s(X2),Y1/Y2,Z1/s(Z2)] [G2] :- sum (X2, Y2, Z2) . ... Non Determinismo Nella risoluzione SLD, così come è stata enunciata, si hanno due forme di non determinismo. La prima forma di non determinismo è legata alla selezione di un atomo Am del goal da unificare con la testa di una clausola, e viene gestita definendo una particolare regola di calcolo. La seconda forma di non determinismo è legata alla scelta di quale clausola del programma P utilizzare in un passo di risoluzione, e viene gestita definendo una strategia di ricerca. Regola di Calcolo Una regola di calcolo è una funzione che ha come dominio l'insieme dei letterali (atomi) di un goal e come codominio un insieme formato da un solo atomo dello stesso goal, ad esempio Am nel goal seguente :-A1 ,...,Am-1, Am , Am+1 , ..., Ak sum (0, X, X) . sum (s(X), Y, s(Z)) :- sum (X, Y, Z) . [CL1] [CL2] G0 :- sum (0, s(0), s(0)) , sum (s(0) ,0 ,s(0)) . Se si seleziona l’atomo più a sinistra (LEFT-MOST) al primo passo, unificando l’atomo sum (0, s(0), s(0)) con la testa di [CL1], si otterrà: [G1] :- sum (s(0), 0, s(0)) . Se si seleziona l’atomo più a destra (RIGTH-MOST) al primo passo, unificando l’atomo sum (s(0), 0, s(0)) con la testa di [CL2], si avrà: [G1] :- sum (0, s(0), s(0)) , sum (0, 0, 0) . Strategia di Ricerca Questa forma di non determinismo implica che possano esistere più soluzioni alternative per uno stesso goal, corrispondenti alle diverse scelte delle clausole con cui tentare l’unificazione. La risoluzione SLD (completezza), deve essere in grado di generare tutte le possibili soluzioni e quindi deve considerare ad ogni passo di risoluzione tutte le possibili alternative. La strategia di ricerca deve garantire questa completezza Una forma grafica utile per rappresentare la risoluzione SLD e questa forma di non determinismo sono gli alberi SLD. Alberi SLD Dato un programma logico P, un goal G0 e una regola di calcolo R, un albero SLD per P {G0} via R è definito come segue: 1. ciascun nodo dell'albero è un goal (eventualmente vuoto); 2. la radice dell'albero è il goal G0 ; 3. dato il nodo :- A1, ..., Am-1, Am , Am+1 , ..., Ak , se Am è l’atomo selezionato dalla regola di calcolo R, allora questo nodo genitore ha un nodo figlio per ciascuna clausola Ci = A :- B1, …, Bq di P tale che A e Am sono unificabili attraverso una sostituzione unificatrice più generale . Il nodo figlio è etichettato con la clausola goal: :- [A1, …, Am-1, B1, …, Bq, Am+1, …, Ak] e il ramo, dal nodo padre al figlio, è etichettato dalla sostituzione dalla clausola selezionata Ci ; 4. Il nodo vuoto (indicato con “:-”) non ha figli. e Strategia di Ricerca La realizzazione effettiva di un dimostratore basato sulla risoluzione SLD richiede la definizione non solo di una regola di calcolo, ma anche di una strategia di ricerca che stabilisca una particolare modalità di esplorazione dell’albero SLD alla ricerca dei rami di successo. Le modalità di esplorazione dell’albero piu’ comuni sono: depth first [PRIMA IN PROFONDITA’] breadth first [PRIMA IN AMPIEZZA] Entrambe le modalità implicano l’esistenza di un meccanismo di backtracking per esplorare tutte le strade alternative che corrispondono ai diversi nodi dell’albero.