Sistemi basati su conoscenza Metodi di ricerca informata Prof. M.T. PAZIENZA a.a. 2009-2010 Strategia di ricerca Le strategia di ricerca non informata trovano soluzioni (spesso non efficienti) a problemi generando sistematicamente nuovi stati che sono poi verificati rispetto all’obiettivo (possibile esplosione combinatoria dello spazio di ricerca) Le strategia di ricerca non informata sono dette anche cieche perché non considerano l’obiettivo; non usano nessuna informazione relativamente all’obiettivo cui stanno mirando finché non ci capitano su. Strategia di ricerca Le strategie di ricerca informata definiscono metodologie risolutive che usano informazione euristica per decidere quali sono i nodi più convenienti da scegliere ad ogni passo. Le strategie di ricerca informata, utilizzando conoscenza addizionale specifica al problema e al dominio di applicabilità, trovano soluzioni più efficienti, ovvero riducono il costo della ricerca. Euristica - Ricerca euristica Euristica (definizioni) “tutto ciò che supporta meglio l’attività di ricerca” “lo studio di metodi e regole a supporto dell’attività di ricerca” “un processo che può risolvere un dato problema ma che non offre alcuna garanzia di farlo (euristica per quel problema)” Euristica - Ricerca euristica Euristica (definizione di Minsky, 1961) “tutto ciò che è collegato al miglioramento delle prestazioni del problem-solving; si usa in relazione a qualsiasi metodo od espediente per migliorare l’efficienza di un programma di problem-solving” ma: Metodi imperfetti non sono necessariamente euristici, né è vero il viceversa! Euristica - Ricerca euristica Euristica (definizione di Feigenbaum e Feldman, 1963) “una euristica (regola o metodo) è una regola, strategia, semplificazione o qualunque altro strumento che drasticamente limita la ricerca di soluzioni nello spazio degli stati del problema. Le euristiche non garantiscono soluzioni ottimali; non garantiscono soluzioni in ogni caso. Una euristica utile è ciò che offre soluzioni che sono abbastanza buone il più delle volte. Euristica - Ricerca euristica Ricerca euristica (definizione di Nilsson, 1971) “E’ importante distinguere tra ricerca cieca e ricerca euristica: la prima corrisponde alla generazione sistematica ed al test degli elementi dello spazio di ricerca , lasciando spazio all’introduzione di informazioni addizionali sul dominio dello specifico problema. Quando tali informazioni addizionali vanno oltre le necessarie per definire una classe di problemi di ricerca, allora è possibile restringere notevolmente la ricerca. In tal caso si parla di ricerca euristica piuttosto che ricerca cieca.” Strategia di ricerca L’informazione euristica rappresenta conoscenza esplicita rispetto ad un nodo, si esprime come una funzione h(n) che rappresenta una stima della lunghezza del cammino da un nodo n al nodo obiettivo. Si assume che il valore euristico possa essere derivato dalle proprietà di un nodo. La funzione euristica è un modo veloce per informare la strategia di ricerca relativamente alla direzione per raggiungere il nodo. Essa fornisce una indicazione su quale vicino di un nodo condurrà all’obiettivo più facilmente. Tecniche euristiche Euristica è qualunque tecnica che migliora le prestazioni del compito di risoluzione del problema nel caso medio, ma non migliora necessariamente nel caso peggiore. Negli algoritmi di ricerca si riferisce ad una funzione che fornisce una stima del costo della soluzione Tecniche euristiche Nei sistemi esperti le tecniche euristiche erano viste come “regole empiriche” che gli esperti del dominio potevano usare per generare “buone soluzioni” senza attivare ricerche esaustivamente. Se le euristiche vengono espresse come regole, si parla di sistemi basati su regole. Strategia di ricerca informata Le tecniche euristiche non sono facilmente adattabili a nuovi problemi: tecniche sostanzialmente simili vengono reinventate continuamente. Esiste l’interesse nello sviluppare algoritmi di ricerca euristici generalizzati le cui proprietà possano essere studiate indipendentemente dal particolare dominio e dal programma che li usi. Dato un problema generale di rappresentazione, le tecniche di ricerca euristica più basilari possono essere studiate come variazione dei metodi di ricerca cieca per lo stesso tipo di rappresentazione del problema. Strategia di ricerca euristica I punti in cui applicare l’informazione euristica sono relativi a: • decidere quali nodi espandere (invece di applicare tecniche in profondità od in ampiezza) • nel corso dell’espansione del nodo, decidere quale successore/i generare (invece di una generazione cieca di tutti i possibili successori ad un dato istante) • decidere che certi nodi devono essere scartati, od eliminati, dall’albero di ricerca. Strategia di ricerca L’idea generale è quella di espandere il nodo che sembra “più promettente”. In genere la specifica strategia di ricerca si distingue per la diversa funzione di valutazione usata per determinare il prossimo nodo da espandere. La funzione di valutazione determina il valore di desiderabilità (o non desiderabilità) dell’espansione di ogni specifico nodo. Funzioni di valutazione Quando tale valutazione è fornita da una stima (e non viene determinata esattamente) si parla di funzione euristica, quindi La funzione euristica h(n) stima il costo del cammino più conveniente dallo stato del nodo n ad uno stato obiettivo; per cui suggerisce di espandere il nodo che “sembra” più promettente. Ogni funzione euristica è specifica al problema, ovvero viene definita a seconda del problema che si sta risolvendo Algoritmi di ricerca best-first La più semplice funzione euristica è scegliere sempre l’elemento di frontiera che appare essere più vicino all’obiettivo, ovvero scegliere il nodo n con il più basso valore di h(n). Implementare questa strategia consiste nel trattare la frontiera come una coda a priorità, ordinata con la funzione h(n). E’ simile alla ricerca a costo uniforme, dove la scelta cade sull’elemento con minimo valore dell’euristica h piuttosto che sull’elemento della coda con minimo valore del costo del cammino g fino a quel nodo. Algoritmi di ricerca best-first I nodi sono ordinati in modo che venga espanso prima il nodo (che sembra) migliore secondo la funzione di valutazione Algoritmi di ricerca best-first La ricerca best-first persegue un certo numero di cammini espandendo il nodo che sembra localmente il migliore. Ha lo svantaggio (come la ricerca in ampiezza) di usare uno spazio esponenziale rispetto alla lunghezza del cammino. A differenza della ricerca in ampiezza, non assicura di trovare una soluzione anche se ne esiste una. Inoltre non trova necessariamente per primo il cammino più breve. Ricerca golosa Esiste tutta una famiglia di algoritmi di best-first. Una ricerca di best-first che usa h (minimizzare il costo per raggiungere l’obiettivo) per selezionare il nodo successivo da espandere è detta ricerca golosa. Viene espanso prima il nodo giudicato più vicino allo stato obiettivo da una qualunque funzione euristica h purché: h(n)=0 se n è un nodo obiettivo La ricerca golosa è simile ad una ricerca in profondità; segue un cammino fino all’obiettivo, per tornare indietro quando si imbatte in un vicolo cieco. Ricerca di itinerario (euristica) Nel caso della ricerca di un itinerario, la distanza in linea d’aria dall’obiettivo, hDLA (n) ovvero la distanza in linea d’aria tra n e la posizione dell’obiettivo, viene considerata una buona funzione euristica Ricerca di itinerario (with step costs in km) Ricerca di itinerario (euristica) Si può calcolare hDLA (n) solo se si conoscono le coordinate dei nodi. Queste ultime (e altre informazioni aggiuntive) permettono alle euristiche di aiutare a ridurre il costo della ricerca Ricerca di itinerario (euristica) Ricerca di itinerario (euristica) L’euristica hDLA (n) determina un costo di ricerca minimo, trova una soluzione senza mai espandere alcun nodo che non sia sul cammino della soluzione. Non è perfettamente ottimale (ricerca golosa), tende a trovare una soluzione velocemente anche se non ottimale Ricerca di itinerario (ricerca golosa - euristica) Ricerca non ottimale ed incompleta Può intraprendere un vicolo cieco con ricerca infinita m Complessità temporale nel caso peggiore O(b ) con m profondità massima dello spazio di ricerca e b fattore di ramificazione. Complessità spaziale = complessità temporale (tutti i nodi sono mantenuti in memoria) Una buona funzione euristica può ridurre le due complessità (in funzione della tipologia del problema e natura della funzione h) Ricerca A* (euristica ammissibile) La ricerca golosa minimizza il costo stimato per raggiungere l’obiettivo h(n). La ricerca a costo uniforme minimizza il costo del cammino dall’origine al nodo corrente g(n). Il costo stimato della soluzione più conveniente attraverso n (ricerca A*) è dato da f(n) pari alla somma f(n)=g(n)+h(n) Ricerca A* (euristica ammissibile) L’algoritmo A* cerca il cammino di minimo costo dal punto di partenza al nodo d’arrivo nel grafo dello spazio degli stati (ovvero il cammino contenente il minor numero di archi nel caso pesino ognuno 1). La funzione, quindi, considera che ciascun nodo n avrà due componenti: 1. il costo per raggiungere n dal nodo di partenza 2. il costo per raggiungere il nodo obiettivo dal nodo n. Ricerca A* (euristica ammissibile) g(n) = costo del cammino dal nodo iniziale al nodo n h(n) = costo stimato del cammino più conveniente da n all’obiettivo f(n) = g(n) + h(n) f(n) = costo stimato della soluzione più conveniente attraverso n La soluzione più conveniente espande prima il nodo con il valore più basso di f Ricerca A* (euristica ammissibile) * A search example Cercare funzioni euristiche Se per un problema esiste una collezione di euristiche ammissibili, e nessuna domina le altre, allora si pone: h(n) max( h1 ),..., h(n)) In alternativa usare informazioni statistiche Argomenti trattati in questa lezione • Strategie di ricerca • Cosa si intende per euristica; livello di generalità/specificità supportato • Quali informazioni fornisce una funzione euristica • Algoritmi di ricerca best first: ricerca golosa, DLA, A* • Come determinare una funzione euristica ottimale per un problema