Intelligenza Artificiale
Maria Teresa PAZIENZA
a.a. 2009-10
Sito
Sul sito di Didattica Web tutte le informazioni su:
Programma
Progetto
Ricevimento
Esami (date, iscrizioni, risultati)
Tesi
Varie
Progetto
Potrà consistere
(a)nella realizzazione di un prototipo informatico
progettato e realizzato secondo modalità introdotte nel
corso delle lezioni o, equivalentemente,
(b)nella stesura di una tesina di approfondimento di temi
inerenti all’IA ed affrontati soltanto limitatamente nel
corso delle lezioni
Materiale didattico
Il materiale didattico (ulteriore ai libri di testo) verrà pubblicato nel
sito del corso su Didattica Web e distribuito di volta in volta in
relazione ai temi specifici affrontati nel corso delle lezioni
(dispense, articoli, slides, monografie e saggi, eventuali
collegamenti a risorse digitali disponibili in rete, ...).
Libri di testo:
“Knowledgs Representation and Reasoning”
R.J. Brachman, H.J. Levesque (ed. Morgan Kaufmann),
“Speech and Language Processing”
D.Jurafsky, J. Martin (ed. Prentice Hall)
Esami
Per partecipare ad una prova d’esame è obbligatorio
prenotarsi almeno 24 ore prima dell’esame.
La partecipazione ad una prova scritta non preclude la
partecipazione a prove successive (nel caso si rifiuti
la valutazione conseguita) previa nuova
registrazione.
Problema
Il prodotto dell’età di 3 ragazzi è 72, la loro somma è 14:
qual è l’età di ciascuno di loro?
Cerchiamo la soluzione del problema:
72 deve essere fattorizzato in 3 termini; esistono più
combinazioni possibili : 2,6,6 – 8,3,3 – 2,4,9 - …
2 terne sommano a 14, ma non basta per la soluzione.
Bisogna introdurre un’altra informazione, per esempio:
Quello più grande si chiama Giorgio.
Soluzione trovata:
8,3,3
Problema
Il prodotto dell’età di 3 ragazzi è 72, la loro
somma è 14: qual è l’età di ciascuno di loro?
Cerchiamo la soluzione del problema…
E’ il pensare che porta l’umano a discernere cosa
è rilevante, all’interno delle sue conoscenze, per
portare a termine un compito/attività/decisione
Intelligenza Artificiale
L’Intelligenza Artificiale è lo studio del comportamento
intelligente (di un umano e/o di un agente) raggiunto
tramite strumenti computazionali
La rappresentazione della conoscenza ed il
ragionamento automatico nell’IA sono relativi
all’analisi di come un agente (« intelligente ») usa la
sua conoscenza per decidere come comportarsi /agire
mostrando, così, un comportamento intelligente.
Intelligenza Artificiale
L’obiettivo è risolvere il problema rappresentato da:
Qual è
• il corretto livello di astrazione della mente
umana
• per costruire un modello mentale
• che debba successivamente guidare le azioni di
una macchina intelligente?
Intelligenza Artificiale
Studio di come raggiungere un
comportamento intelligente
attraverso
strumenti computazionali.
La rappresentazione della conoscenza ed il ragionamento
automatico coincidono con l’analisi/studio del pensare
(inteso come processo computazionale capace di estrarre le
conoscenze rilevanti per la risoluzione del problema).
Nell’umano la conoscenza è veicolata dal linguaggio naturale.
Intelligenza Artificiale
Nell’IA ci si occupa di:
• Costruire macchine intelligenti che operino
come/meglio degli umani
• Formalizzare la conoscenza ed i meccanismi di
ragionamento in ogni settore di interesse
• Usare modelli computazionali per capire/definire
il comportamento di umani ed agenti intelligenti
• Rendere facile ed efficace l’interazione
uomo/macchina
Intelligenza Artificiale
Materia in forte evoluzione; dare una definizione
che delimiti rigorosamente i campi di interesse
rischierebbe di escludere a priori sviluppi futuri
che già si intravedono
L’IA non è una lista di argomenti e metodologie; è piuttosto una
attività complessa legata alla comprensione di
comportamenti intelligenti ed alla loro
implementazione in sistemi intelligenti.
Intelligenza Artificiale
L’IA è contemporaneamente scienza e tecnica,
disciplina di frontiera in cui s’incontrano diversi
domini del sapere: logica, informatica,
psicologia, neuroscienze, filosofia…
Attiene a tutti i campi dell’informazione e trova
applicazione in tutti i settori
Intelligenza Artificiale
L’IA si manifesta con un duplice profilo:
• disciplina ingegneristica (costruire macchine
capaci di svolgere compiti intellettuali integrando
componenti diverse)
• disciplina psicologica (costruire macchine capaci
di esprimere le caratteristiche essenziali
dell’attività cognitiva umana spiegando i rapporti
tra pensiero e fisicità dell’uomo)
Intelligenza Artificiale
La formalizzazione logica dei problemi è fondamentale
alla loro soluzione
Le metodologie risolutive possono richiedere tecnologie
di varia tipologia
Ove la formalizzazione completa non sia possibile, si
ricorre a soluzioni parziali
L’elaborazione del linguaggio naturale è un problema
tipico dell’IA
Gestire la conoscenza (del mondo, di dominio,
dell’applicazione,…) è un problema tipico dell’IA
Elaborazione del linguaggio naturale
multimedialità /
multimodalità
parlato
scritto
Analisi del linguaggio
rappresentazione
della conoscenza
Rappresentazione della conoscenza e
ragionamento automatico
Usando il linguaggio naturale gli umani esprimono in frasi
dichiarative « ciò che si conosce » (pur con lessicalizzazioni
diverse)
–
–
–
–
–
Mario conosce tutte le barzellette sui carabinieri
Maria conosce bene l’informatica
Giovanni conosce la strada per Milano
Il professore sa che Maria arriverà domani
…
Come definizione iniziale si può affermare che:
La conoscenza esprime una
relazione tra « chi conosce » ed una « proposizione »
ovvero la frase dichiarativa
Rappresentazione della conoscenza e
ragionamento automatico
Cosa sono le « proposizioni »?
Entità astratte / frasi che possono essere
vere/false, giuste/sbagliate in contesti specifici
Non sempre si tratta di proposizioni dichiarative;
possiamo anche avere credenze, aspettative,
supposizioni, attitudini, etc.
Rappresentazione
Per rappresentazione si intende una relazione tra due domini: il primo è
qualcosa che sta per o ha il posto di un altro.
In genere il primo dominio è concreto, immediato, accessibile più che il
secondo.
Vengono usati simboli formali (un carattere o gruppi di caratteri presi da un
alfabeto predeterminato) perchè più facilmente gestibili di ciò che i simboli
stessi rappresentano.
Una frase in un linguaggio naturale (es. Italiano) è concreta: possiamo
distinguere le parti che la costituiscono, i loro ruoli etc.
Giovanni ama Maria
Una proposizione è astratta in quanto, per esempio, prevede una sottostante
automatica classificazione di tutti i modi possibili nel mondo in cui
Giovanni ami Maria e quelli in cui non la ami.
Rappresentazione
La rappresentazione della conoscenza usa simboli formali
per rappresentare una collezione finita di proposizioni in
cui un agente ha fede (crede in).
L’agente può credere in un numero infinito di proposizioni.
È compito del « ragionamento » superare il gap tra
ciò che è rappresentato
e
ciò che si conosce o si crede.
Ragionamento
Manipolazione formale dei simboli che rappresentano
• una collezione di proposizioni/credenza
• al fine di produrre la rappresentazione di nuove
proposizioni.
Il ragionamento è una forma di calcolo (tipo quello
aritmetico) in cui si opera sui simboli che
rappresentano le proposizioni
Programma
Il corso sarà articolato su 3 aree:
Elaborazione
del
Ling.Naturale
Rappres. della
conoscenza e
ragionamento
Tecnologie
di IA
Il ruolo della conoscenza nei
sistemi informatici
Le conoscenze servono per:
interpretare la realtà: capire che cosa è successo (ad es.,
ipotizzare le cause di un evento che si è verificato);
prevedere l’evoluzione della realtà: prevedere con
approssimazione accettabile quali modifiche si potranno
verificare nel futuro;
agire in modo razionale modificando la realtà: costruire piani
d’azione per raggiungere determinati obiettivi.
Learning to Reason
Learning
W
Reasoning
Knowledge
Representation
KB
Task
• interarazione con il mondo (World)
per knowledge representation si intende:
- ciò che si è scelto per facilitare il processo di inferenza
- ciò che si è imparato a seguito dell’interazione con il mondo
•
la prestazione viene misurata rispetto al mondo e per uno specifico task di
Page 24
ragionamento
Conoscenza: un problema trasversale
La rappresentazione (e gestione) della conoscenza
è un problema di interesse per l’IA e non solo.
E’ strettamente collegato alla costruzione di
sistemi software: una parte rilevante
dell’Ingegneria del Software (SE) attiene a
tematiche di rappresentazione della conoscenza
IA e SE
• la molteplicità sia dei proprietari che degli
sviluppatori di software,
• il poter aggiungere nuove caratteristiche a servizi
già esistenti,
• la eterogeneità e complessità dei prodotti
presuppongono che lo sviluppo del software sia un
processo basato su una grande quantità di
conoscenza ed una comunicazione intensa tra le
entità coinvolte
Sistemi intelligenti (1)
• Agire in ambienti sconosciuti od ostili (robot in una
situazione ignota, agenti/softbot nel web)
• Gestire grandi quantità di “conoscenza” descrittiva
del mondo e dell’applicazione, con l’obiettivo di
migliorare le prestazioni nella risoluzione di un
problema, acquisire ulteriore conoscenza per
collaborare con altre entità (umani, agenti), gestire
informazioni non strutturate come nel web
Sistemi intelligenti (2)
• Dialogare con altre entità (anche sul web) per
migliorare l’interazione e l’acquisizione di
conoscenza
• Capire i sistemi con cui si interagisce per meglio
integrare le componenti, facilitare l’interazione,
regolare l’accesso alle risorse
Sistemi intelligenti (integrazione)
I sistemi intelligenti non agiscono in maniera isolata,
piuttosto costituiscono componenti importanti in
sistemi più complessi a supporto di una maggiore
capacità, flessibilità e cooperazione del sistema
nel suo insieme.
Ciò richiede l’integrazione di:
• componenti di reasoning in sistemi tradizionali
• conoscenza in basi di dati
• description logics in sistemi object oriented
Sistemi intelligenti (coordinazione di più agenti
umani/artificiali)
Per:
1. Comprensione/gestione del dialogo
2. Costruzione di “assistenti” intelligenti (capaci di
capire l’utente)
3. Supporto al lavoro di gruppo e/o collaborativo
4. Gestione “networks”
Sistemi intelligenti (coordinazione di più agenti
umani/artificiali)
Necessario:
1.Comprensione del linguaggio naturale scritto e
parlato
2.Generazione del linguaggio naturale
3.Gestione delle ambiguità grammaticali e
semantiche
4.Combinazione di tecniche di nlp con altre
tecnologie per realizzare interfacce multimediali
Sistemi intelligenti (acquisizione di conoscenza da
più agenti)
Necessario:
1. Capacità di collezionare, codificare, rappresentare
conoscenza
2. Integrazione di metodologie per la rappresentazione di
conoscenze differenti
3. Gestione dell’organizzazione concettuale della conoscenza
in ontologie e la loro integrazione
4. Gestione efficace della strutturazione, indicizzazione,
ricerca di grandi quantità/risorse di conoscenza
5. Ragionare su domini di conoscenza diversi
6. Applicare la conoscenza del senso comune
Web focus
I sistemi software sono sempre più alimentati dal web
Devono quindi gestire/interagire con dati di sorgenti
eterogenee che possono essere sconosciute in fase
di sviluppo del software.
Per la risoluzione di questo problema gli ingegneri
del software cercano tecnologie che li aiutino nella
gestione della eterogeneità anche runtime.
Semantic Web in Soft. Engineering
Le tecnologie del Semantic Web possono migliorare
l’ingegneria del software (da MDA a ODA) per
aumentare la scalabilità e composizionalità delle
componenti
• supportando la rappresentazione non ambigua della
terminologia di dominio
• permettendo il controllo automatico della consistenza e
validazione di regole invarianti, precondizioni e postcondizioni
• supportando la mediazione e trasformazione della
terminologia basata su conoscenza
Semantic Web in Soft. Engineering
Improvement:
si ottiene, si supporta una aumentata scalabilità e
compatibilità dei componenti
Problema:
difficoltà nella costruzione e manutenzione di
ontologie di metadati
Semantic Web in Soft. Engineering
Come
• “classificatore” per raggruppare tool e tecniche
correlate per modellare rigorosamente la
semantica durante le fasi di specificazione e
disegno del ciclo di vita del software
• “meccanismo” per (rigorosamente) descrivere,
identificare, scoprire e condividere artefatti
all’interno dei sistemi, sottosistemi e team di
disegno sia in fase di disegno che runtime
Semantic Web in Soft. Engineering (2)
Il Semantic Web può essere visto come un set di corpora
formalizzati di contenuti interrelati, riusabili e che possono
essere ulteriormente classificati come:
passivi, dati in forma di:
• documenti e dati piatti HTML, XML,..
• documenti e dati generati dinamicamente via JSP, PHP,..
• metadati RDF, OWL
• media, pictures video, music,..
• databases
Semantic Web in Soft. Engineering (3)
Il Semantic Web può essere visto come un set di corpora
formalizzati di contenuti interrelati, riusabili e che possono
essere ulteriormente classificati come:
attivi, funzionalità presentate come:
• Web services, semantic web services
• componenti funzionali referenziati come frammenti con
contenuti passivi (Java script, Java applets)
Sia gli “attivi” che i “passivi” possono essere descritti
usando tecniche ontologiche
Intelligenza Artificiale (IA)
I calcolatori generali (general purpose) hanno la
caratteristica di essere macchine simboliche, ovvero sono
(1) macchine capaci di manipolare “strutture di simboli”
da porre in corrispondenza ad “entità diverse”:
•
•
•
•
•
parole di una lingua naturale,
espressioni matematiche,
posizioni del gioco degli scacchi,
oggetti da riconoscere e classificare,
……
Intelligenza Artificiale (IA)
I calcolatori generali (general purpose) sono
(2) macchine capaci di utilizzare l’istruzione di “salto
condizionato” che consente di cambiare l’ordine di
esecuzione delle istruzioni.
La macchina rivela una capacità discriminativa,
ovvero seleziona/sceglie la sequenza di istruzioni
da eseguire rivelando un atteggiamento intelligente.
Intelligenza Artificiale (IA)
Inizialmente
attenzione all’analisi di problemi relativi ad ambiti ben
delimitati, per risolvere i quali bastano regole
esplicite per l’elaborazione simbolica e poca
conoscenza specializzata.
Successivamente
da elaborazione simbolica a conoscenza tacita, ad
abilità senso-motorie, alla capacità di adattamento
all’ambiente naturale o alle interazioni sociali con
altri agenti naturali o artificiali.
Intelligenza Artificiale (IA)
Inizialmente
convinzione che compito principale dell’IA fosse lo studio
delle strategie di soluzione di problemi efficacemente
selettive, o “euristiche”.
La programmazione euristica, analogamente agli esseri
umani, esplora solo una parte dei percorsi che, in base alle
informazioni possedute, potrebbero portare ad una
soluzione accettabile del problema dato e che soddisfino
alcuni requisiti irrinunciabili.
Intelligenza Artificiale (IA)
Tipicamente fondati sulla programmazione euristica sono i
sistemi basati su conoscenza (e tra questi i sistemi
esperti); una base di conoscenza raccoglie e sistematizza
conoscenze e tecniche di ragionamento euristico.
Su una base di conoscenza opera un motore inferenziale
che risolve i problemi posti, anche simulando tecniche
di ragionamento euristico.
I sistemi basati su conoscenza vengono considerati uno dei
“prodotti” principali della Intelligenza Artificiale
simbolica.
Intelligenza Artificiale (IA)
I sistemi basati su conoscenza non permettono di affrontare
adeguatamente alcuni aspetti:
Conoscenza tacita: il comportamento intelligente che si
ispira al “saper fare”, ovvero ad una abilità difficile da
descrivere con conoscenze dichiarative e regole esplicite
di manipolazione simbolica
Azioni in tempo reale: capacità di reazione adeguate in
tempi utili per il problema
Robustezza: capacità di lavorare anche in situazioni diverse
da quelle previste dai progettisti
Intelligenza Artificiale (IA)
Il connessionismo ha affrontato con un qualche successo alcuni
problemi di conoscenza tacita e robustezza.
Il modello di un sistema di IA, in tal caso, assomiglia più ad un robot
immerso in un ambiente non predeterminato dal progettista ed in
grado di mostrare comportamenti adattivi in tempo reale, che ad un
calcolatore in grado di sostenere una conversazione o di giocare
una partita a scacchi.
Il connessionismo rivela incapacità di simulare ampie capacità di
ragionamento e di affrontare i problemi dell’IA distribuita e dei
sistemi multiagente (ogni agente deve comunicare con altri agenti,
formarsi aspettative sui risultati delle interazioni, ragionare su
obiettivi e capacità di altri agenti, dimensione sociale dell’IA).
Intelligenza Artificiale (IA)
La costruzione di programmi simulativi che siano in grado
di fornire indicazioni (spiegare) su certe capacità
cognitive è assimilabile al processo di costruzione e
revisione dei modelli scientifici.
Quando il programma “gira” sul calcolatore, diventa
possibile individuarne le lacune, suggerire modifiche per
migliorarlo trovando nelle sue prestazioni conferme o
smentite della teoria generale.
Es. General Problem Solver che dimostrava di essere una
simulazione del protocollo verbale di un soggetto umano alle prese
con la dimostrazione di un teorema di logica proposizionale.
Intelligenza Artificiale (IA) in pratica
Dal punto di vista ingegneristico
Le applicazioni dell’IA sono valutate per le loro capacità
e prestazioni, indipendentemente dai metodi utilizzati.
Idea di base: costruire macchine che non necessariamente
“simulino”, riproducendolo, il comportamento del
cervello umano, ma che siano in grado di “emularlo
selettivamente” nel risultato finale di certe operazioni
Architettura di base di un sistema di IA:
ambiente
Un sistema IA non è un insieme di istruzioni
immutabili che rappresentano la soluzione
di un problema, bensì un ambiente in cui
rappresentare, utilizzare e modificare una
base di conoscenza.
La soluzione viene costruita dinamicamente a
fronte di un certo numero di possibilità.
Architettura di base di un sistema di IA:
ambiente
Un sistema IA deve esprimere due tipi distinti di conoscenza:
• una “base di conoscenza” (che raccoglie la conoscenza di
dominio e del problema attraverso asserzioni e fatti da un
lato e relazioni e regole dall’altro)
• un “motore inferenziale” che utilizza la base di conoscenza
per giungere alla soluzione e fornire spiegazioni. Scelta
dinamica di quale conoscenza utilizzare nel processo
risolutivo.
forward chaining versus backward chaining.
Logica
La logica è sicuramente uno degli strumenti più antichi,
assestati e rigorosi utilizzati dall’uomo per formalizzare e
spiegare il proprio ragionamento.
La logica è semanticamente ben definita, altamente
dichiarativa, ed ha un apparato deduttivo generale.
La logica classica è utilizzata in IA per rappresentare la
conoscenza su un problema (anche se con alcune
limitazioni). La BdC diventa una collezione di asserzioni
della logica dei predicati del primo ordine; le regole di
inferenza permettono di dedurre nuove asserzioni
(teoremi) non esplicitamente contenute nella BdC
Apprendimento automatico
Un sistema non potrà dirsi “intelligente” se
manca della proprietà di accrescere le
proprie conoscenze e migliorare le proprie
abilità (apprendimento).
Per raggiungere questo obiettivo bisogna
dotare le macchine simboliche di capacità di
ragionamento induttivo oltre che deduttivo.
Apprendimento automatico
Il ragionamento induttivo procede
da asserzioni singolari riguardanti particolari fatti o
fenomeni (“esempi”)
ad asserzioni universali esprimibili mediante ipotesi o
teorie che spieghino i fatti dati e siano in grado di
predirne di nuovi.
L’inferenza deduttiva preserva la “verità” (nel senso della
correttezza logica)
L’inferenza induttiva non garantisce ciò e può tendere ad
un’eccessiva generalizzazione e a produrre errori.
Limiti, problemi aperti e …
L’apprendimento e la rappresentazione del senso comune
sono ben lontani dall’essere una soluzione completa.
Limitata crescita incrementale della conoscenza e costi
elevati nel produrla
Alto costo di manutenzione dei sistemi intelligenti
Sistemi inferiori alle aspettative iniziali
…
… aspettative
 Supporto all’accesso di informazioni in grandi patrimoni
conoscitivi (archivi aziendali, informazioni on-line,
repositories di dominio,…) che richiede la capacità di
analisi e gestione di dati eterogenei e ridondanti.
 Strumenti per l’estrazione di conoscenza ad ampio spettro
che utilizzino tecniche di apprendimento automatico.
 Capacità di integrare, all’interno di sistemi informativi
generali, moduli che producano task intelligenti
 Navigazione intelligente sul web
IA debole versus IA forte
L’IA debole si propone di costruire (reale costruibilità)
macchine che si comportino “come se” fossero
intelligenti, ossia macchine capaci di risolvere tutti i
problemi che l’intelligenza umana sa risolvere.
L’IA forte afferma che la macchina che agisce in modo
intelligente deve avere una “intelligenza cosciente”, una
mente cosciente indistinguibile dalla mente umana; l’IA
forte vuol dare risposta al problema astratto di che cosa
sia il “pensare” per una macchina, anche se poi non
riesce a costruire macchine intelligenti.
… Le simulazioni al calcolatore dei processi cerebrali forniscono
modelli degli aspetti formali di questi processi, ma la simulazione
non va confusa con la riproduzione.
Il modello computazionale dei processi mentali non è più reale di
quello di qualsiasi altro fenomeno naturale. Si può immaginare
una simulazione al calcolatore dell’ossidazione degli idrocarburi
in un motore d’automobile, o dei processi di digestione in uno
stomaco alle prese con una pizza. Nel caso del cervello la
simulazione non è più reale che nel caso dell’automobile e dello
stomaco.
La simulazione di un processo cognitivo non produce gli stessi effetti
della neurobiologia di quel processo cognitivo….
J.Searle, La mente è un programma?, 1990
Bibliografia (per cominciare…)
• Association for the Advancement of Artificial Intelligence: AI in the news , 2009,
http://www.aaai.org/AITopics/pmwiki/pmwiki.php/AITopics/AINews
• J. McCarty, M.L. Minsky, N. Rochester, C.E. Shannon: A proposal for the
Dartmouth Summer Research Project on Artificial Intelligence, 1955,
http://www-formal.stanford.edu/jmc/history/dartmouth/dartmouth.html
• R. Cordeschi, G. Tamburrini: L’Intelligenza Artificiale: la storia e le idee, 2001,
http://www3.humnet.unipi.it/epistemologia/gtamb/ia.pdf
• H. Uskoreit: “Language Technology, A First Overview”
http://www.dfki.de/~hansu/LT.pdf
• D. Gelernter: “Artificial Intelligence is Lost in the Woods”
http://www.technologyreview.com/printer_friendly_article.aspx?id=18867
Bibliografia (per cominciare…)
• M. Benasayag G. Schmit : “L'epoca delle passioni tristi”
Feltrinelli Editore, 2004, ISBN 8807103672, 9788807103674
• R. Dipert: Artifacts. Art works and Agency, 1993, Philadelphia:
Temple University Press
• J. Searle: Is the brain a digital computer?, Proceedings of The
American Philosophical Association, 64,3 (1990), pagg.21-38.
• J. Searle: The construction of social reality, 1995, New York:
Thje Free Press
• J. Doyle, T. Dean: Strategic Directions in Artificial Intelligence,
ACM Computing Surveys, 28 (4), Dec. 1996
Argomenti trattati in questa lezione
• Ruolo dell’IA nell’ICT
• Elaborazione del linguaggio naturale come punto
di riferimento per l’IA
• Gestione della conoscenza come punto di
riferimento per l’IA
• Ruolo dell’IA nella Ingegneria del Software
Scarica

PresentazioneCorso - Università degli Studi di Roma Tor Vergata