Intelligenza Artificiale
Semantica del linguaggio naturale
Prof. M.T. PAZIENZA
a.a. 2004-2005
Grazie a Jim Martin e a Dan Jurafsky per molte di queste slides
Semantica
La semantica è lo studio del significato di
generiche espressioni linguistiche
Modellare come il significato di
un’espressione è collegato al significato di
ciascuna frase, parola, ed al contesto in cui
appare l’espressione
Evoluzione?!?
• Dapprima si studiano le parole (morfologia)
• Poi si analizzano le relazioni sintattiche tra
di esse (sintassi)
• Quindi si cerca di lavorare sul significato; in
molti casi il processo di analisi è inverso
Il significato
Si può studiare il significato da tre prospettive diverse:
1. il significato di singole parole (semantica
lessicale)
2. come questi significati si combinano per dare
significato a singole frasi
3. come questi significati si combinano per dare
significato ad un testo o ad un discorso
Il significato
Le parole di per sé non esprimono il significato del
mondo, né ciò che uno sta pensando, né tantomeno
ciò che pensano gli altri.
Possono essere considerate delle sequenze lineari di
termini tali che quando altre persone le leggono, o
sentono, possono capirle e venire a conoscenza di
ciò che noi pensiamo del mondo e che è stato
espresso da quelle parole.
Rappresentazione del significato
Si può usare lo stesso approccio che è stato usato per la
sintassi e per l’analisi morfologica. Necessità di creare
una rappresentazione delle informazioni linguistiche per
catturare il significato di quelle stesse informazioni.
A differenza degli alberi sintattici, queste rappresentazioni
non sono descrizioni primarie delle strutture in ingresso.
In genere esse sono contemporaneamente descrizioni
• dei significati delle espressioni linguistiche così come
• di alcuni stati del mondo
Rappresentazione che permette o facilita l’elaborazione
semantica
Elaborazione semantica
Rappresentazioni che
Permettono di ragionare relativamente alla loro
verità (relazioni con un qualche mondo)
Permettono di rispondere a domande basate sul
loro contenuto
Permettono di fare inferenze (rispondere a
domande e determinare la verità delle cose che non
sappiamo ancora)
Rappresentazione del significato
Logica per esprimere il significato del linguaggio
naturale
Principio di composizionalità (il significato di una
frase può essere ottenuto da operazioni
composizionali sul significato delle sue parti)
Un approccio computazionale alla comprensione
del linguaggio deve porre in essere filtri sintattici
e semantici ->Selectional restrictions
Selectional restrictions
• A ciascun “senso” di una parola è possibile
associare markers semantici che specifichino
features e condizioni sulle features dei sensi delle
parole che possono combinarsi con questi ultimi.
• Un marker semantico può permettere di eliminare
un’analisi sintattica che non la soddisfi.
• Marker semantici e selectional restrictions sono
computazionalmente efficaci.
Comprensione del linguaggio
Un qualunque modello di comprensione del
linguaggio non può prescindere da un modello di
rappresentazione della conoscenza
Conoscenza del mondo versus conoscenza del
dominio
La conoscenza del dominio permette di scartare
alcune interpretazioni di una frase perché fuori
contesto.
Gestione delle metafore.
Significato delle parole
Non basta conoscere il significato delle parole
per arguire il significato delle frasi
Ruolo fondamentale dei verbi (template-like
predicate argument structure)
Numero degli argomenti
Posizione e categoria sintattica
Nome degli argomenti
Nomi come costanti privi di significato
L’approccio teorico
Cominceremo a guardare a
La struttura esterna relazionale tra le parole
(paradigmatica)
La struttura interna delle parole che determina
dove esse possano essere e cosa possano fare
(syntagmatica)
Per cominciare…
• Cos’è una parola?
– tipo, token, stem, root, forme flessse, etc....
– Lessema: un’entry in un lessico consistente in
una coppia (forma, rappresentazione di un
unico significato)
– Lessico: collezione di lessemi
Omonimia
Lessemi che condividono la forma ma hanno
significati distinti e non correlati
miglio misura e miglio graminacea (omografe e
omofone)
pésca di pesci e pèsca frutto (omografe)
Polisemia
Un singolo lessema con più significati
associati ad esso.
– Moltissime parole hanno più di un significato
(piano)
– Anche i verbi tendono ad essere polisemici
(operare)
– La distinzione tra polisemia ed omonimia non è
sempre facile (nè talvolta necessaria)
Relazioni
Relazioni paradigmatiche
– Sinonimia
–
–
–
–
Antonimia
Iponimia
Metonimia
Metafora
Metafora e Metonimia
Rappresentano casi specifici di polisemia
• Metafora:
– Ho speso due ore su quell’esercizio.
• Metonimia
– La Casa Bianca ha annunciato ieri che...
– Questo capitolo parla della cinematica
– La mia auto beve molta benzina
Synonimia
• Due lessemi sono sinonimi se possono essere
sostituiti in tutte le situazioni non alterando il
significato della frase
• Parole che hanno lo stesso significato in alcuni (o
in tutti) i contesti.
– giovane
adolescente
– grande
– automobile
largo …
macchina …
Antonimia
Parole che sono opposte rispetto ad un aspetto
del loro significato, sono molto simili
rispetto agli altri
• buio
luce
• ragazzo ragazza
• caldo freddo
• su
giù
• dentro fuori
Calcolo della similarità tra parole
Per molte applicazioni è utile riconoscere parole che
sono simili tra loro. Machine translation (to find
near-synonyms)
Information retrieval (per fare “query expansion”)
Due modi per fare ciò:
– Calcolo automatico basato sulle distribuzioni di
similarità
– Uso di un thesaurus che elenchi parole simili
• WordNet (per esmpio)
Iponimia/Iperonimia
Iponimia: il significato di un lessema è un
subset del significato di un altro
– Poichè i cani sono dei canidi
• cane è un iponimo di canide, mentre
• Canide è un iperonimo di cane
Similmente,
• Automobile è un iponimo di veicolo, mentre
• Veicolo è un iperonimo di automobile
WordNet
• Databsa lessicale organizzato gerarchicamente
• On-line thesaurus + alcuni aspetti di un
dizionario
• Versioni per altri linguaggi (EuroWordNet)
Category
Noun
Verb
Adjective
Adverb
Unique Forms
114,648
11,306
21,436
4,669
# of Senses
141,690
24,632
31,015
5808
Format of Wordnet Entries
WordNet Noun Relations
WordNet Verb and Adj Relations
WordNet Hierarchies
Struttura interna delle parole
Per quanto attiene alla struttura interna delle
parole, vediamo i seguenti aspetti:
–
–
–
–
Ruoli tematici nei lessemi
Selection restrictions sui ruoli tematici
Semantica decomposizionale dei predicati
Feature-structures per i nomi
Ruoli tematici
– I ruoli tematici sono delle gneralizzazioni dei ruoli
specifici che occorrono con verbi specifici
– I.e. Takers, givers, eaters, makers, doers, killers,
hanno tutti in comune
• -er (nella lingua inglese)
• Sono tutti agenti delle rispettive azioni
– Si può generalizzare su altri ruoli oppure ci si può
limitare ad un set finito di tali ruoli.
Esmpi di Ruoli Tematici
Linking
I ruoli tematici, le categorie sintattiche e le
loro posizioni in più grandi strutture
sinttiche, sono tutti interrelati in modi
spesso complessi. Per esempio…
– AGENTS sono spesso soggetti
– In una regola VP->V NP NP, il primo NP è
spesso un GOAL e il secondo un THEME
Ancora sul Linking
•
•
•
•
•
•
•
•
John opened the door
AGENT
THEME
The door was opened by John
THEME
AGENT
The door opened
THEME
John opened the door with the key
AGENT
THEME
INSTRUMENT
Inferenza
Dato un evento espresso da un verbo che
esprime un trasferimento, che cosa può
essere inferito (dedotto) circa ciò che è
etichettato con THEME rispetto a ciò che è
etichettato con GOAL?
Problemi
•
•
•
•
Cos’è esattamente un ruolo?
Qual è il set corretto di ruoli da usare?
I ruoli sono universali?
I ruoli sono atomici?
– I.e. Agents
– Animate, Volitional, Direct causers, etc
• Possiamo etichettare automaticamente i
costituenti sintattici con i ruoli tematici?
Selection Restrictions
– I want to eat someplace near campus
– Usando i ruoli tematici noi non possiamo dire
ora che eat è un predicato che ha un AGENT e
un THEME
• E cos’altro?
– Che AGENT deve essere capace di mangiare e
THEME deve essere qualcosa che possa essere
mangiato
Logical Statements
• Per eat…
– Eating(e) ^Agent(e,x)^ Theme(e,y)^Isa(y, Food)
Back to WordNet
• Uso degli iponimi di WordNet per codificare le
selection restrictions
Selectional Restrictions come cattiva
approssimazione di una semantica profonda
Sfortunatamente i verbi sono polisemici ed il
linguaggio naturale molto creativo … esempi
del WSJ …
– … ate glass on an empty stomach accompanied only
by water and tea
– you can’t eat gold for lunch if you’re hungry
– … get it to try to eat Afghanistan
Soluzioni
• Eat glass
– Questo è un evento di mangiare, così si può
cambiare il modello di “mangiabile”.
• Eat gold
– La presenza della negazione permette al THEME di
non essere “mangiabile”
• Eat Afghanistan
– Questo è veramente molto difficile, perchè non è
“mangiabile” per niente.
Word Sense Disambiguation (WSD)
Data una parola in un contesto, decidere quale
senso della parola è assumibile come vero.
Selection Restrictions per WSD
Le selectional rectritions possono essere utili per
disambiguare:
– Argomenti ambigui in predicati non ambigui
– Predicati ambigui con argomenti non ambigui
– Ambiguità totale
Problemi
Le selectional restrictions sono violate
costantemente nel linguaggio
Ciò non significa che le frasi siano scorrette, o
da non preferirsi rispetto ad altre
C’è bisogno di qualche processo di
categorizzazione delle modalità con cui le
selectional restrictions vengono violate
Scarica

7SemanticaLingNat - Università degli Studi di Roma Tor Vergata