Analisi del discorso
Maria Teresa PAZIENZA
a.a. 2007-08
Analisi del discorso
Il discorso consiste di più frasi tra loro coerentemente
correlate in uno schema di comunicazione. L’analisi
del discorso consiste nel riconoscimento di eventi
descritti in più segmenti di frase.
• Monologo (la comunicazione fluisce in una sola direzione)
• Dialogo (comunicazione bidirezionale con frasi con direzione
di comunicazione alternata: domande, risposte...)
• Human Computer Interaction (HCI – dialogo limitato dalle
capacità del sistema di sostenere una conversazione;
strategia per limitare la conversazione e permettere di capire
le espressioni dell’utente in un contesto limitato di
interpretazioni )
Dialogo vs. Monologo
Monologo e dialogo richiedono la risoluzione di alcuni
fenomeni:
– Stato dell’informazione (precedentemente fornita o meno)
– Problemi di coerenza
– Risoluzione dei riferimenti
– Implicazioni sottintese, intenzioni
Dialogo richiede la gestione del riconoscimento di
– Alternanza del parlante
– Conoscenze di base (eventualmente condivisa)
– Riconoscimento e correzione di interpretazioni erronee
– Strategie nell’interazione
– Modello mentale di ciascun parlante (modello del
discorso)
Dialogo (Messaggio pubblicitario)
Desidera?
Un biglietto per Milano
A partire da…
A partire da 12 euro, come dite
voi nella pubblicità
Analisi del discorso
Il discorso consiste di
• più frasi tra loro coerentemente correlate
• in uno schema di comunicazione, ma
Cosa (quali fenomeni) rende coerente un
discorso?
Come riconoscerne i fenomeni?
Come analizzarli?
Cosa rende coerente un testo?
• Un uso appropriato di relazioni di coerenza
tra parti del discorso - strutture retoriche
• Una sequenza appropriata di parti del
discorso - struttura del discorso,
articolazione degli argomenti
• Un uso appropriato di espressioni
referenziali
Teoria delle strutture retoriche
Teoria della struttura del discorso basata
sull’identificazione di relazioni tra parti di testo
Si considerino due frasi il cui significato sia espresso
da S1 ed S2, alcune relazioni retoriche sono:
• Elaborazione (set/member, class/instance, whole/part…) inferire
la stessa proposizione P dalle asserzioni S1 ed S2 (in
particolare, in aggiunta,..)
• Risultato: inferire che lo stato o l’evento asserito da S1 causi o
potrebbe causare lo stato o l’evento asserito da S2
• Spiegazione: inferire che lo stato o l’evento asserito da S2 causi
o potrebbe aver causato lo stato o l’evento asserito da S1
• …
Identificazione automatica di relazioni retoriche
Applicazione di approcci di ML noti…
– Identificazione di un gruppo di annotatori per
assegnare un set di relazioni retoriche ad un testo
– Estrazione dal testo di un set di features superficiali
che possa indicare la presenza di relazioni retoriche in
quello specifico testo
– Addestramento di un sistema di ML supervisionato
basato sul training set
Quali feature?
• Marcatori espliciti quali: perchè, però, quindi,
allora, etc.
• Tendenza di certe strutture sintattiche a
segnalare alcune relazioni: le infinitive spesso
sono usate per indicare relazioni di scopo:
Usa rm per cancellare files.
• Ordinamento
• Uso dei tempi
• Intonazione (nel dialogo)
• …
Alcuni problemi con le relazioni retoriche
• Quante relazioni retoriche esistono? Sono
indipendenti dal linguaggio?
• Possiamo usare le stesse relazioni
retoriche nel dialogo e nel monologo?
• Le relazioni retoriche non modellano
completamente la struttura del discorso.
• Difficoltà nel trovare annotatori che siano
concordi nell’annotare lo stesso testo
Espressioni di riferimento
Le espressioni di riferimento sono parole o frasi
la cui interpretazione semantica è una entità
del discorso (detta anche referente)
– Le entità del discorso sono oggetti semantici e
possono avere più espressioni sintattiche
all’interno di un testo
Le espressioni di riferimento forniscono un
collante ulteriore che rende il testo coeso.
Espressioni di riferimento
A pretty woman entered the restaurant. She
sat at the table next to mine and only then I
recognized her. This was Amy Garcia, my
next door neighbor from 10 years ago. The
woman has totally changed! Amy was at the
time shy…
Pronomi vs. Full NP
A pretty woman entered the restaurant. She
sat at the table next to mine and only then I
recognized her. This was Amy Garcia, my
next door neighbor from 10 years ago. The
woman has totally changed! Amy was at the
time shy…
Definite vs. Indefinite NPs
A pretty woman entered the restaurant. She
sat at the table next to mine and only then I
recognized her. This was Amy Garcia, my
next door neighbor from 10 years ago. The
woman has totally changed! Amy was at the
time shy…
Common Noun vs. Proper Noun
A pretty woman entered the restaurant. She
sat at the table next to mine and only then I
recognized her. This was Amy Garcia, my
next door neighbor from 10 years ago. The
woman has totally changed! Amy was at the
time shy…
Modified vs. head NP
A pretty woman entered the restaurant. She
sat at the table next to mine and only then I
recognized her. This was Amy Garcia, my
next door neighbor from 10 years ago. The
woman has totally changed! Amy was at the
time shy…
Premodified vs. postmodified
A pretty woman entered the restaurant. She
sat at the table next to mine and only then I
recognized her. This was Amy Garcia, my
next door neighbor from 10 years ago. The
woman has totally changed! Amy was at the
time shy…
Altri tipi di NP
• Capaci di generare inferenze
– Sally ha comprato un’auto usata. Le
gomme devono essere cambiate.
• Con discontinuità
– John ha conosciuto Bill molti anni fa. Loro
fanno spesso insieme delle escursioni in
montagna.
Anafora
L’anafora è il riferimento ad una entità che appare
precedentemente nel discorso
L’espressione di riferimento usata si dice
espressione anaforica
Le espressioni anaforiche possono essere di
diversa tipologia e dipendono dal contesto del
discorso (articoli, pronomi, espressioni
nominali,…)
Risoluzione dell’anafora
Trovare in un testo tutte le espressioni di
riferimento che hanno la stessa
denotazione
– Risoluzione dell’anafora pronominale
– Risoluzione dell’anafora tra entità nominali
– Risoluzione di frasi nominali anaforiche
– …
Risoluzione dell’anafora
I sistemi possono mantenere una sorta di
history list delle entità presenti nel
discorso.
Per risolvere una anafora, cercare l’history
list dell’entità più vicina che soddisfa i
vincoli.
Conoscenza di supporto
Per l’analisi del discorso è necessario
utilizzare anche conoscenza di supporto
del tipo:
•
•
•
•
Obiettivi e piani
Esistenza di eventuali frame o script
Presupposizioni
Regole del discorso
Obiettivi e piani
Se si conoscono quali sono gli obiettivi della
comunicazione, così come il piano del
comunicatore, è possibile limitare il numero di
interpretazioni possibili
Es. se in una e-mail si richiede un incontro, la
risposta potrebbe
accettare,
modificare,
rifiutare la richiesta.
Esistenza di eventuali frame o script
Qualora si possa descrivere l’uso del
linguaggio in termini di frames (ovvero la
descrizione di un oggetto) o con degli
scripts (come il canovaccio di un’opera
teatrale) che noi possiamo utilizzare, allora
potremmo confrontare il linguaggio
naturale con questi oggetti cognitivi e
quindi gestire anche le aspettative in un
discorso
Presupposizioni
Il linguaggio naturale fa riferimento spesso ad
informazioni comunemente note e non espresse
Si può usare l’inferenza per identificare
l’informazione sottaciuta.
Es. oggi la temperatura ha superato i 37 gradi. Nei
giornali radio si raccomanda agli anziani di
andare almeno per un paio d’ore in un
supermercato ogni giorno.
Regole del discorso
Si può ottenere informazione sapendo che, a meno
di essere in situazioni facete, in genere si usa il
linguaggio naturale in alcuni modi predefiniti. Per
esempio a meno che si voglia mentire, si dice la
verità.
Queste regole ci permettono di verificare se le
regole sono state seguite, oppure determinare le
situazioni di discontinuità.
Argomenti trattati in questa lezione
•
•
•
•
•
•
•
Tipologie di comunicazione nel discorso
Teoria delle strutture retoriche
Espressioni di riferimento
Anafora
Conoscenza di supporto
Obiettivi e piani
Presupposizioni
Elaborazione del linguaggio naturale
Le presentazioni sugli argomenti di elaborazione del linguaggio
naturale fanno in alcuni passi riferimento ad alcune presentazioni
dei colleghi prof. Fabio Massimo Zanzotto e dottor Marco
Pennacchiotti, del dottor Patrick Pantel (ISI-USC), oltre che ad
alcune parti del libro: Speech and Language Processing, Prentice
Hall, 2000, autori D.Jurafsky, J. H. Martin.
Scarica

NLP_9