Elaborazione del linguaggio naturale
morfologia, FSA, FST, POS
esercizi
Maria Teresa PAZIENZA
a.a. 2007-08
FSA
1. Disegnare (se esistono) gli FSA che riconoscono/generano i
seguenti linguaggi regolari:
La=
{ac,abc,abbc,abbbc, …}
Lb=
{ac,abb}
Lc=
{ac,acdc,acdcdc, …}
Ld=
{ac,ab,acdc,abdb,abdc,acdb,acdcdc, …}
2. Scrivere le transition table relative agli FSA
ESERCIZIO 1
FSA
1. Scrivere un FSA che riconosca espressioni “monetarie” del tipo:
“uno euro”, “due euro”, “venti tre euro”, “venti uno ero dieci
cent”, “trenta due euro trenta quattre centesimi”, “due
cent”….
Il cui vocabolario sia ={uno, due, tre,…dieci,venti,…,euro,cent}
2. Scrivere la relativa state-transition table
3. Scrivere l’espressione regolare associata all’FSA
ESERCIZIO 2
FSA
1. Scrivere un FSA che riconosca sintagmi nominali per l’Inglese,
ovvero:
- nomi propri (es. “John”)
- nomi comuni preceduti da articoli e eventualmente da un
numero variabile di aggettivi (es. “the new yellow table”)
- combinazione di sintagmi dei due punti precedenti preceduti
da preposizoni (es. “the new yellow table of John”)
2. Scrivere la relativa state-transition table
ESERCIZIO 3
FSA per la morfologia
1. Scrivere un FSA che riconosca la morfologia derivazionale degli
aggettivi inglesi, ovvero:

Un aggettivo può avere come prefisso negante “un-”

Un aggettivo può avere forma comparativa, superlativa e
avverbiale (rispettivamente i suffissi –er,-est,-ly)
2. Aggiungere all’FSA il seguente fatto:

Esistono alcuni aggettivi “irregolari” che non possono
prendere “un-” e “-ly” (es: big, cool)
3. Integrare il lessico: regolari: “clear, happy”, irregolari: “big,cool”
ESERCIZIO 4
Soluzione esercizio
1
un-
0
-er
-est
-ly
adj_reg
1
2
3

LESSICO
adj_reg
Clear
Happy
ESERCIZIO 4
Soluzione esercizio
-er
-est
-ly
2a
un-
0
adj_reg
1
2
4
3
-er
-est

adj_irr
LESSICI
adj_reg
adj_irr
Clear
Happy
Big
cool
ESERCIZIO 4
Soluzione esercizio
-er
-est
-ly
2b
un0
adj_reg
1

2
5
4
-er
-est
adj_reg
3
adj_irr
LESSICI
adj_reg
adj_irr
Clear
Happy
Big
cool
ESERCIZIO 4
Identificazione dei morfemi
A
1.
Scrivere l’ FST che modelli la morfologia dei nomi singolari/plurali
prendendo in considerazione la regola ortografica dell’ y-replacement:
 -y cambia in –ie prima della –s
 ES: berry  berries
B
1.
Scrivere l’ FST che modelli la morfologia dei verbi presente/passato
prendendo in considerazione la regola ortografica della k-insertion,
sapendo che:

In generale la forma passata si forma dal presente apponendo
come suffisso la particella –ed (ES: presspress-ed)

La k-inserion prevede che ai verbi terminanti in vocale+c sia
aggiunta la k (ES: panic  panic + k +ed)
ESERCIZIO 5
Soluzione esercizio 5
A.1
other
:+
0
s:s
1
7
i:
3
2
:e
:i
e:
4
:y
5
s:s
:+
6
:i
ESERCIZIO 5
Soluzione esercizio 5
B.1
cons:cons
:+
e:e
d:d
6
1
0
7
voc:voc
3
2
:
c:c
:
4
k:
5
:+
6
e:e
ESERCIZIO 5
d:d
POS Tagging: Chaos
Verificare quale intepretazioni di POS tagging Chaos produrrebbe
avendo in input le seguenti frasi:
a. “La vecchia porta la sbarra”
b. “I maestri di Platone furono critici”
Analizzando il processi nelle sue diverse fasi:
1. Ricerca nel lessico delle parole
2. Utilizzo delle regole lessicali per le parole non presenti nel
lessico
3. Disambiguazione: scelta del POS tag più frequente
4. Utilizzo delle regole contestuali
ESERCIZIO 6
Suggerimenti per esercizi
Per la migliore comprensione degli argomenti svolti nelle
presentazioni NLP 1,2,3 si suggerisce di cimentarsi
anche con gli esercizi del libro
Speech and Language Processing, Prentice Hall, 2000,
autori: D.Jurafsky, J. H. Martin
In particolare:
Capitolo 2, esercizi n. 2.1, 2.3, 2.4, 2.5, 2.6, 2.8, 2.10
Capitolo 3, esercizi n. 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.8, 3.9
Capitolo 8, esercizi n. 8.1, 8.2, 8.3, 8.6 facoltativo
ESERCIZIO 6
Scarica

eserciziNLP_123