Elaborazione del linguaggio naturale morfologia, FSA, FST, POS esercizi Maria Teresa PAZIENZA a.a. 2007-08 FSA 1. Disegnare (se esistono) gli FSA che riconoscono/generano i seguenti linguaggi regolari: La= {ac,abc,abbc,abbbc, …} Lb= {ac,abb} Lc= {ac,acdc,acdcdc, …} Ld= {ac,ab,acdc,abdb,abdc,acdb,acdcdc, …} 2. Scrivere le transition table relative agli FSA ESERCIZIO 1 FSA 1. Scrivere un FSA che riconosca espressioni “monetarie” del tipo: “uno euro”, “due euro”, “venti tre euro”, “venti uno ero dieci cent”, “trenta due euro trenta quattre centesimi”, “due cent”…. Il cui vocabolario sia ={uno, due, tre,…dieci,venti,…,euro,cent} 2. Scrivere la relativa state-transition table 3. Scrivere l’espressione regolare associata all’FSA ESERCIZIO 2 FSA 1. Scrivere un FSA che riconosca sintagmi nominali per l’Inglese, ovvero: - nomi propri (es. “John”) - nomi comuni preceduti da articoli e eventualmente da un numero variabile di aggettivi (es. “the new yellow table”) - combinazione di sintagmi dei due punti precedenti preceduti da preposizoni (es. “the new yellow table of John”) 2. Scrivere la relativa state-transition table ESERCIZIO 3 FSA per la morfologia 1. Scrivere un FSA che riconosca la morfologia derivazionale degli aggettivi inglesi, ovvero: Un aggettivo può avere come prefisso negante “un-” Un aggettivo può avere forma comparativa, superlativa e avverbiale (rispettivamente i suffissi –er,-est,-ly) 2. Aggiungere all’FSA il seguente fatto: Esistono alcuni aggettivi “irregolari” che non possono prendere “un-” e “-ly” (es: big, cool) 3. Integrare il lessico: regolari: “clear, happy”, irregolari: “big,cool” ESERCIZIO 4 Soluzione esercizio 1 un- 0 -er -est -ly adj_reg 1 2 3 LESSICO adj_reg Clear Happy ESERCIZIO 4 Soluzione esercizio -er -est -ly 2a un- 0 adj_reg 1 2 4 3 -er -est adj_irr LESSICI adj_reg adj_irr Clear Happy Big cool ESERCIZIO 4 Soluzione esercizio -er -est -ly 2b un0 adj_reg 1 2 5 4 -er -est adj_reg 3 adj_irr LESSICI adj_reg adj_irr Clear Happy Big cool ESERCIZIO 4 Identificazione dei morfemi A 1. Scrivere l’ FST che modelli la morfologia dei nomi singolari/plurali prendendo in considerazione la regola ortografica dell’ y-replacement: -y cambia in –ie prima della –s ES: berry berries B 1. Scrivere l’ FST che modelli la morfologia dei verbi presente/passato prendendo in considerazione la regola ortografica della k-insertion, sapendo che: In generale la forma passata si forma dal presente apponendo come suffisso la particella –ed (ES: presspress-ed) La k-inserion prevede che ai verbi terminanti in vocale+c sia aggiunta la k (ES: panic panic + k +ed) ESERCIZIO 5 Soluzione esercizio 5 A.1 other :+ 0 s:s 1 7 i: 3 2 :e :i e: 4 :y 5 s:s :+ 6 :i ESERCIZIO 5 Soluzione esercizio 5 B.1 cons:cons :+ e:e d:d 6 1 0 7 voc:voc 3 2 : c:c : 4 k: 5 :+ 6 e:e ESERCIZIO 5 d:d POS Tagging: Chaos Verificare quale intepretazioni di POS tagging Chaos produrrebbe avendo in input le seguenti frasi: a. “La vecchia porta la sbarra” b. “I maestri di Platone furono critici” Analizzando il processi nelle sue diverse fasi: 1. Ricerca nel lessico delle parole 2. Utilizzo delle regole lessicali per le parole non presenti nel lessico 3. Disambiguazione: scelta del POS tag più frequente 4. Utilizzo delle regole contestuali ESERCIZIO 6 Suggerimenti per esercizi Per la migliore comprensione degli argomenti svolti nelle presentazioni NLP 1,2,3 si suggerisce di cimentarsi anche con gli esercizi del libro Speech and Language Processing, Prentice Hall, 2000, autori: D.Jurafsky, J. H. Martin In particolare: Capitolo 2, esercizi n. 2.1, 2.3, 2.4, 2.5, 2.6, 2.8, 2.10 Capitolo 3, esercizi n. 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.8, 3.9 Capitolo 8, esercizi n. 8.1, 8.2, 8.3, 8.6 facoltativo ESERCIZIO 6