ANNUNCI I LABORATORI SONO GIA’ COMINCIATI OGGI INIZIA IL MODULO C (C1, 18-20) CAMBIAMENTO ORARI: MODULO C, LAB D LABORATORI: http://www.dit.unitn.it/~poesio/Teach/IU: piano delle lezioni di Informatica Umanistica D online. ORARI: MODULI C1, C2 E C3 LUN MAR MER GIO VEN 8-10 10-12 B2 12-14 C2 14-16 B3 16-18 18-20 C1 B1 C1 C3 CAMBIAMENTI ORARI Modulo B: NON SI TERRANNO LE LEZIONI DEL MODULO B2 (MARTEDI’ 10-12): 21 MARZO (TESI DI LAUREA) 4 APRILE (CONFERENZA EACL) CAMBIAMENTO ORARI: MODULO C, LAB D ORARI: LABORATORI LUN 8-10 MA MER GIO VEN R LAB A LAB B (B2) 10-12 LAB E 12-14 C2 14-16 LAB D (B3) 16-18 LAB C 18-20 B1 D LAB D (17/3) C3 C1 RICEVIMENTO (MASSIMO POESIO) Ricevimento: Martedi’ 16-18, via Sighele 7 INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Introduzione al corso Parole e morfologia LESSICOGRAFIA E COMPUTER: ARGOMENTI DEL CORSO Parole e morfologia I dizionari e la loro storia Dizionari elettronici Uso di corpora nella lessicografia Conoscenza lessicale Lessici elettronici: WordNet ORARI DEL MODULO D LUN MAR MER GIO VEN 8-10 10-12 B2 12-14 C2 14-16 B3 D 16-18 18-20 C3 B1 C1 SYLLABUS Argomento Letture Tenuto da Data Orario Aula 1 Presentazione del corso di Informatica Umanistica D Parole e morfologia Jackson, 1-2 Marello, 1 Graffi e Scalise, V-VI? Poesio Gio 16/03/2006 14:00-16:00 5 2 Dizionari: struttura e storia Jackson 3-7-9-10 Poesio Gio 23/03/2006 14-16 5 3 Machine Readable Dictionaries Un esempio: ELDIT Poesio Abel Gio 30/03/2006 14-16 5 4 Uso dei corpora nella preparazione dei dizionari Concordanze Poesio Gio 14-16 5 5 Preparazione dei corpora: tokenizzazione, lemmatizzazione Poesio ORARIO DA DECIDERE Lenci, Montemagni, Pirrelli, c. 7 PASQUA 6 Uso di corpora negli studi lessicografici 7 Toolboxes per lessicografi: Wordsmith, TALES 8 Semantica lessicale 9 1 0 6/04/2006 20/04 Materiale da McEnery et al Poesio Gio 27/04 14-16 5 Poesio Giuliano Gio 4/05 14-16 5 Poesio Gio 11/05 14-16 5 WordNet. MultiWordNet Poesio Pianta Gio 18/05 14-16 5 TBA Poesio Gio 25/05 14-16 5 Graffi e Scalise, VIII.2 LETTURE Trasparenze su sito / materiali distribuiti a lezione. Howard Jackson. Lexicography: an introduction. Routledge. Lenci, Montemagni e Pirrelli. Testo e Computer. Carrocci. Carla Marello, Le parole dell’Italiano, Zanichelli Giorgio Graffi e Sergio Scalise. Le lingua ed il linguaggio. Il Mulino. ESAME Orale Tenuto insieme agli altri esami di IU Voto in trentesimi IL SITO WEB Le informazioni sul modulo D si possono trovare: http://www.dit.unitn.it/~poesio/Teach/IU Su DidatticaOnline (dalla settimana prossima) CHE COS’E’ UNA ‘PAROLA’? (Una domanda essenziale per decidere cosa il contenuto di un dizionario.) DEFINIZIONE TRADIZIONALE La parola e’ “cio che si trova tra due spazi bianchi” QUANTE PAROLE CI SONO IN UN TESTO? ITALIANO E LATINO il ragazzo puer ha dato dedit una rosa rosam a Maria Mariae Altre lingue senza articoli / particelle: lingue slave (Ceco), Cinese, … CHE COS’E’ UNA PAROLA? 25 lemmi dal Concise Oxford Dictionary: wannabe, want, wanting, wanton, wapentake, wapiti, War., war, waratah, war baby, warble1, warble2, warble fly, warbler, warby, war chest, war crime, war cry, ward, -ward PAROLE E LEMMI warble1, warble2 : due PAROLE con la stessa forma (OMONIMI) want (ma non wanted) Italiano: diligenza, tara, (botte, pesca …) sings, sang, sung sing Italiano: 7 forme di parola, 2 lemmi mangerò, mangeresti, mangerai mangiare nero, nera, neri, nere nero FORME DI CITAZIONE Un dizionario riporta le FORME DI CITAZIONE di un verbo Convenzioni diverse a seconda della lingua: Italiano: infinito (AMARE) Inglese: TO LOVE Latino: prima persona presente singolare (AMO) MULTIWORDS & COMPOUNDS IN INGLESE PHRASAL VERBS: break up, calm down, find out, give in, look over, pass out, show up, take off ….. COMPOUNDS: war baby, war chest, war crime, war cry, war dance bell and whistles, rock and roll, bow and scrape, nip and tuck …. IN TEDESCO: Donaudampfschiffahrtgesellschaftkapitänwitwe CONTRAZIONI: wannabe, gonna, gimme … MULTIWORDS & PAROLE COMPOSTE IN ITALIANO RIFLESSIVI: sedersi (Mario si sedette) sit (Mario sat) COMPOSTI: sci alpinismo salvavita / tritacarne / dopolavoro / benestante PAROLE: RAPPRESENTAZIONI FONEMICHE E GRAFICHE La definizione di parola “cio’ che si trova tra due spazi bianchi” e’ puramente ORTOGRAFICA Occorre distinguere tra una PAROLA e le sue FORME Due forme: i SUONI (FONEMI) che la compongono, e il modo in cui viene rappresentata graficamente (GRAFIA) PAROLE E LA LORO GRAFIA La nostra `immagine’ delle parole (e la loro posizione in un dizionario, cartaceo od elettronico) spesso dipende dalla grafia usata La grafia pero’ cambia di continuo: lengaio linguaggio, dinaro denaro Occorre anche ricordare che lo scritto segue il parlato, e che non sempre la corrispondenza e’ perfetta INGLESE: HOMOGRAPHS read,read, read tear / tear bow, refuse, wind HOMOPHONES: bare / bear, pale / pail, stake / steak Mary / merry / marry (alcuni dialetti Americani) ITALIANO La grafia delle parole Italiane non e’ cambiata molto dagli inizi del Cinquecento (prime edizioni a stampa, e.g., edizione del Petrarca curata da Bembo e stampata da Manuzio nel 1515) Ma per secoli l’ortografia non corrispondeva alla pronuncia DUE ESEMPI DI CAMBIAMENTO DI GRAFIA V=U Vocabolario della Crusca, 1612: VATICINARE VBBIA VDITORE (Crusca 1738: V U, ordine invariato) H Vocabolario della Crusca, 1612: HUMILE GRAFEMI E FONEMI mela m'me:la bello 'bɛ:llo bene ieri 'bɛ:ne 'jɛ:ri In Italiano ci sono 21 grafemi (+ 5) ma 30 fonemi JACKSON: TRE SENSI DI ‘PAROLA’ ORTHOGRAPHIC WORD: una sequenza di lettere circondata da spazi PHONEMIC WORD: una sequenza di suoni (fonemi) LEXEME: una parola nel linguaggio, che puo’ occorrere come lemma nel dizionario UNA DEFINIZIONE PIU’ COMPLESSA Marello: “il termine PAROLA … [indica una] unita’ linguistica a cui sono associati una funzione grammaticale ed un significato, separata graficamente dalle altre da spazi e dotata di coesione interna, per cui non si possono inserire altri elementi al suo interno, ne’ si puo’ mutare l’ordine degli elementi che la costituiscono” PRIME DEFINIZIONI PAROLA (Inglese WORD): elemento linguistico (= del ‘lessico mentale’) FORME DI PAROLA (Inglese WORDFORM): Ortografica Fonetica LEMMA (Inglese LEXEME): Un elemento del dizionario – per le parole con forme variabili, la FORMA DI CITAZIONE La classificazione delle parole POS tags (Jackson, 1.5) Graffi / Scalise 2 RESTRIZIONI SULLE POSIZIONI DELLE PAROLE La ragazza lesse rapidamente il libro *Ragazza la lesse rapidamente il libro *La ragazza lesse il rapidamente libro Inglese: *The Sue quickly read the book Sottocategorie: *La ragazza arrivo’ il libro conigliera, baleniera, teiera, ma: *virtuiera, *pazienzera CATEGORIE LESSICALI (PARTI DEL DISCORSO) NOMI (tavolo, Simona) VERBI (camminare, mangiare, colpire) AGGETTIVI (rosso, rapido) AVVERBI (probabilmente, subito) PRONOMI (io, lui, ci) ARTICOLI (il, la, un) PREPOSIZIONI (di, a, con) CONGIUNZIONI (e, ma, o) [Italiano]: INTERIEZIONI (ahi! ) ALCUNE DISTINZIONI PARTI DEL DISCORSO VARIABILI / INVARIABILI L’uomo cammina / camminava PARTI DEL DISCORSO APERTE / CHIUSE Aperte: nomi, verbi, aggettivi, avverbi Chiuse: articoli, pronomi, preposizioni, congiunzioni CATEGORIE UNIVERSALI? L’articolo manca in molte lingue (Latino, lingue slave, Cinese) Avverbio? CATEGORIE LESSICALI E DIZIONARI Un dizionario tipicamente identifica tutte le parti del discorso che una certa forma di parola puo’ essere usata per esprimere, e solitamente associano lemmi diversi con ogni parte warble1, warble2 Italiano: legge, letto, affetto, porto, pianta … ZINGARELLI INTERATTIVO: LEGGE1 1 Norma, espressa dagli organi legislativi dello Stato, che stabilisce diritti e doveri dei cittadini Legge delega, che viene emessa dal potere esecutivo su delega del potere legislativo entro un ambito ben precisato Legge ponte, emessa in attesa di un'altra più organica A norma, a termini di legge, secondo ciò che la legge prescrive. 2 (est.) Complesso delle norme costituenti l'ordinamento giuridico di uno Stato: la legge è uguale per tutti Essere fuori della legge, non essere garantito dalla legge o non sentirsi a essa soggetto Dettar legge, imporre a tutti la propria volontà. 3 Scienza giuridica: laurea in legge; dottore in legge; facoltà di legge Uomo di legge, specialista nella scienza giuridica. 4 Autorità giudiziaria: ricorrere alla legge In nome della legge, formula con cui i rappresentanti dell'autorità giudiziaria intimano a qc. di obbedire a un comando della stessa: in nome della legge, aprite! 5 (est.) Ogni norma che regola la condotta individuale o sociale degli uomini: le leggi della società. 6 (est.) Regola fondamentale di una tecnica, di un'arte e sim.: le leggi della pittura. 7 Relazione determinata e costante fra le quantità variabili che entrano in un fenomeno: le leggi della matematica, della fisica. ZINGARELLI INTERATTIVO: LEGGE2 leggere v. tr. (pres. io lèggo, tu lèggi; pass. rem. io lèssi, tu leggésti; part. pass. lètto) 1 Riconoscere dai segni della scrittura le parole e comprenderne il significato: imparare, insegnare a leggere; leggere a voce alta (ass.) Fare lettura, dedicarsi alla lettura: trascorro gran parte della giornata leggendo. 2 Interpretare certi segni convenzionali o naturali: i ciechi leggono con le dita; leggere un diagramma (fig.) Leggere la mano, ricavare dati sul carattere e sul destino di qc. basandosi sulle linee della mano. 3 (lett.) Interpretare uno scritto, un passo: i critici dell'Ottocento leggevano erroneamente questa strofa (est.) Interpretare, valutare scritti, eventi e sim. secondo particolari criteri: leggere un film in chiave ironica. 4 (fig.) Intuire i pensieri e le intenzioni di qc.: gli si legge il terrore sul volto. MORFOLOGIA Jackson, 1.6 Marello, 1.2 Graffi / Scalise, I.3 I MORFEMI Le parole non sono necessariamente ‘atomiche’, ma (in Italiano almeno) si possono quasi sempre [STATS?] scomporre in unita’ piu’ piccole: i MORFEMI Un MORFEMA e’ “la minima unita’ linguistica dotata di un significato proprio” DUE ESEMPI BOYS BOY `essere umano, non adulto, sesso maschile’ + -S `plurale’ DUE ESEMPI REPURIFICARE RE- `ripetizione’ + PUR- + `privo di contaminanti’ -IFICARE `rendere’ STRUTTURA DELLE PAROLE INGLESE: RADICE + AFFISSI RADICE (boy) AFFISSI (-s in boy+s) ITALIANO: TEMA + AFFISSI RADICE (ragazz-) TEMA (radice + vocale tematica – e.g., ragazzo) AFFISSI (-i in ragazz+i) AFFISSI La modificazione delle parole avviene in due modi principali: `attaccando’ un AFFISSO ad un morfema; o giustapponendo due morfemi Tre tipi di affissi: PREFISSI: RE- + PURIFICARE REPURIFICARE SUFFISSI: PUR- + - IFICARE PURIFICARE INFISSI: CANT- + -ICCH- + IARE CANTICCHIARE TRE TIPI DI MODIFICAZIONE FLESSIONE DERIVAZIONE COMPOSIZIONE FLESSIONE Processo che AGGIUNGE alla radice / tema informazione semantica ‘grammaticalizzata’ (tipicamente via suffissi): GENERE: bello bella NUMERO: bello belli CASO (Latino, Tedesco): rosa rosam TEMPO: ama amava PERSONA: amo / ami / ama DERIVAZIONE Processo che produce NUOVE parole aggiungendo al tema prefissi, suffissi ed infissi PREFISSI: RE- + PURIFICARE REPURIFICARE SUFFISSI: PUR- + - IFICARE PURIFICARE INFISSI: CANT- + -ICCH- + IARE CANTICCHIARE SUFFISSI ALTERATIVI Indicano dimensioni ridotte o segnalano l’informalita’ della situazione casetta cenetta / sposini Tipici dell’italiano CONVERSIONE Il processo di derivazione puo’ produrre parole la cui categoria lessicale (parte del discorso) e’ diversa da quella della parola originale. N V: magnete magnetizzare A V: attivo attivare N A V: centro centrale centralizzare A N V: giusto giustizia giustiziare In Italiano (ma non in Inglese): sostantivazione dell’aggettivo (povero / il povero) COMPOSIZIONE La composizione forma nuove parole a partire da parole esistenti CAPO+STAZIONE CAPOSTAZIONE SALVA+VITA SALVAVITA PAST- + ASCIUTTA PASTASCIUTTA PER RIASSUMERE: TERMINOLOGIA DI BASE: PAROLA LEMMA NOZIONI DI BASE DI MORFOLOGIA: PARTI DEL DISCORSO MORFEMA FLESSIONE, DERIVAZIONE, COMPOSIZIONE PROCESSI DI FORMAZIONE DELLE PAROLE COMPOSIZIONE DA PAROLE ESISTENTI DERIVAZIONI Remasterizzare ACRONIMI Anche due parole greche (biblioteca, ippodromo) AIDS, CD-ROM, HTML … ‘PRESTITI’ Bonsai, glasnost, golpe, tango, ACRONIMI IN ITALIANO: Dizionario interattivo Zanichelli TN (Trento, Tennessee, etc) T/N – turbonave TND – dinaro tunisino TNT TO TOM - fr. Territoire d'Outre-Mer (territorio d'oltremare) TOREMAR - TOscana REgionale MARittima (società di navigazione) Torr. - Torrente (nelle carte geografiche) TOSAP (Tassa sull'Occupazione di Spazi ed Aree Pubblici) Tosc. (toscano) DA DOVE ARRIVANO LE PAROLE DELL’ITALIANO? Le parole piu’ antiche: Sec IX-X: a, da, bevere, dente, favella 960-963: anno, contenere, ki (qui) 1150-59: genitore, male, pane, prendere Dal bizantino: arcipelago, catasto, duca, iconoclasta, molo, … Dal latino medievale: acquavite, bonificare, commissario, scatola, … Dalle lingue Germaniche: albergo (Gotico), airone (Longobardo) Dall’Arabo: darsena, dogana, ,magazzino, assassino, cotone, facchino, algebra, zenit, alambicco … Dal Francese: bersaglio, conte, dama, freccia, giullare, sire Dallo Spagnolo: acciacco, alfiere, appartamento, disinvoltura, …. STORIA DELLE PAROLE INGLESI Dall’Anglo Sassone ( Old English) Dalle lingue scandinave (they, them, their) Dal Francese ( Middle English) Dal Latino / Greco / Francese durante il Rinascimento fino al 1700 circa LETTURE Jackson, capitolo 1-2 Marello, capitolo 1-2 Graffi / Scalise, capitolo 3