ANNUNCI





I LABORATORI SONO GIA’ COMINCIATI
OGGI INIZIA IL MODULO C (C1, 18-20)
CAMBIAMENTO ORARI: MODULO C, LAB
D
LABORATORI:
http://www.dit.unitn.it/~poesio/Teach/IU:
piano delle lezioni di Informatica Umanistica
D online.
ORARI: MODULI C1, C2 E C3
LUN MAR MER GIO VEN
8-10
10-12
B2
12-14
C2
14-16
B3
16-18
18-20
C1
B1
C1
C3
CAMBIAMENTI ORARI

Modulo B: NON SI TERRANNO LE
LEZIONI DEL MODULO B2 (MARTEDI’
10-12):



21 MARZO (TESI DI LAUREA)
4 APRILE (CONFERENZA EACL)
CAMBIAMENTO ORARI: MODULO C,
LAB D
ORARI: LABORATORI
LUN
8-10
MA
MER GIO VEN
R
LAB A
LAB B
(B2)
10-12
LAB E
12-14
C2
14-16
LAB D
(B3)
16-18
LAB C
18-20
B1
D
LAB D
(17/3)
C3
C1
RICEVIMENTO
(MASSIMO POESIO)

Ricevimento:
Martedi’ 16-18, via
Sighele 7
INFORMATICA UMANISTICA D:
LESSICOGRAFIA E COMPUTER
Introduzione al corso
Parole e morfologia
LESSICOGRAFIA E COMPUTER:
ARGOMENTI DEL CORSO






Parole e morfologia
I dizionari e la loro storia
Dizionari elettronici
Uso di corpora nella lessicografia
Conoscenza lessicale
Lessici elettronici: WordNet
ORARI DEL MODULO D
LUN MAR MER GIO VEN
8-10
10-12
B2
12-14
C2
14-16
B3
D
16-18
18-20
C3
B1
C1
SYLLABUS
Argomento
Letture
Tenuto da
Data
Orario
Aula
1
Presentazione del corso di
Informatica Umanistica D
Parole e morfologia
Jackson, 1-2
Marello, 1
Graffi e Scalise, V-VI?
Poesio
Gio 16/03/2006
14:00-16:00
5
2
Dizionari: struttura e storia
Jackson 3-7-9-10
Poesio
Gio 23/03/2006
14-16
5
3
Machine Readable Dictionaries
Un esempio: ELDIT
Poesio
Abel
Gio 30/03/2006
14-16
5
4
Uso dei corpora nella
preparazione dei dizionari
Concordanze
Poesio
Gio
14-16
5
5
Preparazione dei corpora:
tokenizzazione,
lemmatizzazione
Poesio
ORARIO DA
DECIDERE
Lenci, Montemagni, Pirrelli, c. 7
PASQUA
6
Uso di corpora negli studi
lessicografici
7
Toolboxes per lessicografi:
Wordsmith, TALES
8
Semantica lessicale
9
1
0
6/04/2006
20/04
Materiale da McEnery et al
Poesio
Gio 27/04
14-16
5
Poesio
Giuliano
Gio 4/05
14-16
5
Poesio
Gio 11/05
14-16
5
WordNet.
MultiWordNet
Poesio
Pianta
Gio 18/05
14-16
5
TBA
Poesio
Gio 25/05
14-16
5
Graffi e Scalise, VIII.2
LETTURE





Trasparenze su sito / materiali distribuiti a
lezione.
Howard Jackson. Lexicography: an
introduction. Routledge.
Lenci, Montemagni e Pirrelli. Testo e
Computer. Carrocci.
Carla Marello, Le parole dell’Italiano,
Zanichelli
Giorgio Graffi e Sergio Scalise. Le lingua ed
il linguaggio. Il Mulino.
ESAME



Orale
Tenuto insieme agli altri esami di IU
Voto in trentesimi
IL SITO WEB

Le informazioni sul modulo D si
possono trovare:


http://www.dit.unitn.it/~poesio/Teach/IU
Su DidatticaOnline (dalla settimana
prossima)
CHE COS’E’ UNA ‘PAROLA’?
(Una domanda essenziale per
decidere cosa il contenuto di
un dizionario.)
DEFINIZIONE
TRADIZIONALE
La parola e’ “cio che si trova tra due
spazi bianchi”
QUANTE PAROLE CI SONO IN UN
TESTO? ITALIANO E LATINO
il ragazzo
puer
ha dato
dedit
una rosa
rosam
a Maria
Mariae
Altre lingue senza articoli /
particelle: lingue slave (Ceco),
Cinese, …
CHE COS’E’ UNA PAROLA?

25 lemmi dal Concise Oxford Dictionary:








wannabe,
want, wanting, wanton, wapentake, wapiti,
War.,
war, waratah,
war baby,
warble1, warble2,
warble fly, warbler, warby, war chest, war crime,
war cry, ward,
-ward
PAROLE E LEMMI

warble1, warble2 : due PAROLE con la
stessa forma (OMONIMI)


want (ma non wanted)


Italiano: diligenza, tara, (botte, pesca …)
sings, sang, sung  sing
Italiano: 7 forme di parola, 2 lemmi


mangerò, mangeresti, mangerai mangiare
nero, nera, neri, nere  nero
FORME DI CITAZIONE


Un dizionario riporta le FORME DI
CITAZIONE di un verbo
Convenzioni diverse a seconda della
lingua:

Italiano: infinito (AMARE)


Inglese: TO LOVE
Latino: prima persona presente singolare
(AMO)
MULTIWORDS &
COMPOUNDS IN INGLESE


PHRASAL VERBS: break up, calm down,
find out, give in, look over, pass out, show
up, take off …..
COMPOUNDS:




war baby, war chest, war crime, war cry, war
dance
bell and whistles, rock and roll, bow and scrape,
nip and tuck ….
IN TEDESCO:
Donaudampfschiffahrtgesellschaftkapitänwitwe
CONTRAZIONI: wannabe, gonna, gimme …
MULTIWORDS & PAROLE
COMPOSTE IN ITALIANO

RIFLESSIVI:


sedersi (Mario si sedette)  sit (Mario
sat)
COMPOSTI:


sci alpinismo
salvavita / tritacarne / dopolavoro /
benestante
PAROLE: RAPPRESENTAZIONI
FONEMICHE E GRAFICHE



La definizione di parola “cio’ che si
trova tra due spazi bianchi” e’
puramente ORTOGRAFICA
Occorre distinguere tra una PAROLA e
le sue FORME
Due forme: i SUONI (FONEMI) che la
compongono, e il modo in cui viene
rappresentata graficamente (GRAFIA)
PAROLE E LA LORO GRAFIA

La nostra `immagine’ delle parole (e la
loro posizione in un dizionario,
cartaceo od elettronico) spesso
dipende dalla grafia usata


La grafia pero’ cambia di continuo:
lengaio  linguaggio, dinaro  denaro
Occorre anche ricordare che lo scritto
segue il parlato, e che non sempre la
corrispondenza e’ perfetta
INGLESE:

HOMOGRAPHS




read,read, read
tear / tear
bow, refuse, wind
HOMOPHONES:


bare / bear, pale / pail, stake / steak
Mary / merry / marry (alcuni dialetti
Americani)
ITALIANO


La grafia delle parole Italiane non e’
cambiata molto dagli inizi del
Cinquecento (prime edizioni a stampa,
e.g., edizione del Petrarca curata da
Bembo e stampata da Manuzio nel
1515)
Ma per secoli l’ortografia non
corrispondeva alla pronuncia
DUE ESEMPI DI
CAMBIAMENTO DI GRAFIA

V=U

Vocabolario della Crusca, 1612:





VATICINARE
VBBIA
VDITORE
(Crusca 1738: V  U, ordine invariato)
H

Vocabolario della Crusca, 1612:

HUMILE
GRAFEMI E FONEMI
mela
m'me:la
bello
'bɛ:llo
bene
ieri
'bɛ:ne
'jɛ:ri
In Italiano ci sono 21 grafemi (+ 5) ma 30 fonemi
JACKSON: TRE SENSI DI
‘PAROLA’



ORTHOGRAPHIC WORD: una
sequenza di lettere circondata da
spazi
PHONEMIC WORD: una sequenza di
suoni (fonemi)
LEXEME: una parola nel linguaggio,
che puo’ occorrere come lemma nel
dizionario
UNA DEFINIZIONE PIU’
COMPLESSA

Marello:

“il termine PAROLA … [indica una] unita’
linguistica a cui sono associati una
funzione grammaticale ed un significato,
separata graficamente dalle altre da
spazi e dotata di coesione interna, per cui
non si possono inserire altri elementi al
suo interno, ne’ si puo’ mutare l’ordine
degli elementi che la costituiscono”
PRIME DEFINIZIONI


PAROLA (Inglese WORD): elemento
linguistico (= del ‘lessico mentale’)
FORME DI PAROLA (Inglese WORDFORM):



Ortografica
Fonetica
LEMMA (Inglese LEXEME):

Un elemento del dizionario – per le parole con
forme variabili, la FORMA DI CITAZIONE
La classificazione delle parole


POS tags (Jackson, 1.5)
Graffi / Scalise 2
RESTRIZIONI SULLE
POSIZIONI DELLE PAROLE

La ragazza lesse rapidamente il libro




*Ragazza la lesse rapidamente il libro
*La ragazza lesse il rapidamente libro
Inglese: *The Sue quickly read the book
Sottocategorie:


*La ragazza arrivo’ il libro
conigliera, baleniera, teiera, ma: *virtuiera,
*pazienzera
CATEGORIE LESSICALI
(PARTI DEL DISCORSO)









NOMI (tavolo, Simona)
VERBI (camminare, mangiare, colpire)
AGGETTIVI (rosso, rapido)
AVVERBI (probabilmente, subito)
PRONOMI (io, lui, ci)
ARTICOLI (il, la, un)
PREPOSIZIONI (di, a, con)
CONGIUNZIONI (e, ma, o)
[Italiano]: INTERIEZIONI (ahi! )
ALCUNE DISTINZIONI

PARTI DEL DISCORSO VARIABILI /
INVARIABILI


L’uomo cammina / camminava
PARTI DEL DISCORSO APERTE /
CHIUSE


Aperte: nomi, verbi, aggettivi, avverbi
Chiuse: articoli, pronomi, preposizioni,
congiunzioni
CATEGORIE UNIVERSALI?


L’articolo manca in molte lingue
(Latino, lingue slave, Cinese)
Avverbio?
CATEGORIE LESSICALI E
DIZIONARI

Un dizionario tipicamente identifica
tutte le parti del discorso che una
certa forma di parola puo’ essere usata
per esprimere, e solitamente
associano lemmi diversi con ogni parte


warble1, warble2
Italiano: legge, letto, affetto, porto,
pianta …
ZINGARELLI INTERATTIVO:
LEGGE1
1 Norma, espressa dagli organi legislativi dello Stato, che stabilisce diritti e doveri
dei cittadini Legge delega, che viene emessa dal potere esecutivo su delega del
potere legislativo entro un ambito ben precisato Legge ponte, emessa in attesa di
un'altra più organica A norma, a termini di legge, secondo ciò che la legge
prescrive.
2 (est.) Complesso delle norme costituenti l'ordinamento giuridico di uno Stato: la
legge è uguale per tutti Essere fuori della legge, non essere garantito dalla legge o
non sentirsi a essa soggetto Dettar legge, imporre a tutti la propria volontà.
3 Scienza giuridica: laurea in legge; dottore in legge; facoltà di legge Uomo di
legge, specialista nella scienza giuridica.
4 Autorità giudiziaria: ricorrere alla legge In nome della legge, formula con cui i
rappresentanti dell'autorità giudiziaria intimano a qc. di obbedire a un comando della
stessa: in nome della legge, aprite!
5 (est.) Ogni norma che regola la condotta individuale o sociale degli uomini: le leggi
della società.
6 (est.) Regola fondamentale di una tecnica, di un'arte e sim.: le leggi della pittura.
7 Relazione determinata e costante fra le quantità variabili che entrano in un
fenomeno: le leggi della matematica, della fisica.
ZINGARELLI INTERATTIVO:
LEGGE2
leggere
v. tr. (pres. io lèggo, tu lèggi; pass. rem. io lèssi, tu leggésti; part. pass.
lètto)
1 Riconoscere dai segni della scrittura le parole e comprenderne il
significato: imparare, insegnare a leggere; leggere a voce alta (ass.) Fare
lettura, dedicarsi alla lettura: trascorro gran parte della giornata leggendo.
2 Interpretare certi segni convenzionali o naturali: i ciechi leggono con le
dita; leggere un diagramma (fig.) Leggere la mano, ricavare dati sul
carattere e sul destino di qc. basandosi sulle linee della mano.
3 (lett.) Interpretare uno scritto, un passo: i critici dell'Ottocento leggevano
erroneamente questa strofa (est.) Interpretare, valutare scritti, eventi e
sim. secondo particolari criteri: leggere un film in chiave ironica.
4 (fig.) Intuire i pensieri e le intenzioni di qc.: gli si legge il terrore sul volto.
MORFOLOGIA



Jackson, 1.6
Marello, 1.2
Graffi / Scalise, I.3
I MORFEMI


Le parole non sono necessariamente
‘atomiche’, ma (in Italiano almeno) si
possono quasi sempre [STATS?]
scomporre in unita’ piu’ piccole: i
MORFEMI
Un MORFEMA e’ “la minima unita’
linguistica dotata di un significato
proprio”
DUE ESEMPI
BOYS
BOY
`essere umano, non
adulto, sesso maschile’
+
-S
`plurale’
DUE ESEMPI
REPURIFICARE
RE-
`ripetizione’
+
PUR-
+
`privo di contaminanti’
-IFICARE
`rendere’
STRUTTURA DELLE PAROLE

INGLESE: RADICE + AFFISSI



RADICE (boy)
AFFISSI (-s in boy+s)
ITALIANO: TEMA + AFFISSI



RADICE (ragazz-)
TEMA (radice + vocale tematica – e.g.,
ragazzo)
AFFISSI (-i in ragazz+i)
AFFISSI


La modificazione delle parole avviene in due
modi principali: `attaccando’ un AFFISSO ad
un morfema; o giustapponendo due morfemi
Tre tipi di affissi:



PREFISSI: RE- + PURIFICARE 
REPURIFICARE
SUFFISSI: PUR- + - IFICARE  PURIFICARE
INFISSI: CANT- + -ICCH- + IARE 
CANTICCHIARE
TRE TIPI DI MODIFICAZIONE



FLESSIONE
DERIVAZIONE
COMPOSIZIONE
FLESSIONE

Processo che AGGIUNGE alla radice / tema
informazione semantica ‘grammaticalizzata’
(tipicamente via suffissi):





GENERE: bello  bella
NUMERO: bello belli
CASO (Latino, Tedesco): rosa rosam
TEMPO: ama amava
PERSONA: amo / ami / ama
DERIVAZIONE

Processo che produce NUOVE parole
aggiungendo al tema prefissi, suffissi
ed infissi



PREFISSI: RE- + PURIFICARE 
REPURIFICARE
SUFFISSI: PUR- + - IFICARE 
PURIFICARE
INFISSI: CANT- + -ICCH- + IARE 
CANTICCHIARE
SUFFISSI ALTERATIVI

Indicano dimensioni ridotte o
segnalano l’informalita’ della situazione



casetta
cenetta / sposini
Tipici dell’italiano
CONVERSIONE

Il processo di derivazione puo’ produrre
parole la cui categoria lessicale (parte del
discorso) e’ diversa da quella della parola
originale.





N  V: magnete  magnetizzare
A  V: attivo  attivare
N  A  V: centro  centrale  centralizzare
A  N  V: giusto  giustizia  giustiziare
In Italiano (ma non in Inglese):
sostantivazione dell’aggettivo (povero / il
povero)
COMPOSIZIONE

La composizione forma nuove parole a
partire da parole esistenti



CAPO+STAZIONE CAPOSTAZIONE
SALVA+VITA  SALVAVITA
PAST- + ASCIUTTA  PASTASCIUTTA
PER RIASSUMERE:

TERMINOLOGIA DI BASE:



PAROLA
LEMMA
NOZIONI DI BASE DI MORFOLOGIA:



PARTI DEL DISCORSO
MORFEMA
FLESSIONE, DERIVAZIONE,
COMPOSIZIONE
PROCESSI DI FORMAZIONE
DELLE PAROLE

COMPOSIZIONE DA PAROLE ESISTENTI


DERIVAZIONI


Remasterizzare
ACRONIMI


Anche due parole greche (biblioteca,
ippodromo)
AIDS, CD-ROM, HTML …
‘PRESTITI’

Bonsai, glasnost, golpe, tango,
ACRONIMI IN ITALIANO:
Dizionario interattivo Zanichelli










TN (Trento, Tennessee, etc)
T/N – turbonave
TND – dinaro tunisino
TNT
TO
TOM - fr. Territoire d'Outre-Mer (territorio d'oltremare)
TOREMAR - TOscana REgionale MARittima (società di
navigazione)
Torr. - Torrente (nelle carte geografiche)
TOSAP (Tassa sull'Occupazione di Spazi ed Aree Pubblici)
Tosc. (toscano)
DA DOVE ARRIVANO LE
PAROLE DELL’ITALIANO?

Le parole piu’ antiche:









Sec IX-X: a, da, bevere, dente, favella
960-963: anno, contenere, ki (qui)
1150-59: genitore, male, pane, prendere
Dal bizantino: arcipelago, catasto, duca, iconoclasta, molo, …
Dal latino medievale: acquavite, bonificare, commissario,
scatola, …
Dalle lingue Germaniche: albergo (Gotico), airone
(Longobardo)
Dall’Arabo: darsena, dogana, ,magazzino, assassino, cotone,
facchino, algebra, zenit, alambicco …
Dal Francese: bersaglio, conte, dama, freccia, giullare, sire
Dallo Spagnolo: acciacco, alfiere, appartamento, disinvoltura,
….
STORIA DELLE PAROLE
INGLESI




Dall’Anglo Sassone ( Old English)
Dalle lingue scandinave (they, them,
their)
Dal Francese ( Middle English)
Dal Latino / Greco / Francese durante
il Rinascimento fino al 1700 circa
LETTURE



Jackson, capitolo 1-2
Marello, capitolo 1-2
Graffi / Scalise, capitolo 3
Scarica

Parole e morfologia