REGOLE (E IRREGOLARITÀ) NELLA FORMAZIONE DELLE PAROLE
Fabio Montermini
CLLE-ERSS, CNRS e Université de Toulouse
1. Introduzione
La rinascita della morfologia che ha avuto luogo a partire dagli anni Settanta del secolo
scorso ha avuto nella nozione di regola uno dei suoi cardini fondamentali. Largamente
ispirate al paradigma generativista, le regole della morfologia derivazionale, nella loro versione originaria, consistevano principalmente in una serie di operazioni atte ad ottenere un
determinato risultato a partire da uno o più input1. La prima formulazione del concetto di
‘Regola di Formazione di Parola’ (RFP, in inglese Word-Formation Rule) è quella di Halle
(1973), ma trattamento più completo è quello proposto da Aronoff (1976), il quale ha contribuito a rendere popolare una nozione che, con vari adattamenti, è alla base di gran parte
delle teorie morfologiche attuali2. Come vedremo in particolare nel § 3, la natura deterministica delle RFP, nella loro forma originaria, è fortemente problematica quando tale nozione è applicata ad un ambito, quello lessicale, che è per sua natura aleatorio e ampiamente condizionato da fattori extralinguistici. L’interazione tra le regole e il lessico, attestato o
possibile, è stato in effetti uno dei principali temi di dibattito per i morfologi negli ultimi
decenni (cf., per una disamina recente, Rainer 2012). L’evoluzione tecnologica degli ultimi
decenni, poi, consentendo l’accesso in tempi rapidissimi a quantità di dati linguistici fino a
pochi anni prima inimmaginabili, ha reso sempre più difficile derubricare gli esempi problematici a eccezioni o casi marginali. Allo status dei dati in morfologia derivazionale, e in
particolare ai cambiamenti apportati dalle nuove tecnologie a questo campo d’indagine
linguistica, è dedicato il § 2. Per limitarsi a qualche esempio recente, attualmente, è
tutt’altro che raro imbattersi in esempi come i seguenti che, sotto diversi aspetti, sono incompatibili con le RFP nella loro forma tradizionale.
(1)
1
Nella classificazione proposta da Berruto (questo volume), si tratta di regole del tipo (iii), regole
come ‘istruzioni’.
2
Si veda anche Jackendoff (1975) per una concezione delle regole morfologiche come regole di
ridondanza che è decisamente più attuale, benché all’epoca la concezione delle relazioni lessicali
che ne emerge avesse riscosso assai meno successo.
a.
Il meccanismo ‘variazionale’ dell’evoluzione (contrapposto a quello ‘trasformazionale’ lamarckiano e a quello ‘saltazionale’ che fu dei primi genetisti) si applica per
Darwin solo a livello dei singoli organismi.
[T. Pievani, Evoluzione delle specie, evoluzione delle lingue: affinità, interazioni e
cautele, in: N. Grandi (ed.), Dialoghi sulle lingue e sul linguaggio, Bologna, Pàtron,
2011, p. 63]
b.
Meglio arrivarci in land rover con (pochi) altri appassionati delle stesse cose [...] piuttosto che accalcarsi in un viaggio organizzato in pulmini coi soliti caciaroni russi avvodkazzati.
[http://it.cultura.single.narkive.com/7KdgqlfO/vacanze-all-isola-di- rodi]
In (1a), l’aggettivo saltazionale (che appartiene al vocabolario della teoria dell’evoluzione)
è apparentemente deviante, dal momento che sembra contenere un suffisso -zione, benché
in italiano non sia attestato il nome deverbale *saltazione costruito sul verbo saltare. (1b),
dal canto suo, contiene una forma ancora meno ‘regolare’: l’aggettivo avvodkazzato è perfettamente comprensibile da un parlante italiano, anche in virtù del suo legame evidente
con il nome vodka, ma è difficile identificare con precisione gli affissi che contiene e la
regola (o le regole) per mezzo della quale è stato costruito. In effetti, per spiegare la forma
e il significato di questa parola sembrerebbe più utile ricorrere ad una relazione individuale
– che potremmo definire di analogia (cf. il § 4) – con l’aggettivo avvinazzato, escludendo
così la possibilità che si possa trattare di una ‘regola’.
Nel tentativo di rendere conto in maniera più realistica dei dati realmente osservati, diversi modelli morfologici hanno proposto, in anni più recenti, di abbandonare o di modulare il concetto di regola in favore di nozioni meno rigide, come quella di schema, o modello.
A differenza delle regole, i modelli prevedono gradi diversi di applicabilità, non implicano
necessariamente l’isomorfia tra forma e senso di una parola complessa, dal momento che
l’istruzione semantica è inglobata nel modello stesso, e non sono elaborati indipendentemente dalle parole che li esemplificano, ma al contrario emergono dal lessico esistente.
Come vedremo, l’esistenza di lessemi devianti per una o più proprietà, problematica per
una morfologia basata sulle regole, è più compatibile con una morfologia basata sui modelli. Ciò implica anche un cambiamento importante del punto di vista che il linguista adotta
nei confronti dei dati: la preoccupazione principale non è più quella di identificare, nel
lessico, gli elementi ‘centrali’ da quelli ‘devianti’, ma piuttosto quella di rendere esplicite
le proprietà che rendono i lessemi complessi realmente osservati più o meno aderenti ai
modelli identificati. Nel § 4, in particolare, discuterò di come la nozione di modello o
schema, più flessibile di quella di regola, appaia più adatta a trattare il lessico effettivamente osservabile.
2. Lo status dei dati in morfologia derivazionale
Fino a qualche decennio fa, lo studioso che si occupasse di lessico o di morfologia derivazionale aveva a sua disposizione, come fonte di dati, principalmente le opere lessicografiche (dizionari generalisti o specialistici), qualche raro corpus (ad esempio letterario), oltre
che, naturalmente, la sua intuizione o quella degli altri parlanti nativi della lingua. Fino alla
metà degli anni Novanta, gran parte dei lavori di morfologia erano basati su queste risorse,
il che non ha impedito la realizzazione di studi empirici anche su larga scala. La maggior
parte di questi studi si basa, appunto, su dati lessicografici, prendendo in considerazione,
ad esempio, l’insieme delle parole costruite mediante lo stesso procedimento contenute in
uno o più dizionari. L’uso dei dati lessicografici, tuttavia, è rischioso, soprattutto nel caso
in cui si vogliano studiare proprietà, come quelle semantiche, difficilmente oggettivabili e
per le quali, per così dire, il fattore umano – in questo caso le scelte operate dal compilatore o dai compilatori del dizionario – ha una parte preponderante.
L’evoluzione degli strumenti informatici e la loro diffusione hanno, da questo punto di
vista, apportato un cambiamento decisivo agli studi linguistici in generale, e morfologici e
lessicologici in particolare. Non solo molti dizionari sono stati resi disponibili in formato
elettronico, rendendo le ricerche molto più agevoli e rapide, ma hanno cominciato ad essere realizzati e diffusi corpora e altre risorse sempre più grandi e diversificati, al punto che
oggi avere una solida base empirica è una caratteristica quasi imprescindibile per qualsiasi
lavoro di morfologia, in particolare derivazionale, perlomeno nelle lingue a più ampia diffusione. Un ulteriore impulso a questa tendenza, poi, è venuto, ovviamente, da Internet e
dalla sua democratizzazione attraverso il Web3. Oggi un linguista può avere accesso, quasi
istantaneamente, a un numero virtualmente infinito di produzioni linguistiche in varie lin 3
Nonostante Internet e il World Wide Web costituiscano due oggetti distinti, solo parzialmente
sovrapponibili, quest’ultimo coincide con la parte più visibile e conosciuta di Internet, tanto che le
due realtà sono spesso confuse nel senso comune. Pur tenendo presente questa distinzione, qui i
termini Internet e (World Wide) Web sono usati come sostanzialmente sinonimi. gue diverse, la maggior parte delle quali reali. Naturalmente, l’uso di Internet come
database richiede un certo numero di cautele, ma è innegabile che, dal punto di vista della
ricerca dei dati in linguistica, esso ha costituito una vera e propria rivoluzione, sia quantitativa che qualitativa.
Per dare un’idea dell’evoluzione che Internet ha reso possibile per gli studi lessicali, riporto nella Figura 1 i dati relativi a un lavoro recente sull’elemento di composizione neoclassica -cida/-cidio in italiano (Lasserre / Montermini in st.). Il grafico mostra il numero
di forme reperite nel Gradit, nel corpus CorIs4 e quelle che è stato possibile ricavare da una
serie di ricerche estensive (ma necessariamente non esaustive) sul Web tra il dicembre
2012 e il giugno 2013.
Figura 1: numero di forme in -cida e -cidio in diverse risorse linguistiche
Certo, è del tutto possibile che per altri settori della morfologia derivazionale l’incremento
nel numero dei dati che Internet rende disponibili sia meno spettacolare, ma esso è comunque notevole, come hanno messo in luce un certo numero di lavori realizzati in anni recenti
(cf. ad esempio Hathout / Namer / Plénat / Tanguy 2009 per una visione d’insieme di lavori di questo tipo). È evidente che un cambiamento di scala di questa portata, per qualsiasi
disciplina scientifica, non può non avere conseguenze importanti, dal punto di vista empirico, sulla finezza e sul grado di dettaglio che è possibile ottenere con le analisi, e, dal punto di vista teorico, sulle basi epistemologiche e sulle nozioni impiegate.
Tuttavia, il Web viene ancora utilizzato da molti linguisti come una risorsa tradizionale,
semplicemente più grande e veloce. Il risultato è che, da un lato, gran parte delle sue po 4
http://corpora.dslo.unibo.it/ coris_ita.html.
tenzialità vengono ignorate o non pienamente sfruttate, e dall’altro vengono trascurate le
precauzioni che è necessario adottare quando ci si serve di uno strumento che, per dimensioni e caratteristiche, non è comparabile ad alcuna delle risorse linguistiche che gli preesistevano. Nell’ambito della linguistica computazionale il “Web as a corpus” è ormai un
ambito di ricerca a tutti gli effetti, e tuttavia l’attitudine di molti linguisti nei confronti di
Internet continua a riflettere quella più generale, che oscilla tra l’entusiasmo incondizionato e il rigetto totale. Un uso indiscriminato dei dati del Web presenta certamente diversi
aspetti problematici, alcuni dei quali sono ben descritti in letteratura5 e suggeriscono una
certa cautela nell’impiego dei dati che è possibile ottenerne. Tuttavia, in mancanza di una
risorsa comparabile – almeno quantitativamente – al Web, che non ne presenti gli inconvenienti, è chiaro che esso è diventato insostituibile al giorno d’oggi per chi si interessi alla
creatività lessicale.
Proprio la varietà che il Web ci offre invita a riconsiderare radicalmente l’atteggiamento
dei linguisti nei confronti dei dati: piuttosto che oscillare tra il prescrittivismo rigido, che
spinge a rifiutare in blocco l’uso di dati obiettivamente poco controllabili, e il relativismo
assoluto, secondo cui qualsiasi forma, purché attestata, merita di essere considerata sullo
stesso piano delle altre, è indubbiamente più utile elaborare criteri espliciti per valutare i
dati reali in relazione all’insieme del lessico e delle generalizzazioni che esso rende possibili. Lo scopo della teoria, cioè, non deve essere quello di selezionare i dati, attribuendo
loro etichette di accettabilità o non accettabilità – un atteggiamento che ricorda troppo da
vicino quello della grammatica prescrittivistica per essere scientificamente credibile –
quanto piuttosto quello di costruire uno spazio concettuale all’interno del quale collocare
l’osservabile, in questo caso le forme realmente create dai parlanti, in base a principi che
possono essere considerati generali. Infine, è utile sottolineare un’ulteriore differenza, questa volta più qualitativa che quantitativa, tra il Web e le risorse linguistiche che lo hanno
preceduto: grazie anche alle sue caratteristiche sociolinguistiche, Internet consente, più di
ogni altro strumento, di avere accesso a tutte quelle forme che sono costruite dai locutori
‘al momento’ (in inglese si direbbe on-line), che, come sa chi ha una certa pratica di questo
genere di ricerche, sono assai difficili da reperire anche in corpora di grandissime dimensioni. Ciò include sia parole create in maniera cosciente (neologismi, occasionalismi, for 5
Cf., tra gli altri, Kilgariff (2007); Lüdeling / Evert / Baroni (2007); Hathout / Montermini / Tan-
guy (2008); Dal / Namer (2012) e, per una panoramica più generale degli aspetti linguistici legati a
Internet, Crystal (20062).
mazioni scherzose) che inconscia (lapsus, ‘errori’ morfologici); alcune di queste possiedono tutte le proprietà per poter diventare item lessicali a pieno titolo, altre trovano la loro
ragione di esistere unicamente nella situazione discorsiva all’interno della quale sono state
prodotte. Paradossalmente, è soprattutto a partire da questi dati spontanei che possiamo
costruire un modello credibile della competenza morfologico-derivazionale dei parlanti. Si
tratta, in effetti, di parole che non hanno subito gli stessi fenomeni di erosione, stratificazione o slittamento semantico cui è sottoposto il lessico attestato, istituzionalizzato (e di
conseguenza dizionarizzato). In altre parole si tratta, per usare un termine alla moda in linguistica, di dati più ‘ecologici’.
3. Proprietà delle regole di formazione di parola
Nella loro versione originaria, le RFP erano meccanismi rigidi che possedevano la doppia
caratteristica di essere selettive e deterministiche. Selettive, perché ogni regola definisce in
maniera univoca e discreta l’insieme degli input possibili (nel caso della morfologia derivazionale, dei lessemi base) e di quelli impossibili. Deterministiche, perché, dato un certo
input, esiste un solo output accettabile, il quale è dotato di caratteristiche che sono interamente prevedibili. La possibilità che un lessema possa costituire un input più o meno adeguato per una regola non è contemplata, così come non lo è quella che una regola possa
avere più di un output possibile o che quest’ultimo non possegga tutte le proprietà previste
dalla regola. Eppure, come vedremo, i dati lessicali pullulano di esempi che contraddicono
questi principi.
Per quanto riguarda la prevedibilità dell’output, in particolare, essa si basa sull’ipotesi,
mutuata dalla sintassi, della composizionalità, secondo cui è possibile determinare il significato di un’espressione linguistica a partire dal significato degli elementi che la costituiscono. Applicare tale principio al livello lessicale significa considerare che il significato di
una parola complessa è calcolabile a partire dalle istruzioni semantiche legate alle diverse
sottoparti che è possibile identificare (ad esempio radici o affissi). La morfologia che ne
deriva è insieme additiva (o incrementale, per usare il termine di Stump 2001), poiché
l’interpretazione semantica si costruisce in concomitanza con la struttura morfologica, e
orientata, dal momento che la costruzione delle parole procede dal più semplice al più
complesso attraverso la concatenazione successiva di segmenti. In realtà, esistono abbondanti argomenti, teorici ed empirici, che vanno contro ciascuno dei due aspetti. Per quanto
riguarda il secondo, ad esempio, è addirittura banale opporre all’idea di una morfologia che
procederebbe sempre dal semplice al complesso esempi di parole che presentano lo stesso
grado di complessità e che sono, tuttavia, morfologicamente legate. Si pensi, ad esempio,
alla conversione o a insiemi di parole come catechismo, catechista, catechizzare, per i quali è oggettivamente impossibile trovare una sequenzialità, se non al prezzo di astrazioni
teoriche che restano arbitrarie. Per quanto riguarda il primo aspetto, invece, la pertinenza
di una morfologia puramente incrementale è già stata ampiamente criticata, sia per quanto
riguarda la flessione (cf. lo stesso Stump 2001: cap. 1; Blevins 2006), che la derivazione
(cf. in particolare Aronoff 2007). A sua volta, l’ipotesi della composizionalità si basa
sull’idea che tutto ciò che, nel significato di una parola morfologicamente complessa, non
è immediatamente prevedibile a partire dalle RFP derivi dalla sua permanenza nel lessico,
la quale favorisce i fenomeni di slittamento semantico, metaforizzazione, etc. In realtà, tale
concezione attribuisce un peso notevole – e a mio avviso eccessivo – al fattore tempo nella
costruzione del significato. L’arbitrarietà dei segni linguistici, infatti, è un elemento costitutivo del linguaggio, e in quanto tale deve essere considerata come valida, in qualsiasi
momento, per tutte le parole di una lingua, gli elementi che costituiscono l’interfaccia tra la
lingua e la conoscenza del mondo (cf. Aronoff 2007: 813-814)6.
Nel seguito di questo paragrafo prenderò in considerazione alcuni degli aspetti problematici dell’ipotesi della composizionalità, legati in particolare ad alcuni corollari che chi la
adotta deve necessariamente, implicitamente o esplicitamente, accettare, quelli che chiamerei il principio della segmentabilità (§ 3.1), dell’esaustività (§ 3.2), della completezza (§
3.3) delle parole complesse.
3.1. Segmentabilità
Attribuire una porzione discreta di significato alle varie sottoparti di una parola complessa
significa considerare che, dal punto di vista formale, esse sono sempre chiaramente distinguibili e che ogni unità elementare del piano formale (fonema) può essere attribuita univocamente all’una o all’altra di queste sottoparti. La difficoltà (e forse la vanità) di una tale
operazione, tuttavia, dovrebbe già essere chiara ai morfologi da tempo, data la longevità di
domande come “in amministrazione il suffisso sarà -azione, -zione o -ione?” (Scalise 1999:
457), nonché la sostanziale impossibilità di trovar loro una risposta univoca e convincente.
6
Per un’esemplificazione rimando a Montermini (2010b: 80-82), in cui ho preso in considerazione
un certo numero di significati attestati per un lessema non istituzionalizzato, ma apparentemente
trasparente, poltronista.
Oggi è abbastanza consensuale l’idea che ogni elemento lessicale (includendo gli esponenti
delle RFP, ossia gli affissi) non deve necessariamente possedere una forma di base dalla
quale far derivare tutte le altre, ma può consistere in un insieme di forme la cui variazione
è più o meno motivata fonologicamente, e per le quali i locutori conoscono, in base alla
loro competenza morfologico-lessicale, i contesti appropriati nei quali debbono essere usate. Se, tuttavia, esistono diversi lavori volti a caratterizzare la rappresentazione dei lessemi
come ‘collezioni’ di temi distinti (cf., specificamente per l’italiano, Pirrelli / Battista 2000;
Montermini / Bonami in st.), la variazione degli affissi, ugualmente interessante, è assai
meno studiata in quest’ottica. In Montermini (2010a), ad esempio, ho proposto una gerarchizzazione delle forme dell’esponente della RFP che costruisce i nomi d’azione come
amministrazione, forme che vanno da /atːsjone/ (che può essere considerata come quella di
default) a quelle contenenti una consonante sonorante (come in conversione, espulsione,
etc.). Un altro caso interessante è quello del suffisso -(i)ano in italiano, che può legarsi
praticamente ad ogni nome proprio o toponimo per formare un aggettivo di relazione e può
contenere o meno una semivocale /j/. Esistono buoni argomenti per sostenere che la forma
di default attuale per questo suffisso è /jano/, poiché è quella che si osserva con la maggioranza dei derivati da nomi propri e da toponimi stranieri (che possiamo considerare, in generale, di formazione più recente rispetto agli etnici costruiti su toponimi italiani) contenuti
nei dizionari. I dati neologici7, poi, mostrano che la forma /jano/ è largamente preponderante, se non l’unica scelta, quando la base non presenta particolari problemi fonologici
(finale in /a/ o /o/ semplici non accentate o in consonante: calcuttiano, hannoveriano),
mentre /j/ tende a non essere presente soprattutto con basi che terminano con una sequenza
poco comune in italiano (una vocale accentata, una /e/ o una /u/ atone, uno iato, un dittongo), tutti casi in cui la vocale (o una delle vocali) della base tende ad apparire nel derivato,
spesso a discapito della /j/ (cf. deandreano, ikeano, murnauano, pessoano). I casi in cui nel
derivato la sequenza /ano/ non è preceduta da una vocale, infine, sono rari, e si incontrano
soprattutto con basi che terminano in /a/ atona (floridano, wojtylano). Un modo per interpretare questi dati è considerare che l’esponente della RFP in questione possiede una forma
sottospecificata /Vano/, in cui la posizione vocalica è riempita per default dalla semivocale
/j/, ma può essere riempita da un’altra vocale per ragioni di fedeltà tra la base e il derivato
(o non esserlo affatto se la vocale finale della base è /a/). In una prospettiva del genere,
7
Le osservazioni riportate si riferiscono a un corpus di neologismi in -(i)ano da me raccolto sul
Web tra il 2004 e il 2008.
chiedersi se la vocale che precede /ano/ in deandreano o pessoano ‘appartiene’ alla base o
al suffisso perde gran parte del suo interesse, poiché essa dipende, per l’appunto,
dall’interazione tra la forma della base e quelle possibili per il suffisso.
3.2. Esaustività
Per principio di esaustività intendo riferirmi all’ipotesi secondo cui, in una parola derivata,
tutto il materiale morfologico presente svolge una funzione semantica, contribuendo alla
costruzione del significato dell’insieme. Anche in questo caso, i dati empirici presentano
un quadro ben più complesso. L’esistenza di elementi ‘inerti’ dal punto di vista semantico
in alcuni tipi di derivati è un fatto riconosciuto da tempo. Per il francese, ad esempio, diversi lavori negli ultimi anni hanno messo in luce la tendenza ad utilizzare interfissi per
ragioni fonologiche e prosodiche, come la necessità di evitare sequenze di fonemi simili
troppo ravvicinate, come in goute ‘goccia’ → gout-el-ette ‘gocciolina’ (cf. Plénat 2005;
Roché 2009). In altri casi, la ‘sovrabbondanza’ di sequenze morfologiche semanticamente
vuote sembra avere ragioni puramente stilistico-pragmatiche. In uno studio recente su 329
neologismi del francese che contengono la sequenza finale -logique (Lasserre & Montermini 2013), abbiamo osservato che circa un quarto dei contesti in cui essi apparivano non
era compatibile con i significati generalmente attribuiti all’elemento di origine greca -log(perlopiù ‘ricerca’ o ‘discorso su’). In (2) riporto alcuni risultati di ricerche effettuate sul
Web sui corrispondenti italiani di parole che comparivano nella ricerca menzionata.
(2)
Quando verremo dalle tue parti... ci condurrai in luoghi di perdizione culinaria e birrologica.
[http://www.mmorpgitalia.it/site/printthread.php?t=72208&pp=7&page=3684]
Nessuna lingua che conosco ha la raffinatezza insultologica dell'italiano, e tali possibilità
di espansione creativa...
[http://it.cultura.ateismo.narkive.com/iQF0beeO/aproposito-della-fisica.2]
Il caso meno evidente, ma probabilmente più interessante, è quello in cui tale sovrabbondanza è determinata da pressioni puramente lessicali. Diversi lavori negli ultimi anni hanno
messo in evidenza l’esistenza di quelle che Lindsay / Aronoff (2013: 141-147) definiscono
“morphological niches”: sequenze morfo-fonologiche privilegiate per alcuni tipi di derivati, come -logical in inglese (Lindsay / Aronoff 2013), -aliser / -ariser (Namer 2013) o alité (Roché 2009: 156-158; Koehl 2009) in francese. Proprio questi ultimi esempi mostrano che la possibilità di incontrare sequenze semanticamente vuote è tanto più grande quanto la distanza semantica tra due parole del lessico è piccola, o addirittura inesistente, come
nel caso di un aggettivo di relazione e il suo nome base. In un altro studio, Roché (2007)
spiega le coppie come hégélisme / hégélianisme (‘hegel(ian)ismo’), per cui è difficile trovare una distinzione semantica chiara, sulla base della scarsa carica semantica del suffisso
relazionale -ien, e attribuisce la preferenza osservata, in francese, per la seconda forma a
fattori di altro tipo, in particolare alla grande frequenza di nomi in -ianisme nel lessico filosofico-religioso. Seguendo un spunto suggerito dallo stesso Roché (2007: 55 n. 13), ho
calcolato un campione di forme in -ismo e -esimo derivate da nomi propri rilevate sul Web.
Mentre sembra ragionevole supporre che non esiste una differenza semantica significativa
tra i due suffissi, i dati raccolti, certo preliminari, indicano chiaramente che il primo suffisso tende a legarsi direttamente al nome di base, mentre il secondo preferisce i derivati in
-(i)ano (Tabella 1, le cifre si riferiscono al numero – arrotondato – di pagine Web indicizzate dal motore di ricerca Google, ricerca effettuata in ottobre 2013).
crocismo
crocianismo
crocesimo
crocianesimo
330
76
0
9.400
hegelismo
hegelianismo
hegelesimo
hegelianesimo
22.000
2.700
0
450
manzonismo
manzonianismo
manzonesimo
manzonianesimo
13.000
84
0
51
Tabella 1. Numero di forme in -(ian)ismo e in -(ian)esimo sul Web
Questa distribuzione si spiega, tra l’altro, con la distribuzione globale dei nomi in -ismo e
in -esimo nel lessico dell’italiano. La Figura 2 illustra la percentuale dei lessemi del Gradit
contenenti uno dei due suffissi preceduto da /an/, da /n/ o da un’altra sequenza, e mostra in
maniera chiara l’attrazione reciproca tra -esimo e -(i)ano e la sostanziale indifferenza tra
quest’ultimo e -ismo.
Figura 2. Numero delle forme in -ismo e in -esimo nel Gradit.
3.3. Completezza
Il principio speculare a quello dell’esaustività, visto qui sopra, è quello della completezza,
ossia l’idea che in una parola complessa siano presenti tutti gli elementi che sono necessari
alla costruzione del significato. Anche in questo caso, le eccezioni sono ampie e ben documentate. Migliorini (19572), ad esempio, ha dedicato un intero articolo a quella che definisce la “tendenza a evitare il cumulo dei suffissi” nelle parole derivate, che spiegherebbe
forme come letteratura protestante (‘dei protestanti’) o sociologia criminale (‘che concerne i criminali’) (Migliorini 19572: 140). Altri lavori più recenti hanno messo in luce che
non si tratta di un fenomeno sporadico che tocca singoli lessemi, ma di una proprietà costitutiva di intere serie lessicali. Tale fenomeno può essere messo in relazione con quella che
Booij (2010: 78-79) chiama “regular polysemy”, ossia il fatto che le RFP non formano
necessariamente lessemi con un unico significato, ma oggetti che possono entrare reti lessicali complesse. Un esempio tipico è quello dei derivati etnici. In italiano, ad esempio (ma
cf. anche Roché 2008 sul francese), la RFP che si applica a nomi geografici (soprattutto di
paesi) forma derivati di due categorie lessicali diverse (nomi e aggettivi) e che intrattengono almeno cinque tipi di relazioni diverse con la base.
(3) Ungheria → unghereseN
‘abitante dell’Ungheria’
unghereseA
‘relativo all’Ungheria’ (le città ungheresi)
unghereseN
‘relativo agli ungheresi’ (il carattere ungherese)
unghereseA
‘la lingua dell’Ungheria’
unghereseA
‘relativo alla lingua ungherese’ (i verbi ungheresi)
Un modello puramente incrementale esigerebbe che tutti i tipi di relazioni semanticocategoriali illustrate in (3) fossero marcati esplicitamente. L’elasticità che alcuni lessemi
manifestano per quanto riguarda la categoria e i significati che possono esprimere mi sembra, invece, essere alla base anche di altri casi di ‘riciclaggio’ morfologico, meno sistematici, e perciò meno facili da osservare, ma altrettanto significativi. Pensiamo ad esempio ad
un insieme lessicale come quello che va dal verbo assistere al nome assistenzialità8:
(4)
assistereV
→ assistenteN/A
assistenzialeA
→ assistenzialitàN
→ assistenzaN
→
Nel caso di assistenzialità, che, volendolo glossare per intero, significa all’incirca ‘la proprietà di ciò che è relativo al fatto di assistere’, tutte le relazioni semantiche sono marcate
da un affisso specifico (se si fa astrazione dell’alternanza -Vnte / -Vnza). Altri lessemi,
tuttavia, sono ambigui, ad esempio aderenza che può indicare sia il fatto di aderire che la
proprietà di ciò che è aderente (cf. i pneumatici stanno perdendo aderenza vs. migliorare
l’aderenza dei pneumatici9). Gli esempi di (5) mi sembrano corrispondere a casi in cui i
locutori sfruttano questa ambiguità per esprimere significati complessi ‘economizzando’ i
mezzi espressivi impiegati.
(5)
La produzione basata sulla concorrenza del prezzo tende a tagliare i costi sostenuti dalla
produzione basata sulla qualità.
[http://www.orovero.it/articoli/inasprimento%20della%20crisi%20agricola%20nazionale.a
sp?titolo=inasprimento%20della%20crisi%20agricola%20nazionale]
8
Una ricerca effettuata su Google il 29 ottobre 2013 fornisce circa 1.500 attestazioni di assistenzialità.
9
Sul suffisso -Vnza cf. in particolare Gaeta (2002: 127-148).
Lascia stare l’accoglienza degli italiani che è relativa (infatti magari un romano o un napoletano può essere più allegro ed accogliente di un milanese o valdostano).
[http://it.answers.yahoo.com/question/index?qid=20090316115831AAH2hS2]
Le parole in -Vnza negli esempi qui sopra denotano chiaramente più delle proprietà che
delle azioni, ed in questo senso sono semanticamente più simili ad assistenzialità che ad
assistenza benché con quest’ultimo lessema condividano la struttura morfologica.
Gli esempi citati, infine, nonché quelli riportati in precedenza in (1) e (2), mostrano
un’altra falla di molti studi morfologici tradizionali, quella che chiamerei l’ipotesi
dell’autosufficienza, ossia l’idea che l’osservazione di un certo numero di derivati in isolamento (ad esempio tratti da un dizionario) sia sufficiente per caratterizzare con precisione l’insieme delle proprietà semantiche definite da una RFP. I dati di (5), invece, indicano
chiaramente che solo prendendo in considerazione il contesto sintattico è possibile avere
un’idea chiara della diversità degli usi di una classe di derivati, e se tale diversità è sistematica o occasionale.
4. Conclusione: dalle regole ai modelli
Per ovviare al carattere eccessivamente rigido e deterministico delle regole, molti modelli
di morfologia preferiscono oggi analizzare le relazioni lessicali piuttosto in termini di
schemi o modelli (in inglese patterns). Una caratteristica della morfologia basata sulle regole è quella di stabilire distinzioni binarie e discrete. Dal punto di vista delle unità lessicali, ciò significa distinguere, in esse, le proprietà determinate dalla regola, per definizione
interamente prevedibili, da quelle idiosincratiche, che sono invece attribuite ad altri fattori,
pragmatici, storici, etc., generalmente meno controllabili. Dal punto di vista dei procedimenti stessi, ciò significa distinguere la nozione di regola, un meccanismo la cui applicazione è automatica e che ha un alto grado di generalità, da quella di analogia, che corrisponde piuttosto ad una relazione locale tra singole coppie (o piccoli gruppi) di parole. In
questa prospettiva, ad esempio, parole come saltazionale o avvodkazzato, citate in (1) sarebbero considerate formate per analogia piuttosto che per regola. Eppure, come osservano
Blevins / Blevins (2009: 10), “a rule can be understood as a highly general analogy”. La
differenza tra i due concetti sarebbe, secondo questo punto di vista, più quantitativa che
qualitativa, ma la loro natura è identica, si tratta cioè di schemi che emergono dalle corrispondenze rilevabili tra gli elementi lessicali (per un modello recente della morfologia ba-
sato sull’idea di corrispondenza cf. Spencer 2013). Il concetto stesso di corrispondenza,
poi, è graduabile, poiché due lessemi possono essere in corrispondenza per uno o più dei
diversi livelli che li definiscono (fonologico, sintattico-categoriale, semantico, ma anche –
come abbiamo visto – puramente lessicale). L’impressione di avere a che fare con una regola si ha, allora, quando una serie di corrispondenze lessicali è talmente sistematica e generalizzata da sembrare automatica; in realtà, nessuna corrispondenza è talmente generale
da avere il carattere di obbligatorietà che, per definizione, dovremmo attribuire ad una regola. Se per regola intendiamo un’operazione che, dato un input adeguato, si applica automaticamente per fornire un output univoco e prevedibile (cf. anche Lenci, questo volume),
siamo costretti ad ammettere che in morfologia non esistono regole. Persino un fenomeno
che è spesso considerato come il prototipo della ‘regola’ morfologica, la costruzione del
plurale dei nomi in inglese (cf. Pinker 1999: 171-187), non è interamente regolare e conosce un certo numero di eccezioni, dovute perlopiù ad accidenti storici. Possiamo considerare, infatti, che la morfologia è costitutivamente irregolare a causa degli oggetti che manipola: le parole non sono unità linguistiche inerti, ma costituiscono l’interfaccia tra la lingua e
la conoscenza del mondo (cf. Aronoff 2007: 813-814), e di conseguenza sono, per definizione, soggette a qualsiasi tipo di influenza extralinguistica, storica, sociale, pragmatica,
etc. In conclusione, per superare la dicotomia regolare / irregolare, almeno nell’ambito
della morfologia derivazionale, possiamo considerare che lo scopo principale della teoria
non deve essere quello di elaborare principi che permettano di tracciare una linea netta tra
dati di due tipi, quanto piuttosto quello di costruire, tramite parametri espliciti, uno spazio
all’interno del quale i dati realmente osservati possono essere valutati10.
Bibliografia
Aronoff M. (1976), Word Formation in Generative Grammar, Cambridge, Ma, MIT Press.
Aronoff M. (2007), In the beginning was the word, “Language” 83.4, 803-829.
Blevins J.P. (2006), Word-based morphology, “Journal of Linguistics” 42, 531-573.
Blevins J.P. / Blevins J. (2009), Introduction: Analogy in grammar, in J.P. Blevins / J.
Blevins (eds.) (2009), Analogy in Grammar, Oxford, Oxford University Press, 1-12.
Booij G. (2010), Construction Morphology, Oxford, Oxford University Press.
10
Questa concezione ricorda quella della morfologia canonica, un modello elaborato principalmente per trattare la morfologia flessiva (cf. Corbett 2007 e, per un’applicazione alla morfologia derivazionale, Corbett 2010).
Corbett G.G. (2007), Canonical typology, suppletion and possible words, “Language”
83.1, 9-42.
Corbett G.G. (2010), Canonical derivational morphology, “Word Structure” 3.2, 141-155.
Crystal D. (20062), Language and the Internet, Cambridge, Cambridge University Press.
Dal G. / Namer F. (2012), Faut-il brûler les dictionnaires? Ou comment les ressources
numériques ont révolutionné les recherches en morphologie, in: F. Neveu et al. (eds.),
3e Congrès Mondial de Linguistique Française. Lyon, 4-7 juillet 2012, Paris, Institut de
Linguistique Française, 1261-1276.
Fradin B. / Kerleroux F. / Plénat M. (2009) (eds.), Aperçus de morphologie du français,
Saint-Denis, Presses Universitaires de Vincennes.
Gaeta L. (2002), Quando i verbi compaiono come nomi. Un saggio di morfologia naturale,
Milano, FrancoAngeli.
Gradit: De Mauro T. (ed.), (1999), Grande dizionario italiano dell’uso, Torino, Utet.
Hall M. (1973), Prolegomena to a theory of word formation, “Linguistic Inquiry” 4.1, 316.
Hathout N. / Montermini F. / Tanguy L. (2008), Extensive data for morphology: Using the
World Wide Web, “Journal of French Language Studies” 18.1, 67-85.
Hathout N. / Montermini F. / Tseng J. (eds.) (2013), Morphology in Toulouse. Selected
Proceedings of Décembrettes 7, München, Lincom Europa.
Hathout N. / Namer F. / Plénat M. / Tanguy L. (2009), La collecte et l’utilisation des données en morphologie, in: Fradin / Kerleroux / Plénat (eds.) (2009), 267-287.
Jackendoff R. (1975), Morphological and semantic regularities in the lexicon, “Language”
51.3, 639-671.
Kilgariff A. (2007), Googleology is bad science, “Computational Linguistics” 33.1, 147151.
Koehl A. (2009), Are French -ité suffixed nouns property nouns?, in: F. Montermini, G.
Boyé, J. Tseng (eds.), Selected Proceedings of the 6th Décembrettes. Morphology in
Bordeaux, Somerville, Ma, Cascadilla Press, 95-110.
Lasserre M. / Montermini F. (2013), Neoclassical compounds as relational adjectives, comunicazione presentata al 9th Mediterranean Morphology Meeting, Dubrovnik, 15-18
settembre 2013.
Lasserre M. / Montermini F. (in stampa), Une approche distributionnelle pour l’analyse
des composés néoclassiques, “Verbum”.
Lindsay M. / Aronoff M. (2013), Natural selection in self-organizing morphological
systems, in: Hathout / Montermini / Tseng (eds.) (2013), 133-153.
Lüdeling A. / Evert S. / Baroni M. (2007), Using Web data for linguistic purposes, in: M.
Hundt, N. Nesselhauf, C. Biewer (eds.), Corpus Linguistics and the Web, Amsterdam –
New York, Rodopi, 7-24.
Migliorini B. (19572), Sulla tendenza a evitare il cumulo dei suffissi nella formazione degli
aggettivi, in: B. Migliorini (1957), Saggi linguistici, Firenze, Le Monnier, 135-147.
Montermini F. (2010a), The lexical representation of nouns and adjectives in Romance
languages, “Recherches linguistiques de Vincennes” 39, 135-162.
Montermini F. (2010b), La morphophonologie de l’italien: une approche lexicaliste, tesi di
habilitation à diriger des recherches, Toulouse, Université de Toulouse le Mirail.
Montermini F. / Bonami O. (in stampa), Stem spaces and predictability in verbal inflection, “Lingue e Linguaggio”.
Namer F. (2013), Adjectival bases of French -aliser and -ariser verbs: Syncretism or under-specification?, in: Hathout / Montermini / Tseng (eds.) (2013), 185-210.
Pinker S. (1999), Words and Rules. The Ingredients of Language, London, Weidenfeld &
Nicholson.
Pirrelli V. / Battista M. (2000), The paradigmatic dimension of stem allomorphy in Italian
verb inflection, “Rivista di Linguistica” 12.2, 307-380.
Plénat M. (2005), Rosinette, cousinette, putinette, starlinette, chipinette. Décalage, infixation et épenthèse devant -ette, in: I. Choi-Jonin / M. Bras / A. Dagnac / M. Rouquier
(eds), Questions de classification en linguistique: méthodes et descriptions. Mélanges
offerts au Professeur Christian Molinier, Bern, Peter Lang, 275-298.
Rainer F. (2012), Morphological metaphysics: virtual, potential, and actual words, “Word
Structure” 5.2, 165-182.
Roché M. (2007), Logique lexicale et morphologie: la dérivation en -isme, in: F. Montermini / G. Boyé / N. Hathout (eds.), Selected Proceedings of the 5th Décembrettes. Morphology in Toulouse, Somerville, Ma, Cascadilla Press, 45-58.
Roché M. (2008), Structuration du lexique et principe d’économie: le cas des ethniques,
in: J. Durand / B. Habert / B. Laks (eds.), Congrès Mondial de Linguistique Française,
Paris, 9-12 juillet 2008, Paris, Institut de Linguistique Française, 1571-1585.
Roché M. (2009), Un ou deux suffixes? Une ou deux suffixations?, in: Fradin / Kerleroux /
Plénat (eds.) (2009), 143-173.
Scalise S. (1999), Rappresentazione degli affissi, in: P. Benincà / L. Vanelli / A. Mioni
(eds.) (1999), Fonologia e morfologia dell’italiano e dei dialetti d’Italia. Atti del XXXI
Congresso della Società di Linguistica Italiana, Roma, Bulzoni, 453-481.
Spencer A. (2013), Lexical Relatedness. A Paradigm-Based Model, Oxford, Oxford
University Press.
Stump G.T. (2001), Inflectional Morphology. A Theory of Paradigm Structure, Cambridge,
Cambridge University Press.
Scarica

REGOLE (E IRREGOLARITÀ) NELLA FORMAZIONE - CLLE-ERSS