REGOLE (E IRREGOLARITÀ) NELLA FORMAZIONE DELLE PAROLE Fabio Montermini CLLE-ERSS, CNRS e Université de Toulouse 1. Introduzione La rinascita della morfologia che ha avuto luogo a partire dagli anni Settanta del secolo scorso ha avuto nella nozione di regola uno dei suoi cardini fondamentali. Largamente ispirate al paradigma generativista, le regole della morfologia derivazionale, nella loro versione originaria, consistevano principalmente in una serie di operazioni atte ad ottenere un determinato risultato a partire da uno o più input1. La prima formulazione del concetto di ‘Regola di Formazione di Parola’ (RFP, in inglese Word-Formation Rule) è quella di Halle (1973), ma trattamento più completo è quello proposto da Aronoff (1976), il quale ha contribuito a rendere popolare una nozione che, con vari adattamenti, è alla base di gran parte delle teorie morfologiche attuali2. Come vedremo in particolare nel § 3, la natura deterministica delle RFP, nella loro forma originaria, è fortemente problematica quando tale nozione è applicata ad un ambito, quello lessicale, che è per sua natura aleatorio e ampiamente condizionato da fattori extralinguistici. L’interazione tra le regole e il lessico, attestato o possibile, è stato in effetti uno dei principali temi di dibattito per i morfologi negli ultimi decenni (cf., per una disamina recente, Rainer 2012). L’evoluzione tecnologica degli ultimi decenni, poi, consentendo l’accesso in tempi rapidissimi a quantità di dati linguistici fino a pochi anni prima inimmaginabili, ha reso sempre più difficile derubricare gli esempi problematici a eccezioni o casi marginali. Allo status dei dati in morfologia derivazionale, e in particolare ai cambiamenti apportati dalle nuove tecnologie a questo campo d’indagine linguistica, è dedicato il § 2. Per limitarsi a qualche esempio recente, attualmente, è tutt’altro che raro imbattersi in esempi come i seguenti che, sotto diversi aspetti, sono incompatibili con le RFP nella loro forma tradizionale. (1) 1 Nella classificazione proposta da Berruto (questo volume), si tratta di regole del tipo (iii), regole come ‘istruzioni’. 2 Si veda anche Jackendoff (1975) per una concezione delle regole morfologiche come regole di ridondanza che è decisamente più attuale, benché all’epoca la concezione delle relazioni lessicali che ne emerge avesse riscosso assai meno successo. a. Il meccanismo ‘variazionale’ dell’evoluzione (contrapposto a quello ‘trasformazionale’ lamarckiano e a quello ‘saltazionale’ che fu dei primi genetisti) si applica per Darwin solo a livello dei singoli organismi. [T. Pievani, Evoluzione delle specie, evoluzione delle lingue: affinità, interazioni e cautele, in: N. Grandi (ed.), Dialoghi sulle lingue e sul linguaggio, Bologna, Pàtron, 2011, p. 63] b. Meglio arrivarci in land rover con (pochi) altri appassionati delle stesse cose [...] piuttosto che accalcarsi in un viaggio organizzato in pulmini coi soliti caciaroni russi avvodkazzati. [http://it.cultura.single.narkive.com/7KdgqlfO/vacanze-all-isola-di- rodi] In (1a), l’aggettivo saltazionale (che appartiene al vocabolario della teoria dell’evoluzione) è apparentemente deviante, dal momento che sembra contenere un suffisso -zione, benché in italiano non sia attestato il nome deverbale *saltazione costruito sul verbo saltare. (1b), dal canto suo, contiene una forma ancora meno ‘regolare’: l’aggettivo avvodkazzato è perfettamente comprensibile da un parlante italiano, anche in virtù del suo legame evidente con il nome vodka, ma è difficile identificare con precisione gli affissi che contiene e la regola (o le regole) per mezzo della quale è stato costruito. In effetti, per spiegare la forma e il significato di questa parola sembrerebbe più utile ricorrere ad una relazione individuale – che potremmo definire di analogia (cf. il § 4) – con l’aggettivo avvinazzato, escludendo così la possibilità che si possa trattare di una ‘regola’. Nel tentativo di rendere conto in maniera più realistica dei dati realmente osservati, diversi modelli morfologici hanno proposto, in anni più recenti, di abbandonare o di modulare il concetto di regola in favore di nozioni meno rigide, come quella di schema, o modello. A differenza delle regole, i modelli prevedono gradi diversi di applicabilità, non implicano necessariamente l’isomorfia tra forma e senso di una parola complessa, dal momento che l’istruzione semantica è inglobata nel modello stesso, e non sono elaborati indipendentemente dalle parole che li esemplificano, ma al contrario emergono dal lessico esistente. Come vedremo, l’esistenza di lessemi devianti per una o più proprietà, problematica per una morfologia basata sulle regole, è più compatibile con una morfologia basata sui modelli. Ciò implica anche un cambiamento importante del punto di vista che il linguista adotta nei confronti dei dati: la preoccupazione principale non è più quella di identificare, nel lessico, gli elementi ‘centrali’ da quelli ‘devianti’, ma piuttosto quella di rendere esplicite le proprietà che rendono i lessemi complessi realmente osservati più o meno aderenti ai modelli identificati. Nel § 4, in particolare, discuterò di come la nozione di modello o schema, più flessibile di quella di regola, appaia più adatta a trattare il lessico effettivamente osservabile. 2. Lo status dei dati in morfologia derivazionale Fino a qualche decennio fa, lo studioso che si occupasse di lessico o di morfologia derivazionale aveva a sua disposizione, come fonte di dati, principalmente le opere lessicografiche (dizionari generalisti o specialistici), qualche raro corpus (ad esempio letterario), oltre che, naturalmente, la sua intuizione o quella degli altri parlanti nativi della lingua. Fino alla metà degli anni Novanta, gran parte dei lavori di morfologia erano basati su queste risorse, il che non ha impedito la realizzazione di studi empirici anche su larga scala. La maggior parte di questi studi si basa, appunto, su dati lessicografici, prendendo in considerazione, ad esempio, l’insieme delle parole costruite mediante lo stesso procedimento contenute in uno o più dizionari. L’uso dei dati lessicografici, tuttavia, è rischioso, soprattutto nel caso in cui si vogliano studiare proprietà, come quelle semantiche, difficilmente oggettivabili e per le quali, per così dire, il fattore umano – in questo caso le scelte operate dal compilatore o dai compilatori del dizionario – ha una parte preponderante. L’evoluzione degli strumenti informatici e la loro diffusione hanno, da questo punto di vista, apportato un cambiamento decisivo agli studi linguistici in generale, e morfologici e lessicologici in particolare. Non solo molti dizionari sono stati resi disponibili in formato elettronico, rendendo le ricerche molto più agevoli e rapide, ma hanno cominciato ad essere realizzati e diffusi corpora e altre risorse sempre più grandi e diversificati, al punto che oggi avere una solida base empirica è una caratteristica quasi imprescindibile per qualsiasi lavoro di morfologia, in particolare derivazionale, perlomeno nelle lingue a più ampia diffusione. Un ulteriore impulso a questa tendenza, poi, è venuto, ovviamente, da Internet e dalla sua democratizzazione attraverso il Web3. Oggi un linguista può avere accesso, quasi istantaneamente, a un numero virtualmente infinito di produzioni linguistiche in varie lin 3 Nonostante Internet e il World Wide Web costituiscano due oggetti distinti, solo parzialmente sovrapponibili, quest’ultimo coincide con la parte più visibile e conosciuta di Internet, tanto che le due realtà sono spesso confuse nel senso comune. Pur tenendo presente questa distinzione, qui i termini Internet e (World Wide) Web sono usati come sostanzialmente sinonimi. gue diverse, la maggior parte delle quali reali. Naturalmente, l’uso di Internet come database richiede un certo numero di cautele, ma è innegabile che, dal punto di vista della ricerca dei dati in linguistica, esso ha costituito una vera e propria rivoluzione, sia quantitativa che qualitativa. Per dare un’idea dell’evoluzione che Internet ha reso possibile per gli studi lessicali, riporto nella Figura 1 i dati relativi a un lavoro recente sull’elemento di composizione neoclassica -cida/-cidio in italiano (Lasserre / Montermini in st.). Il grafico mostra il numero di forme reperite nel Gradit, nel corpus CorIs4 e quelle che è stato possibile ricavare da una serie di ricerche estensive (ma necessariamente non esaustive) sul Web tra il dicembre 2012 e il giugno 2013. Figura 1: numero di forme in -cida e -cidio in diverse risorse linguistiche Certo, è del tutto possibile che per altri settori della morfologia derivazionale l’incremento nel numero dei dati che Internet rende disponibili sia meno spettacolare, ma esso è comunque notevole, come hanno messo in luce un certo numero di lavori realizzati in anni recenti (cf. ad esempio Hathout / Namer / Plénat / Tanguy 2009 per una visione d’insieme di lavori di questo tipo). È evidente che un cambiamento di scala di questa portata, per qualsiasi disciplina scientifica, non può non avere conseguenze importanti, dal punto di vista empirico, sulla finezza e sul grado di dettaglio che è possibile ottenere con le analisi, e, dal punto di vista teorico, sulle basi epistemologiche e sulle nozioni impiegate. Tuttavia, il Web viene ancora utilizzato da molti linguisti come una risorsa tradizionale, semplicemente più grande e veloce. Il risultato è che, da un lato, gran parte delle sue po 4 http://corpora.dslo.unibo.it/ coris_ita.html. tenzialità vengono ignorate o non pienamente sfruttate, e dall’altro vengono trascurate le precauzioni che è necessario adottare quando ci si serve di uno strumento che, per dimensioni e caratteristiche, non è comparabile ad alcuna delle risorse linguistiche che gli preesistevano. Nell’ambito della linguistica computazionale il “Web as a corpus” è ormai un ambito di ricerca a tutti gli effetti, e tuttavia l’attitudine di molti linguisti nei confronti di Internet continua a riflettere quella più generale, che oscilla tra l’entusiasmo incondizionato e il rigetto totale. Un uso indiscriminato dei dati del Web presenta certamente diversi aspetti problematici, alcuni dei quali sono ben descritti in letteratura5 e suggeriscono una certa cautela nell’impiego dei dati che è possibile ottenerne. Tuttavia, in mancanza di una risorsa comparabile – almeno quantitativamente – al Web, che non ne presenti gli inconvenienti, è chiaro che esso è diventato insostituibile al giorno d’oggi per chi si interessi alla creatività lessicale. Proprio la varietà che il Web ci offre invita a riconsiderare radicalmente l’atteggiamento dei linguisti nei confronti dei dati: piuttosto che oscillare tra il prescrittivismo rigido, che spinge a rifiutare in blocco l’uso di dati obiettivamente poco controllabili, e il relativismo assoluto, secondo cui qualsiasi forma, purché attestata, merita di essere considerata sullo stesso piano delle altre, è indubbiamente più utile elaborare criteri espliciti per valutare i dati reali in relazione all’insieme del lessico e delle generalizzazioni che esso rende possibili. Lo scopo della teoria, cioè, non deve essere quello di selezionare i dati, attribuendo loro etichette di accettabilità o non accettabilità – un atteggiamento che ricorda troppo da vicino quello della grammatica prescrittivistica per essere scientificamente credibile – quanto piuttosto quello di costruire uno spazio concettuale all’interno del quale collocare l’osservabile, in questo caso le forme realmente create dai parlanti, in base a principi che possono essere considerati generali. Infine, è utile sottolineare un’ulteriore differenza, questa volta più qualitativa che quantitativa, tra il Web e le risorse linguistiche che lo hanno preceduto: grazie anche alle sue caratteristiche sociolinguistiche, Internet consente, più di ogni altro strumento, di avere accesso a tutte quelle forme che sono costruite dai locutori ‘al momento’ (in inglese si direbbe on-line), che, come sa chi ha una certa pratica di questo genere di ricerche, sono assai difficili da reperire anche in corpora di grandissime dimensioni. Ciò include sia parole create in maniera cosciente (neologismi, occasionalismi, for 5 Cf., tra gli altri, Kilgariff (2007); Lüdeling / Evert / Baroni (2007); Hathout / Montermini / Tan- guy (2008); Dal / Namer (2012) e, per una panoramica più generale degli aspetti linguistici legati a Internet, Crystal (20062). mazioni scherzose) che inconscia (lapsus, ‘errori’ morfologici); alcune di queste possiedono tutte le proprietà per poter diventare item lessicali a pieno titolo, altre trovano la loro ragione di esistere unicamente nella situazione discorsiva all’interno della quale sono state prodotte. Paradossalmente, è soprattutto a partire da questi dati spontanei che possiamo costruire un modello credibile della competenza morfologico-derivazionale dei parlanti. Si tratta, in effetti, di parole che non hanno subito gli stessi fenomeni di erosione, stratificazione o slittamento semantico cui è sottoposto il lessico attestato, istituzionalizzato (e di conseguenza dizionarizzato). In altre parole si tratta, per usare un termine alla moda in linguistica, di dati più ‘ecologici’. 3. Proprietà delle regole di formazione di parola Nella loro versione originaria, le RFP erano meccanismi rigidi che possedevano la doppia caratteristica di essere selettive e deterministiche. Selettive, perché ogni regola definisce in maniera univoca e discreta l’insieme degli input possibili (nel caso della morfologia derivazionale, dei lessemi base) e di quelli impossibili. Deterministiche, perché, dato un certo input, esiste un solo output accettabile, il quale è dotato di caratteristiche che sono interamente prevedibili. La possibilità che un lessema possa costituire un input più o meno adeguato per una regola non è contemplata, così come non lo è quella che una regola possa avere più di un output possibile o che quest’ultimo non possegga tutte le proprietà previste dalla regola. Eppure, come vedremo, i dati lessicali pullulano di esempi che contraddicono questi principi. Per quanto riguarda la prevedibilità dell’output, in particolare, essa si basa sull’ipotesi, mutuata dalla sintassi, della composizionalità, secondo cui è possibile determinare il significato di un’espressione linguistica a partire dal significato degli elementi che la costituiscono. Applicare tale principio al livello lessicale significa considerare che il significato di una parola complessa è calcolabile a partire dalle istruzioni semantiche legate alle diverse sottoparti che è possibile identificare (ad esempio radici o affissi). La morfologia che ne deriva è insieme additiva (o incrementale, per usare il termine di Stump 2001), poiché l’interpretazione semantica si costruisce in concomitanza con la struttura morfologica, e orientata, dal momento che la costruzione delle parole procede dal più semplice al più complesso attraverso la concatenazione successiva di segmenti. In realtà, esistono abbondanti argomenti, teorici ed empirici, che vanno contro ciascuno dei due aspetti. Per quanto riguarda il secondo, ad esempio, è addirittura banale opporre all’idea di una morfologia che procederebbe sempre dal semplice al complesso esempi di parole che presentano lo stesso grado di complessità e che sono, tuttavia, morfologicamente legate. Si pensi, ad esempio, alla conversione o a insiemi di parole come catechismo, catechista, catechizzare, per i quali è oggettivamente impossibile trovare una sequenzialità, se non al prezzo di astrazioni teoriche che restano arbitrarie. Per quanto riguarda il primo aspetto, invece, la pertinenza di una morfologia puramente incrementale è già stata ampiamente criticata, sia per quanto riguarda la flessione (cf. lo stesso Stump 2001: cap. 1; Blevins 2006), che la derivazione (cf. in particolare Aronoff 2007). A sua volta, l’ipotesi della composizionalità si basa sull’idea che tutto ciò che, nel significato di una parola morfologicamente complessa, non è immediatamente prevedibile a partire dalle RFP derivi dalla sua permanenza nel lessico, la quale favorisce i fenomeni di slittamento semantico, metaforizzazione, etc. In realtà, tale concezione attribuisce un peso notevole – e a mio avviso eccessivo – al fattore tempo nella costruzione del significato. L’arbitrarietà dei segni linguistici, infatti, è un elemento costitutivo del linguaggio, e in quanto tale deve essere considerata come valida, in qualsiasi momento, per tutte le parole di una lingua, gli elementi che costituiscono l’interfaccia tra la lingua e la conoscenza del mondo (cf. Aronoff 2007: 813-814)6. Nel seguito di questo paragrafo prenderò in considerazione alcuni degli aspetti problematici dell’ipotesi della composizionalità, legati in particolare ad alcuni corollari che chi la adotta deve necessariamente, implicitamente o esplicitamente, accettare, quelli che chiamerei il principio della segmentabilità (§ 3.1), dell’esaustività (§ 3.2), della completezza (§ 3.3) delle parole complesse. 3.1. Segmentabilità Attribuire una porzione discreta di significato alle varie sottoparti di una parola complessa significa considerare che, dal punto di vista formale, esse sono sempre chiaramente distinguibili e che ogni unità elementare del piano formale (fonema) può essere attribuita univocamente all’una o all’altra di queste sottoparti. La difficoltà (e forse la vanità) di una tale operazione, tuttavia, dovrebbe già essere chiara ai morfologi da tempo, data la longevità di domande come “in amministrazione il suffisso sarà -azione, -zione o -ione?” (Scalise 1999: 457), nonché la sostanziale impossibilità di trovar loro una risposta univoca e convincente. 6 Per un’esemplificazione rimando a Montermini (2010b: 80-82), in cui ho preso in considerazione un certo numero di significati attestati per un lessema non istituzionalizzato, ma apparentemente trasparente, poltronista. Oggi è abbastanza consensuale l’idea che ogni elemento lessicale (includendo gli esponenti delle RFP, ossia gli affissi) non deve necessariamente possedere una forma di base dalla quale far derivare tutte le altre, ma può consistere in un insieme di forme la cui variazione è più o meno motivata fonologicamente, e per le quali i locutori conoscono, in base alla loro competenza morfologico-lessicale, i contesti appropriati nei quali debbono essere usate. Se, tuttavia, esistono diversi lavori volti a caratterizzare la rappresentazione dei lessemi come ‘collezioni’ di temi distinti (cf., specificamente per l’italiano, Pirrelli / Battista 2000; Montermini / Bonami in st.), la variazione degli affissi, ugualmente interessante, è assai meno studiata in quest’ottica. In Montermini (2010a), ad esempio, ho proposto una gerarchizzazione delle forme dell’esponente della RFP che costruisce i nomi d’azione come amministrazione, forme che vanno da /atːsjone/ (che può essere considerata come quella di default) a quelle contenenti una consonante sonorante (come in conversione, espulsione, etc.). Un altro caso interessante è quello del suffisso -(i)ano in italiano, che può legarsi praticamente ad ogni nome proprio o toponimo per formare un aggettivo di relazione e può contenere o meno una semivocale /j/. Esistono buoni argomenti per sostenere che la forma di default attuale per questo suffisso è /jano/, poiché è quella che si osserva con la maggioranza dei derivati da nomi propri e da toponimi stranieri (che possiamo considerare, in generale, di formazione più recente rispetto agli etnici costruiti su toponimi italiani) contenuti nei dizionari. I dati neologici7, poi, mostrano che la forma /jano/ è largamente preponderante, se non l’unica scelta, quando la base non presenta particolari problemi fonologici (finale in /a/ o /o/ semplici non accentate o in consonante: calcuttiano, hannoveriano), mentre /j/ tende a non essere presente soprattutto con basi che terminano con una sequenza poco comune in italiano (una vocale accentata, una /e/ o una /u/ atone, uno iato, un dittongo), tutti casi in cui la vocale (o una delle vocali) della base tende ad apparire nel derivato, spesso a discapito della /j/ (cf. deandreano, ikeano, murnauano, pessoano). I casi in cui nel derivato la sequenza /ano/ non è preceduta da una vocale, infine, sono rari, e si incontrano soprattutto con basi che terminano in /a/ atona (floridano, wojtylano). Un modo per interpretare questi dati è considerare che l’esponente della RFP in questione possiede una forma sottospecificata /Vano/, in cui la posizione vocalica è riempita per default dalla semivocale /j/, ma può essere riempita da un’altra vocale per ragioni di fedeltà tra la base e il derivato (o non esserlo affatto se la vocale finale della base è /a/). In una prospettiva del genere, 7 Le osservazioni riportate si riferiscono a un corpus di neologismi in -(i)ano da me raccolto sul Web tra il 2004 e il 2008. chiedersi se la vocale che precede /ano/ in deandreano o pessoano ‘appartiene’ alla base o al suffisso perde gran parte del suo interesse, poiché essa dipende, per l’appunto, dall’interazione tra la forma della base e quelle possibili per il suffisso. 3.2. Esaustività Per principio di esaustività intendo riferirmi all’ipotesi secondo cui, in una parola derivata, tutto il materiale morfologico presente svolge una funzione semantica, contribuendo alla costruzione del significato dell’insieme. Anche in questo caso, i dati empirici presentano un quadro ben più complesso. L’esistenza di elementi ‘inerti’ dal punto di vista semantico in alcuni tipi di derivati è un fatto riconosciuto da tempo. Per il francese, ad esempio, diversi lavori negli ultimi anni hanno messo in luce la tendenza ad utilizzare interfissi per ragioni fonologiche e prosodiche, come la necessità di evitare sequenze di fonemi simili troppo ravvicinate, come in goute ‘goccia’ → gout-el-ette ‘gocciolina’ (cf. Plénat 2005; Roché 2009). In altri casi, la ‘sovrabbondanza’ di sequenze morfologiche semanticamente vuote sembra avere ragioni puramente stilistico-pragmatiche. In uno studio recente su 329 neologismi del francese che contengono la sequenza finale -logique (Lasserre & Montermini 2013), abbiamo osservato che circa un quarto dei contesti in cui essi apparivano non era compatibile con i significati generalmente attribuiti all’elemento di origine greca -log(perlopiù ‘ricerca’ o ‘discorso su’). In (2) riporto alcuni risultati di ricerche effettuate sul Web sui corrispondenti italiani di parole che comparivano nella ricerca menzionata. (2) Quando verremo dalle tue parti... ci condurrai in luoghi di perdizione culinaria e birrologica. [http://www.mmorpgitalia.it/site/printthread.php?t=72208&pp=7&page=3684] Nessuna lingua che conosco ha la raffinatezza insultologica dell'italiano, e tali possibilità di espansione creativa... [http://it.cultura.ateismo.narkive.com/iQF0beeO/aproposito-della-fisica.2] Il caso meno evidente, ma probabilmente più interessante, è quello in cui tale sovrabbondanza è determinata da pressioni puramente lessicali. Diversi lavori negli ultimi anni hanno messo in evidenza l’esistenza di quelle che Lindsay / Aronoff (2013: 141-147) definiscono “morphological niches”: sequenze morfo-fonologiche privilegiate per alcuni tipi di derivati, come -logical in inglese (Lindsay / Aronoff 2013), -aliser / -ariser (Namer 2013) o alité (Roché 2009: 156-158; Koehl 2009) in francese. Proprio questi ultimi esempi mostrano che la possibilità di incontrare sequenze semanticamente vuote è tanto più grande quanto la distanza semantica tra due parole del lessico è piccola, o addirittura inesistente, come nel caso di un aggettivo di relazione e il suo nome base. In un altro studio, Roché (2007) spiega le coppie come hégélisme / hégélianisme (‘hegel(ian)ismo’), per cui è difficile trovare una distinzione semantica chiara, sulla base della scarsa carica semantica del suffisso relazionale -ien, e attribuisce la preferenza osservata, in francese, per la seconda forma a fattori di altro tipo, in particolare alla grande frequenza di nomi in -ianisme nel lessico filosofico-religioso. Seguendo un spunto suggerito dallo stesso Roché (2007: 55 n. 13), ho calcolato un campione di forme in -ismo e -esimo derivate da nomi propri rilevate sul Web. Mentre sembra ragionevole supporre che non esiste una differenza semantica significativa tra i due suffissi, i dati raccolti, certo preliminari, indicano chiaramente che il primo suffisso tende a legarsi direttamente al nome di base, mentre il secondo preferisce i derivati in -(i)ano (Tabella 1, le cifre si riferiscono al numero – arrotondato – di pagine Web indicizzate dal motore di ricerca Google, ricerca effettuata in ottobre 2013). crocismo crocianismo crocesimo crocianesimo 330 76 0 9.400 hegelismo hegelianismo hegelesimo hegelianesimo 22.000 2.700 0 450 manzonismo manzonianismo manzonesimo manzonianesimo 13.000 84 0 51 Tabella 1. Numero di forme in -(ian)ismo e in -(ian)esimo sul Web Questa distribuzione si spiega, tra l’altro, con la distribuzione globale dei nomi in -ismo e in -esimo nel lessico dell’italiano. La Figura 2 illustra la percentuale dei lessemi del Gradit contenenti uno dei due suffissi preceduto da /an/, da /n/ o da un’altra sequenza, e mostra in maniera chiara l’attrazione reciproca tra -esimo e -(i)ano e la sostanziale indifferenza tra quest’ultimo e -ismo. Figura 2. Numero delle forme in -ismo e in -esimo nel Gradit. 3.3. Completezza Il principio speculare a quello dell’esaustività, visto qui sopra, è quello della completezza, ossia l’idea che in una parola complessa siano presenti tutti gli elementi che sono necessari alla costruzione del significato. Anche in questo caso, le eccezioni sono ampie e ben documentate. Migliorini (19572), ad esempio, ha dedicato un intero articolo a quella che definisce la “tendenza a evitare il cumulo dei suffissi” nelle parole derivate, che spiegherebbe forme come letteratura protestante (‘dei protestanti’) o sociologia criminale (‘che concerne i criminali’) (Migliorini 19572: 140). Altri lavori più recenti hanno messo in luce che non si tratta di un fenomeno sporadico che tocca singoli lessemi, ma di una proprietà costitutiva di intere serie lessicali. Tale fenomeno può essere messo in relazione con quella che Booij (2010: 78-79) chiama “regular polysemy”, ossia il fatto che le RFP non formano necessariamente lessemi con un unico significato, ma oggetti che possono entrare reti lessicali complesse. Un esempio tipico è quello dei derivati etnici. In italiano, ad esempio (ma cf. anche Roché 2008 sul francese), la RFP che si applica a nomi geografici (soprattutto di paesi) forma derivati di due categorie lessicali diverse (nomi e aggettivi) e che intrattengono almeno cinque tipi di relazioni diverse con la base. (3) Ungheria → unghereseN ‘abitante dell’Ungheria’ unghereseA ‘relativo all’Ungheria’ (le città ungheresi) unghereseN ‘relativo agli ungheresi’ (il carattere ungherese) unghereseA ‘la lingua dell’Ungheria’ unghereseA ‘relativo alla lingua ungherese’ (i verbi ungheresi) Un modello puramente incrementale esigerebbe che tutti i tipi di relazioni semanticocategoriali illustrate in (3) fossero marcati esplicitamente. L’elasticità che alcuni lessemi manifestano per quanto riguarda la categoria e i significati che possono esprimere mi sembra, invece, essere alla base anche di altri casi di ‘riciclaggio’ morfologico, meno sistematici, e perciò meno facili da osservare, ma altrettanto significativi. Pensiamo ad esempio ad un insieme lessicale come quello che va dal verbo assistere al nome assistenzialità8: (4) assistereV → assistenteN/A assistenzialeA → assistenzialitàN → assistenzaN → Nel caso di assistenzialità, che, volendolo glossare per intero, significa all’incirca ‘la proprietà di ciò che è relativo al fatto di assistere’, tutte le relazioni semantiche sono marcate da un affisso specifico (se si fa astrazione dell’alternanza -Vnte / -Vnza). Altri lessemi, tuttavia, sono ambigui, ad esempio aderenza che può indicare sia il fatto di aderire che la proprietà di ciò che è aderente (cf. i pneumatici stanno perdendo aderenza vs. migliorare l’aderenza dei pneumatici9). Gli esempi di (5) mi sembrano corrispondere a casi in cui i locutori sfruttano questa ambiguità per esprimere significati complessi ‘economizzando’ i mezzi espressivi impiegati. (5) La produzione basata sulla concorrenza del prezzo tende a tagliare i costi sostenuti dalla produzione basata sulla qualità. [http://www.orovero.it/articoli/inasprimento%20della%20crisi%20agricola%20nazionale.a sp?titolo=inasprimento%20della%20crisi%20agricola%20nazionale] 8 Una ricerca effettuata su Google il 29 ottobre 2013 fornisce circa 1.500 attestazioni di assistenzialità. 9 Sul suffisso -Vnza cf. in particolare Gaeta (2002: 127-148). Lascia stare l’accoglienza degli italiani che è relativa (infatti magari un romano o un napoletano può essere più allegro ed accogliente di un milanese o valdostano). [http://it.answers.yahoo.com/question/index?qid=20090316115831AAH2hS2] Le parole in -Vnza negli esempi qui sopra denotano chiaramente più delle proprietà che delle azioni, ed in questo senso sono semanticamente più simili ad assistenzialità che ad assistenza benché con quest’ultimo lessema condividano la struttura morfologica. Gli esempi citati, infine, nonché quelli riportati in precedenza in (1) e (2), mostrano un’altra falla di molti studi morfologici tradizionali, quella che chiamerei l’ipotesi dell’autosufficienza, ossia l’idea che l’osservazione di un certo numero di derivati in isolamento (ad esempio tratti da un dizionario) sia sufficiente per caratterizzare con precisione l’insieme delle proprietà semantiche definite da una RFP. I dati di (5), invece, indicano chiaramente che solo prendendo in considerazione il contesto sintattico è possibile avere un’idea chiara della diversità degli usi di una classe di derivati, e se tale diversità è sistematica o occasionale. 4. Conclusione: dalle regole ai modelli Per ovviare al carattere eccessivamente rigido e deterministico delle regole, molti modelli di morfologia preferiscono oggi analizzare le relazioni lessicali piuttosto in termini di schemi o modelli (in inglese patterns). Una caratteristica della morfologia basata sulle regole è quella di stabilire distinzioni binarie e discrete. Dal punto di vista delle unità lessicali, ciò significa distinguere, in esse, le proprietà determinate dalla regola, per definizione interamente prevedibili, da quelle idiosincratiche, che sono invece attribuite ad altri fattori, pragmatici, storici, etc., generalmente meno controllabili. Dal punto di vista dei procedimenti stessi, ciò significa distinguere la nozione di regola, un meccanismo la cui applicazione è automatica e che ha un alto grado di generalità, da quella di analogia, che corrisponde piuttosto ad una relazione locale tra singole coppie (o piccoli gruppi) di parole. In questa prospettiva, ad esempio, parole come saltazionale o avvodkazzato, citate in (1) sarebbero considerate formate per analogia piuttosto che per regola. Eppure, come osservano Blevins / Blevins (2009: 10), “a rule can be understood as a highly general analogy”. La differenza tra i due concetti sarebbe, secondo questo punto di vista, più quantitativa che qualitativa, ma la loro natura è identica, si tratta cioè di schemi che emergono dalle corrispondenze rilevabili tra gli elementi lessicali (per un modello recente della morfologia ba- sato sull’idea di corrispondenza cf. Spencer 2013). Il concetto stesso di corrispondenza, poi, è graduabile, poiché due lessemi possono essere in corrispondenza per uno o più dei diversi livelli che li definiscono (fonologico, sintattico-categoriale, semantico, ma anche – come abbiamo visto – puramente lessicale). L’impressione di avere a che fare con una regola si ha, allora, quando una serie di corrispondenze lessicali è talmente sistematica e generalizzata da sembrare automatica; in realtà, nessuna corrispondenza è talmente generale da avere il carattere di obbligatorietà che, per definizione, dovremmo attribuire ad una regola. Se per regola intendiamo un’operazione che, dato un input adeguato, si applica automaticamente per fornire un output univoco e prevedibile (cf. anche Lenci, questo volume), siamo costretti ad ammettere che in morfologia non esistono regole. Persino un fenomeno che è spesso considerato come il prototipo della ‘regola’ morfologica, la costruzione del plurale dei nomi in inglese (cf. Pinker 1999: 171-187), non è interamente regolare e conosce un certo numero di eccezioni, dovute perlopiù ad accidenti storici. Possiamo considerare, infatti, che la morfologia è costitutivamente irregolare a causa degli oggetti che manipola: le parole non sono unità linguistiche inerti, ma costituiscono l’interfaccia tra la lingua e la conoscenza del mondo (cf. Aronoff 2007: 813-814), e di conseguenza sono, per definizione, soggette a qualsiasi tipo di influenza extralinguistica, storica, sociale, pragmatica, etc. In conclusione, per superare la dicotomia regolare / irregolare, almeno nell’ambito della morfologia derivazionale, possiamo considerare che lo scopo principale della teoria non deve essere quello di elaborare principi che permettano di tracciare una linea netta tra dati di due tipi, quanto piuttosto quello di costruire, tramite parametri espliciti, uno spazio all’interno del quale i dati realmente osservati possono essere valutati10. Bibliografia Aronoff M. (1976), Word Formation in Generative Grammar, Cambridge, Ma, MIT Press. Aronoff M. (2007), In the beginning was the word, “Language” 83.4, 803-829. Blevins J.P. (2006), Word-based morphology, “Journal of Linguistics” 42, 531-573. Blevins J.P. / Blevins J. (2009), Introduction: Analogy in grammar, in J.P. Blevins / J. Blevins (eds.) (2009), Analogy in Grammar, Oxford, Oxford University Press, 1-12. Booij G. (2010), Construction Morphology, Oxford, Oxford University Press. 10 Questa concezione ricorda quella della morfologia canonica, un modello elaborato principalmente per trattare la morfologia flessiva (cf. Corbett 2007 e, per un’applicazione alla morfologia derivazionale, Corbett 2010). Corbett G.G. (2007), Canonical typology, suppletion and possible words, “Language” 83.1, 9-42. Corbett G.G. (2010), Canonical derivational morphology, “Word Structure” 3.2, 141-155. Crystal D. (20062), Language and the Internet, Cambridge, Cambridge University Press. Dal G. / Namer F. (2012), Faut-il brûler les dictionnaires? Ou comment les ressources numériques ont révolutionné les recherches en morphologie, in: F. Neveu et al. (eds.), 3e Congrès Mondial de Linguistique Française. Lyon, 4-7 juillet 2012, Paris, Institut de Linguistique Française, 1261-1276. Fradin B. / Kerleroux F. / Plénat M. (2009) (eds.), Aperçus de morphologie du français, Saint-Denis, Presses Universitaires de Vincennes. Gaeta L. (2002), Quando i verbi compaiono come nomi. Un saggio di morfologia naturale, Milano, FrancoAngeli. Gradit: De Mauro T. (ed.), (1999), Grande dizionario italiano dell’uso, Torino, Utet. Hall M. (1973), Prolegomena to a theory of word formation, “Linguistic Inquiry” 4.1, 316. Hathout N. / Montermini F. / Tanguy L. (2008), Extensive data for morphology: Using the World Wide Web, “Journal of French Language Studies” 18.1, 67-85. Hathout N. / Montermini F. / Tseng J. (eds.) (2013), Morphology in Toulouse. Selected Proceedings of Décembrettes 7, München, Lincom Europa. Hathout N. / Namer F. / Plénat M. / Tanguy L. (2009), La collecte et l’utilisation des données en morphologie, in: Fradin / Kerleroux / Plénat (eds.) (2009), 267-287. Jackendoff R. (1975), Morphological and semantic regularities in the lexicon, “Language” 51.3, 639-671. Kilgariff A. (2007), Googleology is bad science, “Computational Linguistics” 33.1, 147151. Koehl A. (2009), Are French -ité suffixed nouns property nouns?, in: F. Montermini, G. Boyé, J. Tseng (eds.), Selected Proceedings of the 6th Décembrettes. Morphology in Bordeaux, Somerville, Ma, Cascadilla Press, 95-110. Lasserre M. / Montermini F. (2013), Neoclassical compounds as relational adjectives, comunicazione presentata al 9th Mediterranean Morphology Meeting, Dubrovnik, 15-18 settembre 2013. Lasserre M. / Montermini F. (in stampa), Une approche distributionnelle pour l’analyse des composés néoclassiques, “Verbum”. Lindsay M. / Aronoff M. (2013), Natural selection in self-organizing morphological systems, in: Hathout / Montermini / Tseng (eds.) (2013), 133-153. Lüdeling A. / Evert S. / Baroni M. (2007), Using Web data for linguistic purposes, in: M. Hundt, N. Nesselhauf, C. Biewer (eds.), Corpus Linguistics and the Web, Amsterdam – New York, Rodopi, 7-24. Migliorini B. (19572), Sulla tendenza a evitare il cumulo dei suffissi nella formazione degli aggettivi, in: B. Migliorini (1957), Saggi linguistici, Firenze, Le Monnier, 135-147. Montermini F. (2010a), The lexical representation of nouns and adjectives in Romance languages, “Recherches linguistiques de Vincennes” 39, 135-162. Montermini F. (2010b), La morphophonologie de l’italien: une approche lexicaliste, tesi di habilitation à diriger des recherches, Toulouse, Université de Toulouse le Mirail. Montermini F. / Bonami O. (in stampa), Stem spaces and predictability in verbal inflection, “Lingue e Linguaggio”. Namer F. (2013), Adjectival bases of French -aliser and -ariser verbs: Syncretism or under-specification?, in: Hathout / Montermini / Tseng (eds.) (2013), 185-210. Pinker S. (1999), Words and Rules. The Ingredients of Language, London, Weidenfeld & Nicholson. Pirrelli V. / Battista M. (2000), The paradigmatic dimension of stem allomorphy in Italian verb inflection, “Rivista di Linguistica” 12.2, 307-380. Plénat M. (2005), Rosinette, cousinette, putinette, starlinette, chipinette. Décalage, infixation et épenthèse devant -ette, in: I. Choi-Jonin / M. Bras / A. Dagnac / M. Rouquier (eds), Questions de classification en linguistique: méthodes et descriptions. Mélanges offerts au Professeur Christian Molinier, Bern, Peter Lang, 275-298. Rainer F. (2012), Morphological metaphysics: virtual, potential, and actual words, “Word Structure” 5.2, 165-182. Roché M. (2007), Logique lexicale et morphologie: la dérivation en -isme, in: F. Montermini / G. Boyé / N. Hathout (eds.), Selected Proceedings of the 5th Décembrettes. Morphology in Toulouse, Somerville, Ma, Cascadilla Press, 45-58. Roché M. (2008), Structuration du lexique et principe d’économie: le cas des ethniques, in: J. Durand / B. Habert / B. Laks (eds.), Congrès Mondial de Linguistique Française, Paris, 9-12 juillet 2008, Paris, Institut de Linguistique Française, 1571-1585. Roché M. (2009), Un ou deux suffixes? Une ou deux suffixations?, in: Fradin / Kerleroux / Plénat (eds.) (2009), 143-173. Scalise S. (1999), Rappresentazione degli affissi, in: P. Benincà / L. Vanelli / A. Mioni (eds.) (1999), Fonologia e morfologia dell’italiano e dei dialetti d’Italia. Atti del XXXI Congresso della Società di Linguistica Italiana, Roma, Bulzoni, 453-481. Spencer A. (2013), Lexical Relatedness. A Paradigm-Based Model, Oxford, Oxford University Press. Stump G.T. (2001), Inflectional Morphology. A Theory of Paradigm Structure, Cambridge, Cambridge University Press.