! ! ! Dottorato!di!ricerca!in!Filologia,!linguistica!e!letteratura! ! !XXV!ciclo! La#trascrizione#dell'intonazione.# La#notazione#come#sistema#di#rappresentazione#del#sapere#linguistico# Relatori:! ! ! ! ! ! ! ! ! Prof.!Federico!Albano!Leoni!! ! ! ! ! ! !!!!!!!!!!!Matteo!Servilio! Prof.ssa!Isabella!Chiari! ! ! ! Anno!Accademico!! 2013/2014! ! Tesi!di:! Indice: Introduzione 3 Cap. 1: La rappresentazione linguistica dell’intonazione 7 QUESTIONI PRELIMINARI 7 1 1.1 Una breve storia / 1.2 Specificazioni terminologiche 2 L’INTONAZIONE E I CONFINI DELLA LINGUA 18 2.1 Il significante linguistico dell’intonazione / 2.2 Il significato linguistico dell’intonazione / 2.3 Il caso delle emozioni 3 IL PROBLEMA DELLA RAPPRESENTAZIONE 35 La Musica delle Parole 47 1 MUSICA E INTONAZIONE 47 2 JOSHUA STEELE E LA MELODIA DELLA VOCE 51 Cap. 2: 2.1 Prosodia Rationalis / 2.2 Il pentagramma come organizzazione dello spazio sonoro / 2.3 La dimensione temporale e ritmica del parlato / 2.4 Armonia della voce 3 HENRY SWEET E “IL SUONO DELLA LINGUA” 73 3.1 Suono e senso / 3.2 Fonetica e didattica delle lingue / 3.3 La scrittura fonetica come dispositivo modellizzante / 3.4 La rappresentazione dell’intonazione e dei tratti prosodici / 3.5 Intervalli di tono e variazioni globali / 3.6 Tono, intensità e durata. Il sistema prosodico di Sweet 4 Cap. 3: 1 DANIEL JONES “LA MUSICA DELLA PAROLA” 88 L’intonazione della lingua tra forma e significato 103 HAROLD PALMER E L’INTONAZIONE COME SISTEMA 103 2 IL RUOLO DELLA SILLABA NELLA RAPPRESENTAZIONE DELL’INTONAZIONE 107 3 L’INDIVIDUAZIONE DELL’UNITÀ INTONATIVA 111 3.1 Divisione Fisiologica / 3.2 La divisione in Sense-group / 3.3 L’approccio fonetico - fonologico 4 Cap. 4: 1 LA STRUTTURA INTERNA DELL’UNITÀ INTONATIVA 118 L’intonazione tra fonetica e fonologia 129 IL MODELLO A LIVELLI DELLO STRUTTURALISMO AMERICANO 129 1.1 Level vs Configuration / 1.2 Verso una fonologia dell’intonazione 2 IL MODELLO DI TRASCRIZIONE TOBI 147 2.1 Alle origini di ToBI / 2.2 Gli antecedenti di ToBI /2.3 La trascrizione nel sistema di notazione ToBI / 2.4 principi guida per la selezione dell’informazione / 2.5 Rappresentazione del livello tonale 3 IL MODELLO IPO. DALLA PARTE DELL'ASCOLTATORE 166 4 IL SISTEMA DI ANNOTAZIONE INTSINT 175 4.1 La rappresentazione dei toni nel sistema InTSInt / 4.2 Tra forma e funzione della prosodia Conclusioni 185 Bibliografia 190 2 Introduzione "L’idea che nel parlare selezioniamo singole consonanti e vocali, che in qualche modo spuntano nella nostra bocca allineate nell’ordine giusto, come perline su un filo, non è altro che l’immagine dell’ortografia alfabetica proiettata all’indietro sulla produzione orale" (Harris 1986 [1998], pp. 47-48). In queste poche righe, tratte dal famoso testo di Roy Harris sull'origine della scrittura, è condensato lo spirito che ha stimolato e guidato il presente lavoro di tesi. Nel passaggio dal suono al segno grafico si insinuano infatti una rete di questioni di ordine teorico generale che affondano le radici nelle nozioni di segno, di scrittura, di traduzione intersemiotica e rappresentazione. Quest'ultima è di fatto un problema che ricorre in numerose forme nella linguistica teorica del ventesimo secolo e non solo: da un lato vi è la 'rappresentazione' che gli scienziati della lingua hanno realizzato del proprio oggetto di indagine, dall'altro vi è la relazione tra questa 'immagine' e la 'rappresentazione' che è invece propria dei parlanti. L'ipotesi di Harris vede ad esempio il modello alfabetico sovrapporsi a quello scientifico ponendosi come principale motore interpretativo: "[…] non vi è dubbio che sia stato l'alfabeto a offrire ai teorici del linguaggio il modello più a portata di mano di come il problema della rappresentazione dovrebbe essere affrontato […]. Un alfabeto "ideale" sarebbe un'esemplificazione di tale corrispondenza, almeno in relazione alla pronuncia del linguaggio; ma analoghi "alfabeti" possono facilmente essere costruiti per altri livelli linguistici, sempre basandosi su tale modello" (Harris 1986 [1998], p. 45). Una delle risposte più comuni riguardo a questo tipo di posizione è quella che vede nell'alfabeto la più ovvia conseguenza di una 'rappresentazione' già presente nella mente dei 3 parlanti. L'ortografia alfabetica altro non sarebbe che la proiezione dell'immagine che gli stessi parlanti hanno inconsciamente della lingua. Se questo dibattito è quantomeno possibile nell'ambito del rapporto tra lingua scritta e parlata, cosa dire dell'intonazione? Rimanendo in questi termini possiamo dire ad esempio che le più tradizionali forme di scrittura hanno espunto quasi del tutto tale dimensione dalla loro rappresentazione. Se accettassimo acriticamente l'idea della scrittura come proiezione fedele della lingua da parte dei parlanti, dovremmo ammettere che, per questi ultimi, fenomeni quali accento e intonazione, nel discorso orale sarebbero quantomeno marginali, rimanendo confinati nella punteggiatura. Da un altro punto di vista, che è quello che si è scelto di seguire, il trattamento dell'intonazione nell'ambito linguistico, e in particolare la sua trascrizione o annotazione grafica, manifesta in maniera ancora più evidente questo tipo di problematiche. Quale informazione deve esser codificata in termini notazionali per poter analizzare linguisticamente l'intonazione? Quale rapporto viene stabilito tra l'immagine scientifica degli andamenti intonativi e l'effettivo uso che i parlanti fanno della lingua? Da un punto di vista strettamente teorico non credo sia possibile giungere a una risposta definitiva. Quello che sembra emergere invece dall’analisi di testi e approcci al problema è una grande varietà di prospettive sullo stesso oggetto, prospettive che si traducono appunto in diverse ‘rappresentazioni’. La tesi consiste dunque in un’analisi diacronica dei principali sistemi di annotazione utilizzati nell’ambito degli studi linguistici. La scelta di una prospettiva temporale ha avuto due ragioni fondamentali: prima di tutto la necessità di collocare quanto più fedelmente possibile gli autori e le teorie nei loro contesti originari e in seconda istanza, l’esigenza di mettere in evidenza i principali sviluppi al problema. In particolare il percorso tracciato in questo lavoro ha inizio con i sistemi di rappresentazione elaborati prima del novecento, per poi guardare gli studi del novecento con particolare riferimento alla scuola britannica e a quella dello strutturalismo americano, 4 sino agli ultimi modelli tuttora in uso. Il primo capitolo, intitolato La rappresentazione dell’intonazione, affronta le questioni più strettamente teoriche che riguardano i processi di rappresentazione. Verranno messi in luce alcuni dei problemi riguardanti l’organizzazione del significante e del significato intonativo, problemi da cui dipendono molte delle scelte teoriche che hanno determinato l’inclusione o l’esclusione degli andamenti melodici dal dominio della lingua. Il secondo capitolo, dal titolo La musica delle parole, prende spunto dalle evidenti assonanze tra i fenomeni intonativi linguistici e musicali. Tono, durata, intensità ad esempio costituiscono i parametri descrittivi su cui lavorano i due sistemi. Sarà proprio questa vicinanza ad ispirare i primi lavori organici in tema di intonazione linguistica. Johsua Steele (1775), ad esempio, si servirà di un modello notazionale preso in prestito dalla partitura musicale per mettere in piedi un vero e proprio sistema di trascrizione e analisi dei diversi livelli prosodici. In maniera non dissimile Daniel Jones si servirà nei primi del 900 di sistemi di trascrizioni ispirati al modello musicale per la descrizione dei movimenti tonali della lingua. Nel terzo capitolo, dal titolo L’intonazione della lingua tra forma e significato, sono stati invece presentati i principali lavori della scuola britannica. Lo sviluppo della disciplina in questi anni porta alla luce alcuni dei problemi che si rincorreranno sino ai giorni nostri: il rapporto tra suono e senso, il rapporto tra la forma dell’intonazione e le funzioni linguistiche associate, la struttura del significante intonativo. Al contempo si assiste ad una prima scomposizione del contorno: quest’ultimo sarà suddiviso funzionalmente in classi astratte, determinate e determinabili mediante l’andamento tonale delle sillabe prominenti. Tale astrazione conduce a individuare come pertinenti, e quindi graficamente trascrivibili, i valori relativi della F0 occorrenti su ciascuna sillaba dell’enunciato e a definire formalmente la funzione dell’enunciato sulla base del tono nucleare. 5 Nel quarto capitolo, L’intonazione tra fonetica e fonologia, sono stati infine presentati i lavori e gli approcci più moderni. L’analisi linguistica dell’intonazione e la sua corrispettiva rappresentazione grafica, trova nello strutturalismo americano un interessante terreno di sviluppo. Studiosi come Pike, Bloomfield, Harris hanno affrontato il fenomeno dell’intonazione cercando di trasferire su di esso alcuni dei principi che avevano portato allo sviluppo dell’allora giovane fonologia. Il terreno di discussione sarà così incentrato soprattutto sul tentativo teorico e pratico di trattare fonologicamente il tono nelle lingue intonazionali. Su questa linea si assisterà negli anni ‘80 allo sviluppo della teoria autosegmentale-metrica che condurrà negli anni ’90 all’elaborazione di ToBI (Tones and break indices), il modello maggiormente utilizzato per la trascrizione dell’intonazione. Negli stessi anni, in altri contesti culturali, in particolare Olanda e Francia, verranno alla luce nuovi tentativi di descrizione dell’intonazione. Il primo, presentato nel volume di Johan 't Hart, Rene Collier e Antonie Cohen (1990), è il risultato dell’équipe olandese dell’IPO (Institute for User-System interaction di Eindhoven). Si tratta di un approccio di tipo percettivo che si è posto come alternativa rispetto alla scuola americana dell’approccio per livelli, e alla scuola inglese dell’approccio per configurazioni. Il secondo, denominato InTSInt (International Trascription System for Intonation) è il risultato del lavoro di Daniel Hirst e Albert Di Cristo (1998) e si basa su un metodo notazionale di tipo fonetico. 6 Cap. 1: La rappresentazione linguistica dell’intonazione 1 Questioni preliminari 1.1 Una breve storia Lo studio linguistico dell’intonazione nell’ambito delle scienze del linguaggio è piuttosto recente. Se si escludono casi isolati, seppur di grande interesse storiografico, è possibile segnalare una svolta decisiva in termini, soprattutto quantitativi, intorno alla metà degli anni 60’ (Mario Rossi 1998). Anche i luoghi, gli sfondi teorici e gli ambiti di interesse rendono il tema piuttosto variegato1. Un modo indicativo per constatare il livello di interesse nei confronti dei fenomeni intonativi delle lingue è quello di guardare gli interventi presentati al Congresso Internazionale di Scienze fonetiche (ICPhS) che dal 1934 2 si tiene circa ogni tre anni. Nel terzo incontro, organizzato a Ghent nel 1938, ad esempio, gli interventi dedicati alla prosodia e in particolare all’intonazione furono solo tre 3 ; a Helsinki, nel corso del 4° congresso del 1961, furono sette gli interventi dedicati al tema dell’intonazione 4; tre anni 1 2 3 4 Ricche bibliografie sull’argomento sono contenute nei lavori di Crystal (1969), Léon e Martin (1979), Di Cristo (1975), Couper-Kuhlen (1986), Cruttenden (1986), Ladd (1996), Hirst e di Cristo (2000), Botinis et al (2001), Nespor e Vogel (2007), Martin (2009). In lingua italiana sono disponibili i recenti lavori di Sorianello (2006) e De Dominicis (2010). Il primo incontro si tenne ad Amsterdam, in Olanda. Il prossimo si terrà invece dal 10 al 15 agosto del 2015 a Glasgow, in Scozia. Rossi (1998) sottolinea che gli interventi furono incentrati tutti sull’intonazione dell’Olandese. Vladimir Artemov (1962), J. Carnochan (1962), G. Faure (1962), Lee S. Hultzén (1962), Alvar Nyqvist (1962), Milan Romportl (1962), Milan Romportl (1962), Hans-Walter Wodarz (1962). 7 dopo, a Münster, i contributi pubblicati negli atti furono solo 4 5 ; altri sette si trovano invece nella pubblicazione relativa al 6° congresso di Praga del 1967. Solo quattro anni dopo, a Montreal, le comunicazioni pubblicate furono ben 42. Il 1967 segnò infatti un punto di svolta per quanto riguarda gli interessi dei linguisti sul tema della prosodia e dell’intonazione. In una preziosa bibliografia sul tema, che copre un periodo che va dal 1900 al 1973, Albert Di Cristo raccolse circa 4390 contributi, metà dei quali furono pubblicati proprio nei 5 anni dopo il Congresso di Praga. Il tardivo e marginale interessamento della linguistica ai fenomeni intonativi ha ragioni piuttosto stratificate. Tra le più immediate vi sono senza dubbio quelle di carattere ‘tecnologico’ e metodologico. L’assenza di strumenti di registrazione, archiviazione e riproduzione dei dati fonici ha di fatto limitato ‘l’osservabilità’ del fenomeno e di conseguenza consegnato alla esclusiva manualità dell’analista la responsabilità di estrazione e oggettivazione dei dati. Una condizione che senza dubbio aveva ripercussioni dal punto di vista metodologico poiché non consentiva ad altri studiosi l’eventuale verifica e validazione dei risultati. Una delle principali critiche rivolte agli studi della ‘scuola inglese’, che faceva largo uso del metodo percettivo per l’annotazione e la raccolta dei dati, fu ad esempio legata al metodo, considerato ‘non-scientifico’ e ‘impressionistico’ (Cruttenden 1986, pp. 6-7). Vi è in seconda istanza un problema più profondo che riguarda non solo l’osservabilità strumentale ma le condizioni stesse dell’osservabilità del fenomeno intonativo, che non trovava collocazione in alcun tipo di rappresentazione linguistica. Mancavano cioè quelle condizioni che avevano permesso, grazie alla scrittura, il necessario distanziamento tra l’osservatore e l’oggetto osservato, creando i presupposti per una riflessione teorica esplicita della lingua. Ne è convinto ad esempio Dwight Bolinger che riflettendo sul possibile confronto fra fonologia e intonazione scrive: 5 8 Rossi (1998) segnala che altri dieci interventi furono annunciati dall’Unione Sovietica ma mai ricevuti. Per lungo tempo infatti i linguisti sovietici mostrarono grande interesse per l’intonazione, motivati soprattutto da finalità didattiche. The literature on phonemics is new. But, looked at another way, the literature of phonemics is very old. The common-sense knowledge of phonemics is as old as alphabetic writing - has been with us for several millennia. […] By contrast, the common-sense knowledge of intonation is virtually nil. Aside from the crude (and, where question are concerned, inconsistent) sign of punctuation, there exist not even one system of representing English intonation has been tested by widespread use. There is thus less literature of intonation than on it (Bolinger 1949, p. 248). La lingua scritta, in particolare quella alfabetica, restituiva agli occhi e alle orecchie dei parlanti/lettori un’immagine svuotata del carattere fonico 6. La complessità semiotica del fenomeno comunicativo veniva schiacciata dalla linearità e determinatezza delle ‘lettere’. L’intonazione al contrario trovava nella scrittura un posto accessorio e una resa abbondantemente semplificata mediante la punteggiatura. Non è forse un caso che, se si escludono i trattati di ortografia, i primi tentativi di riflessione ‘scientifica’ sull’intonazione linguistica abbiano avuto come appoggio rappresentativo, notazioni e concetti propri di un campo del sapere differente: la musica 7. Si fanno risalire, infatti, ai lavori sulla punteggiatura le prime discussioni aventi per oggetto la melodia del parlato inglese (Pike 1945, pp. 3-5; Crystal 1969, pp. 20-25). In particolare ai lavori di John Hart e ai suoi Ortographie e The opening of the unrealsonable writing of our inglish toung. Il primo, pubblicato nel 1569, presenta una lunga sezione sull’intonazione (Danielsson 1955, pp. 199-201) che è essenzialmente una discussione sulle regole per l’uso dei segni di interpunzione, con riferimento al punto esclamativo e interrogativo. Altri riferimenti a forme di variazioni tonali nel parlato si trovano in Charles Butler (1633) che nella sua grammatica distingueva due principali andamenti 6 7 George Boulakia (2002) parlerà di una linguistica ‘senza voce’ per evidenzire il disinteresse delle discipline linguistiche al ruolo della sostanza dell’espressione. Cfr. Capitolo 2 9 tonali: ascendente e discendente 8. Tra i grammatici che, come Butler, hanno dato attenzione ai movimenti tonali della lingua troviamo George Puttenham (1589), che enfatizzò ad esempio il ruolo delle pause; Ben Johnson, che in maniera simile descrive un’opposizione tra frasi imperfette, segnalate con la virgola, e frasi perfettamente conclusive, e Simon Daine (1640). Non mancano esempi particolarmente interessanti che hanno anticipato di secoli questioni e modalità di rappresentazione, oggetto del presente lavoro. È il caso di Joshua Steele e del suo Prosodia Rationalis (1775). Come si vedrà nel cap. 2, Steele fu ben consapevole del ruolo dell’intonazione nella lingua e riconobbe ad essa un carattere semanticamente ‘distintivo’ 9. Altri riferimenti si trovano negli studi di dizione. Tra questi si segnala il lavoro di Sheridan (1762), che articolò la categoria del ‘tono’ distinguendo tra toni naturali, universali, e toni artificiali, che sono invece linguo specifici, e James Rush (1827) che pubblicò un elaborato sistema per l’indicazione delle altezze nella voce parlata10. Una prima importante svolta si ottenne tra la fine del XIX secolo e i primi decenni del XX secolo con gli studi di fonetica della ‘scuola britannica’: tra gli autori più significativi si segnalano Henry Sweet, Daniel Jones, Armstrong & Ward e Harold Palmer. 8 9 10 10 Di seguito alcune brevi citazioni “Ton’ is the natural and ordinari tun’ or tenor of the voic’: which is to ris’, or fall, as the Primari points shall requir’, (Cap. 4 $ 3.1). “Period is a point of perfect sens, and perfect sentenc’: which, in the last woord, falleth the Ton’ of the voic’ below its ordinari tenour, with a long paus.” (Cap. 4 $ 3.1). “Comma is a point af mor’ imperfect sens, in a simple axiom, or in either part of a compound: which continueth the tenour of the voic’ to the last, with the shorttest paus.” (Cap. 4 $ 3.1). “Erotesis, if it bee pur’, raiseth the common Ton’ or tenour of the voic’ in the last woord’ unless Emphasis draw it: buti f it begin with a woord interrogativ’; as, [who, what, how, where’, when, why, &c;] it falleth as a Period...” (Chap. 4, $ 3.2). Per un’analisi del lavoro di Butler sull’intonazione cfr. Hultzén (1939). La melodia tonale per Steele è il modo in cui “the different meaning of word formed by the same, or nearly the same, literal sound and syllables, are distinguished” (Steele 1775, p. 188) Rush (1827) suddivise in cinque categorie tutte le variabili legate al suono della voce umana: Quality (rough, smooth, hars, full, thin, slender, soft, musical etc.) Force (strong, weak, feeble, loud, soft, forcible, and faint), Time (long, short, quick, slow and rapid), Abruptness (sudden, gradual emission) e Pitch (rise, fall, hight, low, acute, grave). Sempre in riferimento al Pitch, Rush pose particolare attenzione alla distinzione tra andamento continuo (concrete) e andamento scalare (discrete). Guardando ancora più indietro, l’attenzione ai ‘suoni musicali’ della lingua trova collocazione anche nelle riflessioni dell’antica Grecia. Il termine προσωδία (gr. prosōidía «accento, modulazione della voce», comp. di prós «accanto» e ōidḗ «canto») veniva infatti impiegato per riferirsi alle caratteristiche del parlato che non erano indicate nell’ortografia, specificamente al tono o accento melodico. L’espressione latina accentus (ad e cantus) altro non sarebbe che un calco del termine greco. La versione italiana migliore, che consideri la natura prevalentemente musicale dell'accento antico, sarebbe "intonazione". Ma ora (e quest'uso ha precursori già in tardi grammatici greci) è chiamata prosodia la dottrina delle quantità, cioè delle vocali e sillabe lunghe e brevi (Pasquali 1935, p. 348). Un altro uso del termine intonazione trova collocazione nel contesto musicale, in particolare nei manuali di canto. La variazione melodica della voce umana deve, nel canto, seguire precise regole armoniche e collocarsi all’interno del range discreto costituito dalle note musicali: [...] Poiché essendo la perfetta intonazione il principal cardine dell’armonia, ed essendo questa composta di un perfetto accordo di consonanze, le quali, se in una di esse parti si scostano dal loro vero punto, resta immediatamente tradita la perfezione dell’armonia; di più essendo la voce la parte principale della Musica vocale, se questa è stonata, guasta in quel medesimo tempo l’armonia degli strumenti, quantunque fra loro perfettamente concordi (Mancini 1777 [1996], p. 68). L’intonazione, nella tradizione musicale, corrisponderebbe quindi alla corretta collocazione delle altezze mediante la voce cantata, in rispetto delle regole armoniche e melodiche. Al contrario la stonatura altro non sarebbe che l’imprecisa esecuzione delle note musicali tramite la voce (o un anche altro strumento): da qui le espressioni voce 11 calante (quando le note tendono a collocarsi ad un’altezza leggermente inferiore a quella prevista) o voce crescente (quando le note tendono a collocarsi ad un’altezza leggermente superiore a quella prevista). Tale uso è ancora oggi pienamente valido: “l’intonare” significa riconoscere e/o eseguire suoni alla giusta altezza tonale (in termini fisici, correlati con una frequenza di riferimento). Più semplicemente ci si può riferire alla capacità, impressiva o esecutiva , di soddisfare con la massima precisione l’andamento di qualsiasi parametro fisico del linguaggio musicale” (N. Mari e Schindler , 1974, p. 11). 1.2 Specificazioni terminologiche Sebbene generalmente i termini prosodia e intonazione siano utilizzati in maniera indistinta, è possibile tracciare dei confini per un impiego meno ambiguo o quantomeno più consapevole di essi. È bene inoltre ricordare che spesso le sfumature nell’uso tecnico dei termini in letteratura possono risultare non sempre esplicite e soprattutto possono variare in base all’autore. Con una interpretazione generale si può intendere il termine prosodia come l’insieme delle modulazioni temporali, tonali e dinamiche della voce, che si estendono oltre il singolo segmento; con intonazione, le sole variazioni foniche del dominio tonale (Crystal 1969, Ladd 1996, Hirst e Di Cristo 1998, Hirst et al 2000, Botinis et al. 2001, Gussenhoven 2004, t’Hart and Collier 1990). In alcuni casi l’uso del termine intonazione può acquisire valenza generale integrando anche i parametri della durata e dell’intensità. In questa accezione il termine viene spesso impiegato per riferirsi alle variazioni foniche che pertengono il dominio postlessicale11. 11 12 È il caso di Ladd (1996, p. 4) “Intonation, as I will use the term, refers to use of suprasegmental phonetic features to convey ‘post lexical’ or sentece-level pragmatic meanings in a linguistically structured way”. Fig. 1 Schema tratto da Hirst e Di Cristo (1998) Una seconda e frequente sovrapposizione riguarda l’uso del termine soprasegmentale per indicare quelle caratteristiche dei suoni linguistici, tra le quali ci sono i fenomeni tonali e prosodici12, che si estendono oltre il segmento. Il termine introdotto da Hockett nel 1942 è spesso utilizzato come sinonimo13 di entrambi. In più occasioni tuttavia l’espressione ha trovato resistenze per il suo carattere ‘ideologicamente’ indirizzato al rapporto asimmetrico con il livello segmentale. Da un lato ci sarebbe quindi il livello dei segmenti e della lingua e dall’altro quello dei fenomeni soprasegmentali, sovrapposti ai primi e in un certo senso secondari. È il caso di Albano Leoni (2009): Il termine sovrasegmentale [...] è certamente un riflesso di questo argomento (distinzione tra dominio linguistico e paralinguistico ndr.) e della marginalità della prosodia perché la pone irrimediabilmente in una posizione subordinata rispetto ai segmenti che ne rappresentano il prius (onto)logico: prima verrebbe la stringa 12 13 Occorre inoltre sottolineare che il dominio di riferimento delle funzioni e dei contenuti espressi dalle variazioni di tono può costituire elemento di classificazione delle lingue. Si parla infatti di lingue tonali in cui la variazione di tono può avere un valore distintivo a livello lessicale, e lingue intonazionali, in cui il livello di pertinenza delle modulazioni melodiche si applica su un piano post-lessicale. In questo senso, il dominio di pertinenza dell’intonazione si può stringere ulteriormente agli eventi tonali post-lessicali, o semplicemente non lessicali. “Features which clearly follow each other in the stream of speech are SEGMENTAL. Those which clearly extend over a series of several segmental grouping are SUPRASEGMENTAL. Thus the positions of articulation of final two consonant in crypt are segmental, while the modes of articulation voiceless and fortis, are suprasegmental [Hockett 1942, p. 8]. […] A suprasegmental phone has a DOMAIN defined as the type sequence of segmental phones which it covers [Hockett 1942, p. 14]". Un tentativo di problematizzazione e approfondimento del tema è in Lehist 1970. 13 segmentale, poi verrebbe la modulazione soprasegmentale che si sovrappone alla stringa (Albano Leoni 2009, p. 48). Considerazioni simili sono espresse anche da autori come David Crystal 14 e Elizabeth Couper-Kuhlen15. Ulteriori specificazioni terminologiche sono possibili sulla base del punto di vista fonetico con cui si osservano i fenomeni prosodici e intonativi. Si parlerà dunque di: 1 – Dimensione articolatoria: si pone nella prospettiva del parlante e consiste nella descrizione del processo di produzione dei suoni. 2 – Dimensione percettiva: si pone dal punto di vista dell’ascoltatore si occupa dei processi uditivi e di categorizzazione dei suoni percepiti. 3 – Dimensione acustica: descrive le caratteristiche del segnale trasmesso. Essa costituisce una branca della fisica classica. (Albano Leoni e Pietro Maturi 1995, p. 15-18) Le tre prospettive non hanno tra loro un rapporto simmetrico. Non tutto ciò che è presente nel segnale acustico è pertinente da un punto di vista percettivo e non tutto ciò che è percettivamente rilevante può trovare singoli movimenti articolatori corrispondenti. Molto spesso infatti gli aspetti percettivamente e linguisticamente salienti non sono altro che il frutto della complessa interazione tra un insieme di parametri compresenti. I correlati principali grazie ai quali si realizzano le variazioni prosodiche sono: la frequenza fondamentale della voce (o F0), generalmente considerata come responsabile 14 15 14 “I considered and rejected a number of alternative terminologies to the use of ‘prosodic’: ‘suprasegmenral’, for example, was unsatisfactory, as it carried too dominantly the implications of a specific linguistic theory and method which is inadequate, and also because the prefix ‘supra-’ implies a priority of segmental over non-segmental linguistic features which is linguistically suspect”. (Crystal 1969, p. 6) “The term suprasegmental, [...] stems from a ‘bottom-up’ approach to language and carries the connotation of being ‘non-inherent’, ‘overlaid’ or ‘secondary’”. (Couper-Kuhlen 1986, p. 4) della percezione dell'altezza tonale (pitch) e corrispondente al numero di aperture e chiusure della glottide durante il passaggio dell’aria fonatoria; la durata, dovuta al tempo impiegato a compiere il gesto articolatorio e percepita come variazione di lunghezza (duration); e infine l’ampiezza, correlata alla pressione esercitata dall’aria fonatoria sulla glottide e percepita come variazione di intensità (loudness). Dimensione Articolatoria Dimesnione Acustica Dimensione Percettiva Vibrazione delle corde vocali Energia Movimenti articolari Frequenza fondamentale (F0) Ampiezza Tempo Altezza (Pitch) Intesità (Loudness) Durata (Duration) Tabella 1 Sintesi delle caratteristiche prosodiche considerate sulla base dei tre livelli di descrizione fonetica Le dimensione acustica può fornire una ulteriore specificazione terminologica sulla base della descrizione fisica delle sue componenti. Le onde sonore sono tradizionalmente rappresentate mediante una curva sinusoidale16 come riportato in fig. 2: 16 Occorre tuttavia sottolineare che la rappresentazione ottenuta mediante la funzione sinusoidale è una semplificazione grafica che troverebbe corrispondenza con il suono puro, costituito da una singola frequenza periodica. Molti suoni periodici tuttavia, come le note emesse da uno strumento musicale o dalla stessa voce, non sono di questo tipo. Si parla infatti di suoni complessi, costituito cioè dalla somma di più frequenze, una multipla dell’altra. Tali frequenze sono dette armoniche e la più bassa di queste è la frequenza fondamentale (F0), principale parametro correlato alla percezione delle altezze. 15 Fig. 2 rappresentazione della curva sinusoidale Il grafico, che riporta sull’asse delle ascisse il tempo e sull’asse delle ordinate la variazione della pressione dell’aria, mostra intuitivamente l’andamento periodico, vale a dire un andamento che a istanti di tempo uguali, presenta le medesime condizioni, ossia gli stessi valori di pressione. Il tempo che separa due istanti in cui l’onda presenta le stesse condizioni (es. due massimi o due minimi) è detto periodo e si indica con la T. Esso si misura in secondi (sec) e suoi sottomultipli, millisecondi (msec = 10 -3 sec), microsecondo (µsec = 10-6 sec) ecc. Il valore di y in un punto di massimo o di minimo si dice ampiezza dell’onda. A parità di condizioni l’ampiezza è il correlato fisico della sensazione di intensità. Maggiore è il valore del parametro a, più forte sarà il suono percepito. Il parametro della frequenza (f) è invece misurato in funzione del tempo. Essa si calcola in base al rapporto tra periodi (T) e secondi, ovvero gli hertz (Hz). Tale misura indica il numero di periodi compresi nell’unità di tempo e quindi il numero di volte in cui l’onda sonora ripresenta le stesse condizioni. La frequenza dell’onda sonora è ciò che determina, entro certi limiti, la sensazione di altezza di un suono (Pitch). A parità di condizioni una frequenza più elevata corrisponde a un tono, una nota, più acuta; al contrario una frequenza più bassa corrisponderà un suono più grave. 16 Di seguito è possibile vedere un esempio di rappresentazione fonetica della curva melodica (F0) dell’enunciato ‘Anna’ (anːa): Fig. 3 Fonte: Avesani, Gili Favela (2010) Al centro è collocata la curva di F0 costruita sulla base del rapporto tra il valore delle altezze (asse delle ordinate), calcolato in Hz, e tempo, calcolato in secondi; in alto è invece visibile la forma d'onda dell'enunciato che è costruita ponendo, come per l’onda sinusoidale, sull’asse delle ascisse il tempo e sull’asse delle ordinate la pressione (corrispondente al valore dell’ampiezza); in basso e in corrispondenza dei rispettivi valori acustici è collocata la trascrizione fonetica della parola ‘Anna’. Anche limitando l’indagine alla sola curva melodica l’attività di analisi linguistica risulta vasta e complessa. T’ Hart e Collier (1990) hanno ad esempio sottolineato l’importanza di tener presente contemporaneamente differenti livelli di analisi. Un livello fonetico, che dovrebbe interessarsi alle componenti fisiologiche, acustiche e percettive dell’intonazione, 17 spiegando al contempo le loro reciproche relazioni; un livello linguistico che dovrebbe essere invece finalizzato ad un’interpretazione fonologica dei fatti fonetici e a una spiegazione pragmatica che renda conto delle funzioni dell’intonazione nel corso delle interazioni comunicative tra i parlanti (‘t Hart, Collier e Cohen 1990, p. 2). 2 L’intonazione e i confini della lingua Nella complessità e nella vastità degli studi che si sono succeduti negli anni e che sono cresciuti notevolmente negli ultimi decenni, è possibile rintracciare alcune questioni centrali che fanno da sfondo alle diverse teorie e approcci al problema. Tali questioni hanno alimentato costantemente discussioni e proposte di studio, trovando riflesso negli strumenti di notazione. Due in particolare sono problemi sui quali le ricerche hanno tentato, esplicitamente o implicitamente, di rispondere: da un lato la possibilità di considerare l’intonazione e la prosodia come fenomeni di pertinenza linguistica, dall’altro la possibilità di applicare alle modulazioni intonative e prosodiche modelli di descrizione analoghi a quelli di tipo segmentale. Le possibili risposte a tali problemi non sono univoche né tantomeno indipendenti. Molte delle riflessioni e delle descrizioni sulla struttura del segno linguistico hanno di fatto costituito un discrimine importante per l’eventuale inclusione o esclusione dei fenomeni intonativi all’interno della teoria linguistica. In alcuni casi a determinare chiusure più o meno radicali nei confronti dello studio dei fatti intonativi è stata la costituzione del piano dell’espressione, in altri casi invece il tipo di funzioni ad essi associate. 2.1 Il significante linguistico dell’intonazione Gran parte degli autori del ‘900, con particolare riferimento allo strutturalismo europeo e 18 americano, hanno posto ad esempio tra i loro assunti teorici i concetti di articolazione, linearità, e segmentalità. Alla continuità ed estrema variabilità del segnale fonico, il linguista ha risposto mediante l’elaborazione di categorie descrittive in grado di metterne in luce i caratteri di discretezza e invarianza. “Il paradigma segmentale”, noto e definito formalmente con lo strutturalismo europeo e perfezionato dalla scuola di Leonard Bloomfield, ha, semplificando, visto la lingua come costituita materialmente di ‘pezzi’, segmenti prodotti ed elaborati in maniera discreta e combinati tra loro in maniera lineare a formare unità via via più grandi. Particolarmente esemplificative, rispetto a tale atteggiamento, sono le parole di André Martinet: Una lingua è uno strumento di comunicazione secondo il quale si analizza, in maniera diversa nelle diverse comunità, l’esperienza umana, in unità dotate di un contenuto semantico e di un’espressione fonica, i monemi; l’espressione fonica si articola a sua volta in unità distintive e successive, i fonemi, in numero determinato per ogni lingua, la cui natura e i cui rapporti reciproci differiscono anch’essi da una lingua all’altra. Da ciò risulta 1) che si riserva il termine «lingua» alla designazione di uno strumento di comunicazione doppiamente articolato e dotato di una manifestazione vocale; 2) che, al di fuori di questa base comune, come indicano i termini «diversa» e «differiscono» nella formulazione usata qui sopra, non c’è nulla di propriamente linguistico che non possa variare da una lingua all’altra; è in questo senso che va intesa l’affermazione secondo cui i fatti di lingua sono «arbitrari» e «convenzionali» (Martinet 1960 [1971], pp. 28-29). Sulla base di tali riflessioni il linguista francese collocherà l’intonazione e le modulazioni prosodiche al di fuori dei ‘fatti di lingua’ (Martinet 1960 [1971], pp. 32, 98-100)17. 17 Lo stesso Martinet, pur riconoscendo alle modulazioni intonative un certo grado di funzionalità preferisce in questo caso affidare il principio di classificazione alla “segmentazione” piuttosto che alla “funzione” (Martinet 1962 [1971], p. 76). In questo modo la (non) pertinenza linguistica dell’intonazione è determinata soprattutto dalla sua (non) segmentabilità e (non) discretizzabilità. Commentando queste pagine Malberg (1983) scrive “I fatti soprasegmentali sono oppositivi proprio come gli altri fonemi (lo dimostra la prova di commutazione), solo che sono integrati in paradigmi meno complessi di quelli dei fonemi segmentali. L’unica differenza tra le due serie di fatti funzionali è il livello. La posizione di 19 Una posizione simile è espressa dal linguista danese Louis Hjelmslev nella distinzione tra segni e figure. Queste ultime, nell’ambito della glossematica, rappresentano un insieme limitato di elementi non significanti che, combinandosi, consentono la creazione di segni sempre nuovi: Se una lingua non fosse così organizzata, sarebbe uno strumento inutilizzabile per il suo fine. Abbiamo dunque ogni ragione di supporre che questo tratto - la costruzione del segno in base a un numero limitato di figure - costituisca un elemento basilare essenzialmente nella struttura di qualunque lingua. Le lingue dunque (…) sono in primo luogo (…) sistemi di figure che si possono usare per costruire dei segni (Hjelmslev 1943 [1968], p. 51) 18 Tali figure e tali combinazioni di figure in segni saranno, a ciascun livello di analisi glossematica, in relazione nella catena19. Se provassimo ad articolare ulteriormente le due questioni da cui siamo partiti, ossia 18 19 20 Martinet porta alla strana conseguenza che il carattere distintivo dell’intonazione non andrebbe riconosciuto” (Malberg 1983 [1985], p. 192). È opportuno tuttavia specificare le differenti prospettive con cui si giunge alle seguenti osservazioni. Martinet ad esempio lega la doppia articolazione, che come abbiamo visto è il parametro che permette di discriminare i fatti d’intonazione rispetto ai fatti di lingua, al principio di economia e, a sua volta, alle necessità comunicative dei parlanti. La spiegazione fornita dal linguista francese si rivolge quindi alle condizioni del corretto funzionamento della lingua in termini di interpretabilità. La posizione di Hjelmslev è invece più radicale: non sono i fonemi, nell’accezione più generale, ad essere considerati come unità minime (Hjelmlsev chiama questi prefonemi e li colloca al livello intermedio della norma) ma i cenemi. Questi ultimi sono, secondo l’autore, le unità minime del piano dell’espressione, assolutamente svincolate da riferimenti alla sostanza fonica. Tali cenemi (genericamente detti glossemi) altro non sarebbero che elementi della lingua, intesa come schema, i quali possono essere manifestati in sostanze differenti come il suono, la grafia, il codice morse etc. Le unità minime in questo senso non sarebbero pezzetti di lingua ma ‘spazi topologici’ della forma linguistica (o sarebbe maglio dire semiotica). Questo punto è elegantemente sintetizzato da Gilles Deleuze “Gli elementi di una struttura non hanno né designazione estrinseca né significato intrinseco. Coma rimane? Come ricorda in modo rigoroso Lévi-Strauss, essi non hanno null’altro che un senso: un senso che è necessariamente e unicamente di “posizione”. Non si tratta di un posto in un’estensione reale, né di luoghi in estensioni immaginarie, bensì di posti e luoghi in uno spazio propriamente strutturale, ossia topologico” (Deleuze [2004], p. 20). L’analisi strutturale dei casi effettuata da Hjelmeslev (1935 [1999]). è un esempio del principio strutturale proprio della glossematica. “Quando ascoltiamo un testo parlato, per noi esso si compone di segni, e questi segni si compongono a loro volta di elementi che si svolgono nel tempo: alcuni vengono prima, altri dopo. I segni formano una catena, e anche gli elementi di ogni segno formano una catena. Chiamiamo relazione la funzione (differenza, rapporto) che esiste fra i segni o fra gli elementi all’interno di una stessa catena: i segni e gli elementi sono relati fra loro nella catena” (Hjelmslev 1963 [1970], p. 36-37). l’interpretazione linguistica dell’intonazione e l’analogia tra segmentale e sovrasegmentale, noteremo che la seconda contiene implicitamente una parte della risposta e della problematica legata alla prima. Valutare l’opportunità di un’analogia tra modello segmentale e modello soprasegmentale ha significato, in alcuni casi, subordinare la rappresentabilità dell’uno sull’immagine dell’altro, in base ad una precisa considerazione della lingua. Proviamo ora a considerare alcune possibili risposte ai due quesiti. La differenza terminologica può nascondere una differenza di dominio. Segmenti e soprasegmenti sono diversi nella loro forma dell’espressione, agendo con modalità e su livelli di pertinenza diversi. Tale differenziazione formale corrisponde così a una distinzione di dominio che può essere sintetizzata nell’opposizione linguistico vs nonlinguistico o linguistico vs paralinguistico. È il caso citato di Martinet20. Una seconda risposta consiste nel tentativo di trasferimento, in maniera più o meno analogica, dei tratti tipici del modello segmentale sui fenomeni intonativi e/o prosodici, applicando ai toni i principi della discretezza, distintività e segmentabilità. In sintesi è l’esito del processo iniziato con lo strutturalismo americano (Pike, Wells, Trager and Smith) e continuato fino alle più recenti forme di trascrizione binarie del tono, come ToBI. La curva melodica viene quindi interpretata come costituita di fonemi tonali (pitch phoneme), costruiti sulla base di una discretizzazione del Range in vari livelli di altezza relativi. 20 Il rifiuto delle categorie di gradienza e continuità nell’ambito del dominio linguistico è stata particolarmente evidente nell’ambito della scuola strutturalista americana. Joos (1950) o Hockett (1959), ad esempio, includono nel ‘design of language’ esclusivamente la categoria della discretezza, rifiutando la possibilità di considerare interno al problema linguistico qualsiasi tipo di gradienza categoriale: “All continuity, all possibilities of infinitesimal, gradation, are shoved outside of linguistic in one of linguistics in one direction or other. There are in fact two such direction in which we can and resolutely do expel continuity: semantics and phonetics” (Joos 1950, p. 702). E ancora:“all phenomena, whether popularly regarded as linguistic (such as the tone of anger in an utterance) or not, whichh we find we cannot describe precisely with a finite number of absolute categories, we classify as non-linguistic elements of real world and expel them from linguistic science” (Joos 1950, p. 703). 21 La terza possibilità risiede nell’integrazione dei modelli di analisi e di descrizione delle lingue con categorie complementari a quelle segmentali: continue, non segmentali e graduali. È il caso di Crystal (1969, 1974) il cui studio, orientato principalmente alla descrizione di una teoria integrata dell’atto comunicativo, ipotizza una scala di linguisticità sulla base della maggiore o minore strutturazione dei fenomeni soprasegmentali (Vedi fig. 4). Fig. 4 Scala di linguisticità delle categorie non segmentali dell'inglese (David Crystal 1969, p. 131) Come è visibile dalla figura, l’intonazione (compresa nei parametri Pitch direction e Pitch Range), nell’insieme delle caratteristiche non segmentali considerate, occupa una posizione più vicina al dominio linguistico. Una quarta e ultima risposta è quella fornita da Albano Leoni (2009) che pone a fondamento della linguisticità il tema della significazione, proponendo una prospettiva più ampia di pertinenza che valuti le caratteristiche specifiche del segnale fonico sulla base della complessa interazione semiotica che contraddistingue ogni scambio comunicativo. 22 In questo quadro assumono spazio importante la dimensione pragmatica, la multimodalità, il gioco delle inferenze, i rinvii al contesto e al cotesto, i ruoli dei locutori, le modalità degli scambi comunicativi. Una prospettiva dunque che tende a integrare e fondere completamente le due dimensioni del linguistico e del paralinguistico, a rivalutare il ruolo giocato dall’intonazione e in generale dalla prosodia (Albano Leoni 2009, pp. 41-63), e a considerare la variabilità non come accidente o residuo marginale della struttura linguistica, ma come sua parte costitutiva. 21 2.2 Il significato linguistico dell’intonazione Se da una parte le questioni relative alla linguisticità o meno dei fenomeni intonativi sono state rivolte, come si è visto, soprattutto alla dimensione del significante, mediante la definizioni e la circoscrizione di etichette più o meno condivise, non meno problematico è invece il lato del significato. Uno dei principali problemi riguardanti l’analisi e la conseguente rappresentazione dell’intonazione è infatti relativo alla costruzione della forma del contenuto. Differenti prospettive teoriche sull’oggetto lingua hanno di fatto considerato come pertinenti solo alcune delle innumerevoli funzioni svolte dalle variazioni della F0, finendo per spostare di volta in volta il limite ‘interno’ della lingua e di conseguenza gli interessi della disciplina. André Martinet, come si è accennato, non negava la rilevanza funzionale delle variazioni intonative, ma ne marginalizzava il ruolo. Secondo il linguista francese, a variazioni intonazionali non vi sarebbero cambiamenti nel valore del segno linguistico: Quel che importa soprattutto notare a proposito della melodia del discorso in una lingua come l'italiano è che le variazioni della sua curva non possono cambiare l'identità di un monema o di una parola: in Piove? con melodia ascendente si ha la medesima parole piove come compare in Piove., con la melodia discendente. Anche se la differenza fra le due curve si manifesta soltanto, non è in gioco il 21 “Se è vero che la prosodia e la voce concorrono alla generazione dei sensi, e sono tra gli strumenti per la loro interpretazione, allora è vero che esse sono parte integrante del significante, dunque della lingua, di cui vengono ad essere componenti anche funzionali” (Albano Leoni 2009, p. 78). 23 valore della parola isolata, ma quello di un segmento enunciato più vasto, che può essere la frase intera (Martinet, 1960 [1971], p. 100). Una simile posizione è riscontrabile anche in autori come Kenneth L. Pike (1945). Per il linguista americano infatti la funzione principale dell'intonazione nella lingua inglese è costituita maggiormente da quella relativa alle attitudini del parlante: Most sentences or parts of sentences can be pronounced with several different intonation contours, according to the speakers momentary feeling about the subject matter (Pike 1945, p. 23). Nell'ambito dello studio di Pike, tali contorni hanno la funzione di modificare in maniera temporanea il valore del significato lessicale, riproponendo sotto una luce leggermente diversa l'argomentazione di Martinet: English word have basic, intrinsic meaning; these LEXICAL MEANING are the ones found in the dictionary. […] all of the lexical meanings have this in common, that they are indicated only by the requisite consonants, vowels, and stress, and a context where such a meaning is possible; in that sense, the lexical meaning is intrinsically a part of the word itself and not dependent upon extraneous phenomena such as pitch produced by emotion. […] The intonation meaning is quite the opposite. Rather than being a stable inherent part of words, it is a temporary addition to their basic form and meaning. Rather than being carried by permanent consonant and vowels, it is carried by a transitory extrinsic pitch contour. Rather than contributing to the intrinsic lexical meaning, according to the attitude of the speaker (Pike 1945, p. 21). Inoltre, secondo Pike, uno dei pericoli maggiori insiti nell'analisi semantica di contorni intonativi consiste proprio nella tendenza ad astrarre particolari significati da enunciati linguistici occorrenti in specifici contesti grammaticali e fisici. L'errore che più facilmente può essere commesso è dunque: To select phrases of a particular grammatical construction, demonstrate that a certain contour may appear on all of those phrases, and then claim that the contour in question means or indicates that grammatical pattern-- in spite of available 24 evidence that contour appear on other grammatical phrase type, or that the phrases used could receive any of dozen other contours (Pike 1945, p. 21). La logica che segue l’argomentazione dei due autori è abbastanza chiara e ripropone la tradizionale dicotomia tra denotazione e connotazione, ossia l’opposizione tra un significato principale, o quanto meno privilegiato (il ‘significato intrinseco’ di cui parla Pike) e un significato ‘estensivo’ variabile, secondario, sovrapposto al primo, e quindi, in un certo senso, non pertinente da un punto di vista ‘interno’. È evidente che da questa prospettiva l’intonazione e la prosodia troverebbero, come in parte è avvenuto, uno spazio di considerazione ridotto. La loro azione è, come si è ripetuto più volte, strettamente interrelata con le dinamiche comunicative e contestuali dei parlanti. Il problema, quindi, come verrà mostrato nelle prossime pagine, risiede in particolare nel modo in cui gli autori hanno considerato il rapporto tra la rappresentazione metalinguistica e l’ipotesi relativa al funzionamento della langue. La distinzione tra denotazione e connotazione diviene infatti applicabile, al modo di Pike, solo se si considera il sistema linguistico al pari di un codice, con una organizzazione piuttosto determinata di significati e di istruzioni per la produzione e interpretazione dei messaggi linguistici. Se si parte invece dall’atto comunicativo nel suo complesso la gerarchia tra senso e significato andrebbe rimodulata 22 22 . Il significato apparirebbe come amputato, artefatto e frutto di una L’inversione del rapporto tra senso e singificato costringe a rivedere ad esempio la definizione delle unità stesse della lingua. Se nell’ambito della langue l’unità linguistica ideale può essere ricondotta al segnoparola, nel discorso, e quindi nella pratica comunicativa, tale unità diviene problematica. È possibile riscontrare tale tensione già nel Corso di linguistica generale di Ferdinand de Saussure dove, nelle pagine dedicate al meccanismo della lingua, si può leggere: “Di regola, noi non parliamo per segni isolati, ma per gruppi di segni, mediante masse organizzate che sono esse stesse segni” (Saussure 1922 [2005] p. 155) oppure “Una teoria abbastanza diffusa pretende che le sole unità concrete siano frasi: noi non parliamo che per frasi, e soltanto dopo ne estraiamo le parole” (ivi, p. 129). Tra i più attenti lettori e commentatori di Saussure, vi è senza dubbio il linguista Mario Lucidi, il quale propose di considerare segno la frase e di chiamare iposemi i suoi elementi funzionali, parole e monemi, in modo da sottolineare anche a livello terminologico il primato dell’atto espressivo unitario: “[...] chiamare segni tanto i prodotti complessivi dell’atto linguistico quanto le parti che lo costituiscono (unità lessicali, morfologiche, ecc.), significa considerare nella stessa classe e sullo stesso piano entità manifestate non solo diverse ma, per la loro stessa natura situate in piani diversi, e di conseguenza falsare inevitabilmente 25 rappresentazione astratta operata dall’analista e non dal locutore/ascoltatore 23 . Un caso particolarmente significativo è ad esempio quello delle emozioni. 2.3 Il caso delle emozioni È ormai noto come tra le differenti funzioni associate alle variazioni del contorno melodico del parlato vi siano le espressioni delle emozioni. L’inserimento di tali funzioni nel dominio del ‘linguistico’, del ‘non linguistico’ o del ‘diversamente linguistico’ non è del tutto condivisa. Ancora una volta i limiti entro cui i fenomeni vengono classificati, analizzati e rappresentati come pertinenti alla descrizione linguistica, risiedono nelle prospettive con cui le diverse ‘scuole’ o anche i singoli studiosi hanno guardato al proprio oggetto. Nel campo della linguistica, l’idea di distinguere un livello di informazione affettiva interno alla comunicazione non è nuova. Linguisti e studiosi del linguaggio come Sapir (1927), 23 26 la natura di una parte di essi[...]” (Lucidi 1950 [1966] pp 67-68). E ancora “L’atto linguistico come atto espressivo ha la sua realizzazione unicamente e specificamente nel segno considerato nella sua totalità, non in una o più parole, mai in una o più parole come tali. Non in quanto proferisce delle parole, ma in quanto proferendole realizza nella sua compiutezza un atto linguistico, chi parla si esprime: non nelle singole parole proferite in sé e per sé, ma nella compiutezza l’atto linguistico realizzato è un segno che significa ciò che è stato espresso. L’atto linguistico, e solo esso, consti di una o più parole – e quando in una sola parola viene realizzato, questa cessa di essere una parola – è l’unità significativa per eccellenza, suscettibile quindi solo esso di realizzarsi in un’entità cui possa competere il nome di segno. Concludendo, segno, anzi propriamente segno linguistico, va considerata quell’entità fonico-significativa, in cui si realizza l’atto linguistico nella sua compiutezza; mentre parole, elementi lessicali, morfemi, ecc., mancano delle caratteristiche essenziali che individuano qualsiasi segno, e se segni vengono considerati, se ne falsa inevitabilmente la natura” (Ivi, p. 69). Il rapporto tra senso e significato viene similmente considerato ad esempio nella semantica interpretativa di Rastier. Per il semiologo francese il senso non sarebbe l’equivalente del significato deformato dal contesto “Il significato è senso impoverito, perché amputato dal proprio contesto. Il tipo è un insieme di accidenti, un riassunto convenzionale di occorrenze ritenute come pertinenti per la sua definizione. [...] Il significato non sarà più un tipo variamente deformato nelle proprie occorrenze che costituiscono il senso: pensato in questo modo esso si riduce ad un artefatto dell’ontologia, poggiando sulla lessicografia, anche quando i sensi variano senza limite confermando l’intuizione che ogni occorrenza è potenzialmente unica”. Bühler (1934) o Jakobson (1960) 24 avevano assegnato un ruolo alla dimensione emotiva della comunicazione 25 . Karl Bühler, ad esempio, fornì un modello generale e sostanzialmente integrato (Organon-Modell, vedi fig. 5) in cui alla funzione rappresentativa, propria del rapporto tra i segni e gli oggetti, e fatti, del mondo a cui ci riferiamo, vengono collegate le funzioni di appello ed espressione, rispettivamente rivolte all’ascoltatore e, appunto, alla manifestazione dell’interiorità del parlante. 24 25 “Supporre con Saporta che la differenza emotiva è un carattere non linguistico ‘attribuibile all’attuazione del messaggio e non al messaggio stesso’, significa ridurne arbitrariamente la capacità informazionale” (Jakobson 1963, [2002] p.187). In merito al rapporto tra lingua ed emozioni Elinor Ochs e Bambi Schieffelin (1989) hanno riconosciuto all’interno della ricerca linguistica del ‘900 quattro principali filoni. Il primo è legato alla scuola linguistica di Praga, in particolare a Roman Jakobson (1960) che riprendendo l’Organon-Modell di Karl Bühler ha inserito la funzione emotiva nel suo modello comunicativo. Il secondo riguarda invece le ricerche sull’intonazione. Autori come Bolinger (1948, 1978, 1982), Cruttenden (1981), Crystal (1969), Halliday (1975) che nell’ambito delle loro studi linguistici hanno indagato l’interazione tra le variazioni melodiche ed emozioni. Un terzo filone è invece legato agli studi di narratologia. Autori come Michail M. Bachtin (1981) e Kenneth Burke (1962) hanno esaminato i modi in cui i parlanti/scrittori coloravano i loro messaggi per creare un particolare mood o impatto sull’ascoltatore/lettore. Un quarto filone corrisponderebbe agli studi sul linguaggio in età infantile e alla relazione tra emozioni e apprendimento della lingua. A questi è possibile aggiungere il filone della semiologia di stampo strutturalista (Greimas 1983; Greimas e Fontanille 1991) che ha cercato di costruire una semantica della dimensione passionale nel discorso, considerandola non nei suoi effetti reali e biologicamente determinati ma come effetti di senso, e quindi come forme di significazione iscritte e codificate nel linguaggio. 27 Fig. 5 Organon-Modell tratto da Bühler (1934 [1983] p. 81) Il grafico rappresenta le relazioni che l’emissione fonico-acustica stabilisce con le diverse componenti del segno linguistico26. Ogni segno per Bühler: [...] È simbolo in virtù della sua corrispondenza a oggetti e fatti, è sintomo (indice, indicium) in rapporto alla sua dipendenza dall'emittente, della cui interiorità è espressione, è segnale in forza del suo appello all'ascoltatore, di cui dirige come altri segni di scambio il comportamento esterno o interno (Bühler K., 1934 [1983: 81]). Nel modello dello psicologo tedesco la dimensione emotiva viene così ad integrarsi con quella rappresentativa che invece sarà dominante ad esempio nello strutturalismo. La tricotomia funzionale del segno descritta da Bühler fu parzialmente integrata ad esempio nella fonologia strutturale di Trubeckoj. Partendo proprio dal modello strumentale dello psicologo tedesco, Trubeckoj, nell’introduzione ai Grundzüge der Phonologie, sottolineò come la fonologia dovesse mostrare preminente interesse alla 26 28 “Il cerchio in mezzo simboleggia concreto fenomeno acustico. Tre suoi momenti variabili sono incaricati di promuoverlo per tre volte in modo diverso al rango di segno. I lati del triangolo disegnati entro il cerchio simboleggiano questi tre momenti. Il triangolo per un verso include qualcosa di meno del cerchio (principio della rilevanza astrattiva), e per un atro verso si estende oltre il cerchio per indicare che il dato sensibile subisce sempre un’integrazione appercettiva. Gli insiemi di linee simboleggiano le relazioni semanticamente definite del segno linguistico (complesso)” (Bühler 1934 [1983], p. 81). funzione rappresentativa, rispetto a quella di appello ed espressione (presentazione). Proprio sotto queste funzioni si manifestano ad esempio molte delle variazioni intonative che trovano così poco spazio nella sua teoria fonologica strutturale 27. Il linguista russo è infatti esplicito sul ruolo principale che la teoria linguistica fonologica deve riservare alla funzione rappresentativa rispetto a quella di appello ed espressione: Mentre dunque la «fonologia della rappresentazione» esamina tutto il campo dei mezzi fonici di rappresentazione della lingua, gli altri due rami sopra ricordati della fonologia si dovrebbero occupare solo di una piccola parte dei mezzi fonici di espressione e di appello. Ci si può dunque domandare se veramente i tre rami della fonologia si devono considerare su un piano di parità, e d’altra parte se è opportuna la separazione dei mezzi di espressione e di appello convenzionali da quelli naturali e se lo sia il loro inserimento nel campo della fonologia. (…) Nella descrizione fonologica di una lingua la stilistica fonologica (dia della funzione espressiva che della funzione di appello) va presa in considerazione ma il vero compito della descrizione deve pur sempre restare l’esame fonologico del «piano della rappresentazione (Trubeckoj 1939 [1971], p. 34). Ancora più radicale è André Martinet che dichiara come non pertinenti all’analisi gli elementi espressivi: “Bisognerà infine fare astrazione, nella parola registrata, da ogni elemento con funzione espressiva” (Martinet, 1960 [1971], p. 79). Già ad uno sguardo generale è possibile notare come l’articolazione tra funzione rappresentativa ed espressiva, quest’ultima maggiormente legata alla modulazione 27 “Ci si domanda come devono essere considerate queste diverse sfumature dell’intonazione. Appartengono tutte quante alla fonologia di appello e in genere alla lingua? Oppure appartengono solo alla parola? Sono in genere veramente convenzionali? Intonazioni di tipo emotivo appaiono molto spesso anche in manifestazioni non linguistiche (in esclamazioni indistinte o inarticolate), e la determinata emozione che esse devono risvegliare è chiaramente riconoscibile. A quanto pare queste intonazioni extralinguistiche tendenti a suscitare emozioni mostrano la stessa struttura di tono e di intensità delle parole provviste della stessa colorazione emotiva (per la verità questo fatto non è mai stato studiato fino in fondo). Si può anche dimostrare che molte di queste intonazioni hanno lo stesso significato nelle più disparate lingue del mondo. […] Il compito della fonologia dell’appello non sta nella raccolta sistematica di queste inflessioni della voce a sfondo emotivo né nella loro stretta coordinazione a precise emozioni, ma soltanto nello stabilire quei segni fonici convenzionali che, a prescindere dalle suddette inflessioni della voce distinguono un discorso che ha una certa colorazione emotivo da un discorso invece neutro o calmo”(Trubeckoj 1939 [1971], p. 30-31]. 29 melodica, fosse in qualche modo responsabile di una cesura piuttosto netta tra il dominio del linguistico e del non-linguistico o più velatamente paralinguistico. Non vi è dubbio che la prospettiva strutturale allo studio delle lingue abbia potuto favorire tale discrimine operativo. L’attenzione allo studio scientifico della lingua intesa come forma pura, ha condotto, e in alcuni casi anche in maniera estrema, all’estromissione dall’analisi linguistica del ruolo del parlanti. Questi, nella loro viva corporeità e immersi nello scambio comunicativo, rappresentano infatti il luogo privilegiato in cui le funzioni espressiva e d’appello possono manifestarsi. Per Hjelmslev addirittura parlante e ascoltatore sono logicamente secondari rispetto alla struttura fondamentale del linguaggio: Mi asterrò dall’addentrarmi ora in queste controversie, non per il timore di cacciarmi in un ginepraio, ma perché il problema non è rilevante ai fini dell'argomento ora in discussione. È mia opinione che, pur essendo colui che parla e l'ascoltatore (lettore) importante per il completamento dell'atto linguistico, lo sono difficilmente per qualunque atto linguistico, e non lo sono per la struttura del linguaggio. (…) Sarà opportuno precisare qui che, da un punto di vista logico, il parlare è condizione necessaria per il parlante e ascoltatore, mentre non è vero l’inverso. Sia il parlante che l'ascoltatore diventano tali solo grazie alla lingua, mentre invece, come abbiamo visto, si può avere una lingua senza che vi sia alcuno che parli o ascolti. Sono pertanto propenso a ritenere che il parlante o chi ascolta (o legge), o la coscienza che sfocia nella parola, o il comportamento che ne deriva, difficilmente siano rilevanti per ogni atto linguistico (Hjelmslev 1947 [1988], pp. 162-3]). La considerazione della lingua basata sulla completa autonomia della forma da qualsiasi principio semantico e fonetico conduce la glossematica a espellere le emozioni dal proprio interesse scientifico. Marginalizzare il ruolo dei parlanti all’interno dello studio delle lingue significa così marginalizzare il ruolo delle funzioni espressive e d’appello, maggiormente legate alle dinamiche comunicative e, al tempo stesso, ai fatti prosodici e intonativi. Sempre sulla base della loro funzione, le variazioni emotive legate ai movimenti del 30 contorno intonativo sono classificate da Bertinetto e Magno Caldognetto (1993) come appartenenti al dominio paralinguistico opposto a quello linguistico e extralinguistico28. Questo tipo di suddivisione è rintracciabile in molta della letteratura linguistica. Antonino Pagliaro ad esempio utilizzava l’espressione elementi parafunzionali per indicare tutti gli elementi della parola che animano l’atto linguistico di ‘riflessi soggettivi’: Essi consistono in riferimenti accentuativi e tonali, nella maggiore o minore rapidità dell’articolazione fonica, nelle affinità che vengono avvertite fra una immagine acustica e il reale (Pagliaro, 1973, p. 49). In riferimento al tono infatti Pagliaro parla di zona di confine tra dominio funzionale ed extrafunzionale: Con atteggiamenti che variano da lingua a lingua, da una parte è fatto di parola, dall’altro è fatto di lingua, cioè partecipa del sistema come elemento della sua funzionalità, e, in taluni casi, ha addirittura valore fonematico nell’ambito del singolo segno (Pagliaro 1957, p. 72). Un secondo e importante problema riguarda inoltre il piano della categorizzazione dei contenuti emotivi. Come rileva Sornicola (2013) nell’ambito della stessa psicologia, luogo privilegiato dello studio dei fattori emotivi, non vi è ampio consenso su cosa si debba considerare un’emozione. Al tempo stesso è ancora oggi difficile definire con chiarezza uno stato emotivo: esso mostra infatti confini piuttosto sfumati, e soprattutto è difficile, se non addirittura errato, tentare di isolare concettualmente e formalmente singoli stati. Il piano del contenuto emotivo è graduale, sincretico e vago, e l’interpretazione di una forma fonica risulta spesso non univoca e al contempo molto legata alla situazione discorsiva: [...] Sul piano del contenuto è molto difficile trovare definizioni condivise di stati d’animo o emozioni come, a titolo di esempio, ‘apprensione’, ‘timore’, ‘paura’, ‘terrore’, ‘panico’, e [...] sul piano dell’espressione, non è affatto detto che una 28 I fattori extrafunzionali sono definiti da Antonino Pagliaro come esterni al nesso significante-significato, e perciò senza partecipazione formale al sistema della lingua (1957, p. 76) 31 manifestazione fonica venga interpretata ed etichettata come manifestazione di uno stesso stato d'animo o sentimento da parte di soggetti diversi, perché tra le entità appartenenti a ciascuno dei due piani non esistono discontinuità o confini categoriali [...] (Albano Leoni F., 2003: 34-35). Studi recenti hanno inoltre posto in evidenza l’influenza che la lingua ha sulle esperienze emotive. Quest’ultime sarebbero infatti categorizzate linguisticamente in maniera arbitraria e non troverebbero chiare corrispondenze nel comportamento emotivo dei soggetti. Russell e Barrett (1999) hanno ad esempio mostrato che singoli eventi considerati appartenenti alla stessa categoria emotiva possono presentare delle differenze nel modo in cui sono espresse. Barrett (2006) ha rilevato inoltre come sia difficile far corrispondere a una stessa categoria semantica una serie di configurazioni emotive, rendendo così complessa l’individuazione delle estensioni di ciascuna categoria: It is difficult, if not impossible, to characterize any emotion category by a group of instances that resemble one another in their correlated properties. That is, it is difficult, if not impossible, to empirically identify the extensions of each emotion category" (Barrett 2006, p. 45). A tutto questo si associa quindi la difficoltà di determinare quali parametri sia necessario tenere sotto osservazione per poter studiare il fenomeno. Le emozioni possono essere, infatti, più o meno intense, il più delle volte esse sono il risultato di una complessa compresenza di componenti, non facili da astrarre, e soprattutto non sempre sono interamente veicolate dal segnale fonico. Esse infatti sono comunicate il più delle volte in maniera multimodale, sfruttando la compresenza e l’integrazione di più modalità espressive (Poggi e Magno Caldognetto, 1997; Poggi e Pelachaud, 2000; Magno Caldognetto e Poggi, 2001). Bisogna inoltre tenere in conto che ad indirizzare l’interpretazione del significato complessivo di un enunciato emotivo concorre sensibilmente anche il piano lessicale. In 32 alcuni casi, la difficoltà di categorizzazione propria di alcune emozioni è supportata in maniera determinante dall’informazione verbale. In un recente lavoro dedicato alla manifestazione fonica delle emozioni Vincenzo Vasco descrive le difficoltà incontrate nella classificazione del ‘disgusto’: […]L’informazione verbale è indispensabile al riconoscimento di almeno alcune delle emozioni di base. In tutti i casi in cui l’informazione vocale non permette un sicuro riconoscimento dello stato d’animo, il piano verbale interviene guidando i giudizi degli ascoltatori. E ciò non solo attraverso gli indicatori lessicali, morfologici e sintattici delle emozioni, che pure ho descritto presentando le risposte dei partecipanti. Gli enunciati, per quanto siano stati isolati dal co-testo linguistico e dalla situazione d’enunciazione in cui erano inseriti, permettono agli ascoltatori di ricostruire, anche solo parzialmente, quella situazione e da questa gli stati mentali ed emotivi del parlante. Un enunciato come “Mi fai vomitare, tu a me mi fai vomitare, hai capito?” lessicalizza il disgusto del parlante perché ne descrive una delle conseguenze fisiologiche, la nausea (Vasco 2012, p. 277). Il caso della manifestazione fonica delle emozioni è particolarmente denso di implicazioni teoriche. Da un lato, soprattutto grazie agli studi sulla comunicazione parlata, vi è sempre maggiore consapevolezza e condivisione del ruolo determinante che le stesse hanno nello scambio comunicativo tra i parlanti29; dall’altro il loro carattere costitutivamente graduale, sincretico e dinamico le rendono un oggetto difficilmente integrabile con un modello linguistico fondato storicamente sui tratti tipici del modello segmentale: 29 Magno Caldognetto e Poggi (2004) ricordano come le risorse che i parlanti hanno a disposizione per manifestare il proprio stato d’animo possono essere di diverso tipo: lessicale, tramite la scelta di certe parole emotive; sintattico, mediante l’uso di particolari strutture marcate, ad esempio la dislocazione a sinistra; morfologico, come l’uso di vezzeggiativi, diminutivi e dispregiativi; fonologico di tipo segmentale, attraverso le alterazioni della struttura spettrale delle unità segmentali fonologiche, e soprasegmentale, attraverso le variazioni di durata, intensità e frequenza fondamentale. Inoltre in un recente volume dedicato alla manifestazione fonica delle emozioni i curatori, Magno Caldognetto, Cavicchio e Cosi (2008, vi), sottolineano l’importanza del dominio emotivo per l’analisi linguistica: “I contributi che vengono presentati in questo volume dimostrano l’esigenza di integrare nelle analisi linguistiche dedicate al parlato le emozioni, considerate non solo come componente paralinguistica, ma piuttosto come base cognitiva dell’atto comunicativo che, in quanto tale determina le scelte linguistiche tanto a livello funzionale quanto posizionale collocando il parlato nel più ampio scenario della comunicazione multimodale”. 33 All’interpretazione linguistica deve corrispondere l’identificazione di un valore, che tuttavia non pare affatto pacificamente definito. La minore trasparenza della funzionalità degli elementi soprasegmentali rispetto a quelli segmentali è infatti questione antica e può aver agito da limite all’approfondimento della conoscenza dei fenomeni prosodici, generando una diversità di trattamento dei due piani della fonologia nella storia della teoria linguistica (Giordano 2008, p. 150). Dal punto di visto dei contenuti si è visto come non vi sia una chiara condivisione sul modo in cui esse debbano essere etichettate e organizzate. Dal punto di vista del significante è stato inoltre riscontrato come il meccanismo che regola la trasmissione e l’interpretabilità degli enunciati emotivi non sia ancorato in maniera stabile a pattern espressivi unici e discreti. Le stesse emozioni di base30, considerate in alcuni casi come discrete e universalmente manifestate, trovano non poche resistenze sulla loro riconoscibilità dal punto di vista fonico. La ricerca psicolinguistica ad esempio non è stata in grado, ad oggi, di identificare forme espressive comunemente riconoscibili per le emozioni di disgusto e sorpresa (Scherer K. R., 2003). Tutto ciò si riflette dunque nella difficoltà di organizzare il piano del significante e con esso nella difficoltà della sua rappresentazione31. In tale organizzazione e rappresentazione risiedono infatti le scelte sul numero dei parametri da utilizzare per l’analisi e sulla conseguente delimitazione dei confini categoriali su cui poggerebbero i valori emotivi corrispondenti 32. Al tempo stesso, 30 31 32 34 Con il termine emozioni di base si intendono solitamente le seguenti emozione: gioia, paura, collera, tristezza, disgusto, paura, sorpresa. Esse sono comunemente indicate come innate, universali e manifestate in maniera identica da individui appartententi a culture anche molto differenti tra di loro. Per una revisione della vasta bibliografia sull’argomento cfr. Scherer (2003). Anche limitamente allo studio delle sole emozioni di base, è stato possibile riscontrare una notevole varietà nella raccolta e analisi di dati sia in studi a livello intra-linguistico che inter-linguistico (Magno Caldognetto e Poggi, 2004). Le cause sono da attribuire a numerosi fattori: dalla scelta del materiale (parlato spontaneo, letto, recitato o prodotto in laboratorio), dalla scelta dei parlanti (attori professionisti o persone comuni), dalla scelta del metodo di elicitazione delle emozioni prescelte (presentazione di etichette linguistiche, fotografie, scenari ecc.), fino al materiale linguistico prodotto (vocali o sillabe isolate, interiezione, parole di diversa lunghezza etc.). Problemi descrittivi sono stati evidenziati da Sherer: “[...] part of the problem in demonstrating the existence of qualitative differences between the vocal expression for different types of discrete emotions and the hypothesis that the voice might only reflect arousal, has been due to a limitation with respect to the number of acoustic parameters extracted” (Sherer 2003, p. 249). E ancora: “Efforts to describe/analyze da questa organizzazione e rappresentazione dipende, dal punto di vista scientifico, la comparabilità dei dati e la successiva conferma e disconferma dei risultati. 3 Il problema della rappresentazione In questo primo capitolo ho voluto presentare il mio studio attraverso alcune riflessioni sulla terminologia in uso e sui livelli di analisi in potenza coinvolti nella ricerca. Presentare alcune nozioni, affrontare distinzioni terminologiche e talvolta anche di metodo, mi è parso come una buona base di partenza per lo sviluppo ulteriore del mio lavoro di ricerca. Credo infatti che le due problematiche relative all’intonazione, affrontate in questo primo capitolo, ossia la pertinenza linguistica e il modello di descrizione possibile, riguardino molto da vicino il problema della notazione in generale e le esigenze di metodo in particolare, offrendo insieme e di conseguenza quasi un “apparato normativo” per la lettura e l’organizzazione dei significanti. La terminologia manifesta di fatto una certa oscillazione tra posizioni tutte interne alla teoria linguistica e al metodo. Il caso delle emozioni che ho scelto di citare dimostra come il rapporto tra teoria, analisi e oggetto dell’analisi non sia immediato ma mediato e come esso passi dal piano del significante e da quello del significato. Albano Leoni e Magno Caldognetto, per esempio, considerano le emozioni linguisticamente e in stretto legame alla componente intonativa. Integrare le emozioni nella teoria linguistica diventa così un passaggio necessario per l’accettazione di esse come oggetto di possibile rilievo in un dato apparato teorico e di ricerca. Sarà utile a questo punto segnalare la distinzione terminologica presente in lingua tedesca con i termini Vorstellung e Darstellung. Entrambe si riferiscono alla nozione di rappresentazione. Nel primo caso il riferimento è a una “rappresentazione interna”, mentre the intonation of actual emotional expressions have been limited by the use of simplified descriptors, such as measures of overall pitch level, pitch range or overall rise/fall of pitch contours” (Bänziger e Scherer 2005, p. 254). 35 nel secondo caso il riferimento è a una “rappresentazione esterna” di tipo simbolico. Quest’ultima, nell’accezione Kantiana, viene descritta come una sorta di presentazione metaforica, una presentazione indiretta di ciò che non si può rappresentare intellettualmente mediante concetti. L’accezione che qui si intende dare alla rappresentazione vuole mettere in luce il carattere ‘creativo’ e ‘formativo’ di questa presentazione simbolica. L’analisi dei meccanismi e dei problemi relativi ai modelli notazionali permette infatti di rendere ‘visibile’ gli elementi del dato sonoro che le teorie hanno formalizzato e reso quindi pertinenti. Questi elementi non fanno parte di un mondo scomponibile e analizzabile in maniera univoca, ma sono il frutto di complessi processi di interpretazione, discussioni, spesso mediati da conoscenze scientifiche o da altri tipi di rappresentazione elaborati in contesti diversi (è il caso della musica ad esempio). Così come l’azione dei segni si staglia sul solco che separa i soggetti dal mondo, allo stesso modo i modelli stessi che le teorie elaborano per analizzare i propri oggetti subiscono le conseguenze di tale distanza 33. Su questa linea si può ricondurre ad esempio la riflessione del filosofo Nelson Goodman che ha dedicato feconde pagine alla nozione di rappresentazione: Il modo più ingenuo di concepire la rappresentazione potrebbe essere formulato così: «A rappresenta B se e solo se A somiglia apprezzabilmente a B» ovvero «A rappresenta B nella misura in cui A somiglia a B». Tracce di questa concezione, 33 36 Condivisibili sono a questo proposito le considerazioni di Prieto (1975 [1976], p. 121-140) sul rapporto tra pertinenza e ideologia in relazione alle conoscenza nell’ambito delle scienze della natura e delle scienze umane “Per il fatto che la pertinenza non viene mai dall’oggetto si può già concludere che non c’è mai conoscenza della realtà materiale che sia “oggettiva” nel senso che essa starebbe passivamente difronte all’oggetto rispecchiandolo “così com’è” o, in ogni caso, in un modo che non dovrebbe niente se non all’oggetto stesso. Ma è possibile andare ancora più lontano: dal fatto che la pertinenza è introdotta da un soggetto che è sempre un soggetto sociale deriva che non può esserci conoscenza della realtà materiale che sia socialmente “neutra”. E questa conclusione è valida, è chiaro, tanto per i modi non scientifici di conoscere la realtà materiale quanto per i modi scientifici di conoscerla, cioè per le scienze della natura” (Prieto (1975 [1976], p. 126-127). Di converso l’ideologia sarà intesa come “ogni discorso riferentesi a una conoscenza della realtà materiale che miri a “naturalizzare” questa conoscenza, cioè a spiegarla o farla apparire come la conseguenza necessaria di ciò che è il suo oggetto” (ibidem p. 136). Sul rapporto tra scienza e attività scientifica come prassi socialmente determinata cfr. Latour (1987 [1998]) variamente modificata e corretta restano in gran parte della letteratura sulla rappresentazione. Sarebbe tuttavia difficile concentrare una maggior quantità d’errore in una formula così breve (Goodman, 1968 [2008], p. 11). Il breve estratto del lavoro di Goodman affronta sinteticamente alcuni aspetti che si ritengono di particolare utilità. In prima analisi la critica all’idea che vi possa essere un rapporto immediato tra A (configurazione segnica) e B (il suo oggetto). Idea che sostanzialmente si può far coincidere con quella di lingua come nomenclatura, ossia di una lingua intesa come un elenco di etichette variamente applicate ad oggetti del mondo già categorizzati. La rappresentazione non consiste, per Goodman, in una duplicazione punto a punto dell’oggetto, né in una riproposizione in termini segnici di una sua ‘essenza’ che si colloca al di là dei soggetti e del loro modo di ‘conoscere’. Il nodo centrale che viene posto in evidenza dal filosofo statunitense è il riconoscimento di un processo di mediazione e al tempo stesso convenzionale che si stabilisce tra l’oggetto e la configurazione segnica 34. Non c’è, tra il simbolo e l’oggetto al quale il simbolo allude, alcuna relazione di corrispondenza costretta dalla qualità dell’oggetto. La relazione al contrario può stabilirsi in maniera ‘arbitraria’ mediante la selezione di aspetti e caratteristiche di volta considerati pertinenti: L’identità o invarianza di un mondo vuol dire identità rispetto a quel che all’interno di quel mondo vale come organizzato (Goodman 1978 [2008], p. 9). Un secondo aspetto che emerge dalla riflessione di Goodman è la critica nei confronti di una nozione ingenua di somiglianza35. Quest’ultima altro non sarebbe che un effetto, una 34 35 “La verità è che un quadro, per rappresentare un oggetto, deve essere un simbolo di esso, stare per esso, riferirsi ad esso; e che nessun grado di somiglianza è sufficiente per instaurare la relazione di riferimento richiesta” (Goodman, 1968 [2008] p. 13). Il problema dell’iconismo, iniziato sulla base della nozione di icona in Peirce, ha avuto, soprattutto durante gli anni ’70, una centralità nel dibattito teorico sul linguaggio, e in particolare nelle arti visive 37 sorta di effetto di realtà, che si fonda su complesse costruzioni convenzionalmente accettate. Il rifiuto della concezione di rappresentazione intesa come copia è sostituita dall’idea che rappresentare è in prima istanza interpretare l’oggetto sotto un particolare punto di vista. In questo senso anche la somiglianza è riconducibile alla riproposizione in termini segnici di relazioni individuate tra proprietà dell’oggetto. La teoria della rappresentazione come copia, dunque, si trova bloccata sin dall’inizio dall’incapacità di specificare che cosa debba essere copiato. Non un oggetto nel modo in cui è, né in tutti i suoi modi di essere, né nel modo in cui esso appare all’occhio prima che la mente intervenga. Inoltre c’è qualcosa di sbagliato nella nozione stessa di copiare un qualche modo di essere dell’oggetto, un qualche suo aspetto. Poiché un aspetto non è propriamente l’oggetto-a-una-certa-distanza-eangolazione-e-sotto-una-certa-luce; ma è l’oggetto così come noi lo consideriamo o concepiamo, una versione o un’interpretazione dell’oggetto. Rappresentando un oggetto, noi non copiamo tale interpretazione – la otteniamo (Goodman, 1968 [2008], p. 16). Mi soffermerò brevemente su un caso particolarmente significativo che coinvolge un particolare tipo di rappresentazione: la mappa. Le mappe geografiche sono un ottimo strumento esplicativo per indagare il ruolo e le conseguenze della rappresentazione intesa come forma di interpretazione e conoscenza. Una prima conseguenza del rappresentare qualcosa su una tavola è l’inevitabile attribuzione ad essa di proprietà spaziali. Gli oggetti assumono una collocazione, una distanza, divengono in qualche modo misurabili, comparabili e organizzabili. Come si è visto, Goodman rifiutava l’idea di rappresentazione come copia. Fare la copia di una città o di un territorio significherebbe a questo punto incarnare il famoso paradosso di Jorge Luis Borges relativo alla Mappa dell’Impero in scala 1:1. Ovviamente oltre che (Eco, 1968; 1975; 1997; 2007) (Fabbrichesi Leo, 1983; Gombrich, 1961; Goodman, 1968; Maldonado, 1974; Volli, 1974; 1975). La posizione di Nelson Goodman è molto vicina a quella semiotica: la somiglianza che si stabilisce tra l’oggetto e il segno sarebbe frutto di scelte e costruzioni simboliche convenzionali. 38 tecnicamente dispendioso ciò sarebbe soprattutto inutile. Una mappa geografica è infatti uno strumento finalizzato a usi piuttosto determinati: possiamo usarla per orientarci in luoghi circoscritti, per pianificare viaggi, itinerari, studiare la conformazione dei territori o anche progettare un attacco militare. Ciò è reso possibile dal fatto che essa è ‘a portata di mano’. In breve, ciò che risulta pertinente non è tanto la distanza assoluta tra gli elementi simbolici e l’oggetto rappresentato, ma il rispetto delle proporzioni delle relazioni, in breve il rispetto del rapporto tra le distanze. Vi è poi un secondo aspetto connaturato al primo e che riguarda la selezione dell’informazione. Ciò che la carta geografica permette di vedere non è l’oggetto come possiamo osservarlo ‘a occhio nudo’. In esso le informazioni potenzialmente segnalabili vengono accuratamente selezionate e rese più evidenti mediante artifici simbolici. Sulla base di questa selezione avremo tipologie di mappe differenti: da quelle generiche (fisiche, politiche) a quelle speciali (carte idrografiche, nautiche, geologiche etc.) fino alle carte tematiche (carte climatiche, geomorfologiche etc.). Ciascuna di esse permette di scorgere aspetti di un oggetto densamente composto e al tempo stesso fornisce indicazioni adeguate all’obiettivo per cui ce ne serviamo36. Aggiungiamo inoltre che, a loro volta, ciascuna di queste mappe può essere ‘manipolata’ per far emergere ulteriori aspetti del luogo o del territorio rappresentato, non immediatamente visibili. In una carta topografica è possibile segnalare particolari itinerari, segnalare tipologie particolari di edifici (storici, commerciali, etc.) e destinarla quindi a obiettivi diversi. 36 La ‘destinazione d’uso’ di un particolare tipo di rappresentazione non è un criterio che può essere considerato esterno o marginale. L’uso costituisce infatti un aspetto centrale del problema, divenendo spesso condizione d’esistenza della rappresentazione stessa, o aspetto di influenza delle sue caratteristiche. Basti pensare alle problematiche legate alla misurazione. “Use enters the very concept of representation, as we have seen: to be a representation is to be something used or taken to represent something. But in addition, representations have their uses. They are typically produced for a certain use, with a certain purpose or goal” (van Fraassen 2008 p 76). 39 Nella trascrizione dell’intonazione è possibile rinvenire molte caratteristiche simili. Il suono una volta proiettato sul supporto planare acquista proprietà spaziali e fisiche. Sarà quindi misurabile, confrontabile e scomponibile in più parti. L’analisi acustica consente ad esempio di individuare relazioni non percepibili dai sensi e di spiegarne le componenti mediante formule matematiche. Le stesse possono essere utili per tradurre il tutto in immagini su assi cartesiani attraverso complessi algoritmi che ne consentono una sorta di ‘trasduzione’ grafica. Al contempo tali immagini possono costituire termine di paragone con altri livelli di pertinenza per l’analisi: alle modulazioni della frequenza fondamentale è possibile sovrapporre l’andamento di intensità o sovrapporre un diagramma che permetta di illustrare le formanti. La sola analisi acustica tuttavia non può ‘mostrarci’ il meccanismo funzionale della lingua che dovrebbe essere invece descritto mediante altri mezzi rappresentativi o almeno in concomitanza37. Se a questo confrontiamo ad esempio il modo di organizzare lo stesso fenomeno su un supporto planare destinato alla rappresentazione musicale avremo risultati sensibilmente diversi. La partitura sarà infatti ottimizzata per l’individuazione e la descrizione di proprietà e relazioni proprie del sistema musicale. L’organizzazione discreta delle unità foniche in note musicali è vincolata alle regole armoniche e melodiche e soprattutto è vincolata alla possibilità che esse possano essere eseguite mediante uno strumento musicale38. 37 38 40 Prendendo ancora in prestito la metafora della carta geografica, sarebbe difficoltoso studiare l’organizzazione politica del territorio italiano (la precisa collocazione delle Regioni, Province e dei Comuni ad esempio) partendo dalle informazioni estratte dalla sola cartina fisica. Avremmo forse l’opportunità di intuire alcune forme di organizzazione sulla base di confini naturali (è il caso di catene montuose o fiumi) ma difficilmente potremmo usarla per una descrizione adeguata al nostro obiettivo. La stessa rappresentazione acustica della f0, corrispondente a un suono puro, sarebbe limitante rispetto alla ricchezza timbrica degli strumenti musicali che il cui ‘carattere’, tra le altre cose, tra le altre cose è dato proprio dalla diversa composizione delle frequenze armoniche. Eppure l’utilizzo dello spartito musicale per la rappresentazione dell’intonazione linguistica non è stata un’ipotesi isolata. Joshua Steele, si vedrà in particolare nel capitolo 2, la utilizzò per controbattere la tesi di Lord Monboddo e dimostrare l’esistenza nella lingua inglese di variazioni tonali oltre a quelle di tipo dinamico. Jones si servì di questo strumento notazionale per la trascrizione degli andamenti melodici sotto forma di contorni continui e Fonagy e Madgics (1963) lo utilizzarono per dimostrare l’isomorfismo degli andamenti melodici emotivi in musica e nella lingua. Quest’ultimo aspetto è indicativo rispetto al ruolo che le precedenti interpretazioni e le precedenti rappresentazioni ‘esterne’ di un fenomeno possono esercitare sui nuovi modelli interpretativi. Lo studioso di filosofia della scienza Bas C. van Frassen ha approfondito i meccanismi che regolano le immagini scientifiche, così come modelli e teorie in vari campi del sapere: dalla matematica alla chimica, dalla fisica alla meteorologia. Egli stesso ha rilevato l’impatto del linguaggio sulle nuove teorie: Tutto il nostro linguaggio è profondamente contaminato da teorie. Se potessimo purificare il nostro linguaggio dai termini carichi di teoria, a cominciare da quelli introdotti di recente come «ricevitore VHF», continuando con «massa» ed impulso fino ad «elemento» e così via nella preistoria della formazione del linguaggio, potremmo trovarci, alla fine, senza alcun risultato utile. Il modo in cui parliamo, ed in cui parlano gli scienziati, è guidato dalle immagini fornite dalle teorie precedentemente accettate. Questo vale anche, come fu già sottolineato da Duhem, per i resoconti sperimentali” (van Fraassen, 1980 [1985], p. 39) 39. 39 Nell’ambito della teoria dell’arte Ernst Gombrich (1960 [2002]) ha fornito ad esempio una folta documentazione con l’obiettivo di mostrare come il modo in cui noi vediamo e raffiguriamo è influenzato dall’esperienza, dalla pratica, dagli interessi e dalle disposizioni. In una intervista al sito dell’associazione culturale ASIA Edoardo Boncinelli spiega come anche a livello percettivo e neurofisiologico vi sia una forte influenza di ciò che noi sappiamo su ciò che in questo momento stiamo vedendo: “Gli stimoli nel mondo non ci sono, ci sono soltanto onde elettromagnetiche, ci sono onde sonore, molecole, ma il colore rosa, il LA, l’odore del gelsomino non ci sono, questi nascono da dentro di noi, sono sensazioni che vengono colte dal mare degli stimoli fisici e chimici che evidentemente devono esserci. La corteccia cerebrale fa questa sintesi, mette insieme le informazioni sugli angoli, sul colore, mette insieme anche quello che io so su quello che vedo e comprendo, infatti il bambino vede abbastanza bene ma coglie molto 41 Il ritardo con cui gli studi linguistici hanno dato attenzione ai fenomeni intonativi e prosodici della lingua potrebbe infatti essere letto anche secondo questa linea interpretativa. L’assenza di una rappresentazione adeguata o di strumenti in grado di rendere il fenomeno osservabile e di conseguenza analizzabile 40 ha tenuto in latenza riflessioni e elaborazioni teoriche: La prosodia è un fenomeno difficile da studiare per molti motivi. Il primo è certamente il fatto che tutte le variabili fisiche che la determinano (il tempo e l’intensità per il ritmo, la frequenza per l’intonazione) si dispongono lungo un continuum del quale non esiste una rappresentazione discreta già data (come è invece grazie alla scrittura, per la fonologia, morfologia, lessico e, in parte, sintassi). E questo aspetto è alla base di numerosi problemi teorici ed applicativi (Albano Leoni, 2009, p. 41). Sorte opposta sembra invece essere stata quella legata al modello segmentale. Recentemente Albano Leoni (2005, 2007, 2009) ha approfondito il rapporto tra la nozione linguistica di fonema e la rappresentazione alfabetica, mettendo in luce tra le due una stretta relazione: Il concetto di unità minima, come elemento naturale della costituzione fonica delle lingue, accompagna la cultura occidentale fin dall’antichità, e nasce dalla messa a punto e dalla diffusione di scritture alfabetiche. La produzione di testi scritti in forma alfabetica, cioè come successione lineare di elementi grafici discreti e (dopo la loro canonizzazione) tendenzialmente invarianti, corrispondenti ciascuno a un segmento fonico, è il frutto di un lavorio durato molti secoli e che ha visto il succedersi, l’alternarsi e l’intrecciarsi di scritture ideografiche, sillabo grafiche, miste, alfabetiche. [...] Il significante era dunque rappresentato nella scrittura che, nella sua forma alfabetica, consentiva di vedervi quelle proprietà di linearità e 40 42 meno della realtà perché non ha ancora una stratificazione di conoscenza” (L’intervista è reperibile presso il sito internet http://www.asia.it) Basti pensare che il cimografo, il primo strumento che ha permesso di rappresentare graficamente il flusso d’aria durante la fonazione è stato introdotto per la prima volta in fisiologia da Carl Ludwig nel 1855. Esso fu successivamente ripreso e modificato per ricerche in campo fonetico dall’abate P. J. Rousselot nel 1897 (Giannini e Pettorino 1992). Il cimografo fu ad esempio utilizzato in combinazione con un supporto basato sulla notazione musicale tradizionale da Daniel Jones (1922) nei suoi studi sperimentali sull’intonazione. discretezza che ho detto (Albano Leoni, 2009, p. 83). Simili considerazioni non sono nuove. Diversi linguisti e studiosi del linguaggio hanno visto nella scrittura alfabetica un modello determinante per l’elaborazione del principio delle unità foniche: è il caso di Leopardi 41, Croce42, Harris 43, Saussure44. Le caratteristiche di discretezza e segmentalità, che, come si è visto, hanno caratterizzato l’immagine scientifica della lingua, e al tempo stesso hanno determinato il dominio dei fenomeni ascrivibili alla linguisticità, altro non sarebbero che il riflesso delle caratteristiche della lingua come pertinentizzate dalla scrittura alfabetica. La sovrapposizione fra le caratteristiche della scrittura e l’immagine scientifica della lingua è rintracciabile in numerosi autori. A tal proposito si possono leggere le parole di Hjelmslev: 41 42 43 44 “L’alfabeto è la lingua col cui mezzo noi concepiamo e determiniamo presso noi medesimi l’idea di ciascuno di detti suoni. Quegli che non conosce l’alfabeto, parla, ma non ha veruna idea degli elementi che compongono le voci da lui profferite. Egli ha ben l’idea della favella, ma non ha per niun conto le idee degli elementi che la compongono [...] Ma per determinare gli elementi della voce umana articolata, l’unica lingua, come ho detto, è l’alfabeto” (Leopardi in Gensini 1998, pp. 48-54). De Mauro (1965, p. 92) ricorda che: “Il Croce intendeva negare che fonemi, sillabe, parole avessero un grado di realtà pari a quello dell’atto espressivo-intuitivo, e intendeva asserire che le unità linguistiche di cui si discorre nelle grammatiche o si fa l’elenco nei dizionari sono il prodotto dell’attività estraente degli individui, ossia [...] sono il frutto della prassi: esso sono create non dai parlanti, ma dei grammatici e dai linguisti nella loro attività schematizzatrice e catalogatrice”. "L’idea che nel parlare selezioniamo singole consonanti e vocali, che in qualche modo spuntano nella nostra bocca allineate nell’ordine giusto, come perline su un filo, non è altro che l’immagine dell’ortografia alfabetica proiettata all’indietro sulla produzione orale" (Harris 1986 [1998], p. 47-48). Harris giunge addirittura a negare l’idea che l’alfabeto, in origine, avesse l’obiettivo di rappresentare la struttura fonica della lingua. Per il linguista, agli inventori dell’alfabeto: “Non interessava rappresentare quella che oggi sarebbe chiamata morfologia, vale a dire la scomposizione grammaticale interna delle forme di una parola o la variazione sistematica fra forme correlate di una parola. Né interessa rappresentare la composizione sintagmatica di gruppi di parole. Né ancora [...] interessava rappresentare gli aspetti dell’accento e dell’intonazione. Ma la conclusione più paradossale è che essi non erano interessati al principio alfabetico in sé stesso – o almeno non al principio alfabetico così com’è di solito interpretato dai moderni studiosi: vale a dire, il principio “una lettera: un suono” (Harris 1986 [1998], p. 131). “Quando mentalmente si sopprime la scrittura, chi è privato di questa immagine sensibile rischia di non percepire più niente altro che una massa informe di cui non sa che fare. È come se si levasse il salvagente a chi sta imparando a nuotare” (1922 [2005], p.44). 43 Con l’invenzione della scrittura alfabetica si era capito che dovevano essere creati tanti segni diversi quante erano le differenze di espressione rese necessarie dalla lingua per assicurare la comprensione linguistica. Dunque, con l’invenzione dell’alfabeto è stata individuata, o si è cercato di individuare, non la struttura della pronuncia, bensì la struttura della lingua stessa. Non è avvenuta una trasposizione della sostanza fonetica in quella grafica, ma la forma dell’espressione linguistica è stata direttamente calata nella materia grafica per poterla fissare. Ovviamente, questa analisi primitiva non si è presentata come riflessione teoretica, ma piuttosto come un’intuizione pratica e perciò non possiamo meravigliarci che non abbia colto la situazione reale abbastanza profondamente da evitare la confusione di forma e sostanza (Hjelmslev 1938 [1988], p. 223) La posizione del linguista danese sintetizza due importanti questioni. La prima, e condivisibile, consiste nel considerare l’espressione scritta come una delle modalità semiotiche con cui si attualizza una più generale facoltà di linguaggio45, la seconda, non condivisibile, è quella di considerare i due tipi di manifestazione come equipollenti e dunque distinguibili esclusivamente dal punto di vista della sostanza: La fonematica deve considerare i fonemi come elementi del sistema di una lingua, senza considerare il modo articolare in cui sono realizzati. Essi, infatti, possono essere realizzati per mezzo di suoni, ma anche in molti altri modi, ad esempio per mezzo di lettere o di altri segnali che siano comunemente adottati da due o più individui. Fra suoni e linguaggio non vi è una connessione necessaria: lo dimostra il fatto che per esprimere fonemi possono essere utilizzati simboli diversi dai suoni (Hjelmlsev 1936, p. 213). Alcuni autori non si soffermano ad una equipollenza strutturale dei due sistemi e si spingono alla formulazione di ipotesi relative ai meccanismi cognitivi che regolerebbero 45 44 La scrittura in questo senso può essere considerata come una delle tante forme semiotiche in cui il linguaggio umano in senso più ampio può trovare espressione. Vi è tuttavia un’ulteriore considerazione che credo debba essere esplicitata. Mi riferisco alla tendenza, in più luoghi criticata (Cardona 1981, Harris 1986 [1998], p. 65-82), di vedere nell’alfabeto una ‘naturale’ evoluzione dei processi di scrittura verso uno stadio ideale di perfezione: Roy Harris parla a tal proposito di ‘fallacia evoluzionistica’. Ammettere l’ipotesi evoluzionistica della scrittura, significherebbe infatti appiattire tale nozione su un punto di vista ‘fonocentrico’, esautorando invece il complesso di manifestazioni espressive, riconducibili alla stessa facoltà di linguaggio, che comprende anche la produzione e l’uso di sistemi grafici con fini comunicativi e non solo. Non sarebbe del tutto improbabile vedere in questo diffuso appattiamento delle implicazioni sul destino linguistico della prosodia. in maniera del tutto similare la manifestazione e l’interpretazione della lingua scritta e l’elaborazione e l’interpretazione della lingua parlata: It is precisely that parallelism of phonemics and graphemics which renders feasible a phonemic transcription, that is, a transcription in which each grapheme represent one phoneme, and in which no phoneme can be rendered by more than one grapheme. In such a writing the function and properties of the phoneme and grapheme are exactly equivalent, except that different processes of production and different perceptive sense are involved: the hand and the eyes for the grapheme, the vocal apparatus and the ears for the phoneme. In such an alphabet ‘letter’ and ‘sound’ are synonymous. If today we distinguish between letter (o better grapheme) and speech sound (or better phoneme), the reason is that there has hardly ever existed in any language with some tradition of writing a strictly one to one ratio between the two (Pulgram 1951, p. 19) 46. Il punto su cui credo debba essere condotta la riflessione risiede, nuovamente, sulle due accezioni di rappresentazione prima proposte, e quindi nel rapporto tra la darstellung, come rappresentazione simbolico-convenzionale ‘esterna’ e vorstellung come rappresentazione ‘interna’ propria dei parlanti. Mi sembra che nei casi appena mostrati si tenda a far coincidere la seconda, e quindi la ipotetica capacità inconscia dei parlanti di servirsi della lingua, con la prima, ossia con il modello metalinguistico storicamente e convenzionalmente elaborato. È evidente che se si accetta questo tipo di sovrapposizione, che porta a considerare i fenomeni linguistici costitutivamente, discreti, segmentabili, è difficile riservare un ruolo centrale alla prosodia e alla melodia del parlato. Una delle soluzioni proposte per la rappresentazione linguistica dell’intonazione è stata, come si è visto nelle pagine precedenti, quella di trasferire sul significante intonativo le 46 Secondo Ernst Pulgram anche gli animali farebbero uso delle distinzioni fonemiche dell’uomo per riconoscere gli ordini: “Even animals can do better than that, since they react to phonemes (hardly to intellectual, semantic content) of a human command regardless of the speaker’s allophonic habits Once a dog has learned to obey the order ‘Down’, he will behave accordingly no matter who pronounces the word” (Pulgram 1951, p. 16). 45 caratteristiche considerate peculiari dal ‘modello segmentale’. Questa operazione trova tuttavia diverse resistenze, alcune delle quali saranno approfondite nel corso del lavoro47. Vi è prima di tutto la profonda differenza tra la nozione di fonema48 applicata all’ambito segmentale e la stessa applicata in ambito prosodico. I due livelli, infatti, sono tradizionalmente basati su elementi fonologici le cui proprietà e i cui tratti fonetici sono ritenuti intrinseci nel primo caso e relativi nel secondo: Un segmento intonativo di prosodia ritagliato dal suo contesto è in sé totalmente privo di significato e di funzione, perché i valori che determinano la prosodia, e dunque anche l’intonazione, sono sempre e tutti radicalmente relativi, valutabili e interpretabili solo in rapporto a ciò che segue e a ciò che precede all’interno dell’intera unità prosodica considerata. Quindi, di un segmento vocalico in sé, del quale posso descrivere in modo ‘oggettivo’ l’altezza, la durata e l’intensità (oltre che il timbro), non posso dire se sia linguisticamente acuto o grave, lungo o breve, intenso o debole (Albano Leoni 2001, p. 58). Uno stesso suono sarà considerato basso, quando ciò che precede e/o segue ha valore, in termini di altezza, maggiore, al contrario sarà considerato alto se ciò che precede e/o segue ha valore, sempre in termini di altezza, minore. La proposta derivata dallo strutturalismo americano, di organizzare i valori delle altezze in 4 livelli astratti (chiamati pitch phoneme) fu criticato proprio per l’ambiguità con cui una stessa manifestazione fonica poteva essere ricondotta a trascrizioni, e di conseguenza a combinazioni di fonemi intonativi, differenti49. Vi è poi la differenza dal punto di vista dei contenuti. L’individuazione dei fonemi segmentali è determinata infatti dalla rilevazione di discontinuità dal punto di vista dei contenuti, una discontinuità che non è riconducibile, se non riduzionisticamente, al livello 47 48 49 46 Cfr. Capitolo 4 La definizione della nozione di fonema è stata oggetto, nel corso della sua elaborazione, di un acceso dibattito. Nel presente studio si è fatto riferimento ai resoconti disponibili in Trubeckoj (1939 [1979], pp. 49-55), Jones (1950 [1967], pp. 253 - 269), Twaddel (1935) e su Albano Leoni (2005; 2009, pp. 82-109). Cfr. Capitolo 4 prosodico, in cui le differenze tra i significati sono molto spesso sfumate e graduali e sono il più delle volte legate all’atto linguistico nel suo complesso. Nel contesto britannico invece, caratterizzato soprattutto per l’attenzione rivolta alla didattica delle lingue, il rapporto tra rappresentazione ‘interna’ e rappresentazione ‘esterna’ sembra invertito. Il punto di partenza è infatti l’atto comunicativo, la quotidiana comunicazione parlata, la possibilità dei comuni parlanti di capire e farsi capire. In questa prospettiva che pone al centro, inevitabilmente, la trasmissione e l’interpretazione dei sensi, risulta particolarmente complesso eliminare o marginalizzare il ruolo della prosodia. Tutto ciò, come immaginabile, ha ricadute decisive sulla scelta dei modelli, sui modelli rappresentativi e, come si è visto, sulla ‘taglia’ del dominio linguistico50. Cap. 2: 1 La Musica delle Parole Musica e intonazione Uno dei tratti che ricorre in molti tentativi di descrizione dell'intonazione linguistica è il suo 50 Come sottolinea Marotta (2003) richiamando la distinzione tra linguistica ‘interna’ e linguistica ‘esterna’, la propensione all’una o all’altra interpretazione del dominio della linguistica implica l’esclusione o l’inclusione del modulo intonativo nel piano del significante. 47 continuo confronto con l'ambito musicale. Sono numerosi gli ‘esperimenti’, soprattutto nella tradizione di studi britannici, volti a servirsi della musica come modello di confronto per indicare le variazioni melodiche del parlato. Tra le conseguenze di questa scelta metodologica vi è il riconoscimento di un'affinità sostanziale tra i due sistemi semiotici, consistente nel medesimo utilizzo del materiale fonico come mezzo di espressione. Numerosi sono gli studi che hanno indagato lo stretto rapporto che lega espressione musicale ed espressione verbale. In ambito musicologico ad esempio l'incontro tra parole e musica è stato esplorato nella poesia o nella musica vocale (Dalmonte 1993, 2005); negli studi etnomusicologici si è prestata molta attenzione alle diverse pratiche che collocano il parlato e il cantato lungo un continuum 51 ; anche la psicologia ha mostrato, mediante esperimenti percettivi (Deutsch, Lapidis, Henthorn, T 2008; Deutsch, Henthorn, Lapidis, 2011), la possibilità di 'trasformare' il parlato in cantato. È evidente che operare una netta suddivisione tra i due ambiti non è operazione da poco. Un primo problema potrebbe essere di ordine strettamente semantico. Qual è il valore della parola musica e qual è invece il valore del termine lingua? Un altro problema ad esso affine potrebbe essere di tipo socio-culturale. L'uso del canto o della musica strumentale può non essere vincolato al semplice intrattenimento, ma entrare a far parte di contesti quotidiani con finalità comunicative diverse da quelle estetiche e più vicine invece a quelle del linguaggio verbale. Un altro esempio è nella poesia dove le componenti acustiche dell'espressione verbale e gli stessi segmenti possono essere organizzati per finalità esclusivamente 'musicali', arrivando addirittura a forme di poesia sonora (Fontana, 2003). Quest’ultima fonda la sua specificità sulla completa disarticolazione del livello verbale, a 51 48 “Nelle tradizioni orali di ogni società la contiguità tra parlato e cantato trova ulteriori conferme nelle numerose modalità di formalizzazione del discorso caratterizzate dalla presenza enfatica di uno o più tratti soprasegmentali nell’enunciazione del messaggio linguistico. Slogan, proverbi, forme di saluto, detti sapienziali, comandi e incitazioni militari, scongiuri, formule magiche, incantesimi, preghiere, discorsi rituali, cantilene infantili, annunci di banditori e di venditori ambulanti - ma la lista potrebbe estendersi a dismisura - sono tutti eventi in cui la caratterizzazione fonica (in particolare ritmica e/o intonativa) assume, nell’atto comunicativo, un ruolo coessenziale, quando non addirittura predominante, rispetto ai tratti più specificatamente referenziali dell’enunciato verbale” (Giattanasio 2002, p. 1004). vantaggio invece delle sole caratteristiche sonore della lingua. D'altro canto anche la nozione di musica non ha mai smesso di definire e ricostruire i suoi confini. Il compositore John Cage si impegnava a "esplorare tutte le possibilità strumentali non ancora repertoriate, l'infinito delle fonti sonore possibili" (Cage, 1976); Luciano Berio nel definire la musica chiarisce come essa sia "tutto ciò che si ascolta con l'intenzione di ascoltare musica" (Berio, 1981). È evidente dunque che l'ammissibilità o meno di un confronto tra i due domini è vincolata inevitabilmente alla prospettiva e al valore che associamo ai due termini. Il nostro ambito di indagine, quello relativo allo studio dei modelli linguistici dell'intonazione, non ha l'obiettivo di rovistare tra le pieghe di questo complesso rapporto ma si limita a riferirne i contatti. L'attenzione alle variazioni melodiche della lingua non è recente. David Crystal (1969) spiega che tra le prime riflessioni sulla melodia della voce umana vi sono le teorie della liturgia medievale. Peter Alan Martin Clemoes (1952) racconta, infatti, che il canto gregoriano era essenzialmente uno sviluppo dei contorni intonativi del parlato quotidiano, una specie di speech-song e mostra che all'interno della liturgia medievale era stato sviluppato un sistema ortografico di guide in grado di indicare al lettore le giuste inflessioni della voce 52. Il primo e più completo sistema di annotazione e analisi dell'intonazione linguistica è, però, quello di Joshua Steele (1775). Steele nacque in Irlanda ma visse per molti anni a Londra. Nel 1756 fu eletto membro, e nel 1779 vice presidente, della Society of Arts Manufactures and Commerce, la principale società per lo sviluppo di nuove tecnologie, incluso nuove notazioni musicali. Come verrà mostrato in dettaglio nel presente capitolo, l'autore si servirà di un modello notazionale preso in prestito dalla musica per mettere in piedi un vero e proprio sistema di 52 Si tratta della notazione neumatica, forma embrionale della nostra rappresentazione musicale ordinaria. Notazione particolarmente interessante perché ad essa può essere fatta risalire la prima rappresentazione spaziale dei suoni, che, prima di allora, era vincolata a forme simili a quelle alfabetiche (Machabey 1952 [1963]). Essa consistevana nella simbolizzazione grafica degli andamenti generici della voce, senza riferimenti al valore assoluto dell’altezza, ai relativi intervalli e nemmeno alla durata dei suoni. La notazione doveva servire quindi come ausilio mnemotecnico, e rinviare a un sapere convenzionalmente condiviso, e quindi non necessariamente inscrivibile nella notazione, le precise regole di esecuzione. 49 trascrizione e analisi dei diversi livelli prosodici: tono (accent), durata (quantity), intensità (force), pause (pause), prominenza e scansione metrica (emphasis). La musica, o meglio il suo sistema teorico interpretativo, ha permesso, nel caso appena citato, di osservare il proprio oggetto da quel particolare punto di vista, inserendolo in un metalinguaggio descrittivo ad esso fino ad ora estraneo. A mio avviso sarà proprio la condivisione di questo stesso schema di codifica 54 che permetterà l’uso di espressioni quali melodia o armonia della parola. Anche Daniel Jones si servirà in vari modi dello spartito, che utilizzerà soprattutto come mezzo per mettere in forma, attraverso linee continue, i contorni intonativi della frequenza fondamentale. Altro aspetto che sembra ricorrere in molti degli autori presi in esame è la grande importanza che viene conferita alla pratica di trascrizione. Steele, Jones e Sweet sono autori che mostrano particolare interesse verso le tecniche di annotazione del parlato. Sweet, ad esempio, dichiarerà “The notation of sound is scarcely less important than their analysis: without a clear and consistent system of notation it is impossible to discuss phonetic structure of a language” (Sweet 1877a, p. 100). Se da un lato le tecniche di scrittura del suono si caratterizzeranno per il loro utilizzo pratico, in particolare ai fini della memorizzazione e della didattica delle lingue, dall'altro favoriranno la riflessione su nozioni, come quella del fonema, che entreranno a far parte del dibattito linguistico moderno. La distinzione riscontrata da Sweet tra suoni semanticamente distintivi e suoni semanticamente non distintivi, trova infatti la sua applicazione nel doppio sistema di trascrizione fonetica (broad e narrow). In ultima analisi credo che il tentativo operato nelle prossime pagine possa essere non solo di utilità storiografica, attraverso la presentazione di lavori lontani nel tempo e nello spirito da quelli attuali, ma soprattutto teorica, per l’attenzione che impone all’analisi stessa delle pratiche descrittive, e quindi al modo in cui costruiamo il nostro oggetto d’indagine. 54 50 Un’interessante riflessione sugli schemi di codifica in ambito scientifico è presente in Goodwin: "Per poter dar vita a un insieme strutturato di dati, a insiemi di osservazioni che possano esser confrontati gli uni con gli altri, gli scienziati utilizzano schemi di codifica in grado di circoscrivere e delineare il mondo che analizzano. Quando eventi diversissimi sono visti attraverso un unico schema di codifica, diventano possibili osservazioni equivalenti" (Goodwin 1994 [2003], p. 23). 2 Joshua Steele e la melodia della voce Il primo autore che qui ci apprestiamo ad analizzare è ricco di aspetti di indubbio interesse. Come ho più volte affermato, i motivi che hanno indirizzato lo studio verso l’approfondimento dei modelli di rappresentazione della prosodia sono legati alla convinzione che tali pratiche possano essere viste come espressioni di particolari sguardi sull’oggetto di studio. La prospettiva e al tempo stesso la distanza dall’oggetto sono infatti variabili, e da questo, a mio avviso, possono dipendere i risultati delle ricerche stesse. Il caso di Joshua Steele e del suo Prosodia Rationalis è emblematico rispetto a quanto appena asserito. Lo scopo del suo lavoro è infatti proprio quello di elaborare un modello che contrastasse con la visione della lingua comunemente accettata. In questo senso egli si trova ad operare su un oggetto non del tutto determinato, in cui alcuni aspetti sono ancora privi di una codificazione e per questo semioticamente “amorfi”. Detto in altri termini, il linguista si trova a dover costituire ex novo la forma del suo oggetto, definendone gli elementi pertinenti e individuandone i tratti che istituirebbero così la correlazione tra espressione e contenuto. Nella prefazione del suo saggio, infatti, Steele afferma programmaticamente la necessità di andare oltre i classici studi sulla lingua, vincolati alle due sole proprietà accent e quantity, e per questo insufficienti ad una più chiara descrizione del fenomeno sonoro linguistico: The puzzling of obscurity relative to the melody and measure of speech, which has hitherto existed between modern critics and ancient grammarians, has been chiefly owing to a want of terms and characters, sufficient to distinguish clearly the several properties or accidents belonging to language; such as, accent, emphasis, quantity, pause and force; instead of which five terms, they have generally made use of two, only, accent and quantity, with some loose hints concerning pauses, but without any clear and sufficient rules for their uso and admeasurement; so that the definition required for distinguishing between the expression of force (or loudness) 51 and emphasis, with their several degrees, where worse than lost; their difference being tacitly felt, though not explained or reduced to rule, was the cause of confounding all the rest. (Steele 1779, p. viii). Per poter fare ciò, l’autore si troverà a lavorare in maniera del tutto peculiare con un modello interpretativo già esistente, quello musicale. Quest’ultimo infatti, diversamente dagli studi classici sulla lingua, aveva da tempo messo in forma quelle dimensioni del fenomeno sonoro, pertinentizzandone i tratti e legandoli alla stessa grammatica musicale. Altezze, durate, battute, pause etc. trovavano nella musica una secolare formazione, tale da mettere in luce proprio quelle proprietà che Steele considerava pertinenti anche in una teoria della lingua. La prassi musicale, la sua riflessione meta-semiotica e la sua formalizzazione, rappresentavano per l’autore un ottimo strumento di analisi. Le continue pratiche di risegmentazione del contenuto, la scoperta o invenzione di nuove correlazioni tra espressioni e contenuti permettono infatti ai sistemi linguistici e nonlinguistici di modificarsi ed evolvere continuamente per mezzo soprattutto della loro continua trasduzione. Nel nostro caso specifico, la traduzione tra sistemi è resa possibile dall’utilizzo di un particolare strumento di misurazione. Steele infatti, per poter trasporre in unità musicali il flusso parlato, utilizza una viola. Tramite quest’ultima, egli può controllare i movimenti melodici della propria voce, eseguirli sullo strumento e trasporli infine sul suo nuovo metodo di annotazione. Tale operazione non è affatto ingenua. Al contrario, essa porta con sé una serie di conseguenze teoricamente importanti. La viola può essere considerata come un vero e proprio trasduttore. Le frequenze delle onde sonore della lingua, una volta misurate mediante lo strumento musicale, cambiano statuto semiotico, ed entrano a far parte di un nuovo sistema di riferimento. La melodia della voce diviene melodia musicale, trasformandosi in sequenza di note, e per questo motivo potrà essere trasposta nel sistema notazionale proprio della musica, la partitura. Senza questa traduzione, tutta l’operazione di Steele sarebbe impossibile. Tuttavia tale passaggio, come vedremo, non sarà privo di conseguenze. La lingua, pur mostrando somiglianze con il 52 sistema musicale, non è un suo calco. Le pertinenze e le stesse unità di misura sono costruite sulla base di contrasti e funzioni armoniche che, sebbene illuminanti sotto certi aspetti, possono risultare obsolete rispetto alle finalità del linguista. 2.1 Prosodia Rationalis Iniziamo il percorso storico con una figura importante soprattutto per lo sviluppo di un modello rappresentativo dell'intonazione linguistica. Come abbiamo già detto nelle note di apertura, musica e parlato presentano interessanti aspetti di convergenza, che possono essere indagati mediante l’analisi dei modi in cui tali aspetti sono percepiti, elaborati e infine rappresentati su supporti cartacei, attraverso una vera e propria trasduzione 55 su un altro sistema semiotico, la scrittura. Johsua Steele sembra essere stato il primo a porre in essere un vero e proprio sistema di annotazione del parlato, con il chiaro intento di registrare anche altre proprietà riscontrabili nel flusso orale. Insomma un metodo di annotazione che, in mancanza di strumenti automatici, permettesse di rendere conto di livelli di pertinenza molteplici. Steele viene infatti ricordato per il suo studio sui tratti soprasegmentali 56, analisi resa possibile proprio grazie all'elaborazione di un sistema di notazione capace di rendere conto di tali caratteristiche della voce parlata. Nel 1775 egli concluse il suo volume dal titolo En essay toward establishing the Melody and Measure of speech, to be expressed and perpetuated by peculiar symbol, un vero e proprio trattato per un nuovo studio della lingua. L’opera fu “commissionata” dall’allora presidente della Royal Society, Sir John Pringle, 55 56 Con il termine trasduzione, preso in prestito dalle scienze fisiche e naturali, ci riferiamo a un particolare tipo di traduzione che intercorre tra sistemi semiotici differenti (traduzione intersemiotica). Secondo la tripartizione di Jakobson (1959) si può parlare infatti di traduzione endolinguistica (quando l’interpretazione dei segni linguistici avviene all’interno di una stessa lingua), interlinguistica (quando l’interpretazione avviene tra due sistemi linguistici differenti) o intersemiotica (quando vi è un passaggio da un sistema semiotico ad un altro). Cfr. Alkon, P.K. (1952). 53 dopo l’uscita del trattato filosofico sull’origine del linguaggio, The Origin and Progress of Language di Lord Mondobbo. Come ricorda Omond (1921) la prima parte del volume (fino a pagina 55) era circolata privatamente come manoscritto. Nel frattempo Mondobbo, a cui era stata recapitata la recensione al suo lavoro, rispose ammettendo alcuni punti critici e chiarendone altri. La risposta e la successiva corrispondenza tra i due autori furono riprese dallo stesso Steele che le integrò, inserendole come III e IV parte del suo volume. Nel 1779 venne pubblicata una seconda edizione dal titolo Prosodia rationalis con una parte intitolata Aggiunte e che conteneva le discussioni avute con altri commentatori del suo lavoro. Fino alla chiusura del primo volume (corrispondente a p. 193) le due edizioni sono praticamente identiche. La controversia avuta con Lord Monboddo e che dà avvio alle riflessioni di Steele, si basa sulla convinzione, del primo, che nella lingua inglese non vi siano cambiamenti significativi di altezze: That there is no accent, such as Greek and Latin accent, in any modern language and lastly, the impossibility for us, that are not accustomed to it, to found those antient accents, has persuaded many people that it was impossible for the antients to do it (Monboddo 1774, p. 276). E ancora: As to accents in English, Mr. Foster, from a partiality, very excusable, to his country, and its language, would fain persuade us, that in english there are accents, such as in Greek or Latin. But to me, it is evident that there are non such; by which I mean, that we have no accent upon syllables, witch are musical tone, differing in acuteness and gravity. For though, no doubt, there are changes of voice in our speaking, from acute to grave, and vice versa, these changes are not upon syllables, but upon words or sentences (Monboddo 1774, p. 298). Infine: And there is another difference betwixt our accents and the antient, that ours neither are, nor can by their nature, be subject to any rule; [...] We have, no doubt, 54 accents in English, and syllabic accent too: but they are of a quite different kind from the antient accents; for there is no change of the tone in them; but the voice is only raised more, so as to be louder upon one syllable than another. [...] That there is no other difference is a matter of fact, that must be determined by musicians. Now I appeal to them, whether they can perceive any difference of tone betwixt the accented and unaccented syllable of any word; and if there be none, then is the music of our language, in this respect, nothing better than the music of a drum, in which we perceive no difference except that of louder or softer, according as the instrument is mote or less forcibly struck (Monboddo 1774, p. 299 - 300). Per Lord Monboddo, dunque, la voce umana, sempre secondo la metafora musicale, sarebbe più vicina a uno strumento a percussione, che sfrutta principalmente differenze di tipo dinamico, articolando i piani e forti. Le sillabe prominenti sarebbero differenti non sulla base di un mutamento melodico, ma su di uno esclusivamente dinamico "we perceive no difference except that of louder or softer". Come ricorda Barker (1924) le posizioni di Mondobbo erano condivise da molti dei suoi contemporanei, e Steele, di contro, risponde: "The sound or melody of speech is not monotonous, or confined like the sound of a drum, to exhibit no other changes than those of loud or soft" (Steele 1779, p. 17). L'aspetto che risalta immediatamente all'occhio, e che diviene evidente anche attraverso l'osservazione del modello elaborato da Steele, è la necessità di un continuo rimando alla terminologia e alla metafora musicale. Non è difficile comprendere il perché. Come abbiamo più volte accennato, la mancanza di una chiara codificazione degli eventi linguistici intonativi, rendeva necessario l'ausilio di un sistema di interpretazione che potesse rendere conto delle pertinenze, e allo stesso tempo rendesse possibile una trattazione, una descrizione. Il sistema notazionale musicale, e il suo relativo bagaglio categoriale e descrittivo, era infatti il primo e immediato modello a disposizione: 55 In devising a scheme for expressing on paper musical slides of voice, in the melody speech, I chose one which might come as near as possible to modern notation of music, in order to make it the easier to be comprehended by those whose ideas of sounds and measure of time are already formed on that plan (Steele 1779, p. 8). È dunque solo attraverso il filtro, solo attraverso l'occhio musicale che era possibile guardare e soprattutto ascoltare la lingua dal punto di vista dell'intonazione. In assenza di tale filtro infatti era necessario elaborare, sulla base di determinate pertinenze, un sistema in grado di rendere conto di tale fenomeno. Monboddo e Steele si riferiscono alla voce parlata attraverso la metafora degli strumenti musicali, e il secondo giunge addirittura ad attingere dal campo semantico e simbolico della musica per costruire il proprio modello 57. Se da un lato tale approccio gli consente di mostrare delle somiglianze strutturali tra i due sistemi, come ad esempio il movimento melodico dell’intonazione, dall’altro proprio il confronto tra i due sistemi mostra delle discrepanze, delle differenze, che rendono necessarie delle modifiche al modello notazionale. Come vedremo, gli stessi movimenti melodici che nel parlato sono meno ampi e “continui” necessitano di un modello rappresentativo che renda conto anche di variazioni di altezza inferiori al semi-tono. Il fine di Steele, come da lui stesso dichiarato, non è quello di prescrivere il corretto modo di pronunciare una determinata enunciazione, ma quello di lasciare una traccia, di lasciare una memoria scritta in grado di rendere successivamente accessibili le enunciazioni passate: If the method, here effayed, can be brought into familiar use, the types of modern elocution may be trasmitted to postery as accurately as we have receved the musical composition of Corelli (Steele 1779, p. 14). 2.2 57 56 Il pentagramma come organizzazione dello spazio sonoro La stessa unità di misura è ricavata a partire dalla musica. Si prende come strumento di misura infatti il quarto di tono, ricavato dalla ulteriore suddivisione del semitono (distanza minima tra una nota e la successiva) Il primo e immediato elemento che viene trasportato nel modello di Steele è il pentagramma (vedi figura 6). Il supporto per la registrazione delle variazioni tonali viene costruito a partire dal sistema di registrazione proprio della rappresentazione musicale. In quest’ultima lo spazio sonoro è strutturato all’interno di un sistema di righe e di spazi in cui le note assumono determinati valori posizionali, reinterpretabili a loro volta mediante l’unità di misura fisica dell’Hertz (Hz), la quale esprime la frequenza di oscillazione di un’onda sonora. Fig. 6 - L'estensione delle altezze tonali in musica. In basso la corrispondenza con il valore espresso in Hz La successione di righe e di spazi delimitano la serie di altezze discrete del sistema musicale (note), secondo l’articolazione alto–basso / acuto–grave. Il valore delle note, in termini di altezze, varierà all’interno della rappresentazione musicale mediante la posizione dei simboli grafici. 57 Fig. 7 Intervallo ascendente Fig. 8 Intervallo discendente Come è possibile vedere nelle due immagini, alla dimensione verticale del supporto notazionale corrisponde l’organizzazione del valore delle altezze, e a loro volta righe e spazi saranno d’ausilio per la discretizzazione del range. L’altezza del tono cambierà in maniera crescente nel momento in cui il simbolo grafico verrà posizionato più in alto. Al contrario essa sarà decrescente man mano che i simboli grafici saranno posizionati nella parte inferiore del pentagramma. L’asse orizzontale, secondo l’articolazione sinistra/destra – prima/dopo avrà invece la funzione di determinare la successione lineare delle configurazioni sonore: come nella nostra scrittura destrorse (vedi figura 9). Fig. 9 disposizione delle altezze secondo la scala musicale di Do maggiore Tale sistema di rappresentazione permette al musicista di avere una chiara immagine dell’andamento melodico che dovrà essere riprodotto per mezzo dello strumento. È bene 58 sottolineare che se da un lato vi è una corrispondenza biunivoca tra livello posizionale e nota, esso non ha una corrispondenza spaziale precisa. Uno stesso spostamento sul supporto planare, da rigo a spazio o da spazio a rigo, non corrisponde sempre a uno stesso cambiamento dal punto di vista tonale. Le righe e gli spazi insomma non sono suddivisi seguendo una stessa unità, in quanto tale unità segue un principio funzionale chiaramente connesso alla teoria musicale. Come possiamo vedere nella figura 9, i simboli grafici sono disposti ciascuno seguendo una stessa progressione posizionale. Non vi è tuttavia un isomorfismo tra distanza grafica e “intervalli” musicali 58. A uno stesso spostamento sul supporto planare (passaggio da rigo a spazio o viceversa) non si ha lo stesso spostamento sonoro. Se facciamo riferimento alla figura 9 è possibile notare che il rapporto tra le note mi – fa (primo rigo – primo spazio) pari a un semi-tono59 è differente da quello tra le note sol – la (secondo rigo –secondo spazio) che è invece di un tono. Il principio di organizzazione segue infatti lo schema della scala maggiore60. Il supporto notazionale di Steele, partendo dal pentagramma, giunge all’elaborazione di un nuovo sistema di annotazione. Come si può osservare nella figura 10, lo spazio tra le righe del pentagramma è ulteriormente suddiviso mediante l’ausilio di altre 3 linee orizzontali. Tali righe diventano espressione di una nuova segmentazione dello spazio sonoro che rende 58 59 60 L’intervallo può essere definito come la distanza tra due note successive o simultanee. Più tecnicamente il termine può essere inteso come la “relazione esistente tra due suoni emessi simultaneamente e/o susseguentemente da una e/o più fonti diverse; tale relazione è esprimibile in termini relativi come differenza tra le frequenze dei due suoni (la relazione tra i due suoni è allora una relazione di ampiezza, che dà un’indicazione della distanza fra i due suoni nella scala delle frequenze udibili), ed in termini assoluti come rapporto numerico (ossia come proporzione) fra tali frequenze (la relazione tra i due suoni è allora una caratteristica tipologica). In questo senso si dirà quindi che, dati due suoni a e b di frequenza 𝑓a e 𝑓b, l’intervallo (a,b) è la relazione tra i suoni a e b esprimibile o in termini relativi come differenza: x=𝑓a - 𝑓b o in termini assoluti come proporzione: y=𝑓a /𝑓b. A seconda che l’emissione dei due suoni sia consecutiva oppure simultanea, si parla di intervallo melodico (intervallo «orizzontale», diacronico) oppure di intervallo armonico (intervallo «verticale», sincronico)” (Azzaroni 1997, p. 211). Il semi-tono rappresenta in musica, almeno nella teoria moderna, la distanza minima tra due note. Lo schema della scala consiste nell’insieme delle relazioni che stringono le note di cui è composta. Ciascuna nota sarà infatti collocata a una certa distanza l’una dall’altra, secondo una determinata successione di intervalli. La scala maggiore è, ad esempio, composta dalla seguente successione T – T – st – T –T –T –st (dove T=Tono e st=semi-tono). La scala di do maggiore, presentata in figura 9, è infatti caratterizzata da queste relazioni. 59 misurabili variazioni pari a un quarto di tono. Le lettere a loro volta stanno per le note musicali secondo la denominazione anglosassone (A= La, B=Si, C=Do, D=Re, E=Mi, F=Fa, G=Sol), mentre i simboli x (croce singola) , ⨳ (doppia croce) e ⩩ (tripla croce) servono a specificare l’aumento di altezza della nota sul pentagramma. In particolare, x indica che la nota a cui si applica deve essere maggiorata di un valore in altezza pari a 1/4 di tono (es. Ax si riferisce alla nota A maggiorata di 1/4 di tono). Discorso simile per la doppia e tripla croce: la variazione di altezza applicata alla nota corrisponderà rispettivamente di 2/4 e 3/4 di tono. Fig. 10 La disposizione delle altezze sul supporto notazionale di Joshua Steele (1779) Questa necessità grafica è in realtà il riflesso di una presa di coscienza da parte dell’autore che considera la distanza minima musicale (il semi-tono) insufficiente a rappresentare le variazioni melodiche del parlato: The change of voice from acute to grave, and vice-versa, do not process by pointed degrees coinciding with the divisions of the chromatico-diatonic scale [of music]; but by gradations that seem infinitely smaller (which we call slides); and though altogether of a greater extent, are yet too rapid (for inexperienced ears) to be distinctly subdivided: consequently they must be submitted to some other genus of music than either the diatonic or chromatic (Steele 1779, p. 17). 60 La melodia del parlato è per Steele differente rispetto a quella musicale 61 . Se in quest’ultima il valore delle altezze varia in maniera discreta lungo livelli di range definiti secondo la scala cromatico-diatonica (12 note, ciascuna a distanza di un semitono da quella immediatamente adiacente), nella voce i movimenti melodici dell’intonazione sono continui e con differenze di pitch inferiori al semitono. Tale constatazione indurrà l’autore a suddividere ulteriormente la notazione musicale secondo una scala avente unità pari al quarto di tono. È interessante notare che cent’anni dopo un fonetista come Alexander John Ellis definì le differenze tra voce cantata e voce parlata in termini molto simili: In speech, pitch is uncertain, unsustained, and “gliding” through several pitches but slightly differing from each other. In song, pitch is (or should be) quite certain, sustained, and rarely gliding off to another pitch. Occasionally this is permitted in portamento, but then the passage is from one definite susteined pitch to another (Ellis 1878, p. 10). Oltre all’aggiunta di righe Steele si servirà di ulteriori ausili grafici per rendere conto delle micro variazioni tonali continue. 61 Di seguito alcune definizioni “In senso fisico la melodia non è nient’altro che una successione di suoni” (Ottó Károlyi, 1965); “If two tones are not heard at the same time, bur are consecutive tones of one melodic line, the interval is called melodic interval, as distinguished from the harmonic interval, in wich the two tones are sounded together” (W. Piston, 1941); “Il “segmento melodico” è costituito da almeno due altezze (frequenze) distinte sull’asse del tempo: l’unità minima della “dimensione orizzontale” della musica risulta essere allora l’intervallo, o più precisamente l’intervallo melodico” (Azzaroni 1997 p. 316). 61 Fig. 11 Esempio di trascrizione dell'espressione oh! Nella notazione sono inseriti anche nuovi segni in grado di mostrare i movimenti continui (Slides) propri del parlato, da Steele definiti accents o notes of melody: “Instead of using round or square heads for the notes to be maked on this scale (as in the ordinary music) let us substitute sloping or curving lines, such expression may require; , , , ; which lines, when drawn on the foregoing scale, will easily shew through how many quarter tones the voice is to slide: and these I call accent or notes melody” (Steele 1779, p. 7). In questo modo l’autore può servirsi di una serie di elementi grafici in grado di descrivere andamenti continui tramite accenti lineari o circonflessi. - accento lineare verso l’alto descrive un andamento crescente - accento lineare verso il basso descrive un andamento decrescente - accento circonflesso – alto/basso - accento circonflesso – basso/alto La figura 11 mostra l’esempio della trascrizione di una interiezione (oh!). Oltre alla dimensione verbale, introdotta nella partitura tramite i caratteri alfabetici, la rappresentazione permette di osservare la variazione del tono. 62 2.3 La dimensione temporale e ritmica del parlato Ciò che è stato mostrato fino ad ora è l’analisi della dimensione intonativa del suono. La categoria del tono è stata descritta osservando l’articolazione delle altezze e i suoi modi di rappresentazione che si estendono lungo i due assi, verticale e orizzontale, della partitura. Nel costruire il proprio modello Steele si servirà ancora del sistema di rappresentazione musicale, grazie al quale potrà mettere in forma altre tre proprietà del suono che l’autore chiamerà: quantity, force and emphasis. Le prima, corrispondente alla durata, si riferisce al valore relativo del suono e del silenzio lungo il continuum temporale e riguarda “the distinction of longer and shorter notes or syllables, or of longer and shorter pauses” (Kassler 2005, p. 233). Nel supporto notazionale musicale l’indicazione del tempo di durata avviene mediante la forma dei segni grafici: la maggiore o minore lunghezza di una singola nota viene espressa tramite precisi simboli organizzati secondo uno schema binario: 62 Fig. 12 Articolazione del tempo in musica 63 Tale indicazione è inoltre relativa: per determinare la lunghezza effettiva di una nota occorre infatti stabilire un tempo, solitamente espresso in bpm (battiti per minuto). Ciascuna figura musicale, tramite la sua forma, esprimerà quindi non il valore assoluto in secondi ma il numero di battiti necessari ai fini della sua esecuzione e dipenderà quindi dall’unità temporale di riferimento. Sullo stesso principio, il sistema musicale organizza le pause. A ogni nota di durata corrisponde un identico valore di durata pausale. 63 Il simbolo in alto con forma circolare (denominato breve), pari al 4/4, indica la durata del suono relativa al tempo di riferimento, espresso in battiti al minuto (bpm). Su un tempo di 120bpm (pari a un battito ogni mezzo secondo) il simbolo avrà valore di 4 battiti, dunque 2sec. I valori posti immediatamente sotto hanno un valore dimezzato, pari a 2/4 e così via. Nella notazione musicale moderna i valori di durata intermedi si ottengono mediante l’utilizzo di altri segni denominati punto di valore e legatura di valore. 64 Fig. 13 Articolazione delle pause Nel sistema di Steele la durata degli elementi linguistici assume la stessa strutturazione di quella musicale appena illustrata. La rappresentazione del tempo, e in particolare della durata, ha dunque la forma già definita dal sistema musicale, secondo una suddivisione binaria. Fig. 14 Il sistema delle durate in Joshua Steele Allo stesso modo egli inserisce nel sistema simbolico un secondo segno tipografico per segnalare le pause, seguendo sempre la stessa articolazione binaria: 65 Fig. 15 Il sistema delle pause in Joshua Steele Attraverso la combinazione dei due elementi grafici, coda e testa, Steele è in grado di rappresentare la durata e l’andamento melodico. Fig. 16 Esempio di elementi rappresentativi Mediante la forma della testa e della coda è possibile esprimere accento e durata, mentre per mezzo della posizione lungo l’asse verticale della partitura Steele può invece rendere conto del valore tonale del suono linguistico (vedi figura 11). La seconda proprietà, indicata con il termine force (o quality of suond), si riferisce a ciò che in italiano designiamo con il termine volume, o intensità (Loudness), e che contribuisce a determinare la dinamica della produzione orale. Per segnalare tali cambiamenti di volume (expression of loudness), l’autore di Prosodia Rationalis introduce un’altra serie di elementi grafici, non presenti nel sistema di notazione musicale. Mediante i segni e può segnalare un aumento puntuale del volume su un determinato segmento di frase secondo l’articolazione forte e piano o più forte ( e ) e più piano ( ), mentre attraverso i simboli , può invece indicare rispettivamente i processi di incremento progressivo del volume (crescendo), di decremento e di andamento uniforme dell’intensità. Con l’ultima proprietà, emphasis, l’autore interpreta due fenomeni. Il primo, detto poize, 66 corrisponde al peso, è quello che in linguistica viene definito come stress 64 e che i musicisti chiamano beat. Distintamente dall’accento dunque, che rendeva conto di una modulazione tonale, il poize descrive i cambiamenti locali di prominenza a partire dalla dinamica: Therefore, in order to avoid the confusion made by moderns in the misuse of word accent, let us call the note or syllable on which the cadence falls, heavy, and where necessary, denote it by this mark ; and the note, or syllable, erroneously called unaccented, we will call light, and the mark it thus ; and as we shall find, there are two sorts of light notes, let the lightest be represented thus 20). (Steele 1779, p. Il secondo aspetto contenuto nella proprietà emphasis è quella che Steele definisce cadences. A differenza della musica in cui il termine cadenza ha valore armonico65, per Steele essa assume un carattere propriamente ritmico. Un corrispondente musicale della cadenza in questione è infatti la battuta. Senza entrare nel profondo dibattito musicologico, e con l’intento di chiarire soprattutto l’influenza del modello musicale su l’elaborazione notazionale di Steele, possiamo riferire il termine battuta alle “unità che dividono il continuum temporale in valori di durata stabili”. La battuta dunque ha la funzione di organizzare il flusso temporale in segmenti che hanno un determinato valore di durata 66. 64 65 66 In linguistica i termini accent e stress sono utilizzati per indicare un certo tipo di prominenza. Essi sono principalmente distinti a seconda della proprietà del suono che si incarica di determinare tale prominenza: “The different between stress and accent, then, is based on wich of the attributes of sound is perceptually most dominant feature of utterance: in the case of stress, the dominant perceptual component is loudness; in the case of accent, the dominant perceptual component is pitch” (Crystal 1969, p. 120). Con il termine cadenza si indica in musica una determinata sequenza stereotipica di accordi. “Al principio di preservazione dei gruppi mensurali nelle singole voci dell’insieme polifonico [...] subentra ora il principio di aggregazione delle durate secondo gruppi accentuativi periodici e regolari, ovvero secondo segmenti di pari durata il cui inizio è caratterizzato da un accento comune che ritorna con regolarità” (Azzaroni 1997, p. 140). Sempre Azzaroni definisce battuta “un raggruppamento di durate organizzate non più secondo i criteri della variabilità della mensura, bensì secondo una successione regolare e ripetitiva di accenti forti e deboli che, quanto meno in questa fase iniziale, sono il relazione diretta con il movimento e le figure richiesti dalla danza” (Azzaroni 1997, p. 161). Con la battuta, che sostituisce l’antico gruppo mensurale, entra in campo quindi un nuovo concetto di raggruppamento di durate: “determinate quantità di tempo, rappresentate da corrispondenti quantità di valori di durata delle note, tendono a porsi come costanti e successivi frazionamenti del continuum sonoro - alla stregua di una serie di «pacchetti» contigui di tempo - grazie ad un tratto significativo, un 67 In musica (ma integrata ugualmente nel sistema notazionale di Steele) tale segmentazione viene resa graficamente attraverso l’uso della stanghetta, ossia una linea verticale che suddivide il pentagramma in veri e propri box isocronici: Fig. 17 Esempio di rappresentazione delle battute Il numero frazionario posto all’inizio, indica il valore dell’unità di durata che verrà localmente articolata secondo differenti combinazioni di note e di pausa: Il significato attribuito alla frazione quale indicazione del tempo è connesso all’idea (concretamente e totalmente realizzata nella composizione musicale, oppure realizzata solo in parte) di una pulsazione continua di accenti forti e deboli che scorre nel tempo e lo modella secondo “unità” determinate dalla frazione numerica: ad es. 4/4 ci dice che il tempo musicale viene organizzato secondo una serie continua di insiemi di quattro semiminime alternativamente accentuate, 9/8 ci dice che gli insiemi che modellano il tempo sono costituiti da nove crome accentate a tre a tre, e così via. Da questo punto di vista la globalità del fenomeno musicale sembra contrassegnata, al suo livello profondo, dallo scorrere di una pulsazione non uniformemente accentata, caratterizzata dal ritorno di determinati timepoints di accenti forti che segmentano nel tempo musicale certe “unità”: questo flusso di accenti che organizza e modella il livello temporale della struttura profonda della composizione lo si può identificare con il metro (Azzaroni 1997, p. 169). «marcatore» invisibile, ma percepibile ai sensi, come momento di discontinuità: un accento che cade all’inizio di ciascun «pacchetto» sull’attacco del primo valore di durata, un «punto nel tempo» (un timepoint) che è contemporaneamente appoggio (momento di riposo, momento finale) e avvio (momento dinamico, momento iniziale) di ogni successivo raggruppamento di durate” (Azzaroni 1997, p. 160). 68 Tale suddivisione ha uno strettissimo legame sia con la dinamica della composizione e produzione sia con quella della percezione: il compositore ha dei punti di appoggio metrici per la scrittura, mentre l’ascoltatore può, mediante la battuta, collegare il flusso musicale secondo un ordine relazionale67. In Steele il termine cadenza assume il ruolo di una vera e propria cellula temporale che organizza il flusso linguistico secondo unità di durata assoluta. L’autore anticipa in questo modo quello che più avanti verrà indicato come il principio dell’isocronia68. La cadenza consiste, per Steele, nell’espressione di una tendenza a organizzare la vita secondo movimenti alternanti di elementi prominenti e elementi deboli: Our breathing, the beating of our pulse, and our movement in walking, make the division of time by pointed and regular cadences, familiar and natural to us. Each of these movements, or cadences, is divided into two alternate motions, significantly expressed by the Greek words arsis and thesis, raising and posing, or setting down; the latter of which, coming down as it were with weight, is what mean to call heavy, being the most energic or emphatic of the two; the other, being more remiss, and with less emphasis, we call light (Steele 1779, p. 20). Attraverso la nozione di cadenza Steele può dare forma a questa idea di regolarità di pulsazioni che traspare in molte parti del suo libro e al tempo stesso può integrarla nel suo sistema di rappresentazione trapiantandola dalla musica. A questo punto avremo chiara anche la sua nozione di ritmo come risultato della successione di cellule isocroniche (cadenze) all’interno di un’enunciazione. 67 68 “È una nuova visione della composizione musicale, ma anche della percezione della musica: i ritorni e le simmetrie, le relazioni e le corrispondenze tra eventi musicali scanditi e unificati dall’unità della battuta costituiscono per il compositore i punti di appoggio del decorso musicale, e per l’ascoltatore una sorta di traliccio mediante il quale riconoscere e collegare fra loro gli eventi musicali” (Azzaroni 1997, p. 161). La moderna discussione sul principio dell’isocronia viene fatta risalire a Pike K. L. e in particolare nella sua distinzione tra stress-timed e Syllable-Timed “the units tend to follow one another in such a way that the lapse of time between beginning or their prominent syllables is somewhat uniform. [...]The tendency toward uniform spacing of stresses in material which has uneven numbers of syllables within its rhytm groups can be achieved only by destroying any possibility of even time spacing of syllables. Since the rhythm units have different numbers of syllables, but a similar time value, the syllables of the longer ones are crushed together, and pronounced very rapidly, in order to get them pronounced at all, within that time limitation” (Pike 1945, p. 34). 69 2.4 Armonia della voce Un conciso e completo sommario delle principali innovazioni di Joshua Steele può essere letto in una recensione al volume scritta da Marie L. Barker (1924): “1 – English speech is not monotonous; it has a melody peculiar to itself. 2- We do not always perceive that melody because we are so familiar with it; but we notice immediately a melody that differs from the one we are accustomed to use. 3 – The melody of speech moves up and down by “slide” 4 – The intervals between the tones in speech are not definite musical intervals. 5- The recording of the melody of speech can be reduce to a system. 6 – It is advisable to use sloping or curving lines instead of musical notes to indicate the melody. 7 – A rising tone denotes uncompleted thought, a falling tone denotes completed thought. 8 – The “tone of the court” and other “polite circles” differ s from that of the provinces chiefly on account of the extremes of inflection heard in the latter 9- The range of inflection is greater in emotional than unemotional utterances 10 – Study the living language! (Barker 1924, P. 174). 70 Fig. 18 Esempio di trascrizione tratta da Steele (1779) Nell’esempio proposto in Fig. 13 sono presenti tutti gli elementi grafici e di conseguenza tutte le proprietà sonore che intervengono nell’eloquio. Tramite il pentagramma è infatti possibile rendere conto dei movimenti del tono indicati dai segni grafici degli accenti o notes of melody. Sebbene quasi identici, l’aumento di pitch che occorre sulla prima parola “oh,” ha un valore di altezza tonale maggiore rispetto ad “aim!”. Possiamo al contempo notare come l’intero enunciato sia suddiviso in sei cadenze, ognuna di valore pari a una semi-breve. Interessante, inoltre, notare il ruolo attivo della pausa (terza battuta). Quest’ultima non è infatti una semplice assenza di suono, ma viene anch’essa regolata secondo il principio dell’isocronia. Il tempo di durata della pausa e del suono linguistico infatti si conforma all’unità di battuta, rendendo così ritmicamente funzionale l’uso delle stesse pause. Tra i punti interessanti di questo lavoro vi è senza dubbio la capacità del modello di mostrare dimensioni del suono co-occorrenti, e soprattutto pertinenti, all’interno di ogni enunciazione. Steele può così mostrare che nell’uso della lingua i parlanti si servono di livelli molteplici e compresenti: altezza, durata, pause, enfasi (cadence) e intensità costituiranno, sempre all’interno della terminologia musicale, l’armonia della voce. Ciascuna proprietà sarà suscettibile di entrare in funzione con gli usi della lingua. Lo stesso Steele in più punti del suo lavoro anticiperà risultati che ancora oggi sono utilizzati per 71 illustrare il funzionamento della prosodia: il ruolo della stessa nella determinazione dei significati degli enunciati, il contrasto tra il pitch discendente nelle frasi conclusive o crescente nelle frasi sospensive, oppure la particolare modificazione di tali proprietà negli enunciati emotivi. Come abbiamo accennato in apertura, le unità musicali hanno rappresentato per Steele un’arma a doppio taglio. Se da un lato gli hanno permesso di far luce su aspetti del parlato fino a quel momento oscuri, dall’altro lato sono state del tutto inadatte ad una chiara percezione delle funzioni linguistiche. La stessa variazione di altezza, ad esempio di un semitono, pertinente nella teoria musicale per la distinzione di due diversi accordi (ad esempio maggiore e minore) può non essere parimenti pertinente per un contrasto sul piano linguistico. Altri punti deboli, messi in luce anche da Crystal (1969), sono soprattutto di tipo metodologico, connessi alla evanescenza dei dati in un contesto “en plain air”, e dunque all’inaffidabilità dei risultati: The main inadequacy with Steele’s approach, as pointed out by a critic in The Monthly Review (1776) was procedural, namely, that it is impossible to achieve any accurate and verifiable description of sound (as Steele had achieved with his controlled study) when they occur in actual speech: “What ear can be so quick, nice, and discerning, as to keep pace with, discriminate, and ascertain the rapid and evanescent musical slides of the human voice...so as to enable a person to mark the limit of each syllable, with regard to gravity and acuteness, and to express them on paper?” The answer, of course, was provided by the invention of the phonograph and tape recorder, which allowed repeated hearings and multiple checking (Crystal 1969, p. 25). Al di là dei comprensibili limiti, dovuti soprattutto ad una inadeguata tecnologia, il lavoro di Steele deve essere ritenuto senza dubbio una pietra miliare nella storia della linguistica, soprattutto della linguistica orientata allo studio dell’intonazione. 72 3 Henry Sweet e “il suono della lingua” Negli anni successivi alla pubblicazione del volume di Steele non mancarono seguaci che continuarono e sistematizzarono il suo lavoro 70 . Tuttavia, come ricorda David Crystal (1969, p. 25), dopo Joshua Steele non ci furono contributi significativi sul tema dell’intonazione fino alla fine del XIX secolo, con l’opera del fonetista inglese Henry Sweet. Il problema dell’intonazione torna così ad essere affrontato in maniera più approfondita in Inghilterra intorno alla fine dell’ 800. A stimolare la ripresa del dibattito contribuì notevolmente il lavoro di Hermann von Helmholtz Die Lehre von den Tonempfindungen als physiologische Grundlage für die Theorie der Musik (1863), che i lettori inglesi poterono conoscere grazie alla traduzione di A. J. Ellis nel 187571. Henry Sweet affrontò in molti dei suoi lavori, e in particolare quelli sulla fonetica della lingua inglese, il tema dell’intonazione. Come sarà illustrato di seguito, gran parte delle sue idee e delle sue anticipazioni in ambito linguistico trovano stimolo in tre principali nodi tematici. Ci riferiamo all’interesse di Sweet nei confronti del primato della lingua parlata, della didattica, e della scrittura. 3.1 Suono e senso Language is essentially based on the dualism of form and meaning, and all attempts to reduce language to strict logical or psychological categories, by ignoring its formal side, have failed ignominiously. The form of language is its sounds (Sweet 1877b [1913], p. 85). L’attenzione alla dimensione sonora della lingua è infatti l’architrave di tutta la produzione 70 71 Segnaliamo Odell (1806), Chapman (1818), Roe (1823). “It was during the eighth decade of last Century thath a really new prosody, after some false start, fairly began its course. The researches of Helmholtz - made accessible to English readers by A. J. Ellis in 1875 had laid bare the nature and working of those “tones” wich create verse among other form of vocal music” (Omond 1921, p. 184). 73 di Sweet, il quale giungerà in più occasioni a sottolineare la centralità della fonetica 72 nello studio dei fenomeni linguistici e a formulare esplicitamente due principi assiomatici: 1. ogni studio linguistico deve essere basato sulla fonetica 2. ogni studio linguistico (sia teorico sia pratico) deve essere basato sulla lingua parlata 73. 3.2 Fonetica e didattica delle lingue La stretta relazione tra ‘forma fonica’ e dimensione semantica è un aspetto molto evidente nella pratica d’insegnamento. La corretta pronuncia dei suoni è infatti per Sweet indispensabile nella comunicazione quotidiana: senza un adeguato insegnamento dell’articolazione dei suoni, i parlanti rischierebbero l’errata trasmissione e interpretazione dei sensi74. È proprio all’interno di questi ambiti che è possibile approfondire alcune delle importanti intuizioni del Maestro, come le "distinzioni di suono significanti" (significant sounddistinction) e "distinzioni di suono non significanti" (superflous Sound-distinction): Again, for practical purposes we have to distinguish between differences of sound on which differences of meaning depend - significant sound-distintions - from those which are not significant (Sweet 1900, p. 18). La 'scoperta' di suoni della lingua capaci di rendere conto di mutamenti di significato permette a Sweet di collocarsi tra gli anticipatori della controversa nozione di fonema 75, 72 73 74 75 74 In rapporto alle altre scienze linguistiche la fonetica avrebbe lo stesso valore della matematica nei confronti delle scienze fisiche: “Phonetics is to the science of language generally what mathematics is to astronomy and the physical sciences. Without it, we can neither observe nor record the simplest phenomena of language. It is equally necessary in the teoretical and in the pratical study of language” (Sweet 1900, p. 4). “The main axiom of living philology is that all study of language must be based on phonetics” (Sweet 1900, p. 4). “The second main axiom of living philology is that all study of language , whether theoretical or pratical, ought to be based on the spoken language” (Ivi, p. 49). "Experience shows that even the slightest distinctions of sound cannot be disregarded without the danger of unintelligibility" (Ivi, p. 6). Tra gli anticipatori della nozione di fonema segnaliamo von J.Winteler che nel suo volume del 1876, studiando il dialetto svizzero, aveva avanzato la necessità di distinguere due tipi di opposizioni foniche: come unità funzionale della lingua, e del conseguente sviluppo della fonologia 76. In un contributo dedicato alla figura del fonetista inglese, Annibale Elia (1974) pone in evidenza l’attenzione che Sweet ha riservato alla lingua parlata in ambito didattico e al ruolo che essa ha avuto nell’individuazione di opposizioni foniche semanticamente distintive: C’è da chiedersi come mai nessun altro nel campo dell’insegnamento linguistico sia arrivato, prima di Sweet o in definitiva prima dei contributi della scuola fonetica, alla definizione funzionale del suono (cioè alla scoperta del fonema) [...]. Probabilmente, proprio lo spostamento dell’oggetto dell’insegnamento linguistico dallo scritto al parlato ha portato, in ambito della scienza dell’educazione linguistica a prendere in considerazione le variazioni più minute del parlato (fonetica), e con ciò stesso si è posta l’esigenza di scoprire i limiti funzionali di tali variazioni (Elia 1974, p. 10). Da un lato quindi la tendenza a studiare la lingua nella sua ‘forma fonica’, dall’altro la pratica didattica trasferitasi dal piano scritto al piano orale, spinge Sweet a dover rendere 76 quelle che esprimevano mutamenti di significato e quelle che non lo esprimevano. Sull’approccio innovativo di Winteler, incentrato sul puro principio fonetico nello studio delle lingue, si esprime anche Sweet nel suo Presidential Address: on English Philology and phonology (Sweet 1877b). Su Winteler anche Lepschy (1966, p. 60), Trubeckoj (1939), De Mauro in Saussure (1922) e Belardi (1959). Anche Sievers si è avvicinato a tale nozione ponendo in essere, implicitamente, la distinzione tra foni, come occorrenze linguisticamente indifferenti, e fonemi, come classi astratte linguisticamente differenti: “Die vielen Spielarten von a, die ein aufmerksamer Beobachter constatieren und unterscheiden kann, werden nur deshalb als eine Einheit betrachtet, weil sie sammt und sonders in einen bestimmten Gegensatz zu den ebenso mannigfachen Spielarten der Gesammttypen o oder ä oder anderer Laute gesetzt werden” (Sievers 1876, p. 34). Trubeckoj nel suo Grundzüge der Phonologie (1939) riconosce a Sweet il merito di aver individuato il ruolo distintivo di alcuni suoni linguistici, sottolineando tuttavia la sua mancata scissione tra un punto di vista fonetico e un punto di vista fonologico: “Ci sono però anche certi studiosi che riconoscono senz’altro la differenza fra parola e lingua, e anche la differenza fra opposizioni di suoni distintivi e non distintivi riguardo al significato, ma non vogliono tuttavia dividere la fonologia dalla fonetica. Ci si richiama allora volentieri ai classici manuali della scuola inglese, a Sweet e Jespersen, che trattavano la fonologia insieme alla fonetica, pur essendo essi perfettamente convinti della fondamentale differenza fra opposizioni di suoni distintive e non distintive” (Trubeckoj 1939, p. 11). Anche Bloomfield dichiarò, nel 43, di aver tratto ispirazione per la parte fonemica del suo manuale (cap V-VIII), oltre che da Sapir e Trubeckoj, da Henry Sweet, le cui riflessioni lo spinsero verso l’idea delle ‘caratteristiche distintive’ (cfr. Jakobson 1966). 75 conto di sfumature foniche pertinenti per un parlante nativo ma difficilmente individuabili da parlanti stranieri. 3.3 La scrittura fonetica come dispositivo modellizzante È necessario rilevare che a spingere Sweet verso la ‘scoperta’, mai raggiunta esplicitamente 77 , del fonema, sia stata oltre che l’attenzione alle dinamiche interlinguistiche 78 , anche la sua continua pratica di traduzione inter-semiotica. Ci riferiamo, come prima anticipato, alla sua attenzione nei confronti della scrittura fonetica, e in generale nei confronti dei procedimenti notazionali. La ricerca di un sistema di simboli in grado di poter ‘proiettare’ su carta l’infinita varietà fonica di una o più lingue, costringe irrimediabilmente lo studioso, in questo caso Sweet, ad individuare pertinenze con cui costruire veri e propri gruppi o famiglie di ‘suoni simili’ (sarà proprio la definizione di fonema nella tradizione britannica 79). Solo dopo questo primo passo è possibile condensare ad unità grafica tali classi di suoni. L’interesse di Sweet per la trascrizione fonetica è anch’esso relato alla didattica: la scrittura diveniva strumento ausiliario del parlato, in grado di rendere ‘visibili’ le sfumature di suono espresse da ciascuna lingua 80. La notazione 77 78 79 80 76 “Winteler e Sweet, precursori della elaborata definizione di fonema data da Trubeckoj, non arrivano a definire propriamente «il fonema», ma solo il doppio livello delle opposizioni foniche (quelle significanti o funzionali e quelle non significanti e non funzionali)” (Elia 1974, p. 31). A questo proposito è eloquente un passaggio presente nel suo The practical study of languages: “In comparing the sound of a variety of languages - still more in dealing with sound generally - we require a much more elaborate system of notation than in dealing with a single language; we can no longer content ourselves with marking significant distinction in the simplest and shortes way: it becomes necessary to mark such distinction as that between the first elements of English (ai, au), for the insignificant distinction (au) and the (aa) of ask may be a significant one in some other language - as it actually is in Portuguese, one of whose a-sound is like English (aa), while the other is the first element of English (au)" (Sweet 1900, p. 20). “A phoneme may be defined as a family of sounds in a given language, consisting of an important sound of the language together with other related sound, which take its place in particular sound-sequences” (Jones 1931, p. 74). Fondamentale per Sweet a questo proposito è la lettura del volume Visible Speech (1867) di Alex Melville Bell, tra i principali precursori dell’alfabeto fonetico. L’idea di fondo del lavoro di Bell era appunto la ricerca di un sistema simbolico ‘ideale’ in grado di poter rappresentare la dimensione fonica di tutte le assume inoltre un’importante funzione teorica. Su questo il maestro inglese è molto chiaro: The notation of sound is scarcely less important than their analysis: without a clear and consistent system of notation it is impossible to discuss phonetic structure of a language (Sweet 1877a, p. 100). In questo senso la notazione dimostra di non consistere in una mera mnemotecnica, ma di essere parte stessa della conoscenza metalinguistica della dimensione fonetica. La scrittura, quindi, non si limita alla semplice sostituzione del segno sonoro con un segno scritto: il nuovo dispositivo viene ad imporsi come vero e proprio strumento di modellizzazione della lingua, costruendo una diversa prospettiva di osservazione e consentendo al linguista di ‘vederne’ la struttura e le relazioni81. Non è quindi un caso che la citata distinzione tra significant sound-distinction e superflous sound-distinction, trovi una corrispondenza con l’elaborazione di un doppio sistema di trascrizione che Sweet chiamerà: Narrow Romic e Broad Romic. Se il primo servirà a indicare le diverse sfumature di suono, anche quelle non pertinenti alle distinzioni semantiche, il Broad invece, sarà d’ausilio per la segnalazione dei soli suoni ‘distintivi’82. È lingue esistenti. A questo proposito lo stesso Sweet scrive: “In Mr. Bell's 'Visible Speech', accordingly, an entirely new set of symbols is used, which indicate the action of the organs in every case, all the symbols being made up of a few simple elements, which can be combined to any extent. If the phonetic analysis on which Visible Speech is based were perfect, the alphabet itself might, with a few alterations, easily, be made practically perfect, and capable of representing all possible sound whatever with the minutest accuracy” (Sweet 1876, p. 100). 81 È forse questo il motivo per cui lo stesso Sweet ritene fondamentale, per la pratica fonetica, avere padronanza della notazione: “Next to the power of forming sounds correctly and easily, and recognising them by ear, the most important requisite for the practical phonetician is facility in handling phonetic notation” (Sweet 1880, p. vi). 82 L'idea di utilizzare un alfabeto fonetico per scopi pratici e quindi privo di elementi grafici in grado di rappresentare un numero elevato di sfumature foniche, è presente anche in Ellis (1848) il quale, proprio in apertura del suo libro, scrive: "The Ethnical Alpfabet being a pratical universal alphabet, many of the delicate distinctions which are necessary in a complete phonetical alphabet are neglected; and the writer may therefore find it necessary in particular case, to make a distinction between two vowels which are here represented by the same sign, for with purpose he must have recourse to the more delicate symbols of the complete alphabet" (Ellis 1848, p. 1). Il debito da parte di Sweet nei confronti di John Ellis è chiaramente esplicitato in più occasioni. Sul doppio sistema alfabetico scrive “I thus formed the two systems, Broad and Narrow Romic, mainly on the basis of Mr. Ellis's Pulaeotype, from which the latter differs mainly in the values assigned to the letters. To the 77 bene tuttavia chiarire che le riflessioni di Sweet sul rapporto tra fonetica e proto-fonologia rimarranno ancorate soprattutto all’uso pratico didattico. Gli obiettivi del fonetista inglese e il contesto in cui venivano alla luce i suoi lavori erano ancora lontani dalla svolta saussuriana e strutturalista che spinsero a guardare l’oggetto lingua nel complesso sistema di pertinenze e funzioni83. 3.4 La rappresentazione dell’intonazione e dei tratti prosodici L’intera produzione bibliografica del maestro inglese è intrisa di riflessioni sui procedimenti notazionali che lo stesso considera fondamentali nello studio della lingua e che non si fermano al solo alfabeto fonetico. Quest’ultimo inoltre si configura come un potente strumento descrittivo e analitico, capace di rendere conto non solo della rappresentazione di segmenti articolati ma anche di più ampie porzioni di suono. Il sistema di simboli verrà infatti utilizzato da Sweet per trasferire graficamente anche variazioni di toni, dinamiche e durate, fino a comprendere interi enunciati. Ogni sfumatura sonora considerata linguisticamente pertinente viene in questo modo inclusa all'interno dell'alfabeto fonetico85. Rispetto alla trascrizione dei suoni articolati, l’intonazione occupa nell’opera complessiva 83 85 78 relation between my two systems corresponds that between Mr. Ellis's Glossic and Universal Glossic” (Sweet 1878 [1913], p. 117-18) e ancora “For rougher phonetic notation, and for purely pratical purposes, digraphs are perfectly admissible, as is show both in Mr. Elli's Glossic and my Broad Romic” (Ivi 120). La portata teorica della ‘scoperta del fonema’ è fatta risalire a Baudouin de Courtenay, contemporaneo di Sweet, che negli stessi anni, precisamente 1870, giungeva ‘ufficialmente’ a porre l’accento sulla natura funzionale dei suoni linguistici 83: Dans la linguistique, l’idée de phonème, de son distinctif, ou, mieux, l’idée de ce qui est distinctif dans le son, ne date pas d’hier. C’est surtout à Baudouin de Courtenay qu’appartient le mérit d’avoir inauguré la discussion de ce problème dans l’histoire de notre science. Le grand linguistique polonais a abordé l’idée de phonème dès 1870, à l’âge de vingt-cinq ans, dans sa conferénce inaugurale à l’université de Saint Pétersbourg (Jakobson 1976, p. 48). Il grande interesse per il tema della scrittura e della notazione in Sweet non si limita al rapporto tra suono linguistico e alfabeto fonetico ma si estende anche alla stenografia (è il caso del volume "A manual of current shorthand orthographic and phonetic" del 1892) e alla notazione musicale, come si evidenzia in alcune note manoscritte risalenti al periodo tra il 1904 e il 1908, di cui si parla in MacMahon (2007). del fonetista inglese uno spazio ridotto. Un sistema dunque graficamente semplice, se si considerano gli sviluppi futuri nel contesto britannico o statunitense, ma capace di descrivere in maniera complessa le diverse forme e funzioni della lingua. Lieberman nel suo Intonation, perception, and Language (1967) metterà in evidenza proprio questa capacità del modello rappresentativo di Sweet: Recent research shows that Sweet's intonation can be used to transcribe the intonation patterns of English utterances quite accurately. A trained linguist can accurately transcribe the change in fundamental frequency of a segment of speech relative to its immediate surround using this notation (Lieberman 1967, p. 254). Va ricordato che, nonostante la presenza di esempi importanti nel passato, come quello già mostrato in Prosodia Rationalis da Johsua Steele, il contesto di studi dell’epoca non presentava lavori influenti e mirati in tema di trascrizione dell’intonazione. Ciò avverrà, però, nei primi decenni del ‘900 soprattutto nella tradizione linguistica inglese. Come evidenzia Sweet: The whole relation of tone to language has as yet been only imperfectly studied, and all that can be expected from student in our present state of knowledge is the power of discriminating the four inflections /, \, ⋁ and ⋀”. (Sweet 1877a, p. 95). L'intonazione viene descritta da Sweet come "Changes of pitch or tone", dipendente dalla rapidità delle vibrazioni sonore, le quali dipendono a loro volta dalla lunghezza delle corde vocali. Dal punto di vista della forma sonora, tali variazioni tonali presentano tre principali forme: piatta, ascendente e discendente. A sua volta l'intonazione può presentare variazioni continue o discrete86, oppure combinarsi sotto forma di composti su una stessa sillaba 87. Il modello è dunque molto semplice: tre forme melodiche generali il cui utilizzo nel parlato permette ai soggetti della comunicazione di trasmettere e interpretare informazioni non contenute nel solo segnale articolatorio. Nei suoi scritti Sweet sottolinea ad esempio 86 87 “Changes of pitch or tone may proceed either by leaps or glides” (Sweet 1888, p. 8). “There are also compound tones, formed by uniting a rise and fall in one syllable: (1) the compoundrising, (2) the compound-falling” (ibidem). 79 l’importanza dell’intonazione per la specificazione delle modalità di frase 88 (ad. es interrogative o affermative), per sottolineare l’atteggiamento del parlante (es. esitazione, dubbio) o per esprimerne lo stato emotivo. 3.5 Intervalli di tono e variazioni globali Nell’individuazione degli elementi sonori pertinenti alla differenziazione dei sensi linguistici, Sweet segnala, oltre all’andamento della melodia, anche l’ampiezza dell’escursione tonale generale. Tale caratteristica verrà poi indicata come pitch range89. Secondo Sweet infatti: All these tones can be varied indefinitely according to the interval through wich they pass. As general rule, the greater the interval, the more marked the character of the tone (Sweet 1877a, pp. 94-5). L’importanza linguistica degli intervalli tra i toni è riscontrabile nella progressiva specificazione simbolica degli stessi all’interno della produzione di Sweet. Confrontando i lavori è possibile osservare un’integrazione nel sistema dei caratteri utilizzati dal maestro. L’ampiezza dell’escursione tonale viene infatti codificata successivamente e non risulta essere presente nel suo Handbook of phonetics, sebbene Sweet ne descriva gli effetti: 88 89 80 “Intonation or tone is either level, rising, or falling marked respectively. The level tone is not much used in speech. The rising tone is heard in questions, such as what’, the falling in answers, such as no`” (Sweet 1893, p. 14). Tra i contributi più interessanti segnaliamo Crystal (1969, pp. 143-151) che distingue due principali sistemi di contrasto linguistico determinato dalle differenze di pitch range, che definisce Simple e Complex. Sul ruolo distintivo dell’escursioni tonali anche O’ Connor e Arnold (1961) o Clements (1979), il quale sottolinea il ruolo semantico e grammaticale del pitch range: "Among the intonational processes affecting the frame are those of RANGE EXPANSION and RANGE CONTRACTION, as well as register shift. The first two involve the magnitude of the largest interval over which all tones may range. In range expansion (which is widely characteristic of excited or emotional speech), the peaks and valleys of the fundamental frequency contours are more widely separated than in normal or unmarked speech; while as a result of range contraction, they are more compressed.[…] These two processes not only serve semantic (expressive) functions in many languages, but may also become integrated into the grammatical system" (Clements 1979, p. 549). Thus, a rise through a small interval (a second for istance) denotes mere enquiry, through a large one (such as a sixth) surprise. Again, the semitone (minor) interval has a plaintive effect, but here the less the interval the more marked its minor character, most of all therefore in the simple semitone or half-tone. The reason of this is that sadness, like all un-energetic emotion, naturally expresses itself in inflessions of narrow range (Ivi, p. 95). Come è possibile constatare, non vi è un mezzo rappresentativo in grado di rendere conto di tali differenze di intervalli. Una mancanza che in termini di trascrizione renderebbe impossibile la disambiguazione di due frasi pronunciate sfruttando una diversa escursione tonale, e di conseguenza renderebbe impossibile una corretta lettura e interpretazione dell’enunciato. Nella sua opera del 1890, A primer of phonetics, Sweet supererà questo ‘vuoto’ grazie all’introduzione di un espediente grafico: For ordinary purposes it is enough to distinguish between a high rise (′) and a low rise (,) the former passing through a less interval than latter. Conversely a high fall (`) passes through a greater interval that a low fall ( 、) (Sweet 1890, p. 66). La riflessione di Sweet sul ruolo dell’intonazione non si ferma tuttavia alla descrizione dei movimenti ascendenti e discendenti, considerati localmente, e si spinge ad evidenziarne il ruolo anche nell’insieme complessivo dell’enunciato. Tali variazioni globali del tono prenderanno così il nome di chiavi (Key). Fig. 19 Variazioni globali di tono Besides the separate inflections of which it is made up, each sentence, or sentencegroup, has a general pitch or key its own. Key is marked by prefixing the voiceleap symbols in the same way as with the other group-modifiers [...]. For ordinary purposes it is enough to distinguish three keys: the middle being generally left 81 unmarked (Sweet 1890, p. 66). Per il fonetista anche la melodia, così come l’ampiezza del suo range, diviene elemento linguistico, elemento utile nell’economia della lingua e pertanto codificabile attraverso il sistema notazionale. Tali contorni melodici infatti avranno un importante ruolo nell’espressione delle emozioni: un pitch generale alto sarà più frequente nei casi di manifestazioni gioiose, mentre uno prettamente basso sarà più frequentemente riscontrabile in enunciati di rabbia. I cambiamenti di chiave non sono tuttavia legati esclusivamente alle manifestazioni delle sfumature emotive: Change of key has also a purely logical significance. Thus question are naturally uttered in a higher key than answers, and parenthetic clauses in a lower key than those wich state the main fact. In all natural speech there is incessant change of key. Changes of key may proceed either by leaps or progressively. Progressive change of key may be expressed by prefissing / or \ to the sign of key-change. Thus ′o is heard in all cases of passion rising to a climax (Sweet 1877a, p. 96). Fig. 20 Articolazione del Pitch nel sistema notazionale di Henry Sweet 3.6 82 Tono, intensità e durata. Il sistema prosodico di Sweet Lo studio della ‘categoria’ del tono (pitch) entra a far parte dell’architettura teorica del linguista inglese all’interno della sezione da lui stesso definita Sintesi. Lo scopo di questa distinzione è ben annunciata dallo stesso Sweet. Mentre lo studio analitico si interessa all’articolazione dei suoni linguistici presi isolatamente 90 , la parte dedicata alla sintesi osserva questi ultimi nelle loro relazioni con altri suoni (è il caso dello studio della divisione in sillabe o dei cosiddetti glides) e con altre dimensioni del suono, come il caso del tono. Synthesis looks mainly at the beginning and end of each sound, as the point where it is linked on to other sounds; while analysis concerns itself only with the middle of the fully developed sound. Synthesis is thus the science of sound-joints or ‘glides’. There is also a more general kind of synthesis which deals with the relations of sounds to one another in sound-group-their difference in length, loudness, pitch, etc. Synthesis, lastly, deals with the organic and acoustic ingrouping of sound into syllables, etc., and the divisions between these group (Sweet 1890, p. 41). Fra i tratti più importanti della sintesi Sweet segnala la quantità o durata e l'accento (stress), costituendo così uno dei primi e articolati sistemi per la trascrizione e analisi del sistema prosodico. La categoria della durata viene articolata in cinque livelli, tutti contraddistinti dai corrispondenti simboli: 90 “We have hitherto considered sound from a purely analytical point of view, that is, each sound has been considered by itself, as if it were a fixes, isolated element. But in language sounds are combined together to form sentences, and many sounds occur only in certain fixes combinations. Analysis regards each sound as a fixed, stationary point, synthesis as a momentary point in a stream of incessant change” (Sweet 1890, p. 41). 83 Fig. 21 Articolazione della durata Il fonetista inglese descrive la categoria della durata non solo in riferimento ai segmenti ma estende la sua riflessione anche a espressioni linguistiche più estese comprese in un breathgroup o in enunciati più ampi91. Sweet non approfondirà ulteriormente la questione della ‘rapidità’ del parlato in riferimento agli usi linguistici che di questa fanno i parlanti. Tuttavia tali considerazioni apriranno le porte allo studio della velocità di eloquio (speech rate) come tratto del sistema prosodico in grado di occupare un importante ruolo nella comunicazione linguistica92. Anche l’intensità (force o stress in Sweet) trova la sua importante collocazione nel 91 92 84 “We can also distinguish degrees of rapidity of speech in different breath-groups or longer periods”(Ivi, p. 43). È possibile incontrare riflessioni sul ruolo della rapidità del parlato in Sievers (1901), che sottolinea la necessità di distinguere tra durate assolute e durate relative. Anche Jespersen si esprime a questo proposito nel suo Lehrbuch der Phonetik (1904). Altri riferimenti si trovano in Karcevskyi (1931), Fónagy & Magdics (1960), Goldman-Eisler (1961). Crystal (1969) articola la dimensione temporale in due tipologie di sistema che lui definisce ‘Simple tempo system’ e ‘Complex tempo system’. La velocità di eloquio è inoltre parametro importante negli studi di analisi della conversazione. Uhmann (1992) la inserisce tra gli indici di contestualizzazione (Cook-Gumperz & Gumperz 1976). Per la sua analisi Uhmann si serve di una doppia distinzione: density of all syllables e density of accented syllable. Mentre la prima misura il numero di sillabe incluse in un’unità di tempo, la seconda analizza, all’interno dell’unità di tempo, esclusivamente il numero di sillabe accentante. Incisi, segnalazioni di parti non rilevanti all'interno del discorso, ripensamenti e riparazioni, vengono così interpretate alle luce dei valori di densità variamente articolati. Sorianello (2006) ha sottolineato come ad influenzare tale parametro posssano essere diverse variabili come "il contesto enunciativo in cui avviene la comunicazione, lo stile, l'intento comunicativo, la tipologia testuale del messaggio prodotto" (Sorianello, 2006 p. 31). Negli studi sul parlato emotivo la velocità di eloquio compare tra i parametri fonetico-acustici legati all’espressione vocale delle emozioni (Scherer, Johnstone, Klosmeyer 2003). Fluency e Speech Rate sono così organizzati nei seguenti indici: Number of syllables per second, Syllable duration, Duration of accented vowels, Number and duration of pauses, Relative duration of voiced segments, Relative duration of unvoiced segments. Altre applicazioni e analisi sono state effettuate nell'ambito degli studi della comunicazione politica (Savastano, Giannini, Pettorino, 1995; Pettorino, Giannini, 1997). ‘disegno’ del fonetista inglese. A livello fisiologico essa è determinata dal diverso sforzo impiegato nel processo di emissione 93, a livello fisico corrisponde all’ampiezza delle onde sonore, mentre a livello uditivo il parametro fa riferimento al volume della voce. Per Sweet: “The comparative force with which the syllables that make up a longer group are uttered is called ‘stress’” (Ivi, pp. 45-46). La variabilità dell'accento può essere acusticamente infinita, tuttavia Sweet identifica 4 livelli 94 segnalati anche per mezzo della trascrizione: weak, half-strong o ‘medium’ (:) (secondary), strong (˙) e very strong o extra-strong (¨)95. L’accento (stress) è dunque dipendente dalla variazione relativa dell’intensità, e quindi dalla diversa distribuzione della forza di emissione applicata alle sillabe. Lo stesso tipo di variazione, in riferimento al livello di enunciato, sarà indicato da Sweet con il termine Emphasis: In speaking of the stress of words in a sentence as opposed to that of syllables in a word the term 'emphasis' is commonly used (Sweet 1890a, p. 46). Nei sui studi strettamente fonetici tuttavia Sweet si occuperà esclusivamente dell’accento sillabico, lasciando in latenza il ruolo e le funzioni dell’accento applicato a porzioni più ampie di enunciato. In effetti tale nozione è approfondita dal maestro inglese nel libro A Primer of spoken English del 1890 e precisamente in apertura alla sezione del volume dedicata alla sintassi. Lì Sweet indicherà con maggiore chiarezza proprio le funzioni 93 94 95 Sul piano fisiologico il parametro dell’intensità è legato a diversi fattori quali quantità di energia articolatoria, pressione dell’aria proveniente dai polmoni, grado di tensione delle pliche vocali. In realtà il numero oscilla tra 3 e 4. In Handbook of Phonetics i livelli di accento indicati sono tre: weak, medium (secondary) e strong con una menzione dell’esistenza del ‘very strong’. Come sottolinea Crystal (1969, p. 157) ci sono stati due principali punti di vista sulla quantità di livelli di stress nella lingua inglese. Tra questi si segnalano Jespersen (1933) che nel saggio ‘note on metre’ ne individua quattro: weak, half weak, half strong, strong, il quale tuttavia nota come sia difficile, data la mancanza di strumenti di misurazione, distinguere le differenze tra gli accenti intermedi. Trager e Smith (1951, p. 36), sotto un profilo teorico molto diverso da quello del maestro inglese, parlano invece di Primary, Weak, Secondary e Tertiary stress. 85 associate alle diverse varietà di sentence stress, tra cui quelle di emphasis 96. The emphatic stress. The general principle of sentence-stress is to stress the logically prominent words - those which are most indispensable for expressing the sense (Sweet, 1890b p. 28). L’accento enfatico entra dunque in relazione con quella che in tempi più recenti la linguistica pragmatica ha analizzato come la struttura informativa97 degli enunciati. Sebbene in termini generali rispetto agli sviluppi attuali, Sweet metterà a fuoco la cosiddetta dicotomia dato/nuovo, evidenziando la stretta connessione tra dimensione prosodica, sintattica e semantica. La dinamica dei suoni linguistici viene così incaricata, a livello frasale, di sottolineare, mediante prominenze acustiche, le parti salienti del discorso portatrici di nuova informazione. Su questo Sweet si esprime molto chiaramente: All words that express new ideas are more or less emphatic; while words that express ideas already familiar or that can be taken for granted are unemphatic (Sweet 1890, p. 29) 98. Avremo dunque una ulteriore articolazione, quella tra positive emphasis e negative emphasis: il primo sarà utilizzato da Sweet per indicare l’accento posto su porzioni di enunciato semanticamente salienti, e quindi maggiormente prominenti; il secondo sarà utilizzato per indicare le parti dell’enunciato familiari ai parlanti e dunque acusticamente 96 97 98 86 Tra i vari tipi di sentence stress descritti da Sweet ci sono: intensive stress, contrasting stress, the modifying stress, the grouping stress, the distributed stress (Sweet 1890b, p. 29). Cfr. Halliday (1967), Lombardi Vallauri (2002; 2006). Coleman (1914) distinguerà tra “Prominence” e “Intensity”. Decenni più avanti Lieberman (1967) articolerà ulteriormente le nozioni suddividendo tra Prominence “perceptually, is [...][...] the perceived ‘loudness’ of a vowel relative to its environment” i cui correlati acustici sono “duration, fundamental frequency, and sound pressure level (or amplitude)” (Liebermann 1967, p. 225); Stress “abstract entities that are generated by phonologic rules of the “stress cycle”. L’accento infatti secondo la teoria di Liebermann “is a phonetic element that has definite acoustic correlates in the speech signal that are independent of the acoustic correlates of the segmental phonemes” (Liebermann 1967, p. 226). Infine l’Emphasis è il termine utilizzato “to identify instances where the distinctive feature [+P𝗌] produces extra prominence on the vowels of a word (and its consonants), apart from the stress that the vowel of the word would have received from phonologic stress cycle. In other words emphasis is prominence that is not predicted by the stress cycle” (Liebermann, 1967 p. 228). meno salienti. Fig. 22 Il sistema di trascrizione in Henry Sweet Il sistema di trascrizione dei fenomeni prosodici e intonativi creato da Henry Sweet, trova la sua collocazione nella complessa costruzione del sistema di scrittura fonetica elaborato dal linguista inglese. In questo senso, l'alfabeto non viene limitato alla rappresentazione dei segmenti, ma esteso alla descrizione di fenomeni della lingua operanti in domini più ampi, come la sillaba o l'enunciato. Tali elementi grafici verranno così impiegati per descrivere dettagliatamente la 'forma fonica'. Le articolazioni dei suoni linguistici saranno considerate quindi nel contesto globale della pronuncia, e della comunicazione. In tale prospettiva tono, intensità, e durata saranno dunque dimensioni del suono linguisticamente pertinenti alla trasmissione e comprensione dei significati. Abbiamo inoltre visto come l'intera architettura teorica e pratica ruoti intorno a tre importanti ambiti, rappresentati dal primato della fonetica nello studio della lingua, dall'interesse per la notazione e dalla pratica d'insegnamento. Sono questi infatti i 'luoghi' in cui si articolano la maggior parte delle intuizioni del maestro, come il valore distintivo dei suoni linguistici, che anticiperanno di decenni la 'scoperta del fonema' o, l'attenzione alla relazione tra struttura intonativa e struttura informativa degli enunciati. 87 4 Daniel Jones “La musica della parola” Henry Sweet può essere considerato senza dubbio un autore di riferimento per gli studi sull’intonazione grazie ai suoi interessi e alle sue numerose intuizioni. Scrittura, didattica delle lingue e primato della fonetica sono infatti elementi che ricorreranno nella scuola linguistica britannica, influenzando e arricchendo il campo di studi sull'intonazione. Dal punto di vista della rappresentazione dell’intonazione linguistica, tra la fine dell‘800 e la prima metà del ‘900, non sono mancati tentativi di sviluppo. Tra questi è di indubbio interesse quello operato dal linguista inglese Daniel Jones, il cui modello si caratterizzerà per l’utilizzo della notazione musicale e di un sistema costituito da linee continue e punti con il quale tracciare gli andamenti intonativi. Altri tentativi in questo senso, sebbene con sfumature differenti, erano state fatte, come abbiamo visto precedentemente, da Johsua Steele (1799) e dai suoi principali seguaci, ad es. Chapman, J. (1818). Nello stesso periodo altri studiosi sfrutteranno il sistema notazionale musicale come supporto di iscrizione dei fatti linguistici. Nell’ambito della metrica, ad esempio, si segnala Pierson (1884) che userà proprio lo spartito per la trascrizione sia delle variazioni metriche che dell’intonazione: 88 Fig. 23 Pierson 1884 p. 33 Fig. 24 Pierson 1884 - Esempio di frase interrogativa99 Medesimo tentativo è da ascrivere, in tempi più recenti a Ivan Fonagy e Klara Magdics. In un loro famoso intervento del 1963 dal titolo Emotional patterns in speech and music essi faranno riferimento al modello notazionale musicale (Fig. 3) per operare un vero e proprio confronto tra l’espressione delle emozioni in musica e nel linguaggio verbale: 99 In figura 23 le note musicali sono considerate esclusivamene nei loro valori di durata; in figura 24 la disposizione delle note sul pentagramma, in corrispondenza del testo, consente la visualizzazione dell’andamento tonale di una frase interrogativa. L’ultima nota è infatti collocata, rispetto alla precedente, in posizione più elevata. In questo modo Pierson può segnalare l’innalzamento del tono sulla parte finale della frase. 89 Fig. 25 Fonagy e Magdic (1963, p. 294) 100 L’obiettivo del loro studio è quello di mostrare, attraverso l’analisi dei principali indicatori prosodici di dieci emozioni 101 , le corrispondenze tra i due sistemi semiotici, quello linguistico e quello musicale. Diversi sono i parametri pertinenti per l’analisi, tra questi si trovano il pitch-range, l’andamento dell'intonazione e il suo valore, la distribuzione delle sillabe accentate, il tempo e le pause. Mediante lo spartito dunque è possibile segmentare il flusso parlato in successioni di toni e durate ed avere, come vedremo, un sistema di riferimento anche a livello acustico. Come noterà anche Crystal (1969), tra i difetti principali di questo mezzo di trascrizione c’è il differente valore funzionale degli intervalli in musica e nella lingua: nel primo caso le funzioni melodiche e armoniche si sviluppano a partire da intervalli di tono definiti, nel secondo caso invece la successione dei toni nella loro relazione con funzioni linguistiche non avviene mediante intervalli definiti102. 100 101 102 90 Le note musicali disposte sul pentagramma sono utilizzate per trascrivere gli andamenti tonali e la scansione ritmica in corrispondenza testo verbale. La figura rappresenta il confronto fra un enunciato neutrale (linea 2) e uno di gioia (linea 1) in lingua ungherese. Tra i parametri che risaltano maggiormente c’è l’incremento del pitch-range, che si mantiene costantemente più alto sul primo enunciato rispetto al secondo. Esso misura infatti la differenza (o escursione) fra i valori massimi e quelli minimi della frequenza fondamentale (resa in questo caso dalla successione delle note), che caratterizzano una certa catena fonica. Le analisi sono state fatte su conversazioni, drammi e composizioni strumentali e vocali. Le dieci emozioni selezionate riguardavano invece (1) gioia, (2) tenerezza, (3) nostalgia, (4) civetteria, (5) sorpresa, (6) paura, (7) protesta, (8) disprezzo, (9) rabbia, (10) sarcasmo. In riferimento al modello di rappresentazione mediante lo spartito musicale Crystal (1969, p. 35) scrive “such an approach (conventional musical symbols ndr.) was unsatisfactory, not merely for the practical that it was extremely difficult to read, but also for theoretical reason that the voice does not pass from one pitch to another by definite intervals”. Altri esperimenti notazionali di questo tipo sono riscontrabili nell'ambito dello studio delle lingue tonali. Un esempio è quello di Bien - Ming Chiu (1930) nella descrizione del dialetto cinese Amoy: Fig. 21 Bien - Ming Chiu (1930)103 Il sistema qui impiegato è molto simile a quello utilizzato da Sapir (1922) nella descrizione del takelma: Fig. 22 Sapir (1922) Il metodo di trascrizione utilizzato da Daniel Jones combina, invece, il potenziale offerto dallo spartito con una rappresentazione melodica continua, mediante l’impiego di linee e punti. Una tecnica molto simile a quella descritta Paul Passy nel 1887: 103 La trascrizione sulla partitura rappresenta i diversi andamenti tonali utilizzati nel dialetto cinese. Ogni battuta, segnalata mediante i numeri, contiene una diversa tipologia di tono, di cui le note trascrivono l’andamento. 91 Fig. 23 fonte Paul Passy (1887)104 Come vedremo il sistema è del tutto simile, con i dovuti aggiustamenti, a quello impiegato da Daniel Jones nel suo Intonational curve del 1909. Non è forse un caso, infatti, che fu lo stesso Jones a curare l’edizione inglese del volume di Passy nel 1907. Il procedimento sviluppato dal fonetista inglese, in linea con la tradizione britannica, pone in evidenza la necessità di inserire l’intonazione al centro degli studi sulla pronuncia e di farlo mediante un mezzo di trascrizione adeguato 105. In questo modo si tenta di superare i precedenti studi che consistevano nell’impiego di simboli fonetici generali per indicare l’andamento del pitch106, come abbiamo mostrato nelle pagine dedicate a Henry Sweet. Secondo Jones, infatti, in una completa analisi della pronuncia devono essere rappresentate le seguenti caratteristiche del fenomeno sonoro107: - Qualità dei vari suoni - Quantità del suono (lunghezza) 104 105 106 107 92 L’immagine si riferisce alla trascrizione elaborata da Passy sulla base del testo tratto dalla Grammaire di Labiche. Il linguista segnalerà mediante una linea continua gli andamenti melodici delle frasi. Il testo è scritto senza segnali di interpunzione ed è diviso in breath-groups. La curva si interrompe del tutto tra i breath-groups mentre presenta dei punti quando le pause si verificano nel mezzo. “The branch of phonetic science know as Intonation, i. e. the variations in the pitch of speaking voice, has not hitherto met with equate treatment in book on pronunciation owing to the want of satisfactory method of indicating these variations” (Jones 1909a, p. IV). “Intonation, when marked at all, has generally been indicated by sign such as `,´,ˇ, etc. placed at the beginnings and ends of words or sentences. Such marks may give a rough idea of the kind of intonation required, as for instance that the pitch is to rise or fall, but they fail to show with any sort of accurancy the precise points of the sentences at which the changes of pitch begin and end, and they do not profess to indicate absolute pitch, or the subtle variations of pitch which are perpetually occurring in speech” (Jones 1909a, p. IV). In a complete analysis of pronunciation the following elements of speech must be represented: (i) the quality of various sounds, (ii) the quantity of the sound (lenght), (iii) their relative loudness, and (iv) the pitch of the voice in pronuncing them” (Jones 1909a, p. V). - Il loro volume relativo (intensità, dinamica) - L’altezza della voce nella pronuncia dei suoni (pitch, intonazione ndr.) Il fine del modello notazionale è, quindi, quello di trasferire mediante un sistema di rappresentazione queste quattro principali caratteristiche del fenomeno sonoro. Per fare ciò, Jones si serve sia di strumenti tratti dalla tradizione linguistica, che di strumenti elaborati fuori dall’ambito disciplinare propriamente linguistico. Le prime tre caratteristiche infatti sono trascritte mediante l’uso di simboli dell’alfabeto fonetico: articolazione dei singoli suoni, accenti (dinamiche) e lunghezza vengono posizionati nello stesso spazio attraverso i simboli fonetici. Per quanto riguarda l’ultimo dei quattro parametri elencati, il pitch, e precisamente per l’andamento melodico generale, l’autore sceglie di utilizzare uno nuovo strumento di misurazione e analisi che sarà costituito, come abbiamo anticipato, da un sistema formato da linee continue e punti, inserito in uno spartito musicale. Fig. 26 fonte Daniel Jones (1909a) 108 Il frammento qui riproposto ci mostra, nella sua interezza, il sistema di trascrizione utilizzato da Daniel Jones nel volume Intonational curves. In basso sono trascritte le tre caratteristiche di qualità, intensità, lunghezza proiettate sul dispositivo attraverso la simbologia fonetica. Nella parte alta del frammento abbiamo invece il più complesso sistema rappresentativo composto dalle linee orizzontali del pentagramma, linee verticali, punti e linee curve. Queste ultime hanno il compito di rendere conto della variazione 108 L’immagine riporta una parte della trascrizione fonetica di un brano tratto da Richard the second di Shakespeare. Lo spezzone riportato in figura si riferisce alla seguente frase “Let’s talk of graves, of worms, and epitaphs”. 93 melodica del flusso parlato. Analizzando più nel dettaglio il dispositivo planare sarà possibile osservare alcune peculiarità e alcune consonanze con il metodo di scrittura musicale. Come è possibile osservare, lo spazio grafico si compone di un pentagramma del tutto corrispondente a quelli usati nella pratica musicale. All’interno di tale spazio, l’analista potrà annotare le variazioni del pitch109. Fig. 27 Daniel Jones (1909a) Come abbiamo avuto modo di mostrare precedentemente, l'utilizzo della partitura permette all'analista di servirsi di un metro, di uno strumento in grado di sezionare il parametro dell’altezza in grandezze definite da valori tonali. In questo caso l'unità di misura è stabilita a partire dalla suddivisione dello spettro sonoro in grandezze musicali. La dimensione verticale del supporto articola la categoria del tono secondo il seguente rapporto alto : basso = acuto : grave. Procedendo dal basso verso l’alto, e sfruttando come riferimento le righe e gli spazi, avremo note con un valore di pitch maggiore. L’unica differenza con il supporto originale è l’assenza di segni per le alterazioni (diesis e bemolle), che hanno il compito di indicare l’aumento o la diminuire del valore tonale della nota a cui si applicano. 109 94 “The quality of the sound is shown by phonetic symbols, their lenght by the use of the mark : e ; their loudness by stress mark ‘ by lines being placed at every point where there is a minimum loudness (i e at the limits of the syllables) – and lastly the pitch of the voice by curves on musical staves” (D. Jones 1909a p. V). In questo caso i punti indicanti le note sul pentagramma possono occupare 4 diverse posizioni: rigo (il punto è attraversato centralmente dal rigo del supporto planare), soprarigo (la parte inferiore del punto è adiacente al rigo musicale), spazio (il punto si trova al centro dello spazio e non ha contatti con alcun rigo), sotto-rigo (la parte superiore del punto è in contatto con il rigo musicale) 110. I simboli grafici posti a sinistra, definiti chiavi musicali, hanno il compito di fissare il valore delle note e quindi della loro relativa altezza. Dunque i simboli, rispettivamente chiave di fa (chiave di basso) e chiave di sol (chiave di violino), definiscono lo spettro di frequenza che è possibile rappresentare in quello spazio. I punti posti in basso avranno un valore di pitch inferiore a quelli posti in alto, e a loro volta i punti posti nello stesso rigo o spazio del pentagramma, ma contestualizzati da due chiavi differenti, avranno valori diversi. Le lettere scritte in basso esemplificano quanto appena detto, indicando il valore delle note musicali secondo la denominazione anglosassone 111. Tale dispositivo ha il vantaggio di consentire una misurazione prossima anche al dato acustico. Ciascuna posizione sul pentagramma, una volta contestualizzata a partire dalla chiave, ha un suo valore corrispondente in Hertz, ossia l'unità di misura del sistema internazionale della frequenza. Il difetto, che Jones supererà tramite l’utilizzo delle curve, è la natura discreta della rappresentazione sonora: il pentagramma è costituito da una vera e propria scala discreta di altezze. Il risultato ottenuto dall’autore è, sotto certi aspetti, non lontano da quello raggiungibile mediante più moderni, e potenti, mezzi strumenti di analisi. Per osservare le variazioni della F0 è possibile attualmente servirsi di software in grado di rappresentare graficamente una curva di frequenza fondamentale mediante un grafico che ha il tempo sull’asse delle ascisse e gli Hz in sull’asse delle ordinate. Il grafico risultante renderà visibile e misurabile, momento per momento, il valore tonale della voce. L’esempio 110 111 Si nota in questa operazione il tentativo di adattare il supporto notazionale musicale alle esigenze di misurazione. Operazione simile era stata già effettuata da Johsua Steele (cfr.) Ogni lettera corrispondente a una delle sette note della scala diatonica A = La, B = Si, C = Do, D = Re, E = Mi, F = Fa, e G = Sol. 95 seguente è tratto da De Dominicis (2010) che esemplifica l’utilizzo del software Praat: Fig. 28 Finestra di editing della F0 con Praat (Fonte: De Dominicis (2010 p. 96) 112 Il modello rappresentativo musicale segue lo stesso principio, collocando sull’asse verticale la variazione delle altezze e sull’asse orizzontale la successione temporale. Leggendo da sinistra verso destra il pentagramma si avrà così lo stesso tipo di rappresentazione. L’utilizzo delle linee curve permette infatti a Jones di trasferire all’interno del sistema di riferimento del pentagramma la variazione melodica continua della voce, operando sostanzialmente una rappresentazione della F0. Ad esempio, nel primo pentagramma di Fig. 8 la prima nota in basso, ‘E’, ha un valore pari a 82,4 Hz mentre nel secondo pentagramma la nota più bassa è ‘G’ che ha un valore pari a 196 Hz: i valori oscilleranno rispettivamente tra gli 82,4 Hz e i 349,2 Hz, e tra 196 Hz a 585 Hz. Nei volumi dedicati alla pronuncia dell’inglese D. Jones (1909b, 1918) affronta il tema dell’intonazione e il suo metodo di trascrizione, descrivendone tecniche e strumenti. Un primo mezzo, semplice ma adatto a finalità pratiche, consiste nel riportare su un supporto cartaceo, sempre attraverso l’uso di linee curve, l’impressione del dato acustico appena 112 96 La schermata si riferisce alla frase Antonio canta una canzone ascoltato113. Fig. 29 Daniel Jones (1918) Un secondo, lo stesso utilizzato nel volume Intonational curve, consiste nella trascrizione della melodia, sempre a orecchio e sempre mediante il supporto dello spartito, attraverso l’ausilio di un grammofono o un fonografo. Il vantaggio è chiaramente quello di poter interrompere, riascoltare e focalizzare l’attenzione su punti particolari delle registrazioni vocali114. Altri metodi di trascrizione, ulteriormente più accurati, sono quelli che si servono del tracciato cimografico, ossia di una rappresentazione meccanica a forma di curva, risultante dall’azione di variazioni foniche 115. Tale metodo di misurazione può servirsi di un tratto lineare di riferimento, come quello generato da un diapason con frequenza nota, da confrontare simultaneamente con quello della voce registrata, oppure di una griglia di riferimento, costituita da linee perpendicolari al tracciato, che permettono di calcolare il 113 114 115 “A rough musical notation may be determined or approximate curves may be drawn free-hand by anyone with a really good musical ear. This method is generally sufficiently accurate for practical linguistic purposes” (Jones 1922, p. 167). “A more accurate method of obtaining curves is the following. If while a gramophone, phonograph, or other similar instrument, is in operation, the needle is lifted from the revolving record, the car will retain the impression of the sound heard at the instant when the needle is lifted. If the record is of speaking voice and the needle is removed in the middle of a voice sound, the ear retain in particular the pitch of the musical note with the voice is producing at that instant; this may be marked on some kind of musical stave, and by taking similar observations at a large number of points in any sentence and joining the points by lines, a complete intonation curve of the sentence result” (Jones 1922, p. 168). Il cimografo è uno strumento per la registrazione grafica delle variazioni di pressione dell’aria, come emesse dal naso o dalla bocca, e dei movimenti di varie parti degli organi coinvolti nella fonazione. Per una descrizione dettagliata del cimografo e delle parti di cui è composto cfr Jones (1922 p. 168-171) o 97 valore della curva melodica in unità di vibrazioni al secondo. Quest’ultimo è il caso delle immagini in fig. 28 e 29. Fig. 30 Tracciato cimografico 116 dell'espressione Good morning Fig. 31 Trascrizione su supporto notazionale dei valori misurati con il cimografo Jones spiega in questi termini il metodo di calcolo: The calculation is worked out thus. The length of the first 4 vibrations is measured in terms of the scale of hundredths of a second shown in the bottom line of tracing. The length proves to be 27 units. The average duration of each vibration in the group is therefore one - quarter of this, viz. 00675 sec. Therefore at that rate of vibration 1 sec. would contain or 148 vibrations. This corresponds a note between D and D# in the bass clef (Jones 1922, p. 181). Sulla base di quanto appena affermato il fonetista elabora la seguente tabella con la quale 116 Il cimografo è in sostanza un tamburo ricoperto da un foglio spesso affumicato con il nerofumo che ruota alla velocità voluta mediante un meccanismo ad orologeria. Sul foglio del tamburo in rotazione uno stilo gratta via il nerofumo producendo il tracciato del fenomeno fisiologico considerato, recepito da un apposito trasduttore e trasmesso per via meccanica, idraulica, pneumatica o elettrica. La rappresentazione in figura 30 mostra il tracciato derivante dalle misurazioni effettuate contemporaneamente sul naso, bocca e laringe. 98 analizzare il dato acustico risultante dal tracciato cimografico. Tabella 2 I valori dei parametri misurati nelle diverse sezioni del tracciato Come è possibile osservare, il meccanismo è alquanto lungo e complesso e consiste nella trasposizione punto a punto dei valori acustici delle variazioni di tono. Se si esclude la difficoltà di realizzazione, il risultato può essere paragonato, per qualità e dettaglio, a quello ottenuto dai moderni strumenti di analisi fonetica. Quel che viene focalizzato dall’autore in questi esempi, come quelli mostrati in Intonational curve, è la natura continua e complessa del fenomeno intonativo. Il vantaggio è sicuramente quello di mostrare l’enorme variabilità e instabilità delle altezze nella voce parlata e di rendere oggettivabile il suo valore, attraverso un sistema di misurazione più 99 accurato e rendendo il dato disponibile ad altri studiosi117. Quel che sembra mancare nelle pagine appena descritte è, invece, una maggiore attenzione alle funzioni linguistiche connesse alle variazioni di tono. I metodi analitici più precisi, infatti, consentono di approssimare la rappresentazione con il dato acustico, fornendo informazioni circa la corretta pronuncia di quel brano specifico, di quella specifica occorrenza linguistica, senza tuttavia mostrare la relazione tra forma e funzione linguistica. A questo scopo e con finalità prettamente pratiche 118, si conforma il metodo di trascrizione mostrato in figura 32. La registrazione a mano libera e l’assenza di supporti di registrazione acustica, rendono necessaria una trascrizione più generica, relativa ed astratta. Al valore assoluto del dato acustico si sostituisce una rappresentazione che potremmo definire “proto-fonologica”119: il formato, svincolato dai valori musicali della partitura può esprimersi entro uno spazio di valori relativi. In questo modo Jones può mostrare curve ‘tipiche’ che si correlano a un determinato significato o un determinato atteggiamento del parlante. In questa direzione Jones inscrive la curva all’interno di uno spazio continuo (e non discreto come il pentagramma) in cui sono indicati solo dei valori relativi (alto e basso) 120. 117 118 119 120 Così Jones spiega l’impiego di questo metodo di trascrizione “Accurate records of intonation, have it is true, been produced by means of tracings of voice vibrations, obtained by use of a kimograph or otherwise. The vibrations may in this way be measured, or the number occurring in short unit of time counted and the result plotted on squared paper, the variations of pitch being thus expressed by curved lines. Such curves are, however inconveniently large and elaborate, and the phonetic symbols to witch the various parts of the curves correspond have to be placed far apart and at irregular intervals, thus rendering the text difficult to read. Besides this the work of preparing curves by this method is so aborious, that no one has ever yet analysed texts so sufficient length to be of any practical value to language students” (Jones 1909a, p. IV). "Some teachers have cast doubt on the utility of intonation curves in practical teaching. I can assure them from experience that most learners find such curves a considerable help. I have even known a foreigner acquire a perfectly accurate intonation of a passage of English by this means, without ever having heard the words read aloud" (Jones 1922, p. IV). “Fonologicamente l’intonazione consiste nella ricorrenza di determinate successioni di altezze tonali diverse, detti contorni (o profili) intonativi, ognuno dei quali viene usato con un significato costante entro un costituente di lunghezza variabile [...]” (Nespor 1993, p. 265). Questo tipo di esemplificazione viene presentata nel volume del 1909, Pronunciation in English. Nel suo lavoro del 1922 i grafici manterranno contemporaneamente le due forme. 100 Fig. 32 Esempi di trascrizione Daniel Jones Lo spazio rappresentativo riduce i suoi tratti: mancano le righe orizzontali della partitura che segnalavano i valori acustici del pitch, mancano le linee verticali che segnalavano i punti di variazione nell’andamento della melodia. La dimensione verticale del dispositivo è sempre connessa al valore delle altezze: la curva intonativa assume valori relativi crescenti nella zona più alta dello spazio di rappresentazione (delimitata dalla linea orizzontale segnalante high pitch) mentre decresce di valore con il progressivo avvicinamento alla parte bassa (low pitch). In questo modo Daniel Jones può trattare in maniera linguisticamente pertinente anche altre funzioni dell’intonazione come ad esempio il carattere emotivo degli enunciati: 101 Fig. 33 Esempi di enunciati emotivi Oppure legare l’intonazione a differenti tipi di enunciato: Fig. 34 Esempi di trascrizione (Jones 1922) 102 Cap. 3: 1 L’intonazione della lingua tra forma e significato Harold Palmer e l’intonazione come sistema Palmer è considerato il padre della linguistica applicata 121 inserendosi a pieno nell’ambito dell’area di studi interessati alla didattica, in linea con la tradizione britannica presentata nel capitolo 2. Seguendo la traccia solcata da Henry Sweet (1900), sulla necessità di individuare dei principi generali per l’insegnamento delle lingue, Palmer cercherà di istituire una nuova ‘scienza linguistica pedagogica’. Tuttavia quest’ultima sarà concepita in maniera più aperta: mentre il suo predecessore concentrerà sulla fonetica il ruolo fondamentale per lo sviluppo della ‘living philology’122, Palmer estenderà gli interessi della linguistica applicata ad altre branche degli studi linguistici123 (filologia, fonetica, grammatica e lessicologia ad esempio). L’obiettivo della nuova linguistica applicata sarà quello di ispirarsi al metodo scientifico, mediante la creazione di un accurato metalinguaggio descrittivo 121 122 123 124 124 e mediante un processo di Stern (1983, p. 100) riporta che “Palmer is often considered “the father of British applied linguistics”’. Howatt (1994, p. 291) concorda con questa descrizione e considera Palmer “the founder, with Daniel Jones [...], of what eventually became the British school of applied linguistics”. Sull’importanza di Harold Palmer nell’ambito della linguistica applicata cfr. Smith (2011). “The main axiom of living philology is that all study of language must be based on phonetics” (Sweet 1900, p. 4). “[…]Philologists tell us what language is, phoneticians can give us the most accurate information concerning sounds and the methods of theaching them, most of the essential facts of grammar can be expleined clearly by grammarians, and the nature of words, including their etymological, morphological, semantic, and ergonic aspects, is already known to the lexicologist” (Palmer 1917, p. 22). “If the study of language is a science, a scientific terminology must have been formed and must exist, consisting of an adequate number of terms both old and new, all accurately defined by the creators of such terms and perfectly understood by all who use them” (Palmer 1917, p. 20) . 103 sistematizzazione125. Con lo stesso spirito Palmer si avvicinerà ai problemi riguardanti l’intonazione. Nel volume del 1922, interamente dedicato al tema, procederà con estrema cura alla descrizione di un sistema intonativo della lingua inglese, integrando in esso novità a livello di metalinguaggio e di trascrizione. Rispetto ai tentativi della scuola britannica (in particolare Steele (1779) Sweet (1877a), Jones (1909a, 1909b, 1922) e Armstrong e Ward (1926)), concentrati soprattutto sulla descrizione di principi generali di funzionamento dell’intonazione e di una sua rappresentazione in termini di contorni globali 126 , Palmer guarderà ad essa come un sistema di cui è possibile descrivere forma e organizzazione. Nel suo lavoro l’autore non si fermerà alla sola elencazione di possibili occorrenze. Gli andamenti intonativi non saranno considerati, e rappresentati, come ‘forme inarticolate’, ma come unità complesse, composte da ulteriori elementi funzionali. Su questo Palmer sembra essere abbastanza esplicito: The object of this book is fourfold: (…) 2 – To suggest a scheme of classification and terminology by which these tone and tone-compounds may be divided into classes according to their degree of resemblance or difference (Palmer 1922, p. V). La teoria linguistica, che in questo caso ha un principale obiettivo didattico, si rivolge alla costruzione di un sistema intonativo organizzato secondo classi, secondo forme generali in grado di rendere conto delle manifestazioni variabili del parlato. Inoltre l’autore non si limiterà alla trattazione del livello espressivo. L’organizzazione di quest’ultimo sarà funzione del livello semantico della lingua, mediante l’esposizione di variazioni e contrasti semantici in funzione del differente impiego di toni. Una parte sostanziale del volume sarà infatti dedicata: “to formulate in a series of law or rules the 125 126 “To lay the foundations of the science of language-study it will not be necessary to make new discoveries ; it will be quite sufficient to collect factors which are perfectly well known and to coordinate them into one comprehensive system” (Palmer 1917, p. 22). Bolinger (1951) indicherà l’approccio britannico con il termine “configurazionale” in opposizione a quello di americano che invece definirà “a livelli”. 104 facts which have so far been discovered concerning the relation between tones and meaning” (Palmer 1922, p. V). Il grande merito degli studi di didattica delle lingue, soprattutto nella nostra prospettiva, è stato quello di aver posto al centro il problema della trasmissibilità dei significati della lingua come mezzo di comunicazione. È in questo senso che l’intonazione può essere considerata come linguisticamente pertinente, in quanto elemento indispensabile soprattutto per la quotidiana conversazione: No one who wishes to use the English language in the manner of English speakers can anymore ignore the phenomena of its intonation than he can ignore the phenomena of its pronunciation. It may be no more than a personal opinion of mine, but I am convinced that the two things, pronunciation and intonation, are so bound up with each that it is futile to teach or to learn one without the other (Palmer 1922, p. V). L’insegnamento della lingua in questo senso non può prescindere dall’intonazione. Parlare e insegnare una lingua non può consistere nella mera descrizione grammaticale, e nemmeno nella corretta pronuncia di singole parole. Per poter ‘vivere’ una lingua è necessario inserirsi nella quotidiana prassi comunicativa, e con essa saper cogliere il potenziale linguistico-semiotico di tutte le sue componenti, compresa l’intonazione: What is often diagnosed as a foreign “pronunciation”, or foreign “accent”, frequently turns out to be a foreign intonation. Many foreign speakers of English may be faultless in their English sounds, and even English stress, but they intone in such a manner that we at once detect that they are not English, and often we fail even to understand the meaning of what they are saying. […] Many characteristic tones are as important as or even more important than characteristic sound (Palmer 1922, p. 4). Il parlato per Palmer non consiste dunque nella semplice trasposizione della lingua scritta. Nei processi comunicativi quotidiani il parlante si servirà dell’enorme ricchezza del ‘segnale acustico’. Una stessa espressione verbale può infatti risultare ambigua nel caso in 105 cui si tratti di una forma scritta e al contrario essere facilmente interpretabile se espressa invece mediante il canale fonico acustico. Se nel primo caso l’ambiguità dell’espressione può essere risolta solo mediante l’introduzione di elementi contestuali o co-testuali, il parlato può fare uso delle diverse e compresenti modalità comunicative. Tra questi ausili vi è il tono o ‘musical pitch’128. Il primo elemento ad essere descritto è il tono, o meglio lo ‘spazio di possibilità’ dei valori tonali. Non vi è nel dispositivo notazionale un riferimento alla misurazione assoluta delle altezze, come avveniva ad esempio in alcune modalità di analisi realizzate da Johsua Steele o da Daniel Jones (cfr. cap. 2.4), ma un vero e proprio campo di valori relativi. Fig. 35 Lo spazio di trascrizione delle altezze 129 (Palmer 1922, p. 2) Lo spazio di rappresentazione del pitch è suddiviso in tre aree: High, Mid e Low. Non vi sono unità di misura e riferimenti precisi per la misurazione del pitch. Ciò che emerge dunque come pertinente è il valore relativo delle altezze tonali: una stessa ‘nota’ potrebbe, di principio, occupare luoghi diversi dello spazio rappresentativo poiché, il suo valore 128 129 Palmer H. E. (1922, p. 1). La trascrizione permette dunque di collocare ciascuna sillaba della parola (nell’esempio mostrato vi è la parola Anybody), o dell’enunciato, in corrispondenza dei tre valori. 106 sarebbe dipendente da quello delle altre note compresenti 130. Per Palmer infatti il valore linguistico dei toni non risiede nella loro misura fisica assoluta, ma nel rapporto reciproco che essi stringono nel corso di un atto linguistico: “We see, then that the meaning of a given word or sentence may depend upon the relative pitch of the note or notes upon which it is sung” (Palmer 1922, p. 2). 2 Il ruolo della sillaba nella rappresentazione dell’intonazione Altro aspetto di rilievo è l’importanza teorica che viene ad assumere la sillaba. Nello schema in fig. 35 si può notare come la suddivisione del materiale linguistico e la variazione tonale vengano annotate in corrispondenza di ciascuna sillaba. Nell’ambito britannico e non solo, a livello di trascrizione, non è un assoluto caso isolato. È del 1923 ad esempio il volume di Klinghardt & Fourmestraux in cui si utilizzano dei punti di varia grandezza per segnalare l’andamento del tono sulle sillabe. Armstrong & Ward (1926) utilizzeranno un sistema composto da linee curve e punti. 130 Questo aspetto del lavoro di Palmer sembra essere un elemento di contatto tra l’approccio ‘configurazionale’ e a ‘livelli’. 107 Fig. 36 Klinghardt e De Fourmestraux (1923) Fig. 37 Armstrong e Ward (1926) Nella prima figura sono rappresentati rispettivamente gli andamenti di enunciati formati da due e tre sillabe. I punti di maggiore spessore indicano le sillabe finali 131, mentre la linea orizzontale ha lo scopo di creare un punto di riferimento per indicare un valore medio132. Se la sillaba finale, indicata dal punto più grande, è posta in basso, l’andamento è discendente, e viceversa. Anche nel secondo esempio la sillaba è assunta come unità minima della rappresentazione. La dimensione verticale, entro cui sono collocati i simboli, indica il valore relativo delle altezze. Linee e punti posizionati sulle vocali saranno invece utilizzati per indicare rispettivamente le sillabe accentate e quelle non accentate. Per gli andamenti ascendenti e discendenti verranno infine sfruttate linee curve. Rispetto a Palmer in cui, come verrà mostrato di seguito, le sillabe assumono ruolo strutturale importante, in Armstrong e Ward la loro valorizzazione a livello grafico sembra essere dettata da scopi esclusivamente pratici. 131 132 "A thick dot represents the final syllable of a tone-group, and signifies at the same time that this syllable is to be slightly accented” (Klinghardt e De Fourmestraux 1923, p. 19). “The horizontal line found in each intonation-picture is, in the first instance, merely a guiding line enabling the reader to determine at a glance the relative positions of the dots. But it also represents an approximate middle pitch” (Klinghardt e De Fourmestraux 1923, p. 20). 108 It should be noted that though the pitch is shown by a series of disconnected marks, the whole of one intonation group is continuous line, and that the connections between them are made quite naturally (Armstrong e Ward 1926, p. 2). Altri esempi più vicini alla rappresentazione di Palmer saranno poi impiegati, sempre nell’ambito della linguistica britannica, da Crystal (1969) o Cruttenden (1986). Fig. 38 Crystal (1969 p. 224) Fig. 39 Cruttenden (1986) Anche in questi ultimi esempi è ben visibile la pertinenza grafica, e teorica, che la sillaba ricopre ai fini della rappresentazione linguistica dell’intonazione. Nella ‘Tonetic Transcription’ dei due autori presentati trovano posto le altezze tonali, mediante lo spazio verticale del supporto, la prominenza delle singole sillabe, tramite la dimensione del punto, e gli andamenti tonali, grazie all’uso di linee curve continue 133. La sillaba assumerà infatti sempre maggiore rilievo, ai fini della rappresentazione, della descrizione e dell’analisi linguistica dei fatti intonativi. Basti pensare che il riferimento implicito dell’approccio britannico e americano su cui è 133 Un medesimo modello rappresentativo è presente in O’ Connor, Arnold (1961). 109 modellato il gruppo tonale (tone group) è costitituito proprio dalla struttura della sillaba134 : Si tratta della nozione sintagmatica più antica negli studi di fonologia. Le prime riflessioni sulla sillaba possono essere fatte risalire al mondo greco classico. Perciò, non ci stupisce che la medesima ipotesi venga adottata per dare supporto alla scomposizione della curva adoperata sulla base di analoghe restrizioni paradigmatiche e sintagmatiche (De Dominicis 2010, p. 60). Fig. 40 Struttura fonologica della sillaba - De Dominicis (2010) Secondo De Dominicis la struttura fonologica della sillaba (Fig. 6), sembra riproporsi nella forma interna dell’unità intonativa. La rappresentazione della sillaba presenta infatti un elemento obbligatorio che strutturalmente assume la massima prominenza: Il nucleo sillabico è l’unico componente obbligatorio della sillaba e, quindi, gerarchicamente domina i margini (attacco e coda sillabica). Esso non è definito in modo sostanziale, ma solo per la sua funzione formale di vertice gerarchico della struttura sillabica (De Dominicis 2010, p. 61). Allo stesso modo, segnala De Dominicis, il vertice gerarchico di IP è segnalato dal Nucleo 134 Nell’ambito della fonologia dell’intonazione di stampo generativo essa assume il ruolo di unità. Nespor e Vogel parlano della sillaba come “the smallest costituent of the prosodic hierarchy” (Nespor e Vogel 2007, p. 61). Più in generale, nell’ambito della linguistica generativa, l’integrazione teorica della sillaba giunge intorno agli anni 70: “In the early and mid 1970s, the main discussion surrounding the syllable was whether or not it belonged in a theory of generative phonology. […] Once the syllable was accepted, there was a rapid increase in the amount of research dealing with various aspect of its nature and role in phonology” (Nespor e Vogel 2007, p. 61-62). Nella linguistica strutturale Trubeckoj ha inserito la nozione di sillaba all’interno dello studio fonologico della prosodia: “Le caratteristiche prosodiche non sono proprie delle vocali come tali, ma delle sillabe. Una parte dei fonemi che compongono la sillaba può essere prosodicamente non-pertinente” (Trubeckoj 1939 [...], p.207). 110 intonativo, che, come verrà illustrato successivamente, sarà il costituente linguistico su cui si avrà il picco di prominenza gerarchica. 3 L’individuazione dell’unità intonativa Con Palmer (1922) l’intonazione viene organizzata, per la prima volta, in un sistema di unità funzionali tra loro connesse secondo precise regole di combinazione. Il tone-group è definito come: "a word or series of word in connected speech containing one and only one maximum of prominence" (Palmer 1922, p. 7). Tuttavia nel corso degli anni il modo con cui i linguisti hanno basato i loro tentativi di identificazione delle unità intonative non è stato univoco. La natura continua ed estremamente variabile delle componenti prosodiche ha rappresentato per gli studiosi dell’intonazione un ostacolo notevole nella definizione e nell’individuazione di unità tonali che potessero essere utilmente impiegate a fini analitici e descrittivi. A complicare il quadro vi è anche l’irriducibilità dei fenomeni prosodici al modello della doppia articolazione. Per Martinet (1960) infatti: Si classificano nella prosodia tutti i fatti di parola che non entrano nel quadro fonematico, cioè quelli che sfuggono, in un modo o in un altro, alla seconda articolazione. Fisicamente si tratta di fatti fonici necessariamente presenti in ogni enunciato parlato […]. In tali condizioni è comprensibile che linguisticamente tali fatti non possano valere per la loro presenza o per la loro assenza, ma piuttosto per le loro modalità, variabili da una parte all’altra di un enunciato. Di conseguenza essi si prestano meno alla caratterizzazione di unità discrete, in confronto ad altri, come la nasalità o occlusione labiale, che possono figurare o non figurare in un enunciato (Martinet 1960 [1971], p. 98). È possibile infatti descrivere in maniera accurata ciascun punto dell’andamento melodico di un enunciato, rivelandone con estrema precisioni i dati acustici. Allo stesso tempo questo valore assoluto è insufficiente ai fini di una descrizione linguistica in quanto, in assenza del 111 suo contesto di occorrenza, non è possibile stabilire se tale frammento di suono abbia un tono alto o basso, intenso o debole, lungo o breve 136. La relatività del valore intonativo è per Abercrombie (1967), ad esempio, un elemento che accomuna la melodia musicale e quella della lingua: Not only are both based on pattern arising from pitch fluctuation, but in bot hit is the position of the points in the pattern relative each other that counts, not their frequency in terms of number of vibration per second. Speech melody and musical melody can both be ‘transposed’ without loss of identity (Abercrombie 1967, p. 107). Ma non è tutto. Se è vero che, come mostreremo tra poco, tale meccanismo di segmentazione è intimamente connesso alla dinamica fisiologica dell’emissione fonica, non mancano riflessioni che hanno messo al centro l’importanza dell’ascolto e dei processi interpretativi dei parlanti. La questione della segmentazione del discorso in unità tonali e della individuazione del punto focale all’interno di ciascuna unità tonale è forse l’aspetto determinante per individuare la centralità del ruolo dell’udito nella decodifica del parlato. Ciò è confermato anche dall’importanza della prosodia nell’apprendimento linguistico da parte dei bambini e nello sviluppo della loro capacità di segmentare il continuum della catena parlata (processo che avviene senza che il bambino abbia ancora alcun controllo consapevole sul meccanismo laringeo, e quando il suo controllo degli schemi prosodici della sua lingua è ancora ad uno stadio aurorale) (Albano Leoni 2001, p. 60). Cruttenden (1986) pone in evidenza il modo con cui studiosi differenti si sono avvicinati al problema, e la difficoltà nell’individuare un criterio unico e semplice. 136 “[…]Un segmento intonativo di prosodia ritagliato dal suo contesto è in sé totalmente privo di significato e di funzione, perché i valori che determinano la prosodia, e dunque anche l’intonazione, sono sempre e tutti radicalmente relativi, valutabili e interpretabili solo in rapporto a ciò che segue e a ciò che precede all’interno dell’intera unità prosodica considerata. Quindi, di un segmento vocalico in sé, del quale posso descrivere in modo ‘oggettivo’ l’altezza, la durata e l’intensità (oltre che il timbro), non posso dire se sia linguisticamente acuto o grave, lungo o breve, intenso o debole” (Albano Leoni 2001, p. 58). 112 In reading, or in speaking prepared texts, most intonation-group boundaries are clearly marked. But even with the most experienced readers and speakers, there are many cases where it remains difficult to decide whether a boundary is present or not. And with inexperienced readers and speakers (adults’ intonational competence is extremely variable) the difficulties are multiplied. When we consider spontaneous speech (particularly conversation) any clear and obvious division into intonation-group is not so apparent because of the broken nature of much spontanuous speech, including as it does hesitation, repetitions, false start, incomplete sentences and sentencese involving a grammatical caesura in their middle (Cruttenden 1986, p. 36). Tra i numerosi e differenti approcci al problema, in accordo con Couper-Kuhlen (1986), è possibile metterne a fuoco tre. Il primo pone al centro della definizione di unità intonativa il meccanismo fisiologico dell’emissione fonica. In questo senso le unità si organizzerebbero tendenzialmente entro i confini di «gruppi respiratori», facendo così affidamento quasi esclusivamente a criteri esterni della suddivisione degli enunciati. Il secondo dà, invece, maggior peso a criteri interni, o semantico/grammaticali, cercando di far coincidere le unità tonali a porzioni di enunciato aventi unità semantica e grammaticale. Il terzo e più recente ha infine cercato di determinare i confini intonativi tramite criteri fonetico/fonologici. 3.1 Divisione Fisiologica Le prime riflessioni sul ruolo del meccanismo fisiologico di emissione nella scomposizione del flusso parlato in unità prosodiche possono essere trovate in Sweet. In varie occasioni il fonetista inglese (Sweet 1876, 1877a, 1877b, 1890) ha posto l’accento sulla necessità di basare il criterio di suddivisione del continuum fonico linguistico su gruppi respiratori (breath-groups), a cui corrisponderebbe parzialmente anche la divisione logica dell’enunciato. The only division actually made in language is that into ‘breath groups’. We are unable to utter more than a certain number of sounds in succession without renewing the stock of air in the lungs. These breath-groups correspond partially to 113 the logical division into sentences: every sentences is necessarily a breath-group, but every breath-group need not be a complete sentence (Sweet 1890, p. 42). Nel suo articolo dal titolo Language and Thought Sweet inserisce la divisione degli enunciati come prima e importante questione nello studio delle lingue: The first and most obvious is the organic necessity of taking breath - we are unable to utter more than a certain number of sounds in succession withoutrene wing the stock of air in our lungs, which unavoidably necessitates a pause. Speech in its simplest form consists mainly of short questions and answers expressed in simply constructed phrases-in this case there is not merely a pause, but an absolute cessation of voice. Within these "breath-groups, or phonetic sentences, there is no pause whatever. This is importanto observe, as many people, misled by our ordinary word-division, imagine that they make a pause at the end of every word. But a very little observation will be enough to convince them that the words of a sentence run into one another exactly in the same way as the syllables of a word do (Sweet 1877b, p. 459). Sempre all'interno della tradizione britannica, sarà Jones a riferirsi al breath-group come ad un gruppo di suoni pronunciati nello spazio compreso tra due pause 137. In linea con Sweet, Jones assegnerà alla scomposizione del parlato una duplice funzione, fisiologica e semantica. Per il linguista inglese le pause hanno, infatti, il compito di consentire al parlante di riprendere fiato e contemporaneamente di rendere più chiaro il significato delle parole: Pauses are continually being made in speaking. They are made (1) for the purpose of taking breath, (2) for the purpose of making the meaning of the meaning of the words clearer (Jones 1922, p. 135). Circa sessanta anni più tardi Lieberman diede corpo, nell’ambito delle sue ricerche fisiologico-acustiche, alle intuizioni Sweetiane sul breath-group. Per Lieberman, richiamandosi alla Motor Theory, i processi interpretativi dei parlanti troverebbero sostegno nell’organizzazione articolatoria delle emissioni foniche: 137 "Group of sound which are pronounced without pause are called breath-groups"(Jones 1922 p. 135). 114 However, under certain conditions, listeners appear to 'decode' intonational signals in terms of the articulatory mechanisms that could underlie the acoustic signal (Lieberman 1967). The listeners, in other words, appear to be acting as though they make use of a 'motor theory' of speech percep-tion to interpret the acoustic signal (Lieberman, Sawashima, Harris e Gay 1970, p. 313). L’autore sostenne infatti che i parlanti producevano e percepivano l’intonazione in termini di “unmarked” e “marked” breath groups, risultanti dall’interazione tra respirazione e sistema muscolare laringale 138 . Secondo Lieberman i cambiamenti nel valore della frequenza fondamentale sarebbero intimamente connessi alla pressione subglottidale dell’aria. Proprio la riduzione della pressione dell’aria a ridosso dei confini del breathgroup provochere l’abbassamento finale del pitch negli enunciati non marcati 139. L’abbassamento, secondo Lieberman, sarebbe dunque il risultato di una caratteristica involontaria del parlante “che non dipenderebbe da regole linguistiche, ma che si trova a cooccorrere con le caratteristiche linguistiche della produzione di F0 relative alla produzione dell’accento” (Bertinetto, Magno Caldognetto 1993, p. 179). Nel caso dei breath group marcati, quelli che presentano un incremento nel valore della F0 nella loro parte finale, interverrebbero invece i muscoli laringali la cui attività avrebbe lo scopo di evitare il fenomeno dell’abbassamento del pitch140. 138 139 140 “The breath-group is a suprasegmental feature (…). The breath-group at the articulatory level involves a coordinated pattern of muscular activity that includes the subglottal, laryngeal, and the supra glottal muscles during an entire expiration” (Lieberman 1967, p. 167). The data shows that the sub glottal respiratory muscles start to force air out from the lungs while the laryngeal muscles close the glottis to its "phonation neutral position" and adjust the tension of vocal cord. The super glottal vocal tract simultaneously begins to move into position and phonation commences at a specified fundamental frequency which the speaker can repeat at will. At the end of the sentence the sub glottal respiratory muscles lower the sub glottal air pressure during the last 150-200 msec. of phonation. The tension of the laryngeal muscles for the unmarked American English breath-group appears to remain relatively steady throughout the sentence. The fundamental frequency of phonation is thus a function of the sub glottal air pressure function and it falls during the last 150-200 msec of phonation" e ancora "The falling terminal fundamental frequency contour that result from absence of an increase in the laryngeal tension at the end of unmarked breath-group apparently is a universal aspect of the unmarked breathgroup" (Lieberman 1967, p. 167 - 168). "The marked breath-group contrasts with the unmarked breath-group during the last 150-200 msec of phonation where the tension of the laryngeal muscles increases in the marked breath-group. The increased 115 Controevidenze sono state avanzate da Ohala e Hirano (1969) i quali, tramite l’elettromiografia, hanno mostrato che i muscoli laringali sono coinvolti attivamente nel controllo del pitch durante la fonazione. In questo modo gli studiosi limitano il ruolo della pressione subglottidale dell’aria, che occuperebbe una parte minore nella variazione del pitch 141 . Detto in altri termini, l’intonazione e la sua articolazione appaiono fortemente influenzate nella loro organizzazione dalla base fisiologica 142. 3.2 La divisione in Sense-group Altre ricerche hanno orientato le loro attenzioni alla relazione tra intonazione e significato ipotizzando un’unità strutturale di intonazione corrispondente a un sense-group. Per Armstrong e Ward (1926) ad esempio la lingua parlata consiste di uno o più sense-group in cui ciascuno è un gruppo intonativo: “Connected speech consist of sense-group (either one or a series), each of wich is a sense-group” (Armstrong & Ward 1926, p. 25). Il loro famoso manuale sull’intonazione inglese è infatti organizzato in modo da presentare agli studenti esempi di andamenti melodici semplici e complessi (formati da più sensegroup) sulla base della loro completezza semantica. 141 142 tension of laryngeal muscles counters the falling sub glottal air pressure and the marked breath-group thus has a terminal not-falling fundamental frequency contour” (Lieberman 1967, p. 169). “The data provided no confirmation of a recent hypothesis by Liberman that, for American English, during other than YES-NO question, the laryngeal tension remains relatively steady and that pitch variation is a function of the subglottal air pressure. On the contrary, the muscles studied participated actively in pitch control, and variations in subglottal pressure could account for but a fraction of the observed pitch changes” (Ohala e Hirano 1967, p. 1208-1209). L’importanza della componente biologica è messa in evidenza anche da Albano Leoni (2009) il quale, descrivendo il meccanismo articolatorio dell’intonazione commenta: “Questo meccanismo è perfettamente congruente con le capacità uditive e riflette dinamiche fonatorie generali di ordine probabilmente biologico, dunque naturali e universali: la sua articolazione in unità tonali è legata ai cosidetti «gruppi respiratori»; le unità tonali si concludono sempre (tranne che nei casi di marcatezza) con una declinazione naturale di tutti gli indici (intensità e frequenza tendono a zero e l’eloquio rallenta), e anche la marcatezza (cioè l’andamento terminale ascendente) non è che il rovesciamento di un andamento naturale. Le caratteristiche prosodiche, proprie di ciascuna lingua, sono dunque la componente arbitraria che si innesta su una base solidamente naturale (come del resto fanno altre manifestazioni linguistiche)” (Albano Leoni 2009, p. 45 – 46). 116 Secondo Klinghardt e Klemm (1920) l’intonazione avrebbe il compito di rendere i significati più chiari. Essi parlano di intonatorischer Sinntakt che Couper-Kuhlen (1986) traduce con l’espressione intonational sense-group, spiegando che in questo termine l’idea di unità base dell’intonazione e di sense-group viene a sovrapporsi, e che quindi l’una è dipendente dall’altra. Sebbene in maniera non del tutto esplicita anche il manuale di O’Connor e Arnold (1961) ha enfatizzato il ruolo dell’intonazione nell’organizzare gruppi di parole (word group) rilevanti a livello grammaticale. We need some neutral term to refer to these groups of words which are grammatically relevant - they are not always clauses or subject or phrases - and the term we shall use in this book is simply word groups (O' Connor e Arnold 1961, p. 3). 3.3 L’approccio fonetico - fonologico Un’alternativa agli approcci prevalentemente fisiologici o semantici è quella sviluppata da autori come Crystal, che definiscono le unità tonali a partire da criteri fonologici, cercando di integrare i criteri esterni a quelli legati all’organizzazione interna delle unità 143. The approach presented here may be described as being phonological without being phonemic; it tries to avoid the constrictions such as would be placed upon intonation analysis based on grammar or semantics. It also tries to adopt a more ‘open’ view of the subject, by beginning with the question of identification of the units relevant for intonational study (Crystal 1969, p. 200). L’unità tonale (tone-unit) sarà dunque identificabile mediante la presenza di picchi di prominenza in corrispondenza dell’elemento strutturale interno definito nucleo (nuclear 143 “Alternatively we might adopt a semantic approach to definition, and introduce some such amorphous notion as the ‘sense group’; or we might try and identify it with reference to some extra-linguistic phenomenon, such as the ‘breath-group’; or we might adopt a wholly phonological definition” (Crystal 1969, p. 205). 117 tone). Quest’ultimo secondo Crystal è quell’elemento la cui presenza è necessaria e che consente all’ascoltatore di percepire il senso di completezza di un enunciato: “If it is omitted, the auditory effect is one of ‘being cut short’” (Crystal 1969, p. 207). Altri elementi fonetici sono incaricati di indicare con relativa precisione i confini dell’unità tonale. È possibile ad esempio osservare dei mutamenti nell’andamento del pitch, dipendenti dal movimento del tono nucleare. Un ulteriore criterio consiste nella presenza di indicatori in prossimità del confine: è il caso delle pause144 o di altre forme di modificazioni fonetiche, come ad esempio l’allungamento e la declinazione finale o resetting intonativo iniziale. Secondo Crystal questo criterio fonetico-fonologico è sufficiente per indicare senza ambiguità la posizione dei confini delle unità tonali all’interno del parlato connesso. 4 La struttura Interna dell’unità intonativa Come si è anticipato in precedenza, al riconoscimento del tone-group, Harold Palmer fece corrispondere una scomposizione interna di tale unità, sulla base di elementi organizzati in maniera sistematica che prenderanno il nome di nucleo (Nucleus), testa (Head) e coda (Tail)145. Il nucleo è il luogo intorno al quale viene organizzata la forma degli altri componenti. Esso corrisponde alla sillaba accentanta della parola più prominente dell’unità intonativa 146 . 144 145 146 Crystal (1969) rileva tuttavia che non sempre le pause sono in grado di far emergere chiaramente le unità. Questa stessa suddivisione sarà adottata, con lievi differenze sia da autori appartenenti alla tradizione americana che quella britannica. Kenneth L. Pike ad esempio dichiara esplicitamente alcune affinità con lo studioso inglese: “My own analysis of intonation was largely complete before this particular work of Palmer’s came to hand, but I consider a similar series of observations, made independently, to be one of the most important factors contributing to my result. Roughly, his term nucleus correspond to the primary contour described in this present study, and head correspond to pre-contour” (Pike 1945, p. 6). Crystal (1969, p. 208) organizza l’unità tonale secondo una struttura interna (Internal structure of the tone-unit) composta da un elemento obbligatorio (Nucleus) e tre opzionali (Head, Prehead e Tail); Halliday (1963) utilizzerà una formula simile mediante l’uso dei termini tonic, pretonic etc. “Each Tone-Group contains a Nucleus, which is the stressed syllable of the most prominent word in the Tone-Group” (Palmer 1922, p. 7). 118 Come sottolinea l’autore stesso, il nucleo corrisponde a ciò che usualmente viene definito accento di frase147. A loro volta i termini tail e head saranno costituiti rispettivamente dalla sillaba o dalle sillabe che seguono e che precedono il nucleo nello stesso tone-group. Schematizzando avremmo dunque: Fig. 41 Struttura del Tone Group secondo la descrizione di Palmer (1922) La prima parte del lavoro di Palmer consisterà nel tentativo di descrizione della forma del sistema intonazionale inglese. In tale sistema il nucleo avrà il ruolo principale di determinare le varie tipologie di Nucleus Tones, ossia gli andamenti di tono caratteristici dei diversi e specifici Tone Groups148, che a loro volta esprimeranno determinate funzioni semantiche. Palmer illustra quattro distinte forme di Tone Groups a seconda dell’andamento del tono nucleare: Tone group 1 – presenta nell’immediata vicinanza del nucleo un tono con andamento discendente. Tone group 2 – presenta nell’immediata vicinanza del nucleo un tono con 147 148 “The nucleus correspond to what is usually called sentence stress” (Palmer 1922, p. 7). Come sottolinea Sorianello, la nozione di Nucleo sarà centrale in tutte le prospettive teoriche interessate all’intonazione: “In tutti i modelli intonativi, la nozione di Nucleo rappresenta l’asse portante intorno al quale si dispongono le altre categorie tonali. Nonostante le difficoltà relative alla sua identificazione formale, su un punto gli esperti sembrano concordare: il Nucleo è l’elemento della stringa tonale che convoglia il grado più elevato di prominenza melodica, e dunque il significato intonativo dell’intero contorno. Il suo statuto è speciale, ovvero obbligatorio e unico. Questo corollario teorico si rinviene tanto negli approcci intonativi di tipo olistico, ad esempio nella Scuola inglese, quanto negli approcci lineari e composizionali” (Sorianello 2006, p. 89). 119 andamento ascendente. Tone group 3 – presenta nell’immediata vicinanza del nucleo un tono con andamento ascendente discendente. Tone group 4 - presenta nell’immediata vicinanza del nucleo un tono con andamento lievemente ascendente. Anche in questo caso il valore degli andamenti non è assoluto ma relativo e l’ampiezza dello spettro tonale effettivamente coinvolto potrebbe cambiare in contesti di eloquio differenti149. Potremmo dunque osservare che lo studio di Palmer sembra andare nella direzione di una descrizione che si colloca nello iato tra fonetica e fonologia, operando un’astrazione ‘analogica’ degli andamenti tonali e contestualizzandoli in un sistema di regole di combinazione. Il contorno melodico infatti non è rappresentato punto a punto nelle sue variazioni, esso viene suddiviso funzionalmente in classi astratte determinate e determinabili mediante l’andamento tonale delle sillabe prominenti. Tale astrazione conduce a individuare come pertinenti, e graficamente trascrivibili, i valori relativi del contorno occorrenti su ciascuna sillaba dell’enunciato e a definire formalmente la funzione dell’enunciato sulla base del tono nucleare. Come si vedrà in seguito sarà proprio l’andamento dell’altezza sulla sillaba più prominente dell’enunciato a determinare la tipologia del tone group, e ad esso corrisponderanno delle particolari forme della testa e della coda. 149 “The ‘Falling’ and ‘Rising’ are relative, not absolute; the Range of a falling or rising tone varies according to the degree of animation speech” (Palmer 1922, p. 8). 120 Fig. 42 L'organizzazione del Tone Group sulla base del Nucleo La Coda (Tail) viene definita dall'autore come la sillaba o le sillabe che seguono il nucleo nello stesso Tone Group. A seconda della tipologia di Tone Group Palmer individua codes differenti che, sostanzialmente, non faranno altro che seguire il movimento tonale del nucleo. Nel Falling Nucleus (Tone Group 1) il pitch si mantiene sul livello basso. Tale andamento sembra essere una regola costante, e proprio per questo motivo viene escluso dalla rappresentazione tonetica: Fig. 43 Rappresentazione tonetica del Tone Group 1 (discendente) Nei casi in cui si è in presenza di un nucleo avente andamento ascendente (Tone Group 2 e 4), la coda partecipa nella salita del valore di tono. In questo senso il contorno ascendente si distribuisce progressivamente sul nucleo e sulla coda come mostrano gli esempi: 121 Fig. 44 Rappresentazione tonetica del Tone Group 2 e 4 Le sillaba o il gruppo di sillabe appartenenti alla coda nei gruppi tonali con nuclei ascendenti e discendenti (Tone Group 3), queste ultime seguono l’andamento ascendente e discendente del nucleo: la curva si distribuisce lungo il nucleo e la coda. Fig. 45 Rappresentazione tonetica del Tone Group 3 La sezione dedicata alla testa è quella a cui Palmer dedica il maggiore spazio. Se ne distingono diversi tipi. Una prima classificazione viene fatta sulla base del numero di sillabe da cui è costituita, rispettivamente 1, 2 e 3 o più; una seconda classificazione viene fatta sulla base del rapporto tra l’altezza delle sillabe prenucleari e del nucleo. Nel caso in cui i toni della testa siano più alti del punto iniziale del tono nucleare avremo una testa definita superior 150; se l’altezza della testa non è mai più alta della punto iniziale del nucleo la testa sarà definita inferior 151; quanto invece i toni tendono a salire da una posizione media fino al punto più alto dell’intero tone group avremo una testa definita scandent152; etherogeneus verrà infine utilizzato per riferirsi a una combinazione delle teste appena 150 151 152 “A Superior head is one the tones of which are higher in pitch the initial point of nucleus-tone” (Palmer 1922. p. 18). “An Inferior head is one the tones of which are never higher in pitch than the initial point on the NucleusTone” (Palmer 1922, p. 17). “A Scandent head is one the tones of which rise or climb from the mid-level to the highest pitch of the whole tone-group. This highest point (which may be termed the “vertex”) is therefore higher in pitch than the initial point of any nucleus” (Palmer 1922, p. 18). 122 introdotte. Di seguito lo schema di un gruppo tonale: Fig. 46 Struttura completa del Tone Group elaborata sulla base della descrizione di Palmer Come abbiamo già accennato nelle pagine precedenti, l’articolazione interna del Tone Group realizzata da Palmer nel suo volume, non si limita alla sola descrizione della forma fonica dell’intonazione. Quest’ultima viene elaborata in funzione dell’organizzazione semantica degli enunciati. Il linguista individua differenze semantiche in corrispondenza di organizzazioni espressive diverse e viceversa153: We have so far considered the English Tone-Groups from the point of view of their form; we have divided them into four classes according to the nature of the nucleus. […] We have however said little concerning the significative (or 153 In alcuni casi, in particolare quello del tone group 4, l’autore ammette di aver considerato come pertinente alla sua definizione la specificità dei significati di cui quest’ultimo era incaricato: “The significative value of this tone-group is peculiar, and appears to bear no analogy whatever to the High-Rising Tone-Group, nor are there apparently any intermediate or transitional forms between the two. This, I think, justifies its right to be considered as an independent tone-group, and not a variety of [high-Rising Tone Group]” (Palmer 1922, p. 84). 123 “semantic”) value or values of the tone-groups; we now have to take each of these in turn and endeavour to specify the meaning or meanings implied by them; we shall see how a given word or group of words may change its meaning according to the way in which it is intoned. We shall conclude that a coherent and consistent system of semantic laws underlies all these tonetic phenomena (Palmer 1922, p. 72). Seguendo gli esempi e le descrizioni dell’autore è possibile ricostruire l’organizzazione del suo sistema intonativo relativo alla lingua inglese. In questo si può notare come per l’autore nucleo e testa abbiano il ruolo maggiore nella comunicazione dei significati, mentre la coda sembra essere ininfluente. In molti degli esempi proposti, l’autore confessa di aver avuto difficoltà nella definizione di formule generali in grado di rendere conto perfettamente di tutte le possibili sfumature di significato per ciascun Tone Group. Scorrendo le varie esemplificazioni si può notare infine come la maggior parte delle varietà semantiche ruotino intorno alle due tipologie di Tone Group corrispondenti all’andamento discendente e ascendente (rispettivamente 1 e 2): gli stessi che nel lavoro di Armstrong e Ward occuperanno l’intero spazio di attenzione, e che verranno definiti con la formula Unemphatic sentences e Emphatic sentences 154 . A questi ultimi sono generalmente associati gli enunciati che hanno un carattere di conclusione. Palmer utilizza il termine finality pur ammettendo le numerose eccezioni e varianti. Al Tone Group 2 (nucleo con andamento ascendente) sono invece legati enunciati con carattere prevalentemente dubitativo e incerto. Nei due restanti (tone group 3 e 4) Palmer individua un carattere rispettivamente concessivo e rassicurante. Di seguito lo schema riassuntivo: 154 “English intonation can be reduced to two tunes, with variations of these due to special circumstances. The exeples given are divided into two section: A. Unemphatic sentences in wich the two tunes are used in their simplest form; B. Emphatic sentences where the intonation expresses a special meaning in the speaker’s mind” (Armstrong e Ward 1926, p. 4). 124 Tone Group I TIPOLOGIA TESTA: Inferior 1 – Categoric Statement* 2 – Special Question* 3 – Command* 4 – General Question* 5 – Isolated Words – When quoted or contrasted * la prominenza è confinata quasi interamente nella parola del nucleo Superior 1 – Statements con la prominenza distributa sulla testa 2 – Special Question – Forma normale 3 – Commands – Forma normale 4 – General Questions – che implicano la “La risposta è nel contrario” Scandent 1 – Statements – Animata con prominenza distributa sulla testa 2 – Special Question – Animata, forma normale 3 – Commands – Animata, forma normale 4 – General Question – Animata, che implicano la “La risposta è nel contrario” 5 - Esclamazione Tone Group II TIPOLOGIA TESTA: Inferior - 125 1 - Statements quando implica “Then why...?” 2 - Statements che implicano dubbio esitazione etc. 3 - Special Question quando ripetuta 4 - General Question con prominenza confinata sulla parola-nucleo 5 - Words or word groups modifying nucleus-word of adjacent Tone Group Superior 1 - Statement* 2 - Commands* 3 - Special Question - echoed 4 - General Questions - forma normale 5 - Echoed Statements * Che hanno carattere di protesta Scandent 1 - Special Question - echoed (in maniera animata) 2 - General Questions - animata 3 - Echoed Statements - animata Tone Group III 1 - Statements* 2 - Commands* * implicanti concessione. Usati principalmente per contrasto. Tone Group IV TIPOLOGIA TESTA: 126 Scandent 1 - Parting Greetings. 2 - Statements aventi carattere rassicurante Con i lavori di Harold Palmer l’immagine scientifica dell’intonazione inizia a mostrare interessanti cambiamenti. Al contorno continuo e globale che aveva caratterizzato il metodo di trascrizione di Daniel Jones, si sostituisce il tentativo di strutturare l’intonazione in diverse unità organizzate funzionalmente. Ciò consente all’autore di mettere in forma l’ipotesi di un sistema dell’intonazione che investe sia il piano dell’espressione che quello del contenuto. Un aspetto questo che può essere considerato come elemento di novità rispetto ai lavori di Jones, in cui l’elemento della sistematizzazione sembra mancare. Va rilevato inoltre come la centralità del senso sia una delle caratteristiche peculiari dell’approccio britannico, fondamentalmente legato alla didattica delle lingue. Se è vero che le caratteristiche prosodiche sono difficilmente collocabili all’interno delle teorie linguistiche per il loro carattere instabile e variabile, è altrettanto vero che le pratiche di insegnamento hanno ampiamente dimostrato il ruolo fondamentale della prosodia e dell’intonazione negli scambi comunicativi ordinari. All’atto pratico queste componenti si dimostrano essenziali al corretto funzionamento della lingua. Per capire e farsi capire quindi non basta pronunciare correttamente le singole parole o porzioni di parole. Studi più recenti nel campo della didattica hanno confermato l’inestricabile legame tra rappresentazione, comprensione delle funzioni dell’intonazione e apprendimento. Levis e Pickering (2004) spiegano come nell’ambito dell’insegnamento della lingua inglese sia risultato cruciale l’impiego di tecnologie per la visualizzazione degli andamenti intonativi. Cruciale inoltre sembra essere la capacità degli insegnanti di mostrare le corrispondenze tra andamenti melodici e funzioni semantiche. La rappresentazione e la maggiore consapevolezza dell’organizzazione semantica dell’intonazione, ossia i caratteri 127 dell’approccio britannico, sarebbero quindi componenti essenziali per un rapido apprendimento della lingua stessa. 128 Cap. 4: 1 L’intonazione tra fonetica e fonologia Il modello a livelli dello strutturalismo americano Nel corso degli anni 40-50 del ‘900, soprattutto nel contesto linguistico americano, possono essere rintracciati i primi interessanti tentativi di applicare in maniera sistematica all’intonazione i risultati raggiunti dalla nascente fonologia. Solo un decennio prima infatti, tra il ‘29 e il ’39, si era assistito alla pubblicazione dei Travaux du cercle linguistique de Prague che avevano testimoniato il fermento per la nuova scienza della lingua e culminato nei Grundzüge der Phonologie di Trubeckoj. Lo strutturalismo americano dunque, con Leonard Bloomfield, Kenneth L. Pike, Zellig Harris, Wells R. S., George Trager, pose le basi per i successivi sviluppi nello studio dell’intonazione. La scomposizione del contorno in livelli di pitch assolutamente relativi, ma anche le riflessioni teoriche che ne scaturirono, aprì numerose questioni che trovano eco anche negli approcci più moderni. Tra queste, la plausibilità di trasferire punto a punto il concetto di fonema alla dimensione tonale, e la conseguente plausibilità di un’analisi fonologica dell’intonazione. Su questo terreno di indagine si collocò una parte importante del lavoro di Bolinger che, in numerosi interventi sul tema, mostrò i limiti e le problematiche dell’approccio a livelli. L’analisi linguistica dell’intonazione e la sua corrispettiva rappresentazione grafica, trova nello strutturalismo americano un interessante terreno di sviluppo. Studiosi come Pike, Bloomfield, Harris hanno affrontato, sebbene con grado di approfondimento differente, il fenomeno dell’intonazione, cercando di trasferire su di esso alcuni dei principi che hanno portato allo sviluppo dell’allora giovane fonologia. Come vedremo, il terreno di discussione sarà incentrato soprattutto sul tentativo teorico e pratico di trattare fonologicamente il tono 129 nelle lingue intonazionali. Leonard Bloomfield, ad esempio, nel suo famoso ‘Language’ (1933) colloca i cambiamenti di pitch, e il loro ruolo nel complesso sistema linguistico, nel capitolo dedicato alle modificazioni, subito dopo la descrizione della nozione di fonema e delle sue tipologie (Bloomfield 1933 [1996], pp. 125 – 145). Tali elementi saranno definiti da Bloomfield fonemi secondari: Il tono rappresenta il tratto acustico in cui le variazioni gestuali, non distintive ma socialmente efficaci sono più vicine alle distinzioni linguistiche vere e proprie (Bloomfield 1933 [1996], p. 131). Tra gli elementi che fanno parte di tali modificazioni il linguista americano inserisce la lunghezza, il volume e il tono musicale. I modificatori, in sostanza, interverrebbero sulla base segmentale di cui farebbero parte i fonemi. Tuttavia lo stesso Bloomfield nota come: Questa distinzione tra suoni linguistici di base e modificazioni è conveniente dal punto di vista espositivo, ma non è sempre riconosciuta nel sistema fonetico delle lingue; molte lingue considerano alcuni di questi ultimi tratti sullo stesso piano dei fonemi del primo tipo (Bloomfield 1933 [1996], p. 125). Prendendo spunto dal tono finale Bloomfield distinguerà ad esempio diverse "differenze fonemiche". Affermazione [.], domanda (a sua volta suddivisa in domanda polare [?] e domanda di informazione [¿]), a questi poi aggiunge il fonema esclamativo [!] che può essere combinato con i precedenti; il tono causale o tono di sospensione [,]. Rulon S. Wells (1945), nell'applicare al pitch inglese il metodo già adottato per i fonemi segmentali, definisce come soprasegmentali i fonemi che non sono né vocali né consonanti, ed evidenzia i diversi livelli di utilizzo di questo termine (Wells 1945, pp. 28 -31). 130 Un contributo influente verso la progressiva apertura della fonologia al campo dell'intonazione è sicuramente quello offerto da Kenneth Lee Pike. Se con Bloomfield, come ricorda Crystal (1969, p. 45), abbiamo avuto il primo tentativo di trattare fonemicamente la categoria del tono, è con Pike che si ha indubbiamente un modello più esplicito e articolato di trattamento dell'intonazione. Lo studioso è infatti considerato il primo strutturalista americano ad elaborare una metodologia per lo studio dell'intonazione basata su livelli155. Per il linguista americano nella descrizione dell'intonazione non è sufficiente affermare che un contorno melodico è ascendente, discendente o ascendente discendente ma bisogna tener conto di altre relazioni interne come l’ampiezza degli intervalli tra i punti iniziali o finali del contorno: Even the simplest rise has a complex series of relationships to other contours, and complex internal structure. The size of the interval between beginning and ending points, the height of the beginning point relative to the general pitch level of the sentence, paragraph, conversation, or speaker's norm, the relation to timing, phrasing, stress, and pausing, -- these and other characteristics need to be described for the complete understanding of any contour (Pike 1945, p. 25). Allo stesso modo di Harold Palmer, ma in maniera del tutto indipendente 156, Pike considera l'andamento melodico di un enunciato suscettibile di una scomposizione in più parti funzionali157. Gli elementi discreti riconosciuti sono essenzialmente il contorno primario, che ha inizio da una sillaba tonica, e il precontorno, costituito dalle sillabe atone precedenti 155 156 157 Non mancano tuttavia esempi di tentativi di trascrizione precedenti all’opera di Pike che abbiano fatto in qualche modo uso di livelli tonali astratti. È il caso di Walter Ripman 1922 che nel suo volume di introduzione alla fonetica, si servì di simboli numerici per indicare le variazioni dell’intonazione. Anche Harold Palmer nel 1922 inserì nel suo sistema complesso di descrizione una classificazione che serviva di 3 livelli di altezza relativa (high note, mid note, low note). Pike (1945, p. 6) Palmer scomporrà il tone group in nucleo, testa e coda (Cfr. Cap. 3). 131 il contorno primario. Pike articola infatti la categoria del tono secondo quattro livelli di altezza relativa. Tali livelli, che lo stesso linguista definisce pitch phoneme, sarebbero infatti pertinenti alla differenziazione delle varie funzioni intonative nella lingua inglese. The pitches of intonation are relative. The absolute pitch of a syllable -- the number of vibrations per second -- has no significance as such. The significance of pitches is determined by their height relative to one another (Pike 1945, p. 25). Secondo l’autore, la scelta di istituire quattro livelli non è arbitraria. Un numero inferiore di livelli non sarebbe stato sufficiente alla distinzione di molti contorni melodici, mentre un numero maggiore avrebbe potuto portare alla costruzione di un grande numero di combinazioni di pitch inutilizzati. The four levels are enough to provide for the writing and distinguishing of all the contours which have differences of meaning so far discovered, provided that additional symbols are used for stress, quantity, pause, general height of the voice, general quality of the voice, and so on (Pike 1945, p. 26). Tuttavia, a differenza del livello segmentale in cui la nozione di fonema è collegata ad unità asignificanti, in grado di permettere, mediante una sostituzione, l’individuazione dello scarto di significato tra due elementi (parole) 158, al pitch phoneme o fonema intonativo Pike non riconosce questa caratteristica: The pitch levels appear to be nearly or completeely meaningless by themselves. It 158 Il riferimento è al metodo delle coppie minime utilizzato in fonologia per l’identificazione dei fonemi: “Quando due suoni ricorrono nelle medesime posizioni e non possono essere scambiati fra loro senza con ciò mutare il significato delle parole o renderle irriconoscibili, allora questi due suoni sono realizzazioni fonetiche di due diversi fonemi” (Trubeckoj 1939: 59). 132 is the intonation contour as a whole which carries the meaning while the pitch levels contribute end points, beginning points, or direction-change points to the contours--and as such are basic building blocks which contribute to the contours and hence contribute to the meaning (Pike 1945, p. 26). Per Pike dunque non è sufficiente sostituire un singolo livello con un altro per ottenere un cambiamento ‘significativo’, al contrario è il complesso intervento delle componenti del contorno intonativo a contribuire in maniera determinante alla dimensione del significato. Dal punto di vista notazionale i livelli entrano a far parte della rappresentazione sotto forma di numeri: da 1 a 4 in corrispondenza di valori decrescenti (1 - extra-high; 2 - high; 3 - mid; 4 - low). Diversamente dalle rappresentazioni 'configurazionali' in cui il contorno intonativo, sia pure stilizzato, tendeva ad essere posto in evidenza nella sua interezza all'interno delle rappresentazioni, con l'introduzione dei livelli, l'intonazione subisce sia a livello teorico che notazionale una progressiva segmentazione. Sebbene, come abbiamo ricordato, Pike consideri l'intervento complessivo delle componenti intonative decisivo per l'identificazione dei significati, egli, a proposito del tono, non riconosce come determinanti tutti i movimenti, ma solo quei punti, chiamati CONTOUR POINTS, che sono cruciali per la loro identificazione: In determining the pertinent level or level contour, one does not classify the pitch of every syllable or part of a syllable, but only those points in the contour crucial to the establishment of its characteristic rises and falls; these may be called CONTOUR POINT (Pike 1945, p. 26). In questa prospettiva, sempre più vicina all'approccio fonologico all'intonazione, si potranno intendere i contour points come luoghi astratti in cui determinare l'altezza relativa, pertinente all'identificazione di una generale tipologia di enunciato. La 'forma' intonativa coinciderà dunque con la successione di livelli di altezza relativi, rappresentabili 133 semplicemente mediante la successione di numeri. Una delle immediate conseguenze è la sempre più pressante autonomia del livello intonativo da quello segmentale. Una caratteristica riconosciuta anche da linguista Rulon S. Wells (1945, p. 29)159. Per essere intesa fonologicamente una certa forma intonativa dovrà rimanere costante al variare del livello segmentale (ad esempio enunciato formato da un maggior numero di sillabe), e viceversa, sarà possibile applicare differenti forme generali a uno stesso materiale segmentale160. In questa direzione vanno infatti gli esempi proposti dall'autore: Fig. 47 Esempio tratto da Pike (1945, p. 26) Al di là del materiale segmentale e dalla sua lunghezza, ciò che conta sono, secondo Pike, la successione dei contour point. In the first five samples each syllable had at least one contour point, so that the relative pitch of each syllable was important to establishing of contours and their meanings. In the last two samples, there were more syllables than contour points. These extra syllables can be pronounced with intermediate pitches in a general descending scale, or with considerable variation in the amount of drop from syllable to syllable. There may be many more than four actual levels, but it is the contour-point levels which are pertinent to the system (Pike 1945, pp. 26-27). 159 160 Tra le caratteristiche dell’intonazione Wells (1947) segnala come fondamentale il fatto che i contorni si comportino come un sistema separato. Ad esso si associa, come rilevato già nel pensiero di Pike l’idea di una scomposizione dell’intonazione in punti pertinenti: “For otherwise there would be no reason to speak of contours at all; there would only the individual pitch phonemes by themselves, each of which generally coincides with less then a phrase” (Wells 1947, p. 255). “L’intonazione consiste nella ricorrenza di determinate successioni di altezze tonali diverse, detti contorni (o profili) intonativi, ognuno dei quali viene usato con un significato costante entro un costituente di lunghezza variabile” (Nespor 1993, p. 265). 134 In questo modo la rappresentazione del contorno può mettere in rilievo i tratti comuni del livello intonativo e operare una ripartizione di livelli. I profili intonativi in questa prospettiva tendono ad acquistare autonomia rispetto al materiale segmentale, operando di fatto un passo molto importante verso il processo di fonologizzazione dell'intonazione. Riassumendo, per la trascrizione dell'intonazione inglese Pike si servirà di un sistema di notazione particolarmente semplice che gli permetterà di porre sotto osservazione contemporaneamente: il valore dei livelli relativi di tono, i punti rilevanti del contorno e i confini delle unità ritmiche161. I livelli sono mostrati mediante l'uso dei numeri, da uno a quattro rispettivamente per il livello più alto e il livello più basso di pitch. Il punto iniziale del primary contour è generalmente indicato dal simbolo °. Il contorno primario può essere ulteriormente scomposto in tre punti (Pike 1945, pp. 26-29): beginning point (punto iniziale che occorre sempre sulla sillaba accentata), ending point (punto finale, quando il contorno copre più di una sillaba) e direction-change point (punto in cui l’andamento intonativo cambia direzione): "The advantage of this system lies in its unambiguous indication of the contrastive levels, the contour point, and the like, with resultant presentation of the structural organization of the material. Further, the printing difficulty is moderate" (Pike 1945, p. 42). Fig. 48 Esempio tratto da Pike (1945, p. 42) La frase dell'esempio si compone di due unità ritmiche: If he can e he'll cooperate. Inoltre if 161 Per un’analisi approfondita cfr. Wells (1947) 135 e he'll essendo in posizione precedente al simbolo ° devono esser letti come i precountours mentre su -op- e la prima parte di can rappresentano i punti iniziali del prymary contour mentre la parte centrale di can presenta un punto in cui il contorno modifica la sua direzione (direction-change contour). Infine tra can e he’ll è segnalato un confine intonativo. L'aspetto interessante del modello di Pike è che, oltre ad essere il primo tentativo di descrivere un complesso sistema fonologico dell'intonazione, rappresenta il risultato di una progressiva astrazione notazionale. Lo stesso autore racconta come nel 1942, e quindi a soli 3 anni dalla pubblicazione del suo volume sull'intonazione, l'English Language Institute, presso l'Università del Michigan dove Pike lavorò per circa 30 anni, utilizzava una forma di trascrizione che si avvicinava molto a quella già incontrata precedentemente nei lavori dei fonetisti inglesi. Un approccio notazionale più vicino quindi al modello 'configurazionale', che solitamente è storicamente opposto a quello 'a livelli'. In un primo momento vennero utilizzati una serie di simboli grafici, quattro come i livelli di pitch individuati dal linguista americano, che indicavano sommariamente l'andamento del tono. Un esempio è il seguente: Fig. 49 Primi esempi di trascrizione (Pike 1945, p. 42) Benché tale metodo fosse ‘tecnicamente’ corretto, Pike ricorda che nella pratica didattica esso risultava scomodo da leggere, dato che i parlanti inglesi erano abituati all’uso della punteggiatura. Quest’ultima infatti, oltre a segnalare sommariamente l’andamento intonativo, era posizionata al termine delle frasi e non all’inizio come in questo caso. Ma non è tutto. Pike racconta inoltre come i membri dell'istituto si cimentarono nell’uso di una trascrizione che sfruttava linee continue in grado di mostrare visivamente l'andamento 136 dell'intonazione lungo i quattro livelli di pitch162. Di seguito un esempio: Fig. 50 Esempio di trascrizione tratta da Pike (1945, p. 42) Il sistema qui riproposto ebbe un rapido successo grazie alla facilità con cui gli studenti riuscivano ad utilizzarlo e venne così adottato nel 1943. Non mancarono tuttavia i problemi: se da un lato la linea continua assicurava una più semplice comprensione dell’andamento melodico generale, dall’altro rendeva difficoltosa la scomposizione funzionale del contorno. In questo modo l’interpretazione del lettore era orientata verso determinati valori relativi di pitch per ciascuna sillaba e non esclusivamente su quelle pertinenti al “contrasto fonologico”: Since it is the contour point which actually are the only ones in which the relative pitches are within the four-level phonemically-contrastive system, while the intermediate syllables may have considerable fluctuation or intermediate pitch, an implication of contrastive pitch on each syllable brings a mild distortion (Pike 1945, p. 43). Queste distorsioni furono ancora più evidenti con studenti di lingua straniera. Così, sempre nel 1943, testando i materiali, fu scoperto che vi erano ulteriori problemi e per questo 162 “[...] A line was drawn continuously over an entire sentence; for pitch one, the line passed well above the letters; for pitch two it came at the top of short letters; for pitch three it came immediately below the line; and for pitch four, further below” (Pike 1945, p. 42). 137 motivo furono adottati altri accorgimenti grafici. Alla linea continua fu sostituito un sistema grafico che utilizzava quest’ultima solo in riferimento ai contour points, e una linea tratteggiata per il resto del contorno. Qui di seguito le due trascrizioni: Fig. 51 Esempi di trascrizione tratte da Pike (1945, pp. 110-111) Un’ulteriore modifica venne infine introdotta per far sì che la linea continua potesse indicare esclusivamente il punto iniziale del primary contour: Fig. 52 Esempio di trascrizione (1945, p. 111) In questo modo, si riuscì a semplificare ulteriormente la notazione, rendendo obsoleta l’indicazione dell’accento di frase [‘] e facendo coincidere nell’unico mezzo grafico (linea) accento, intonazione e ritmo. Tuttavia, come nel precedente caso, i problemi furono soprattutto relativi alla segnalazione del pitch per ciascuna sillaba. Le linee, continue o tratteggiate, fornivano, nel complesso, informazioni ‘non-pertinenti’, spingendo i lettori ad interpretare in maniera vincolante le indicazioni degli andamenti tonali su ciascuna sillaba e non solo su quelle ritenute pertinenti. Da qui dunque la progressiva scelta dei livelli per l’annotazione delle variazioni 138 ‘significative’. Sulla linea del lavoro di Pike e di Wells si collocherà anche l'influente contributo di Trager e Smith (1951) 163. Analogamente a come fatto dai loro colleghi, essi introdurranno nella trascrizione fonemica 4 classi corrispondenti ai 4 livelli astratti di pitch: da [1] per il più basso sino a [4] per il più alto, insieme ad altri elementi simbolici per l’indicazione delle giunture164 e per le variazioni fonetiche interne a ciascun livello. 1.1 Level vs Configuration Una posizione critica nei confronti dell'approccio definito "a livelli" è quella di Dwight Bolinger. Anche per il linguista americano il problema circa la plausibilità di un'analisi fonemica dell'intonazione è centrale. Tra i temi principali nella sterminata ricerca di Bolinger vi è infatti l’approfondimento delle basi teoriche dell’intonazione. Il linguista americano in più occasioni si è mostrato critico nei confronti degli approcci che, ignorando il tratto di gradualità, sono orientati ad applicare sul dato categorie puramente discrete. Altri nodi centrali del lavoro di Bolinger sono quelli relativi alle teorie del fonema intonativo presenti nelle pubblicazioni dello strutturalismo americano (Bolinger 1947, 1949, 1951, 1961). Is English intonation susceptible of phonemic analysis? If not now, will it be so later? What kinship there between tonal and phonemic event, and is there such a 163 164 "Extensive testing of spoken English material has convinced us of the correctness of the independent conclusions of Pike and Wells that there are four pitch phonemes in English. Our presentation of the supporting data will be in terms of this conclusion" (Trager and Smith 1951, p. 41). Oltre alla suddivisione per livelli i due linguisti introdurranno ulteriori elementi di descrizione. All’interno di ciascun livello furono segnalate variazioni di altezza mediante i seguenti simboli [ˆ°ˇ ]̄ per il valore che va rispettivamente dal basso verso l’alto. Tali giunture, indicanti i movimenti intermedi tra due pitch o tra un pitch e il suo andamento finale, avranno dunque il seguente valore: [ ̈] per segnalare un andamento finale costante rispetto al tono precedente; [+] per segnalare un andamento ascendente rispetto al tono precedente e [ ̄] per segnalare un andamento discendente rispetto al tono precedente. Questi tipi generali di giunture saranno declinate all’interno di ciascun livello mediante i seguenti simboli: barra singola (/) doppia (//) o doppia croce (#). 139 thing as a tonal segment? How successful have been the attempts thus far to subject English intonation to phonemic analysis? (Bolinger 1949, p. 248). Bolinger in queste poche righe riassume i punti controversi della questione, e quindi la possibilità di trasferire in maniera analogica le tecniche e le conoscenze che hanno caratterizzato la fonologia segmentale ad un oggetto d'analisi del tutto differente, per caratteristiche e funzioni, come il tono. Il luogo di discussione su cui si sviluppa la riflessione del linguista americano è quello dell'unità teorica e analitica del fonema. È possibile, in pratica, applicare il concetto di fonema utilizzato nell'analisi fonologica segmentale alla categoria del tono, in una prospettiva orientata alla fonologizzazione dell'intonazione? Come abbiamo appena anticipato, e come incontrato anche nelle pagine precedenti (Cfr. Cap. 1), non vi è dubbio che alla base della giovane fonologia vi fosse il concetto di unità distintiva rappresentata dalla nozione di fonema. Ed è questo l'elemento su cui Bolinger individua il potenziale terreno di confronto teorico. Un primo e importante conflitto viene riscontrato nell'opposizione tra discreto/continuo che caratterizzerebbe i due domini. Il fonema segmentale è infatti 'semantically discontinuous'. Come abbiamo discusso nei precedenti capitoli uno dei tratti fondanti di tale categoria linguistica è la sua proprietà differenziante: "I suoni dotati di un valore distintivo, i suoni capaci di differenziare le parole, hanno ricevuto un nome speciale nella scienza del linguaggio, vengono detti fonemi" (Jakobson 1976 [1978], p. 48). Secondo Bolinger, se non con rare eccezioni, i movimenti del tono tendono a prendersi carico di variazioni semantiche continue: If a note of warning consist in an upward movement of pitch, the intensity of the warning varies proportionately as the range increases or decreases (Bolinger 1949, p. 249). 140 Un tale aspetto ha un riflesso diretto e conseguente nei confronti del modello rappresentazionale. Trasferire in maniera analogica il modello segmentale sulla categoria di tono, ed è quanto sostanzialmente accaduto alla linguistica americana negli anni 40-50, significa individuare un sistema grafico in grado di discretizzare a livello fonico e semantico l'intonazione. Significa in breve rendere discontinuo l'andamento continuo del tono e al contempo far corrispondere a quelle discontinuità pertinenze a livello semantico. La proposta elaborata da Kenneth Pike, consistente nella scomposizione della categoria del pitch in quattro livelli astratti, va in effetti verso questa direzione 165. L'applicazione del test delle coppie minime o di "commutazione", per usare l'espressione indicata da Hjelmslev (1943), è, nell'ambito delle variazioni graduali di significato, estremamente complicata. Ne è convinto ad esempio Hockett (1955, p. 144 sg): il problema di se e come due eventi linguistici suonino "uguali" o "differenti" pone il parlante nativo in una situazione di perplessità, perché diverse sfumature di significato, soprattutto le varianti emotive spogliate di valore discriminativo di senso, possono da lui essere ragionevolmente giudicate come "aventi suono diverso". Anche se cambiamo la domanda e ci chiediamo se i due enunciati "significano la stessa cosa o no", può facilmente verificarsi un fraintendimento, perché il verbo "significare" può ancora racchiudere per l'informante differenze emotive166. 165 166 Per necessità di completezza si segnala che nel suo modello Pike prevede accanto alle differenze fonemiche del pitch altri tipi di modificazioni (Pike 1945, p. 76-100). Tali variabili possono essere raggruppati in tre classi: 1) puramente fonetiche 2)di natura fonemica e graduale 3) sovraimposti. Per la seconda classe in particolare, seguendo la strada già segnata da Bloomfield circa la presenza di tratti non distintivi ma socialmente significanti, Pike introduce una ulteriore distinzione tra fenomeni linguistici in suoni che rappresentano costrasti fonemici e fenomeni linguistici che invece sono gradazioni socialmente significanti. Quest’ultime secondo l’autore “affect the meaning of utterance but are not organized into a rigidly limited number of contrastive units”. Un esempio citato è quello della velocità di eloquio che secondo Pike appare essere graduale: “Rapid speech tends to use fewer primary contours than does slow speech. The rate of talking, therefore, affect general contour pattern of a sentence, and may militate against the use of certain specific contours such as the deliberative one” (Pike 1945, p. 77). In particulare Hockett scrive: "To the field situation, the informant brings native control of his language, including the whole system of what "sounds same" and what "sounds different" to him. The investigator 141 Come e quanto queste riflessioni possano avere ripercussioni sul sistema notazionale dell'intonazione è ben mostrato dallo stesso Bolinger. In un suo famoso articolo dal titolo Intonation: level versus configuration del 1951, il linguista americano pone sotto la lente di ingrandimento le scelte operative dei suoi colleghi (Pike, Wells, Trager e Smith) e in particolare quella di suddividere il valore del pitch in livelli astratti. A fondare tale suddivisione del pitch phoneme, come abbiamo avuto modo di vedere in precedenza, vi è la presa di coscienza dell'assoluta relatività del fenomeno intonativo. Ciò che dà valore linguistico a un determinato profilo melodico è la relazione tra le altezze e non i suoi valori assoluti. In questo senso i livelli astratti avrebbero l’obiettivo di indicare, mediante la trascrizione, proprio quelle relazioni significative tra i toni astraendole dall’insieme dei valori acustici assoluti. La critica di Bolinger si fonda infatti sull'ambiguità della trascrizione grafica, a cui ovviamente si collegano problemi riguardanti le modalità teoriche di trattamento dell'intonazione. Il metodo di trascrizione basato sui 4 livelli di pitch presenta infatti potenziali luoghi di ambiguità: Assume, first, that the pitch phonemes are entirely relative. Each pitch phoneme would be free to range over the whole register of the speaker's voice, with no brings several things: (1) his understanding of the fundamental assumption, including an understanding of what it means for items to "sound same" or "sound different" to a native speaker; (2) some training in general phonetics, by which he will be able to tell, at least in part, what articulatory motions are probably responsible for any particular bit of speech-sound he elicits from his informant, and in terms of which he can put down in a written notation something which represents more or less accurately each elicited speech-event; (3) most important, his ability, as a human being, to be enculturated, to learn a new language, to empathize. The basic problem in phonologic field work is to bring it about that there reside, in a single nervous system, both the native or native-like active control of the phonologic system, and the clear understanding of what is meant by "sounding same" and "sounding different." For, when this has been accomplished, it becomes possible to tabulate the various articulatory motions which differentiate utterances that sound different, ignore differences of articulation which do not make any such difference, and thus achieve a description of the phonologic system. Until the basic problem is solved, this is quite impossible: the investigator cannot be sure whether two items that sound the same to him actually sound the same to the informant, and cannot be sure that clear differences to his own ears have any relevance for the informant" (Hockett 1955, p.145). 142 limitation save /4/ would at a given moment always be higher than /3/, /3/ than /2/, and /2/ than /1/. Give the four pitches the benefit of the doubt and say that all intonation morphemes are expressible in terms of this number of variables. On this assumption we gather that if there is a pitch morpheme that is keyed to four different pitches, the entire morpheme might be shifted to a higher or a lower set of frequencies without disturbing the internal relationships of the four pitches; similarly the tonal range of pitch could be expanded or compressed without disturbing these relationships. It would follow that no pitch phoneme could be identified out of some context, and that a given absolute pitch could correspond to any of the four pitch phonemes (Bolinger 1951, p. 199). Per il linguista americano le conseguenze sono "imbarazzanti". La relatività assoluta dei livelli di pitch rende, come abbiamo anticipato, i contorni parzialmente indeterminabili: è possibile infatti che ad un identico contorno intonativo possa essere potenzialmente applicata una pluralità di trascrizioni. Gli esempi sono portati da Bolinger stesso: There would be no way to distinguish 123 from 234, 121 from 232 or 242 or 343 or 141, and a morpheme contesting of but one pitch phoneme might be 1,2,3, or 4. If pitches were completely relative we could not, to take an example, fall back on a preceding morpheme such as 1342 to establish a kind of scale by which a 4 might be judged to be 4-1342 itself might be shifted up a fifth without having its identity destroyed" (Bolinger 1951, p. 200). Bolinger sottolinea l’ambiguità dello strumento di trascrizione e con essa la difficoltà che l’analista incontra nel determinare, e rendere visivamente a livello notazionale, le funzioni linguistiche. Se si pone ad analisi per esempio una curva ascendente, il sistema notazionale, costituito dai quattro livelli (1-2-3-4), consente l’uso di diverse forme di trascrizione: 12,23,34 se si interpreta la salita del tono all’interno di livelli adiacenti; 13,24 se invece si considera l’escursione tale da coinvolgere due livelli non adiacenti; e infine 14. Situazione ancora più paradossale riguarda poi il singolo suono che, preso isolatamente, e quindi in mancanza di altri riferimenti, può entrare a far parte di tutti e 4 i livelli. 143 Un altro aspetto che contrasta con l'immediato passaggio concettuale, e con esso teorico e applicativo, tra la nozione di fonema a livello segmentale e la stessa, trasferita a livello sovrasegmentale, è quello del rapporto tra la natura arbitraria del primo, e quella prevalentemente motivata del secondo. I fonemi sono infatti definibili linguisticamente solo sulla base dei loro rapporti differenziali, e quindi sulla base della dipendenza dalle relazioni 'interne', senza riferimento ai valori sostanziali. Con l'intonazione per Bolinger questo sembra non accadere: Intonation contains a few arbitrary uses, but they are embedded in a matrix of instinctive reaction; even the arbitrary uses may generally assigned values consistent with the nervous interpretation (…). The purely arbitrary uses of intonation are hardly more numerous then the expressive uses of the articulations of phonemics; they are opposite in the frequency of their respective kind of use (Bolinger, 1949, p. 249). Vi è infine, per Bolinger, un ulteriore livello di attrito nell'applicazione del concetto di fonema al dominio dell'intonazione: The phonemes comprise numerous variables, each of which depends upon a different special function of the articulatory organs (Bolinger 1949, p. 249). Se si pone l'articolazione come base per la determinazione del fonema, vi sarebbe per l'intonazione una sola variabile: il tono. Inoltre, come già abbiamo ampiamente illustrato, la distinzione di quest'ultimo non avviene per valori assoluti, ma per 'assolutamente relativi'. The consequences of this are serious, for they suggest that the proper phonemes of pitch are to be found not in position, but in direction: not high versus low, but up versus down. This result in yet another contrast with the ordinary phonemes: it is as if we were unable to treat of m as an entity, but had to take as our fundamental unit the shift from m to something else (Bolinger 1949, p. 249). 144 Per Bolinger, quindi, ad accentuare la difformità sull’ipotetica analogia tra il fonema segmentale e quello intonativo vi sarebbe lo ‘spessore’ delle variabili implicate. I fonemi segmentali possono essere distinti con relativa facilità per il fatto di essere composti da elementi complessi: ognuno di essi contiene un insieme di tratti distintivi167, la cui articolazione garantirebbe la loro differenziazione. Per quanto riguarda il Pitch invece, il tratto interessato riguarderebbe, come abbiamo anticipato, esclusivamente la variazione della frequenza fondamentale (F0): So it is impossible to isolate a pitch as one can isolate a segmental phoneme: an untrained listener can identify a prolonged english /s/ without benefit of context; no amount of training will enable him to distinguish one linguistically significant pitch from another, however much, unless it occurs in context 168 (Bolinger 1958, p. 110). E ancora: That pitch functions in the same way as the segmental phonemes - the vowels and consonants - and that a sequence of different pitches will produce something potentially meaningful in the same way that a sequence of vowel and consonants may produce a word. In order to manage this, it is necessary to decide when one pitch is different from another (Bolinger 1958, p. 109). Perplessità furono infine espresse anche sullo status morfemico del pattern intonativo. In un’analisi effettuata sull’intonazione e sulle giunture nella lingua spagnola, Stockwell, 167 168 Jakobson, Halle and Fant (1952) e Jakobson and Halle (1956) In realtà sulla capacità dei parlanti di riconoscere isolatamente un suono linguistico riconducibile al singolo segmento sono state espresse forti perplessità. Anche in questo caso a livello percettivo la comprensibilità sarabbe compromessa dall’impossibilità di avere informazioni derivanti dal contesto comunicativo e al tempo stesso dal co-testo del messaggio linguistico, luoghi in cui si radica molta dell’informazione necessaria alla disambiguazione o semplicemente alla corretta interpretazione del messaggio (cfr. Albano Leoni, 1998). 145 Bowen e Silva-Fuenzalida (1956), citati dallo stesso Bolinger 169, hanno espressero dubbi sul fatto che sequenze di elementi soprasegmentali potessero essere o meno morfemi: A sequence of pitches up to and including a terminal juncture will be referred to as an INTONATION PATTERN. Whether or not such a sequence of suprasegmental elements is a morph remains to be demonstrated on the morphological level of analysis (Stockwell, Bowen e Silva-Fuenzalida 1956, p. 661). 1.2 Verso una fonologia dell’intonazione Il tentativo dello strutturalismo americano di applicare un trattamento fonologico all’intonazione tracciò così il solco per i successivi studi linguistici. Le tematiche e le domande che abbiamo incontrato in queste pagine continuarono infatti ad essere affrontate e sviluppate alla luce di nuovi approcci teorici. È il caso ad esempio del modello autosegmentale e metrico. Elaborato inizialmente da Goldsmith (1976) per lo studio delle lingue tonali africane, fu successivamente applicato anche a livello delle lingue intonazionali. Cruciale sarà quindi il lavoro di Janet Pierrehumbert del 1980. Seguendo la linea tracciata dalla proto-fonologia di stampo strutturalista, tale modello si fondò sul tentativo di descrivere i toni su un livello diverso da quello segmentale. Parallelamente, anche la notazione subì in questi anni importanti modificazioni. Venne così elaborato un modello descrittivo che negli anni si è imposto come standard per l’analisi di un numero svariato di lingue. È il caso del metodo di trascrizione ToBI (Tones and Break Indices) che si basa su un sistema binario di simboli per la rappresentazione dei toni semplici (alto o H e basso o L) e delle loro eventuali composizioni bitonali (ad esempio, H+L o L+H). 169 “It is hard to see on what basis the levels and junctures are contrastive units, if sequences or them are not morphs” (Bolinger 1958, p. 111). 146 2 Il modello di trascrizione ToBI Come si è mostrato nelle precedenti pagine, e come è emerso analizzando anche i diversi modelli di trascrizione dell'intonazione, uno dei tratti che caratterizza gli approcci orientati a descrivere fonologicamente l'intonazione consiste principalmente nella scomposizione dell'andamento tonale in una sequenza di eventi intonazionali discreti. È proprio in questo scarto, tra la continuità del dato e la necessità di individuare schemi interpretativi adeguati alla descrizione linguistica, che si alimentò negli anni 50 il dibattito tra descrizione dell'intonazione in termini di ‘configurazioni’ o ‘livelli’. Dalla metà degli anni 70, numerose teorie hanno cercato di spiegare l'intonazione, il ritmo ed anche le variazioni segmentali dell’enunciato in termini di gerarchie di costituenti prosodici e di relazioni di prominenza tra tali costituenti (ad es., Selkirk, 1984; Ladd, 1986; Nespor e Vogel, 1986; Beckman e Pierrehumbert, 1986; Pierrehumbert e Beckman, 1988). Comune a queste teorie è la concezione di prosodia come componente autonoma della grammatica. La teoria linguistica si è posta il compito di definire quali siano le categorie tonali rilevanti della melodia, come queste si associno alla sequenza dei segmenti che compongono il testo, quali rapporti di prominenza esistano tra le categorie tonali, e quali siano gli usi linguisticamente significativi dell’estensione melodica (pitch range), sia a livello di enunciato sia a livello di discorso. È il caso dell'approccio autosegmentale - metrico. Come indica la sua denominazione, tale approccio nasce dall'incontro di modelli autosegmentali e metrici. In particolare l'elemento comune ai modelli autosegmentali (Goldsmith, 1976a, 1976b, 1990) è la concezione della rappresentazione profonda delle unità fonologiche. Essa è costituta da un insieme di livelli autonomi a cui sono riconosciute determinate proprietà. Negli anni 70 infatti, attraverso l’analisi di alcuni tratti 147 soprasegmentali, in particolar modo dei toni, è stato osservato che il dominio di un tratto può essere sia più piccolo che più grande di un segmento. Queste osservazioni hanno così condotto alla conclusione che alcuni aspetti dei sistemi fonologici devono essere specificati in termini di domìni più piccoli del segmento, altri di domìni più grandi. Alcuni tratti vennero così rappresentati su livelli separati da quello segmentale e non come caratteristiche distintive delle vocali o consonanti. In questo modo la rappresentazione fonologica passò quindi ad essere non più lineare ma multilineare: in questo senso alcuni tratti non sono più considerati caratteristiche intrinseche di un segmento, ma caratteristiche fonologiche indipendenti dal materiale segmentale, da cui il termine autosegmento, usato originariamente per i toni e, in lavori successivi, per un numero sempre maggiore di elementi fonologici. Vi saranno poi dei principi di associazione che determineranno in che modo gli elementi situati a diversi livelli possano essere messi in corrispondenza. Entro il quadro autosegmentale-metrico delineato ad esempio in Beckman (1996), i costituenti della gerarchia prosodica rilevanti per l’intonazione sono sillaba, sintagma intermedio (ip) e sintagma intonativo (IP). 148 Fig. 53 Schema esemplificativo dell’albero prosodico e metrico I toni che a livello fonologico sono associati al sintagma intermedio e intonativo, si allineano170 al confine destro di tali unità: essi sono chiamati rispettivamente phrase accents (T) e boundary tones (T%). I toni associati invece alle sillabe metricamente "forti" che formano la testa di un costituente prosodico (parola fonologica, in italiano; piede, in inglese) assegnano a tali sillabe un ulteriore grado di prominenza: la sillaba con accento lessicale (stressed) diviene intonativamente accentata (accented). Questi toni sono chiamati pitch accents (T*). Questo progressivo cambio di prospettiva influenzerà notevolmente anche l’annotazione. Il rapporto tra l’oggetto d’analisi e la rappresentazione grafica subirà infatti un ulteriore processo di astrazione. Se Pike (1945) aveva in qualche modo isolato i caratteri pertinenti dell’andamento melodico, è in questi anni che vengono alla luce i primi elaborati sistemi di trascrizione fonologica dell’intonazione. In questo quadro, la descrizione non è più la 170 Con il termine allineamento si indica la sincronizzazione dei toni con i segmenti finali del costituente. 149 trasduzione punto a punto del dato acustico o la descrizione in qualche modo omologica, seppure astratta, dell’andamento intonativo. Essa diviene un elemento che deve in qualche modo adattarsi alla dimensione fonologica della lingua. Come verrà mostrato nei prossimi paragrafi, all’interno delle riflessioni teoriche dell’approccio autosegmentale vedrà la luce uno dei principali sistemi di annotazione tutt’ora in uso: il sistema ToBI (Tones and Break Indicies). In riferimento a tale sistema di trascrizione De Dominicis (2010) scrive: Il sistema ToBI (Tones and Break Indices) non trascrive l’andamento reale del contorno intonativo (per quanto stilizzato), ma quello che potremmo definire il sistema di associazioni tra fatti tonali registrati e grandezze fonologiche segmentali (come i vari tipi di accents o prominenze intonative) e soprasegmentali (come le sillaba, le unità prosodiche e i loro confini). Si tratta, in sostanza, di un modo di concepire la fonologia, piuttosto che di un semplice metodo di annotazione intonativa (De Dominicis 2010, p. 125). 2.1 Alle origini di ToBI Il termine ToBI è stato utilizzato in due principali accezioni. Originariamente era riferito alla modello di trascrizione sviluppato tra il ‘91e il ’94 per l’etichettatura prosodica dell’inglese-americano standard (Beckman and Hirschberg, 1994). In maniera più generica è stato impiegato per riferirsi allo sviluppo del sistema di trascrizione in altre varietà dell’inglese (e.g. Mayo et al. 1997 [Glasgow]) e in altre lingue (e.g. Grice et al. 1996; Venditti 1997). Prima di passare alla descrizione del sistema di trascrizione ToBI è utile ripercorrerne brevemente i suoi sviluppi in termini temporali. Questo perché rispetto ai suoi precedenti presenta diversi elementi di novità. I modelli fin qui descritti hanno subito tutti, in maniera più o meno pervasiva, l’influenza di un medesimo contesto di applicazione. Sia i britannici che i principali esponenti dello strutturalismo americano, penso a Pike, avevano come primario obiettivo quello dell’insegnamento della lingua inglese. Non erano infatti rari dei 150 cambiamenti nella forma della rappresentazione dovuti alle difficoltà di lettura degli allievi (es. Amstrong e Ward, Pike). Le conseguenze teoriche di quelle scelte spesso erano tenute in secondo piano o addirittura non considerate. Vi è poi un secondo elemento di differenza che riguarda il contesto culturale e storico all’interno del quale queste tipologie di studi sono emerse. Se i primi tentativi di trascrizione erano il frutto di opere individuali, in alcuni casi elaborate da illuminati intellettuali fuori dal contesto accademico (es. Harold Palmer), in questi anni la specializzazione delle conoscenze e l’integrazione dei campi del sapere acquistano una valenza differente rispetto al passato. In questo senso è difficoltoso giustapporre in maniera acritica simboli, e tipologie di trascrizione, che si instaurano all’interno di complessi sistemi di conoscenze e basi teoriche. Il sistema di annotazione ToBI in questo senso è particolarmente rappresentativo. La sua elaborazione fu infatti il risultato di un serrato confronto tra studiosi provenienti da ambiti disciplinari differenti e soprattutto con obiettivi differenti. Lo sviluppo originario del sistema di annotazione avvenne nel corso di quattro appuntamenti con delegati di Università e discipline differenti. Ai workshop parteciparono ingegneri interessati al riconoscimento automatico del parlato 171 e a un migliore sistema text-to-speech, psicologi interessati alla relazione tra elaborazione del linguaggio umano e prosodia, informatici interessati all'elaborazione di sistemi di generazione del parlato e modelli di dialogo, fonetisti che volevano testare le loro teorie sull’associazione del tono e 171 Ormai diversi anni fa Dennis Klatt, maestro e pioniere degli studi sulla sintesi del parlato, sostenne che la prosodia è un fattore fondamentale nel determinare la qualità di un sistema di sintesi, anche dei sistemi più intelligibili a livello segmentale (Klatt 1987). Tale affermazione rimane valida anche ai nostri giorni. Un alto grado di intelligibilità a livello di parola, infatti, non garantisce la qualità di un sistema di sintesi da testo scritto (Silverman, 1993), poiché una prosodia “povera” a livello di enunciato rende difficile da processare sintatticamente e semanticamente anche il parlato sintetico più intelligibile a livello di parola (Sproat, Ostendorf e Hunt, 1999). 151 sull’allineamento (Beckman, Hirschberg e Shattuck-Hufnagel, 2004)172. Gli obiettivi a breve e lungo termine di questo incontro pluridisciplinare possono essere rintracciati nella volontà di costruire una serie di strumenti omogenei per l’etichettatura, in grado di rendere possibile la condivisione di corpora di parlato, finalizzati a una vasta gamma di impieghi nel campo delle tecnologie e delle scienze della voce.Al contempo si è cercato di costruire un vocabolario comune per ricercatori dislocati in luoghi differenti che permettesse loro di arricchire e sviluppare da punti di vista differenti il modello originario. Proprio per questo motivo fu elaborato un sistema di trascrizione relativamente accessibile all’uso da parte di comunità di ricerca aventi una varietà di interessi e convinzioni teoriche disparate: One corollary principle is that the conventions should be easy enough to teach that their use is not limited to a few experts to do transcription and to themselves train apprentice labellers (Beckman, Hirschberg, Shattuck-Hufnagel 2004, p. 13). 2.2 Gli antecedenti di ToBI Possiamo indicare tra gli immediati antecedenti del sistema di annotazione ToBI, tra gli altri, il lavoro di Pierrehumbert (1980) e Beckman e Pierrhumbert (1986) per la scomposizione del contorno intonativo in gruppi funzionalmente distinti di target tonali alto (H) vs basso (L); Price et al. (1991) e Wightman et al. (1992) per il trattamento delle 172 Questa pluralità di approcci e interessi trovò espressione nei luoghi in cui si svolsero gli incontri. Il primo workshop dedicato alla trascrizione prosodica fu organizzato da Victor Zue, professore di ingegneria elettronica e scienze informatiche, presso il MIT Laboratory for Computer Science nell’agosto del 1991; il secondo fu invece organizzato al NYNEX da Kim Silverman nell’aprile del 1992; il terzo venne organizzato Mary E. Beckman presso il dipartimento di linguistica dell’ Ohio State University. L’ultimo incontro, nell’agosto del 1994, fu organizzato da Mari Ostendorf al dipartimento di elettronica e ingegneria della Boston University. 152 giunture e Ladd (1980) per il trattamento dei fenomeni di downstep 173. È bene tuttavia sottolineare che molti degli aspetti legati al modello possono essere rintracciati nella lunga storia delle ricerche sulla prosodia e sull’intonazione nel linguaggio, che trovano spazio anche nel presente lavoro. Un esempio è la relazione tra l’intonazione e la scomposizione del flusso parlato. È ormai noto che una delle funzioni fondamentali della prosodia è quella di facilitare la scomposizione (parsing) del flusso parlato in raggruppamenti acusticamente coerenti, in modo da guidare l’ascoltatore nel decidere quali suoni o insiemi di suoni vadano integrati in singole unità, passibili di ulteriori analisi linguistiche. Riflessioni in tal senso sono ad esempio presenti già nei lavori di Sweet (cfr. Cap. 2.3). Anche la nozione di pitch accent, presente nel lavoro di Pierrehumbert, è sedimentata nella storiografia linguistica, basti pensare agli importanti lavori di Bolinger (1958). Our modern understanding of the inventory of SBE intonation pattern traces its roots to astute observations by teachers of English as a foreign language beginning in the first decades of the last century (Palmer 1922; Armstrong e Ward 1926) and studies of large corpora in the 1960s (Halliday 1967; Crystal 1969) and later (e.g. Gussenhoven 1984) (Beckman, Hirschberg, Shattuck-Hufnagel 2004, p. 16). Per quanto riguarda il trattamento del tono, ad esempio, è possibile rintracciare una assonanza tra l’approccio a livelli introdotto nello strutturalismo linguistico americano e quello autosegmentale-metrico di Pierrehumbert (1980, 2000). To our mind, a theory framed in terms of target levels is attractive because it affords good facilities for describing how the same intonation pattern lives up with different text; the crucial point in the contour, the F0 target, con be lined up with crucial points in the text, with stretches in between computed accordingly. The behavior of given contour under changes in pitch range can be modeled in a similar fashion, by transforming the target points (Pierrehumbert 1980, p. 54). 173 Come segnala Albano Leoni (2009) la prospettiva fonologizzante binaria ha un precedente importante in Isačenko e Scädlich (1970). I due studiosi, sebbene inseriti in un quadro teorico differente, individuavano come elementi dell’intonazione di frase tedesca due Tonbrüche, uno ascendente /↑/ e uno discendente /↓ /. Questi toni formerebbero sul piano paradigmatico un’opposizione binaria, nella quale il tono ascendente sarebbe l’elemento marcato e il tono discendente quello non marcato. 153 Come si è illustrato nei paragrafi introduttivi del presente capitolo (v. p.) la critica di Bolinger si instaurava su alcuni punti nodali dell’approccio a livelli. In particolare sulla possibilità di utilizzare per la rappresentazione degli andamenti tonali i fonemi intonativi (tone target), sotto forma di quattro livelli astratti piuttosto che cambiamenti di pitch dinamici (dynamic tones). La proposta di Pierrehumbert a cui seguì la successiva elaborazione del modello originario di ToBI, cercò di risolvere tale diatriba considerando pertinenti alla descrizione due e non più quattro, o cinque, livelli e al contempo fornendo un più elaborato modello di relazione tra il target tonale e il pitch range. 2.3 La trascrizione nel sistema di notazione ToBI Possiamo riassumere a questo punto alcuni dei principi fondamentali che sono alla base alla base del modello Autosegmentale Metrico originario174. 1. La struttura prosodica di una frase può essere proiettata su livelli separati che corrispondono nella teoria a tipi strutturali indipendenti. 2. Il contorno intonativo viene scomposto in un sistema binario di livelli di pitch, secondo la distinzione tra relativamente alto (H) e relativamente basso (L). Questi livelli sono bersagli, o target, statici. Inoltre la relatività del livello è definita in riferimento al range di pitch del sintagma intonativo piuttosto che dai valori di pitch adiacenti175. 3. Il range locale di pitch è determinato da una varietà di effetti, come relazioni 174 175 Nel corso dello sviluppo del modello metrico-autosegmentale e del sistema ToBI è possibile infatti distinguere un paradigma teorico iniziale ed uno più recente (Beckman, Hirshberg, Shattuck-Hufnagel, 2004). In quest’ultimo si assiste infatti a un progressivo incremento di attenzione riservata ai movimenti, oltre che ai bersagli tonali e contemporaneamente a un decremento di interesse per il riferimento della struttura dei toni alla gerarchia metrico-prosodica. In questo aspetto sembra riverberarsi lo sfondo della scuola americana. 154 sintagmatiche di prominenza o la presenza di downstep176 e di upstep177. Tali effetti sono indipendenti dal livello del tono, così che un tono alto (H) in una parte del contorno intonativo può essere in un altro punto più basso di un tono L presente nella stessa frase. 4. I toni vengono distinti per la loro funzione. Avremo dunque edge tones e pitch accent. I primi sono associati ai confini delle unità e sotto-unità prosodiche, mentre i secondi sono associati alle sillabe prominenti o metricamente forti (Silverman et al., 1992), secondo il modello di Liberman e Prince (1977). In questo senso il valore assoluto di pitch di un tono dipende dalla sua funzione così, come dalla sua posizione; per esempio un tono L che definisce l’inizio di un pitch accent ascendente L+H* può essere più alto di un tono L% al confine di sintagma intonativo seguente. La funzione di un tono determina anche la sua associazione relativa alla proiezione autosegmentale di consonanti e vocali; un pitch accent è in connessione con la sillaba accentata interessata, mentre un tono di confine maggiore è associato ai costituenti che si trovano al confine del sintagma del sintagma interessato. 5. I toni di confine (H vs L) sono associati a diversi gradi di giuntura o forza di confine; quello del sintagme intermedio (ip) e quello del sintagma intonativo (IP). A questo punto è possibile vedere come anche la rappresentazione notazionale subisca l’influsso della stratificazione propria della teoria autosegmentale. Hirshberg, Beckman (1994) e Beckman, Ayers Elam (1997) nelle loro linee guida per la trascrizione mediante il modello ToBI prevedono quattro livelli (tiers) di pertinenza: 1. Un livello ortografico (orthographic tier) nel quale vengono annotate le parole e i loro confini. 176 177 Per downstep si intende una compressione di range di pitch nel sintagma che abbassa un successivo target tonale alto non-iniziale e tutti i toni H che lo seguono nel sintagma. Per upstep si intende un innalzamento di range di pitch nel sintagma che comincia da un tono di confine minore alto. 155 2. Un livello tonale (tonal trier) all’interno del quale vengono etichettati i pitch accent, i phrase accent e i boundary tones. 3. Un livello degli indici di giuntura (break-index trier) che indica il grado di disgiuntura, compreso tra i valori 0 e 4, presente tra le parole che formano l’enunciato. Maggiore sarà il valore numerico assegnato al confine, minore è il grado di coesione prosodica tra i due costituenti178. 4. Livello misto (miscellaneous tier), dove si indicano disfluenze, pause piene, tosse, respiro e altri tipi di fatti paralinguistici. 2.4 I principi guida per la selezione dell’informazione Si è in più occasioni specificato come la trascrizione, e più in generale i processi di notazione, abbiano come tratto comune la selezione delle pertinenze entro le quali viene a configurarsi ‘l’immagine scientifica’ dell’oggetto. Anche la trascrizione ToBI non cerca di trascrivere tutti gli aspetti della prosodia o anche tutti gli aspetti che sono suscettibili di trascrizione simbolica. Nel decidere cosa includere e cosa lasciare fuori possono essere rintracciati tre principi: First, we wanted to be able to distinguish in our transcription all of the categorically distinct intonation patterns and prosodic units of the language (or rather of the three intonationally similar dialects that we claim to cover). Second, we felt we should not transcribe aspects of prosody which are more amenable to quantitative measures than to the categorical divisions of a symbolic transcription. Finally, we did not want to squander the user’s energies in transcribing even categorical aspects of prosody which are predictable from other parts of the 178 Le etichette disponibili sono le seguenti: ‘0’ quando non viene percepito il ‘distacco’ tra due parole; ‘1’ se la distanza tra due parole è percepita come normale; ‘2’ se si percepisce separazione, ma questa non è attribuibile con certezza alla presenza di un confine intonativo; ‘3’ se la separazione percepita è dovuta alla presenza di un confine intonativo di tipo intermedio (di questi casi, sul livello tonale si trova un phrase accent); ‘4’ se la separazione percepita è motivata dalla presenza di un confine intonativo gerarchicamente superiore (sul livello tonale si trova un boundary tone). 156 transcription or from auxiliary tools such as dictionaries” (Beckman e Ayers Elam 1997, p. 9). Gli aspetti della prosodia che invece si cerca di catturare nella loro completezza sono di due tipi. Il primo è la struttura prosodica (il ritmo di parole più o meno accentate che si alternano l’una con l’altra, e il raggruppamento di parole in costituenti prosodici di varia grandezza); il secondo riguarda i pattern intonativi (la sequenza di eventi tonali contrastivi che prendono il nome di pitch accent, phrase accent, e boundary tones). Un esempio di aspetti della prosodia che vengono tenuti al di fuori dalla trascrizione è il tempo locale di ciascuna parola nell’enunciato, che può essere registrato in maniera molto più accurata da misurazioni quantitative rispetto a una divisione arbitraria in categorie astratte, collegate a un valore generico di velocità (Campbell 1992). Un aspetto categoriale della prosodia che non viene introdotta nella trascrizione è invece la marcatura delle sillabe accentate e atone all’interno di ogni parola. Questo tipo di informazione, in virtù del terzo principio prima introdotto, è infatti abbastanza prevedibile e non necessita quindi di specificazione notazionale. Un’eccezione è invece quella di segnalare all’interno di ciascuna frase i punti più alti della frequenza fondamentale [HiF0], solitamente utilizzati per calcolare il valore del pitch range al fine di facilitare le ricerche sul rapporto tra quest’ultimo e la struttura del discorso (es. Grosz e Hirschberg 1992; Avesani e Vayra 1992). Se da un lato l’accento interno delle parole può essere il più delle volte predetto, vi sono al contempo altri aspetti dell’accento che non possono essere previsti con la stessa sicurezza179. Nel processo di etichettatura e analisi in ToBI un grande aiuto è fornito dalla registrazione del contorno relativo alla frequenza fondamentale. Come ricordano Beckman e Ayers Elam: 179 “The distribution of sentence accents is not determined by syntactic structure but by semantic and emotional highlighting. Syntax is relevant indirectly in that some structures are more likely to be highlighted than others. But a description along these lines can only be in statistical terms. Accents should not be mashed down to the level of stresses, which are lexical abstractions” (Bolinger 1973, p. 644). 157 The transcription of events on the tone tier is closely linked to this record. In the case of pitch accents, the labeller can make this link explicit by choosing to place the label for the pitch accent specifically at the F0 maximum or minimum that realizes the starred tone of the accent, if this F0 event is within the interval of the accented syllable nucleus. [...] There is a more practical connection, as well, inasmuch as most transcribers find the fundamental frequency contour an invaluable aid in making the analysis of the intonation pattern that is embodied by the transcription on the tone tier (Beckman e Ayers Elam 1997, p. 13). Ma quale informazione relativa alla frequenza fondamentale può essere considerata pertinente alla trascrizione? Anche in questo caso il processo di trascrizione deve ‘allargare le maglie‘ per l’individuazione delle variazioni pertinenti alla segnalazione del tono. Nell’interpretazione della F0 per la trascrizione tonale è importante infatti tenere a mente che molti aspetti dell’enunciato possono influenzare, anche di molto, l’andamento della frequenza fondamentale. Un esempio è costituito dall’effetto delle consonanti sorde [es. p, t, s] nella rilevazione del contorno. Queste ultime infatti, ostacolando il flusso d’aria necessario alla vibrazione delle corde vocali, rallentano la vibrazione stessa, e quindi abbassano il valore del pitch o addirittura lo arrestano rendendone impossibile la sua rilevazione (Gussenhoven 2004). Altre perturbazioni del contorno intonativo possono verificarsi a causa delle varie qualità della voce o della modalità di fonazione dei parlanti: For most speakers, subglottal pressure falls very sharply at the very end of an utterance. If the cross-glottal pressure difference becomes very weak, there may no longer be good glottal closings — i.e. the phonation may become quite breathy — so that even fairly robust pitch-tracking algorithms can easily fail. For some speakers this switch to breathy voice might happen even earlier if the utterance has a long low-pitched stretch corresponding to a L- phrase accent. Or, a speaker might break into creaky voice in such a region. In fact, many speakers break into creaky voice in almost any region with very low fundamental frequency. Since creaky voice is typically characterized by very irregular glottal periods (i.e., the fundamental frequency is physically not well- defined), pitch-tracking algorithms 158 often do not do well during these portions of the utterance, creating a messy ‘spattering’ of values (Beckman e Ayers Elam 1997, p. 14). Per quanto riguarda invece più da vicino la pratica di trascrizione di un enunciato mediante il sistema ToBI, essa è composta almeno da sei parti. Di queste, due riguardano la registrazione fonetica e quattro sono invece composte da una successione di simboli. Qui la tabella riassuntiva presente in Beckman, Hirschberg, e Shattuck-Hufnagel (2004): Tabella 3 Gli aspetti pertinenti della trascrizione ToBI Beckman, Hirschberg, e Shattuck-Hufnagel (2004) La primaria registrazione fonetica avviene sulla base della registrazione audio dell’enunciato: il flusso sonoro è quindi catturato e trasdotto digitalmente in una forma d’onda. La seconda informazione fonetica è quella riguardante invece la rappresentazione della frequenza fondamentale. Esistono software in grado di estrarre in maniera immediata dal segnale audio la forma d’onda e la frequenza fondamentale. Di seguito è possibile vedere come sono rappresentate due delle sei parti che compongono l’annotazione in ToBI: 159 Fig. 54 Rappresentazione ella forma d'onda e della F0 in Praat180 La schermata, tratta dal software Praat, mostra nella parte superiore la forma d’onda dell’enunciato e in basso l’andamento della F0. Già ad una prima osservazione superficiale sono individuabili alcune caratteristiche importanti che possono entrare a far parte dell’analisi. La forma d’onda ad esempio, tramite l’ampiezza delle curve, consente di collocare visivamente l’intensità delle varie parti dell’enunciato 181 . In questo senso è possibile, anche in maniera impressionistica, avere una prima idea delle salienze, dei luoghi di interesse dell’enunciato (ad es. vari tipi di accento, o informazioni derivanti dalla struttura informativa). Stesso discorso vale per la F0: picchi e avvallamenti consentono di puntare l’attenzione sui luoghi di prominenze ed eventuali luoghi di confine tra costituenti prosodici. 180 La frase proposta è la seguente ‘Luisa fingeva di guardare da un’altra parte‘ ed è stata tratta dal corpus CLIPS (cod. LFp1B04r_#11). 181 Sempre in Praat sono presenti strumenti che consentono di estrapolare anche una curva relativa all’informazione dell’intensità. 160 2.5 Rappresentazione del livello tonale Il livello tonale è la parte di trascrizione che corrisponde più da vicino all’analisi fonologica. Come abbiamo più volte accennato, i toni sono espressi con simboli (H, L), marcati con dei diacritici che ne indicano le funzioni intonative. Il tono alto H è realizzato come un picco o un massimo locale di frequenza fondamentale, il tono basso L è realizzato come un minimo locale di frequenza fondamentale. La loro differenza è paradigmatica: in una stessa posizione strutturale H sarà sempre più alto di L. Vengono marcati due tipi di toni, quelli associati a sillabe accentate (pitch accents) e quelli associati a confini intonativi (phrasal tones: phrase accents, boundary tones), che delimitano costituenti prosodici di due livelli: intermediate phrase (sintagma intermedio) e intonational phrase (sintagma intonativo). Più in dettaglio avremo: Pitch Accent: accento intonativo. Il diacritico usato è “*” e indica l’associazione del tono alla sillaba accentata. Phrase Accent: letteralmente accento (tono) di sintagma, identifica un sintagma intermedio (composto da almeno un accento intonativo e uno di sintagma). Il diacritico usato è “-” e ha funzione delimitativa (L-, H-) Boundary Tone: tono di confine, identifica un sintagma intonativo (composto da uno o più sintagmi intermedi). Il diacritico usato è “%” e ha funzione delimitativa (L%, H%) I toni di confine che si possono annotare con ToBI sono quindi i seguenti: L-L% discendente semplice (senso di conclusione) H-H% alto ascendente 161 L-H% basso ascendente (senso di continuazione) H-L% medio %H inizio di contorno molto alto: in genere nelle esclamative Per quanto concerne l’accento, ToBI ne marca di due tipi: 1. a) Accenti monotonali: H* si manifesta come un picco raggiunto dalla curva F0. L* target tonale realizzato nella parte più bassa dell’estensione melodica del parlatore, spesso senza variazioni considerevoli di F0. 1. b) Accenti bitonali: Negli accenti bitonali un tono è associato alla sillaba tonica – e l’associazione esplicitata dalla notazione con l’asterisco - mentre l’altro tono che può precedere o seguire, non è associato ad alcuna sillaba, ma realizzato “con riferimento al tono asteriscato”. Questo ha come conseguenza che la realizzazione fonetica di un tono asteriscato vedrà il target alto o basso del tono centrato stabilmente entro la sillaba tonica, mentre il target del tono non asteriscato sarà più variabile e potrà allinearsi a segmenti diversi della sillaba pretonica o postonica in dipendenza del contesto segmentale o della velocità di elocuzione. H+L* movimento discendente su sillabe contigue L+H* movimento ascendente su sillabe contigue (H+L)* movimento discendente nella stessa sillaba 162 (L+H)* movimento ascendente nella stessa sillaba H* !H down-step: sequenza scalare di toni alti con andamento “a gradino”. Di seguito invece un esempio di trascrizione proposto da Beckman; Hirschberg, Julia Bell; Shattuck-Hufnagel (2004): Fig. 55 Forma d’onda, contorno F0 ed etichettatura ToBI. Fonte Beckman et al. (2004) Nell’esempio sono ben visibili tutti i livelli di pertinenza dell’annotazione introdotti fin qui. In particolare, nella finestra in alto è visibile la forma d’onda ricavata automaticamente dall’input del segnale audio e nella finestra in basso l’elaborazione della F0. Tuttavia è nella finestra disposta nella parte centrale dell’immagine che si colloca il cuore 163 dell’etichettatura, in cui sono presenti le trascrizione del livello tonale e la marcatura degli indici di (dis)giuntura. Sempre nella sezione centrale sono presenti le indicazioni di importanti eventi fonetici. Ad esempio l’etichetta [HiF0] che come abbiamo visto in precedenza viene utilizzata di solito per calcolare il valore del pitch range a partire dal livello massimo. Non è un caso quindi che al punto di massima escursione sia associato un accento monotonale alto, o peak accent, [H*]. Quest’ultimo, che rappresenta il bersaglio tonale alto, è associato alla sillaba prominente. Inoltre la salienza è ben visibile anche dal punto di vista dell’intensità: in corrispondenza dell’accento vi è infatti anche un incremento dell’ampiezza dell’onda. Tra gli elementi annotati è riscontrabile il fenomeno di downstep in corrispondenza del tono [!H*], quest’ultimo fornisce il riferimento per indicare l’inizio di una compressione del range. Sono segnalati inoltre i toni di confine: il primo [L-L%] è presente in una pausa di ‘riflessione’ in corrispondenza della stringa uh... Mentre il secondo tono di chiusura, che conclude l’ascesa dovuta alla modalità interrogativa dell’enunciato, è medio e quindi marcato dal tono [H-L%]. Vi è infine il livello dei Break Indices. Questi ultimi, come si è visto, hanno la funzione di segnalare i luoghi di rottura più o meno marcata tra porzioni di enunciato. Maggiore è il valore (da 0 a 4) maggiore sarà la separazione tra i due elementi. Nell’esempio qui proposto sono presenti 3 Break Indices di valore massimo: il primo subito dopo l’esitazione iniziale Uh..., il secondo in corrispondenza della seguente esitazione Uh... e l’ultimo nella parte finale dell’enunciato Cab?. Proprio in corrispondenza di questi sono collocati i toni di confine precedentemente descritti. Problemi di trascrizione Anche il modello di trascrizione fonologica di ToBI presenta aspetti che sono stati più volte ritenuti problematici. Allo stesso modo dei primi modelli a livelli, infatti, la trascrizione ToBI presenta zone di ambiguità dovute all’eccessiva genericità dell’opposizione binaria 164 dei target tonali alto (H) vs basso (L). Il problema era stato affrontato in maniera simile da Bolinger in riferimento vaghezza della trascrizione. Ambiguità che consisteva nella trascrizione di fenomeni differenti sotto la stessa etichettatura o al contrario di fenomeni uguali con etichettature differenti. Il linguista francese Philippe Martin (2009) ha esemplificato uno dei possibili errori di trascrizione che si verificherebbe mediante l’uso di ToBI: La transcription d’une variation mélodique montant rapidement ou lentement, ou montant faiblement ou fortement, ou encore de variation concave ou convexe sera toujours la même (Martin 2009 p. 77). L’esempio grafico è il seguente: Fig. 56 Diverse variazioni del contorno melodico ascendente trascritte con la notazione ToBI (Martin 2009) Martin spiega come il risultato di questa ambiguità notazionale sia dovuto alla mancanza di un parametro temporale, che conduce la trascrizione a sintetizzare il movimento con l’etichetta LH*. In questo senso avremo per tutti i diversi movimenti del tono lo stesso tipo di trascrizione: Le paramètre temporal ayant disparu, chacun de ces mouvements de F0 sera a priori transcrit par la même séquence LH*: a) plus court que b) sera noté LH*, ainsi que c) moins ample que a) LH. De même a) linéaire, d) concave et e) convexe seront tous trois transcrits LH*, avec une variante possible L+H* pour d) (Martin 2009, p. 78). 165 Sulla stessa linea si colloca ad esempio Marotta (2002-3) che segnala la povertà descrittiva del modello, dovuta al ridotto numero di etichette: “Nella T(eoria) A(autosegmentale) dell’I(ntonazione) le categorie ammesse sono […] due P(itch) A(ccent) semplici (A* e B*) e quattro PA complessi (B*+A, B+A*, A*+B, A+B*) per un totale massimo di sei PA, che dovrebbero essere in grado di esprimere la competenza fonologica relativa al dominio intonativo per i parlanti di una qualsiasi lingua naturale” (Marotta 2002-3, pp. 241-242). Albano Leoni (2009) considera questo tipo di rappresentazioni fonologiche binarie insufficienti rispetto al potenziale semantico della prosodia 182. Altri tipi di problematiche sono riconducibili infine al carattere fonologico del modello, nato e pensato in una specifica lingua e spesso difficilmente applicabile ad altri sistemi. 3 Il modello IPO. Dalla parte dell’ascoltatore La sigla IPO è riferita alla teoria dell’intonazione sviluppatasi presso l’istituto per la ricerca sulla percezione (l’Instituut voor Perceptie Onderzoek) di Eindhoven. Tale teoria trova nel lavoro di ‘t Hart, Collier, Cohen del 1990 il punto di riferimento più importante. L’equipe olandese si concentra esclusivamente su una delle dimensioni della prosodia e precisamente nell’intonazione, definita: The esemble of pitch variations in speech caused by the varying periodicy in the vibration of the vocal cord (‘t Hart, Collier, Cohen, 1990, p. 2). 182 “[…] Se si mettono in relazione la complessità e la potenza semiotica della prosodia, […] con la povertà analitica dei modelli oggi più ricorrenti, si vede come almeno nell’opinione di chi scrive, una rappresentazione fonologica della prosodia basata sulle combinazioni di pochi tratti sia non solo poco efficace ma addirittura infondata e l’abbandono di un apparato teorico e descrittivo sottile e penetrante come quello qui descritto [modello analitico della tradizione britannica ndr.] , appare un regresso (Albano Leoni 2009, p. 62). 166 Tra i principi postulati dal loro metodo di analisi vi è il tentativo di coniugare l’aspetto fonetico a quello più strettamente linguistico. Il carattere di novità rispetto alla teoria Autosegmentale Metrica riguarda principalmente l’attenzione riservata al ruolo dell’ascoltatore. Come abbiamo visto nei precedenti paragrafi, il punto di vista teorico sui fatti intonativi era concentrato soprattutto sulla elaborazione di un sistema metalinguistico in grado di spiegare il carattere fonologico dell’intonazione attraverso la ricerca dei suoi elementi costanti. Punto di vista che è ritenuto ancora insufficiente: Early attempt to apply the distinctivity criterion to speech melody have not successful. The semantic distinction was commonly limited to the dichotomy of ‘statement’ vs ‘question’, which led to typology of ‘falling’ vs ‘rising’ intonation pattern” (‘t Hart, Collier, Cohen, 1990, p. 3). Al contrario, in questa nuova prospettiva, acquista maggiore peso il ruolo occupato dai parlanti e in particolare dall’ascoltatore nel processo di decodifica del dato acustico. Il modello percettivo (‘model of the listener’) opera così una sorta di filtro in grado di selezionare dal segnale acustico solo le informazioni pertinenti ai fini della comunicazione. Such a model should eventually answer the many question subsumed under more general one: what does the listener make of pitch in speech? (‘t Hart, Collier, Cohen, 1990, p. 3). La risposta a tale domanda dovrebbe così fare luce sulle distinzioni operate dall’ascoltatore a livello di unità melodiche, sul modo in cui egli struttura tali unità nella percezione complessiva del contorno intonativo, su come vengono collegati i percetti alle entità melodiche più astratte, fino all’integrazione di queste informazioni con quelle testuali del messaggio linguistico. Al tempo stesso gli autori sono convinti che le impressioni uditive vadano indagate sistematicamente in relazione alle proprietà del segnale acustico e in particolare a quelle che risultano dall’azione fisiologica volontaria. La metodologia sviluppata dai ricercatori si basa così su serie di stadi la cui progressiva applicazione permette il raggiungimento di un grado di astrazione maggiore. 167 L’approccio IPO prende in considerazione solo i movimenti del pitch che sono percettivamente rilevanti, e in particolare quelle variazioni di F0 che sono state prodotte intenzionalmente dal parlante. Il primo passo dell’analisi consisterà dunque nell’elaborazione di una versione stilizzata del contorno intonativo, attraverso l’eliminazione dalla curva di F0 di tutti i movimenti tonali privi di rilevanza percettiva. Il risultato di questa stilizzazione dovrà fornire una copia fedele (close-copy) contenente il minor numero di dettagli irrilevanti ed essere percettivamente indistinguibile dall’originale. Since a close-copy stylization is, by definition, auditory indistinguishable from the resyntetized original, it contains all the perceptually relevant pitch movements; and since it is made with the smallest possible number of straighline segments, it contains only the perceptually relevant pitch movements, whereas irrelevant detail has been removed (‘t Hart, Collier, Cohen, 1990, p. 43). Fig. 57 Rappresentazione della F0 in una copia percettivamente equivalente ('t Hart, Collier, Cohen 1990) Il risultato, come è possibile vedere dalla figura, sarà una linea continua comparabile con una rappresentazione di tipo configurazionale. A garantire inoltre la correttezza dell’operazione di sintesi saranno test percettivi. Il primo stadio dell’analisi effettuata mediante il modello IPO suscita da subito una serie di 168 importanti riflessioni. Ciò che la rappresentazione grafica tenta di mostrare è la pertinenza percettiva di determinati elementi del segnale fonico. La validazione del percetto, operata dall’ascoltatore rispetto alla manipolazione del segnale, realizzata mediante il primo processo di sintesi, consente dunque di mettere in evidenza i movimenti del contorno intonativo utili ai parlanti nel processo di comunicazione. Di conseguenza dalla rappresentazione saranno amputate tutte quelle fluttuazioni involontarie della F0 considerate ininfluenti, e coincididenti con le microintonazioni solitamente dipendenti da due principali fattori (Reinholt Petersen, 1986): il valore di pitch intrinseco delle vocali (Ladd, D.R. e K.E.A. Silverman 1984) e le perturbazioni dovute a fenomeni di coarticolazione. L’ipotesi avanzata dagli autori è che tali microvariazioni della frequenza fondamentale, dovute soprattutto ad aspetti fisiologici involtari, siano percettivamente meno rilevanti in riferimento alla melodia del parlato. La seconda operazione del processo di analisi consisterà in quella che viene detta standardizzazione. Essa consiste nella sostituzione dei movimenti stilizzati della frequenza fondamentale con altrettanti movimenti standardizzati, in base al calcolo delle soglie di tolleranza linguistica: If, for example, three rising movements in a close copy have slopes of 30, 40 and 90 ST/s respectively, we can already be sure that, on the basis of - smaller perceptual tolerance, those of 30 and 40 ST/s will not be distinguished from each other. Taking linguistic tolerance into account might even provide the possibility that the three different slopes can be replaced by one of 55 or 60 ST/s for all three movements without the loss of perceptual equivalence (‘t Hart, Collier, Cohen, 1990, p. 43). Nel passaggio tra stilizzazione e standardizzazione verranno dunque rimosse tutte le perturbazioni micro e macroprosodiche. Inoltre, al fine di ottenere dei risultati standardizzati, gli autori segnalano due condizioni da seguire. In primo luogo la generalizzazione non dovrebbe influenzare eventuali differenze categoriali tra i diversi movimenti del pitch. A tal proposito si prosegue mediante una seconda validazione 169 percettiva che possa verificare l’equivalenza delle standardizzazioni rispetto alle precedenti stilizzazioni. In secondo luogo le standardizzazioni dovrebbero ‘suonare’ in maniera accettabile, ed essere quindi rappresentazioni eque delle intonazioni linguistiche. Fig. 58 close copy (linea tratteggiata) e standardizzazione (linea continua) della F0 L’immagine presenta la misurazione della F0 per la frase Alan’s in Cambridge, studying botany. Le sillabe prominenti sono segnalate tramite la sottolineatura del testo; la curva originale è segnalata mediante i puntini; la close-copy mediante una linea tratteggiata; la curva standardizzata tramite una linea continua. Benché tutte le rappresentazioni del contorno presentino specificità di forme e grandezze, è possibile notare come vi siano delle corrispondenze nella configurazione complessiva: le stilizzazioni consistono infatti di una F0 di livello medio (M) prima della prominenza alta (H) che si trova in corrispondenza della sillaba accentata (Cam) seguita da una discesa della curva sino al livello basso (L). Tra i due movimenti, la curva passa dal livello basso (L) a quello medio (M), in modo tale che le sillabe situate prima della seconda sillaba prominente si situano a livello medio (M). Dopo aver verificato sperimentalmente, mediante test percettivi, l’adeguatezza della standardizzazione, si passa alla scomposizione della curva in una stringa di movimenti di 170 F0 (pitch movement). In questo processo di astrazione saranno dunque identificati gli intonation patterns, categorie astratte per mezzo delle quali si giunge alla definizione del lessico intonazionale della lingua. Tali pattern intonativi saranno costituiti dalla combinazione di movimenti. Il pitch movement rappresenta l’unità minima di curva di F0; il suo movimento è specificato per mezzo di alcune dimensioni percettive suddivise in categorie e identificate durante il processo di standardizzazione. I tratti che contraddistinguono ciascuna categoria sono: la direzione (ascendente o discendente), l’allineamento del movimento rispetto alle sillabe (anticipato, ritardato, molto ritardato), la velocità di variazione (veloce e lenta) e infine l’ampiezza della variazione (completa o parziale). Fig. 59 fonte 't Hart, Collier, Cohen (1990) Queste stringhe di movimenti standardizzati della F0 stabiliscono tra loro relazioni sia paradigmatiche che sintagmatiche. La corretta definizione dei movimenti tonali è una fase fondamentale della teoria, in quanto la loro concatenazione permetterà di determinare unità di rango superiore come la configurazione tonale o il pitch contour. Per costituire tali relazioni i ricercatori olandesi hanno cercato di capire se in tali 171 combinazioni di movimenti vi fossero delle restrizioni e se, in caso affermativo, vi fossero delle regole. Da ciò, mediante una procedura di prove ed errori, si può giungere ad una grammatica provvisoria intonativa, relativa a una data lingua: We adopted a strategy in which we postulated which combinations would be permitted and which not, and subsequently predicted that the former would, but the latter would not, be found in a new, independent corpus of considerable length. The postulates were based on experiences with previous material, but extended with expectations about the possibility of certain new combinations being permitted or not. This strategy led to what might be called a 'tentative grammar', an algorithm intended to generate all permitted strings of movements, and none but these” (‘t Hart, Collier, Cohen 1990, p. 57). In uno schema di sintesi ‘t Hart, Collier, Cohen illustrano tutte le varie fasi della procedura IPO: 172 Fig. 60 Diagramma della procedura IPO Partendo da un certo numero di frasi (speech utterances) e seguendo il diagramma in senso antiorario, avremo come primo passo la misurazione della frequenza fondamentale (F0 mesurement) e l’ottenimento delle curve F0 (F0 curve) che tuttavia contengono ancora molte variazioni involontarie. Tramite il criterio della uguaglianza percettiva (perceptual equality) si costruiscono copie fedeli (close copy) che contengono soltanto i movimenti di F0 percettivamente rilevanti. Utilizzando il criterio dell’equivalenza percettiva (perceptual equivalence) le copie sono trasformate in stilizzazioni standardizzate (standardized stylization). Se la loro accettabilità viene confermata (acceptability test), i movimenti percettivamente rilevanti standardizzati possono essere inclusi nell’inventario dei movimenti di pitch (pitch movements). La loro combinatoria e le regole che la governano è 173 oggetto dello studio di una grammatica le cui regole sono soggette a continua conferma (tentative rules). Dall’analisi di questo modello emerge una linea interpretativa che punta alla convergenza di aspetti teorici per molto tempo considerati contrastanti. L’obiettivo teorico consiste dunque nella ricerca di integrazione tra livello ‘atomistico’ e ‘globale’. Seguendo lo schema proposto da ‘t Hart e Collier (1975) avremo: Global Abstract Concrete Atomistic Intonational pattern F0 curve Pitch movement Pitch contour Tabella 4 - sintesi dei caratteri globali e atomistici adattato da 't Hart e Collier (1975) I pitch movements costituiscono le sole unità atomistiche del sistema, la loro natura è concreta, in quanto unità dalla valenza percettiva. La curva F0 e i pitch contours non sono altro che la manifestazione delle corrispondenti categorie astratte, ovvero gli intonation patterns. Essi saranno inoltre globali poiché il loro dominio di applicazione è l’enunciato. Il modello dell’equipe olandese mediante l’attenzione all’aspetto complessivo e percettivo dell’intonazione, insieme al riconoscimento dell’importanza riservata ai movimenti tonali, piuttosto che ai target, si avvicina all’approccio configurazionale della scuola britannica. L’analisi IPO è quindi lontana dalla scomposizione in livelli intonativi (pitch levels) tipica della scuola strutturalista americana e successivamente del metodo metrico-autosegmentale (Ladd 1983, Pierrehumbert 1980). Il rifiuto dei livelli si basa sul fatto che le variazioni di F0 richiedono una certa quantità di tempo per realizzarsi; l’impressione percettiva è quindi quella di un movimento tonale risultante dall’inevitabile transizione fisiologica che si 174 produce tra i livelli coinvolti dalla variazione. Se i livelli fossero le unità minime dell’intonazione, le transizioni prodotte dal passaggio da un livello a un altro (i pitch movements) avrebbero delle proprietà melodiche invariabili. Problema che, come accennato, emerge con forza dalle critiche rivolte al modello ToBI. 4 Il sistema di annotazione InTSInt Il sistema di annotazione InTSInt (International Trascription System fot INTonation) è stato elaborato per codificare le variazioni rilevanti della F0 ed è basato su un approccio esclusivamente fonetico. A differenza di ToBI, quindi, in cui l’etichettatura è strettamente connessa alla struttura fonologica linguo-specifica, con InTSInt l’analisi può essere effettuata più agevolmente su diverse lingue. Le ricerche che hanno dato origine a tale metodo di annotazione erano infatti finalizzate all’elaborazione di un sistema che fosse in grado di comparare, su una base il più possibile omogenea, gli andamenti prosodici di varie lingue. Da questo punto di vista quindi tale sistema si pone obiettivi che possono essere comparati con quelli di IPO e che al tempo stesso divergono da quelli di ToBI. Come si è visto in precedenza nel corso dei primi anni ’90 venne proposto un nuovo sistema di trascrizione dell’inglese americano (Silverman et. al. 1992) basato sulle ricerche di Pierrehumbert (1980), Pierrehumbert e Beckman (1988). Il grande interesse suscitato dalla comunità scientifica si trasformò nel tentativo di adattare questo nuovo sistema alle altre lingue, sebbene gli stessi autori avessero mostrato perplessità sulla immediata applicazione del modello alla descrizione di dialetti o lingue straniere. Uno dei motivi ispiratori del progetto InTSInt fu proprio la possibilità di trasferire in maniera pressoché inalterata gli strumenti di descrizione in lingue differenti: One specific original motivation for INTSINT was an attempt to develop a system which could be used for transcribing both English and French (Hirst e Di Cristo 1998, p. 14). 175 e ancora: The hypothesis behind the distinction between physical and phonetic levels of representation is that all languages obey the same physical constraints in the production and perception of variations in fundamental frequency, intensity and duration. A phonetic representation, then, is one where such universal constraints have been factored out (Hirst et al 2000, p. 54). InTSInt costituisce, dunque, per il livello soprasegmentale il sistema di rappresentazione speculare all’IPA (International Phonetic Alphabet) (Hirst 2005a). Come ricorda Rosa Giordano (2005) i simboli e il sistema stesso sono entrati a far parte degli apparati di trascrizione nel progetto SAM (Speech Assesment Method ) che ha definito lo standard per la transcodifica dei sistemi di annotazione linguistica in caratteri leggibili con sistemi operativi per computer. L’annotazione si sviluppa in due fasi principali. Nella prima il contorno della frequenza fondamentale viene tradotto in una sequenza di bersagli tonali (target points); nella seconda invece viene effettuata l’etichettatura di ogni punto rilevante fisicamente. La prima stilizzazione della curva avviene dunque mediante l’elaborazione di una serie di target piuttosto che di movimenti di pitch primitivi, come avveniva invece per IPO. Questi target saranno collegati a quelli adiacenti mediante un appropriata funzione di transizione. L’algoritmo utilizzato per l’estrazione della curva è MOMEL (MOdelling MELody) (Hirst, Espesser, 1993; Hirst, Di Cristo, Espesser, 2000). Quest’ultimo sostituisce in maniera automatica il tracciato intonativo originario con un’approssimazione matematica percettivamente identica a quella di partenza. In questo aspetto l’obiettivo è lo stesso ricercato dall’approccio IPO: la rimozione di eventuali errori di calcolo presenti nel tracciato e contestualmente, la rimozione di punti linguisticamente irrilevanti: 176 The analysis of raw fundamental frequency curves for the study of intonation needs to take into account the fact that speakers are simultaneously producing an intonation pattern and a sequence of syllables made up of segmental phones. The actual raw fundamental frequency curves that can be analysed acoustically are the result of an interaction between these two components and this makes it difficult to compare intonation patterns when they are produced with different segmental material (Daniel Hirst 2005, p. 34). L’eliminazione delle componenti macroprosodiche e microprosodiche mediante l’algoritmo MOMEL viene ulteriormente ottimizzata mediante una particolare funzione (quadratic spline function) che permette la produzione di una curva stilizzata percettivamente equivalente all’originale. Di seguito la differenza tra una codifica della F0, realizzata tramite una interpolazione quadratica, e una codificazione mediante linee rette: Fig. 61 Fonte Hirs e Espesser (1993) 177 4.1 La rappresentazione dei toni nel sistema InTSInt Una volta terminato il processo di stilizzazione della curva è prevista la fase di annotazione prosodica, che viene realizzata mediante l’utilizzo di un insieme di etichette. Tali simboli saranno impiegati per indicare i punti salienti della F0. Il contorno intonativo sarà quindi suddiviso in unità tonali individuate mediante una serie di caratteristiche fonetiche 183, che saranno indicate etichettanto i confini per mezzo di parentesi quadre ([ per l’inizio dell’unità tonale e ] per la fine). All’interno di ciascuna unità i punti di variazione verranno considerati sia in modo globale (toni assoluti) sia in modo locale (toni relativi). Nel primo caso il riferimento sarà quello del range frequenziale del parlante, mentre nel secondo caso i valori saranno determinati in maniera relazionale sulla base dei bersagli precedenti e successivi. Avremo così: a) TONI GLOBALI: - “T” o “⇑” (Top) per indicare il target point con il valore più alto dell’intero contorno. - “B” o “⇓” (Bottom) per indicare il target point con il valore più basso dell’intero contorno. - “M” o “⇒” (Mid) per indicare il target point con il valore pari a quello medio del contorno. b) TONI RELATIVI: - “H” o “↑” (Higher) per indicare un target point più alto rispetto al precedente; - “L” o “↓” (Lower) per indicare un target point più basso rispetto al precedente - “S” o “→” (Same) per indicare un target point di altezza simile al precedente 183 “Per la definizione e l’identificazione di questa unità [unità tonale] gli autori rimandano ad una serie di caratteristiche acustiche e percettive che sono generalmente riscontrate in molte lingue nella strutturazione di sintagmi prosodici di varia estensione; l’unità presa in considerazione, quindi, è individuata in base a caratteristiche fonetiche e alla modulazione dei principali parametri prosodici, mentre i criteri fonologici non interferiscono né nella segmentazione né nell’etichettatura” (Giordano 2005, p. 238). 178 InTSInt prevede inoltre altri due toni iterativi che segnalano una leggera variazione rispetto al target point precedente: - “U” o “<“ (Upstepped) per indicare un target point leggermente più alto rispetto al precedente - “D” o “>” (Downstepped) per indicare un target point leggermente più basso rispetto al precedente. Fig. 62 Cofigurazioni associate ai relativi simboli nel sistema InTSInt (Hirst et al. 2000) 4.2 Tra forma e funzione della prosodia La descrizione del sistema elaborato dal Laboratoire Parole et Langage dell’Université d’Aix-en-Provence ci porta ancora una volta dentro alla questione relativa al rapporto tra forma e funzione nella prosodia. La prosodia può essere descritta dal punto di vista della sua forma e della sua funzione. I molteplici approcci teorici nel corso degli anni hanno cercato in maniera più o meno consapevole di mediare tra questi due ambiti con risultati non sempre soddisfacenti. Hirst (2005b) inoltre sottolinea come una delle caratteristiche peculiari della prosodia del parlato, in relazione agli altri aspetti del linguaggio, sia la quasi universalità del rapporto tra forma e funzione. Dal punto di vista della forma tutte le lingue sembrano fare uso di distinzioni di quantità, intensità, e variazioni di tono. Inoltre quasi tutte le lingue sembrano collegare la prosodia alla dimensione semantica delle parole, alla struttura informativa, e quindi alla prominenza delle stesse all’interno di enunciati più complessi. Sempre Hirst ricorda come un altro aspetto universalmente riscontrato sia la 179 grande quantità di informazioni che la prosodia veicola a livello di attitudini, emozioni e affetti in generale. La specificità delle lingue in fatto di prosodia si collocherebbe, secondo l’autore, non nell’organizzazione della forma o delle funzioni in sé ma nel modo in cui tali lingue stabiliscono le relazioni tra questi due domini. Più che mai in questi anni la problematica notazionale in senso stretto si coniuga con quella più generale di ‘rappresentazione’. Hirst, Di Cristo e Espesser chiariscono che il termine dovrebbe essere scisso in due ambiti di specificità riferendosi ora alla rappresentazione cognitiva ora alla rappresentazione analitica. Inoltre, mentre sembra esistere un ampio consenso sull’esistenza di rappresentazioni cognitive astratte, minore sembra essere il consenso, secondo gli autori, relativo alla natura di queste rappresentazioni. Come si collocano i livelli fonologici, sintattici e semantici rispetto al livello della pronuncia? Come si collocano quindi i livelli funzionali rispetto a quello fisico-fonetico? Gli autori suggeriscono che le soluzioni adottate siano state diverse. Da un lato c’è chi considera la rappresentazione cognitiva come composita, per cui l’enunciazione si serve delle informazioni provenienti dai diversi componenti: Fig. 63 Fonte: Hirst, Di Cristo, Espesser (2000) Per altri invece, come ad esempio Selkirk (1978, 1984, 1986), ci sarebbe un livello autonomo di rappresentazione fonologica che decodifica tutte le informazioni concernenti la pronuncia di un enunciato: 180 Fig. 64 Fonte: Hirst, Di Cristo, Espesser (2000) Altre interpretazioni infine vedrebbero la componente sintattica (includendo il lessico) comunicare sia con la dimensione semantica che fonologica. Tuttavia non ci sarebbe collegamento diretto tra semantica e fonologia: Fig. 65 Fonte: Hirst, Di Cristo, Espesser (2000) Una distinzione simile può essere quindi fatta tra rappresentazione funzionale e rappresentazione formale. Nel primo caso si tratterà di decodificare l’informazione necessaria per l’interpretazione semantica e sintattica della prosodia, nel secondo invece l’informazione necessaria per la sua pronuncia. Come si è visto in precedenza uno dei 181 limiti, e al tempo stesso delle sfide, del sistema ToBI, sviluppatosi sulla scia dell’approccio autosegmentale-metrico, è quello di essere fortemente vincolato dalle caratteristiche fonologiche delle lingue su cui si applica 184. Il fatto che diverse lingue facciano uso di forme prosodiche differenti per codificare le stesse funzioni ha spinto gli autori del sistema InTSInt a pensare in maniera separata queste due dimensioni: The inventories of prosodic forms and prosodic functions might then both be part of universal linguistic theory while the specific mapping between forms and functions in any given language would be defined by language specific parameters (Hirst, Di Cristo, Espesser 2000, p. 53). In questa prospettiva la descrizione della prosodia delle lingue può essere vista come un processo che dal dato acustico si sposta via via su livelli funzionalmente più dettagliati sulla base di trascrizioni puramente fonetiche. 184 “It is important to emphasize, however, that the four labelling tiers [...], together with the audio and Fo records, are only the obligatory parts of the MAE_ToBI record. We had no expectation that these four tiers and two types of continuous record would suffice for tagging systems for all languages or even for all users of MAE databases. Rather, the originators of MAE_ToBI fully expected individual sites to add other ToBI tiers or other completely independent annotations as needed, in order to customize shared databases to their own purposes”. (Beckman, Hirschberg e Shattuck-Hufnagel 2004, p. 71). 182 Fig. 66 Fonte: Hirst, Di Cristo, Espesser (2000) A partire dunque dagli enunciati le descrizioni potranno stratificarsi su tre principali livelli: il primo di rappresentazione fonetica (phonetic representation) attraverso una prima astrazione, quanto più fedele possibile, della frequenza fondamentale; una rappresentazione fonologica superficiale (surface phonological representation) in cui vengono applicate categorie discrete alle variazioni del contorno intonativo in rapporto diretto con il segnale acustico; una rappresentazione fonologica più profonda (underlying phonological representation) che avrà legami con le funzioni più astratte della struttura linguistica e sarà legata solo indirettamente al segnale acustico. In questa panoramica il sistema InTSInt si concentrerà dunque principalmente sui primi due livelli di rappresentazione con l’obiettivo di fornire una descrizione universalmente applicabile e al tempo stesso fungere da base su cui indagare le relazioni linguo-specifiche tra livello formale e livello funzionale. Nel rapporto tra forma e funzione si inseriscono dunque le principali differenze tra gli approcci più recenti. Hirst sottolinea come l'intonazione e la prosodia, a differenza degli altri livelli linguistici, presentino una universalità di forma e funzione. In sostanza le lingue si servirebbero universalmente delle variazioni prosodiche per veicolare un insieme pressochè omogeneo di funzioni. Le costrizioni di cui le lingue particolari si servirebbero, 183 sarebbero dunque riferibili al modo in cui esse mettono in relazione le due facce del segno, differenziando quindi questo tipo di rapporto tra forma e funzione. La notazione ToBI, collocandosi in una prospettiva fonologica, si troverebbe nella condizione di dover rappresentare mediante il suo sistema di trascrizione la specifica articolazione tra forma e funzione, spesso non direttamente ricavabile dalla sola F0, della lingua a cui si applica. Molti dei problemi di adattabilità e trasferibilità del modello su altri sistemi linguistici potrebbero dunque essere letti come derivanti da questa caratteristica. In netta opposizione si colloca invece il tentativo del progetto InTSInt della scuola francese che punta invece a una rappresentazione prettamente fonetica dell'intonazione. In questo modo, evitando le costrizioni linguo-specifiche del rapporto tra significante e significato, si cerca di costituire un modello di descrizione, universalmente applicabile alle diverse lingue, del solo piano espressivo. 184 Conclusioni Prima di proporre delle riflessioni e indicare i possibili sviluppi del tema, è utile sottolineare alcuni degli elementi che sono emersi dall'analisi dei modelli di rappresentazione dell'intonazione. Il primo è di tipo strettamente semiotico e fa da sfondo ai commenti e alle riflessioni che si sono succedute nei vari capitoli del lavoro. Il processo di traduzione grafica, attraverso la costituzione di un modello notazionale simbolico destinato alla rappresentazione della lingua, in questo caso dell'intonazione, non è un passaggio 'naturale'. Vi sono prima di tutto delle costrizioni di tipo materiale. La rappresentazione permette ad esempio di rendere visibili aspetti della materia fonica che difficilmente si riuscirebbero a cogliere senza un adeguato addestramento. È questo il punto che emerge dalla critica di Roy Harris alla 'tirannia dell'alfabeto'. Ed è questo tipo di problematica che emerge chiaramente anche nei primi lavori sistematici sull'intonazione. Lo studio di Johsua Steele si colloca ad esempio in questa frattura tra oggetto e segno. L'autore inglese si trova in qualche modo a dover costruire un sistema interpretativo capace di 'mostrare' l'importanza delle variazioni di tono nella lingua. Per fare ciò si rifugerà in un modello notazionale in un certo senso già pronto all'uso: la partitura musicale. Mediante questo sistema egli riuscirà a classificare e ad analizzare diversi livelli prosodici: tono (accent), durata (quantity), intensità (force), pause (pause), prominenza e scansione metrica (emphasis). Un'altra considerazione da fare riguarda la notevole perdita di informazione che questa trasmutazione di materia comporta. Il processo di astrazione del simbolo grafico dovrà quindi cogliere gli aspetti del segnale fonico che l'analista reputerà importanti e per cui la notazione stessa è stata costruita. La nota sul pentagramma utilizzata da Steele permetterà allo studioso di cogliere in termini assoluti l'altezza del suono, e con i dovuti calcoli anche 185 il valore in termini di Hz, ma difficilmente riuscirà a rendere conto del 'colore timbrico’ di quella nota. Lo stesso sistema potrà agevolare la descrizione dell'andamento della frequenza fondamentale (lo farà ad esempio Daniel Jones), ma difficilmente potrà far 'vedere' le diverse armoniche che compongono il suono nel suo complesso. Da un punto di vista scientifico il lavoro mostra, attraverso la descrizione dei numerosi approcci al problema, come vi sia una netta distanza tra le difficoltà incontrate dagli studiosi nell'elaborazione dei propri modelli descrittivi e l’assoluta efficienza con cui i parlanti utilizzano queste dimensioni della lingua per trasmettere e interpretare informazioni. Cosa deve dunque considerarsi pertinente ai fini di uno studio linguistico dell'intonazione? Nei fatti la risposta non né univoca né definitiva. Vi è un primo ordine di problemi che è di natura prettamente epistemologica. La prospettiva con cui le diverse scuole linguistiche hanno definito i loro principi e marcato i confini della loro disciplina ha avuto ripercussioni sullo spazio occupato dai fatti intonativi nel dominio linguistico. L’impatto dello strutturalismo ha indubbiamente frenato lo sviluppo di una discussione sui metodi di indagine e di riflessione sull’intonazione che invece aveva avuto ampio spazio nella scuola britannica. Molte delle questioni oggi riprese e approfondite ad esempio in ambito pragmatico, psicolinguistico, e più in generale dagli studi sul parlato avevano avuto un ruolo centrale negli studi fonetici inglesi. I motivi, come si è visto, sono stati molteplici. Tra questi, il tentativo di separare l’oggetto lingua dalle pratiche comunicative dei parlanti e al contempo di fondare la specificità dell’oggetto lingua sul modello segmentale che ha trovato non poche resistenze rispetto alla complessità dei fenomeni prosodici. Un altro ordine di problemi è invece di natura empirica. Diverse sono ad esempio le difficoltà riguardanti la costituzione del piano dell’espressione proprio della prosodia. L’individuazione delle unità e con essa la descrizione della sua organizzazione non è un’operazione semplice. La natura continua dei correlati acustici e al tempo stesso dei sensi a cui essi si associano, chiaramente distinguibili dai parlanti e funzionalmente determinanti 186 nelle dinamiche della comunicazione ordinaria, rende difficoltosa e poco efficace una loro generalizzazione e formalizzazione. Lo stesso metodo delle coppie minime, utilizzato in fonologia per l’individuazione delle distinzioni di significato, non trova facile applicazione con i fenomeni intonativi. Va aggiunto inoltre che questi ultimi si presentano spesso interrelati con le altre caratteristiche non segmentali e con altri elementi fonici co-occorrenti. Tono, intensità e tempo, ad esempio, partecipano contemporaneamente alla costituzione dei contrasti significanti. Al tempo stesso altri tratti come quelli emotivi o relativi alle qualità della voce partecipano alla composizione degli andamenti tonali, creando non poche difficoltà nell’estrazione di indici acustici che si trovano a condensare contemporaneamente più livelli di informazione. La complessità delle questioni trova ancora oggi risposte divergenti. Marotta (2010) ad esempio sostiene l’esistenza di una doppia prospettiva, una linguisticamente ‘interna’ ed una linguisticamente ‘esterna’. Rispetto ai fatti linguistici interni la prosodia e l’intonazione si troverebbero ad avere un ruolo marginale. In senso opposto Albano Leoni ha in più occasioni avanzato l’ipotesi di una prospettiva unitaria in grado di mettere al centro le complesse attività semiotiche delle interazioni tra i parlanti. Posizione questa che renderebbe obsoleta una suddivisione tra fatti interni e fatti esterni alla lingua. Tali problemi trovano inevitabilmente riflesso nelle pratiche di rappresentazione. Il modello alfabetico che, come abbiamo visto, ha rappresentato per la fonologia un primo e determinante impulso alla riflessione metalinguistica, non presentava che limitate informazioni sul ruolo che la prosodia, e in particolare l’intonazione, potevano avere nel meccanismo linguistico. Tale impulso è senza dubbio legato alla capacità del supporto grafico di mostrare e rendere osservabile, sotto un certo rispetto, il proprio oggetto, rendendolo al tempo stesso manipolabile. Una simile condizione è infatti riscontrabile nel rapporto tra gli studi dell’intonazione e la notazione musicale. Allo stesso modo dell’alfabeto, la partitura ha reso ‘evidenti’ forme e relazioni tra elementi della lingua come 187 tono, intensità e durata, fornendo un valido sostegno alla elaborazione di concetti e costruzioni teoriche. E’ indubbio che negli ultimi decenni, soprattutto con lo sviluppo di nuove e più accurate tecnologie, lo studio dell’intonazione abbia registrato un incremento notevole di interessi. L’estrema specializzazione dei saperi, e con essa la vicinanza di prospettive plurime sul medesimo oggetto di analisi, ha allargato di molto la richiesta di nuovi modelli interpretativi. Pur nella grande variabilità dei sistemi di trascrizione adottati dall‘800 alla metà del XX secolo, la gran parte degli studi sui fatti intonativi fu influenzata da finalità soprattutto didattiche. A partire dagli anni ’80 l’interesse comincia ad essere focalizzato anche sulla base di nuove esigenze di ricerca. Ingegneri, informatici, psicologi, oltre ai linguisti e scienziati della voce iniziano a interessarsi all’elaborazione di sistemi di analisi progressivamente più accurati. Dal punto di vista notazionale, l’esigenza sempre più pressante è quella di rendere tali analisi fruibili e confrontabili a un pubblico sempre più vasto e variegato. E’ in questo contesto che viene a collocarsi ad esempio il sistema ToBI. Ispirato soprattutto dall’ambito di studi relativo alla teoria fonologica autosegmentalemetrica, esso ha accolto, come si è visto, il contributo di altre branche di ricerca. Ma è vero anche il contrario. La pluralità degli interessi e delle prospettive ha spinto verso l’elaborazione di nuovi sistemi di codifica, ognuno dei quali finalizzato a metodi specifici di analisi intonativa, che di conseguenza hanno contribuito a costruire nuove e differenti immagini dello stesso oggetto. Problematizzare il ruolo della trascrizione e con essa della rappresentazione scientifica della lingua significa dunque aprire uno spazio di riflessione sui modi in cui queste influenzano e indirizzano il nostro sguardo. Il passaggio dal suono al segno visivo non è infatti un’operazione ‘ingenua’, ma implica, come abbiamo visto, delle scelte. Occorre operare selezioni, individuare delle linee di resistenza dell’oggetto che non sono sempre visibili, e che dipendono il più delle volte dalla costruzione di complessi schemi di codifica, ossia di quei processi di classificazione che sono necessari per la messa in evidenza dei 188 fenomeni, e che il più delle volte sono storicamente costituiti. Guardare alla rappresentazione significa inoltre cercare di non confondere ‘la mappa con il territorio’, e di guardare così ai mezzi rappresentativi come ausili per una descrizione e non come ‘calco’ o ‘sostituto’ dell’oggetto che si cerca di descrivere. Come si è argomentato nelle pagine iniziali del lavoro, la distanza che separa gli oggetti dalle configurazioni segniche, e che di conseguenza non può farli coincidere, è presente anche tra le teorie scientifiche che dovrebbero far luce sui rapporti tra la lingua e le sue diverse funzioni. Se da un lato tutto ciò può apparire un limite, dall’altro è interpretabile come condizione a priori di ogni ricerca scientifica, condizione questa che diviene garanzia dell’inesauribilità della ricerca stessa. L'indagine sul problema della notazione intonativa mostra infine come in essa si riflettano problemi e questioni controverse, che sono ancora oggi lontane dall'essere risolte in maniera condivisa. L'importanza di questa tematica nella riflessione linguistica diviene sempre più pertinente, grazie allo sviluppo di nuove tecnologie di raccolta, elaborazione e analisi dei dati. Su di esse passa oggi la possibilità di rappresentare, misurare, analizzare, confrontare e condividere le conoscenze in numerosi campi della scienza linguistica. 189 Bibliografia Abercrombie D. (1967), Elements of general phonetics, Edinburgh: Edinburgh University Press. Albano Leoni, F. (1998), ‘L'indeterminatezza del significante. Premessa’, in F. Albano Leoni, D. Gambarara, S. Gensini, F. Lo Piparo e R. Simone (A cura di), Ai limiti del linguaggio. Vaghezza, significato e storia, Roma-Bari: Laterza, pp. 9-14. Albano Leoni, F. (2001), ‘Il ruolo dell'udito nella comunicazione linguistica. Il caso della prosodia’, in Rivista di linguistica, 13, pp. 45-68. Albano Leoni, F. (2003), ‘I correlati acustici di una 'voce leggermente rauca, con un tono di sarcasmo quasi amaro'. Fonetica e linguistica della parole’, in Cosi P., Magno Caldognetto E., Zamboni A. (a cura di), Voce canto parlato. Studi in onore di Franco Ferrero, Padova, Unipress. Albano Leoni, F. (2005), ‘Lo statuto del fonema’, in S. Gensini e A. Martone (a cura di), Il linguaggio. Teorie e storia delle teorie. In onore di Lia Formigari, Napoli: Liguori, pp. 281-303. Albano Leoni, F. (2007), ‘Saussure, la sillaba e il fonema, in Elia e M. De Palo (a cura di), La lezione di Saussure. Saggi di epistemologia saussuriana, Roma, Carocci, pp. 56-85. Albano Leoni, F. (2009), Dei suoni e dei sensi. Il volto fonico delle parole, Bologna: Il Mulino. Alkon, P. K. (1952), ‘Joshua Steele and the Melody of Speech’, in Language and Speech 2, 154-174. 190 Arend Z.M. (1934), ‘Badouin de Courtenay and the Phoneme Idea’, in Le Maitre Phonetique january. Armstrong L. E. e Ward, I. C. (1926), A Handbook of English Intonation, Cambridge: Helfer. Avesani C. e Vayra M. (1992), 'Discorso, segmenti di discorso e un’ipotesi sull’intonazione'. In Cresti E., Maraschio N. e Toschi (a cura di) Storia e teoria dell’interpunzione. Atti del Convegno Internazionale di Studi Firenze 19 – 21 maggio 1988, Roma, Bulzoni. Azzaroni, L. (1997), Canone Infinito, Bologna: Cooperativa Libraria Universitaria Editrice. Bachtin, M. (1981), ‘The dialogic Imagination’, In Holquist M. (a cura di), Austin: University of Texas Press. Barker, M. L. (1924), ‘Joshua Steele on Speech-Melody (1779)’, in Modern Language Review, 169- 174. Barrett L. F. (2006), ‘Are Emotions Natural Kinds?’, in Association for Psychological Science, vol.1, no. 1, 2006, 28-58. Beckman M.E. e G. Ayers Elam (1997), Guidelines for ToBI Labelling, The Ohio State University Research Foundation. Beckman, M. (1996), ‘The parsing of prosody’, in Language and Cognitive Processes, 11,1-2, 17:67. Beckman, M. e Pierrehumbert, J. (1986), 'Intonational structure in Japanese and English', in Phonology Yearbook, 3: 255-309. Beckman, M. E. e Ayers, G. M. (1994), Guidelines for ToBI Labelling. Online MS and accompanying files available at http://www.ling.ohio-state.edu/~tobi/ame_tobi. 191 Beckman, M. E. e Hirschberg, J. (1994), The ToBI Annotation Conventions. Online MS. Available at http://www.ling.ohio-state.edu/~-tobi/anie_tobi/annotation_ conventions.html. Beckman, M. E., Hirschberg, J. B., Shattuck-Hufnagel, S. (2004), ‘The Original ToBI System and the Evolution of the ToBI Framework’, in Jun, Sun-Ah (a cura di), Prosodic Models and Transcription: Towards Prosodic Typology, Oxford University Press. Belardi W. (1959), Elementi di fonologia generale, Roma, Edizioni dell'Ateneo. Bell, A. M. (1867), Visible Speech: The Science of Universal Alphabetics, London: Simkin, Marshall & CO. Berio, L. (1981), Invervista sulla musica, a cura di Rossana Dalmonte, Roma-Bari: Laterza. Bertinetto P. M. e Magno Caldognetto E. (1993), ‘Ritmo e intonazione’, in Alberto M. Sobrero (a cura di), Introduzione all’italiano contemporaneo, vol. I: Le strutture, RomaBari: Laterza, pp. 141-192. Bien-Ming C. (1930), ‘The tone behaviour in Hagu: an experimental study’, in Archives Néerlandaises de Phonétique Expérimentale 6, 6-45. Bloomfield (1933), Language, Holt, Rinehart and Winston, Inc; trad. it. 1974, Il linguaggio. Milano: Il Saggiatore; rist. EST (1996), Bolinger D. (1947), ‘American English Intonation, (review of K. L. Pike, The Intonation of American English 1945)’, in American Speech, 22, 134-136. Bolinger D. (1951), 'Intonation: Levels Versus Configurations', in Word, 7, 199-210. Bolinger D. (1958), 'A Theory of Pitch Accent in English', in Word, 14 (1958), 109-149. Bolinger D. (1961), Generality, Gradience, and the All-or-None, Mouton: The Hague. 192 Bolinger D. L. (1949), ‘Intonation and analysis’, in Word, 248-254 Bolinger, D. (1948), ‘The intonation of accosting question’, in English Studies, 29, pp. 109114 Bolinger, D. (1972), 'Accent Is Predictable (If You're a Mind-Reader)', in Language, Vol. 48, No. 3, pp. 633-644 Bolinger, D. (1978), ‘Intonation Across Languages’, in Greenberg J. H. (a cura di), Universals of Human Language, Vol. 2, Phonology, Stanford, Stanford University Press, pp. 471-524. Botinis, A., et al. (2001), ‘Developments and paradigms in intonation research’, in Speech Communication, 33 (2001) 263-296. Boulakia, G. (2002), ‘Linguistica e fonetica: senza voce o mezza voce?’, in De Dominicis (a cura di), La voce come bene culturale, Roma: Carocci, pp. 63-85. Bühler, K. (1934), Sprachtheorie. Die Darstellungsfunktion der Sprache, Jena: Fischer; trad. it. Teoria del linguaggio. La funzione rappresentativa del linguaggio, Roma: Armando, 1983. Burke, K. (1962), A Grammar of Motives and a Rethoric of Motives, Cleveland: The Worls Publishing Co. Butler C. (1663), The english grammar, London. Cfr Chaerles Butler's Englisch grammar, ed. A. Eichler, Halle: Neymeyer, 1910. Butler, C. (1633), The English grammar, Oxford: the Author. Cage J. (1976), Per gli uccelli. Conversazioni con Daniel Charles, Milano: Multhipla. 193 Campbell, W. (1992), ‘Prosodic encoding of English speech’, in In Proceedings of the 1992 International Conference on Spoken Language Processing, 663–666. Banff, Canada. Cardona, G. R., (1981), Antropologia della scrittura, prima ed. Torino: Loescher, rist., Torino: Utet, 2009. Carnochan, J. (1962), ‘Pitch, Tone and intonation in Igbo’ in 4th International Congress of Phonetic Sciences, Mouton: the Hague, pp. 547 – 554. Chapman, J. (1818), The Music, or Melody and Rhytmus of Language. Edimburgh. Clements, G. N. (1979), ‘The Description of Terraced-Level Tone Languages’, in Language , Vol. 55, No. 3, 536-558 Clemoes, P (1952), Liturgical Influence on Punctuation in Late Old English and Early Middle English Manuscripts. Dept. of Anglo-Saxon Occasional Papers no. 1, Cambridge: Dept. of Anglo-Saxon. Clemoes, P (1952), Liturgical influence on punctuation in late Old English and early Middle English manuscript, Dept. of Anglo-Saxon Occasional Paper no. 1, Cambridge: Dept. of anglo-Saxon. Coleman, H.O. (1914), ‘Intonation and emphasis’, in Miscellanea Phonetica, I, International Phonetic Association, pp. 6-26. Cook-Gumperz, J. & Gumperz, J. (a cura di) (1976), Papers on language and context. Berkeley, University of California, Language Behavior Research Laboratory. Couper-Kuhlen, E. (1986), An introduction to english prosody, London: Edward Arnold. Cruttenden (1986), Intonation, Cambridge: Cambridge University Press. 194 Cruttenden, A. (1981), ‘Falls and rises: Meanings and universals’, in Journal of Linguistics 17, pp. 77-92. Crystal, D. (1969) Prosodic System and Intonation in English, Cambridge: Cambridge University Press. Daine, Simon (1640), Simon Daine’s Orthoepedia Anglicana, Rösler M. e Brotanek R. (a cura di), Halle: M. Niemeyer, 1908. Dalmonte, R. (1993), ‘Parole di musica e poesia’, in Id. (a cura di), in Phoné semantiké, Il Verri, 1-2 . Dalmonte, R. (2005), ‘Musica e parole’, in J.-J. Nattiez (a cura di), Enciclopedia della musica, vol IX, Einaudi: Torino, pp. 185 - 205. Danielsson, B. (a cura di), (1955) Works on English orthography and pronunciation; 1551, 1569, 1570, Stockholm: Almqvist & Wiksell. De Dominicis (2010), Intonazione. Una teoria della costituenza delle unità intonative, Roma: Carocci. De Dominicis (a cura di) (2002), La voce come bene culturale, Carocci, Roma. De Mauro T. (1965), Introduzione alla semantica, Roma, Bari: Laterza Deleuze, G. (1973), ‘À quoi reconnaît-on le structuralisme?’, in Histoire de la philosophie, Idées, Doctrines, vol. 8 - Le XXe siècle, Hachette, Parigi , pp. 299-335. tr. it. Lo strutturalismo, Milano: SE, 2004. Deutsch, D., Henthorn, T., and Lapidis, R. (2011), ‘Illusory transformation from speech to song’, in Journal of the Acoustical Society of America, 129, 2245-2252 195 Deutsch, D., Lapidis, R., and Henthorn, T. (2008), ‘The Speech-to-Song Illusion’, in Journal of the Acoustical Society of America, November, 124, 2471. Di Cristo, A. (1975), Soixante et dix ans de recherche en prosodie, Aix: éd. de l’Université de Provence. Eco, U. (1968), La struttura assente, Milano : Bompiani. Eco, U. (1975), Trattato di semiotica generale, Milano: Bompiani. Eco, U. (1997), Kant e l'ornitorinco, Milano: Bompiani. Eco, U. (2007), Dall'albero al labirinto, Milano: Bompiani. Elia, A. (1974), ‘«Filologia viva». Henry Sweet e la priorità del parlato’, in Elia A., D'Agostino E. (1974), Teorie linguistiche e glottodidattica, Bologna: Il Mulino. Ellis A. J. (1848), The ethnical alphabet, or Alphabet of nations. Being an extension of Messrs. Pitman and Ellis's English phonetic alphabet, London: F. Pitman. Ellis A. J., (1878), Speech in Song. Being the Singer's Pronouncing Primer of the Principal European Languages for Which Vocal Music Is Usually Composed. London, Novello, Ewer Publication. Fabbrichesi Leo, R. (1983), La polemica sull’iconismo, Napoli: Edizioni Scientifiche Italiane. Faure, G. (1962), ‘L’intonation et l’identification des mots dans la chaîne parlée’, in 4th International Congress of Phonetic Sciences, Mouton: the Hague, pp. 598 - 609. Fónagy I. e Bérard E. (2006), ‘Functions of Intonation’, in Yuji Kawaguchi, Ivan Fonágy, Tsunekazu Moriguchi (a cura di), Prosody and Syntax. Cross-linguistic Perspectives, Amsterdam/Philadelphia: John Benjamins Publishing Company. 196 Fónagy, I. & Magdics, K. (1960), ‘Speed of utterance in phrases of different lengths’, in Language and Speech, 3, 179-92. Fonagy, I. e Magdics, K., (1963) ‘Emotional patterns in intonation and music’, in Zeitschrift für Phonetik, 16, pp. 293–326. Fontana G. (2003), La voce in movimento, Monza: Harta Performing & Momo, [con CD]. Gensini, S. (a cura di) (1998), La varietà delle lingue, Scandicci, La Nuova Italia. Giannattasio, F. (2005), ‘Dal parlato al cantato’, in J.-J. Nattiez (a cura di), Enciclopedia della musica, vol. V, Einaudi: Torino, pp. 1003-1036 Giannini, A. Pettorino, M. (1992), La fonetica Spetimentale, Napoli: Edizioni Scientifiche Italiane. Giordano, R. (2005), ‘Analisi prosodica e trascrizione intonativa’ in InTSInt, in Albano Leoni F., Giordano R. (a cura di), Italiano Parlato. Analisi di un dialogo, Liguori, Napoli, pp. 231-256. Giordano, R. (2008), ‘Cambiamenti di prospettiva nello studio della prosodia: funzionalità e proprietà linguistiche dell’intonazione’, in Testi e linguaggi, 2 (2008): 149-162. [Studi monografici. Grammatiche a confronto, a cura di M. Voghera]. Giorgio Pasquali, ‘Prosodia’, in Enciclopedia Italiana, vol. 33, Roma: Ist. Enciclop. Italiana, p. 348. Goldman-Eisler, F. (1961), ‘The distribution of pause duration in speech’, in Language and Speech, 4, 232-7. Goldsmith, J. A. (1976a), Autosegmental Phonology, Ph. D. dissertation, Cambridge MA, MIT Press 197 Goldsmith, J. A. (1976b), 'An Overview od Autosegmental Phonology', in Linguistic Analysis, 2, 1, pp. 23-68. Goldsmith, J. A. (1990), Autosegmental and Metrical Phonology, Oxford: Blackwell. Gombrich, E. H. (1960), Art and illusion, London: Phaidon Press; trad. it Arte e Illusione. Studio sulla psicologia della rappresentazione pittorica, New York: Phaidon Press, 2002. Goodman, N. (1968), Languages of art: an approach to a theory of symbols, IndianapolisNew York: The Bobbs-Merril Inc., trad. it. I linguaggi dell'arte, ed. tascabili, Milano: Il Saggiatore SPA, 2008. Goodman, N. (1978), Ways of Worldmaking, Indianapolis: Hackett Publishing Company; trad. it Vedere e costruire il mondo, Roma-Bari: Laterza, 2008. Goodwin C. (1994), ‘Professional Vision’, American Anthropologist, 96 (3), pp. 606-633; trad. it Visioni professionali, in Goodwin C., Il senso del vedere, Roma: Meltemi, 2003, pp. 17-67. Greimas, A. J., (1983), Du sens II. Essais sémiotiques, Paris, Seuil; trad. it. Magli P. e Pozzato M. P. (a cura di), Del senso 2. Narrativa, modalità, passioni, Milano: Bompiani, 1984. Greimas, A. J., Fontanille, J., (1991), Sémiotique des passions. Des états de choses aux états d’âme, Paris, Seuil; trad. it. 1996, Semiotica delle passioni. Dagli stati di cose agli stati d’animo, a cura di F. Marsciani, I. Pezzini, Milano, Bompiani. Grice, M., Reyelt, M., Benzmuller, R., Mayer, J., E Batliner, A. (1996), 'Consistency in Transcription and Labelling of German Intonation with GToBI', in Proceedings of the 1996 International Conference on Spoken LanguageProcessing (New Castle, DE: Citation Delaware), 1716-19. 198 Grosz, B., e Hirschberg J. (1992), ‘Some intonational characteristics of discourse structure’, in Proceedings of the 1992 International Conference on Spoken Language Processing, 429–432. Banff, Canada. Gussenhoven, C. (1984), On the Grammar and Semantics of Sentence Accents (Dordrecht: Foris), Gussenhoven, C. (2004), The Phonology of Tone and Intonation, Cambridge: Cambridge University Press. Gussenhoven, Carlos (2004), The phonology of tone and intonation, Cambridge: Cambridge University Press. Halliday M. A. K. (1967), ‘Notes on Transitivity and Theme in English: Part 2’, in Journal of Linguistics, Vol. 3. No. 2, 199-244. Halliday, M. A. K. (1963), 'the tone of English', in Archivum Linguisticum, 15.1: 1-28. Halliday, M. A. K. (1979), Learning How to Mean, London: Edward Arnold. Harris, R. (1986), The Origin of Writing, London: Duckworth; trad it. L’origine della Scrittura, Viterbo: Liguori, 1998. Hart J. (1569), An Orthographie: conteyning the due order and reason, howe to write or paint thimage of mannes voice, most like to the life or nature. London: William Seres. Helmholtz, H. L. F. Von (1863), Die Lehre von den Tonempfindungen als physiologische Grundlage für die Theorie der Musik trad. en A.J.Ellis 1875, The sensation of tone as physiological basis for theory of music. New York & London: Longmans. Hirst, D. J, Di Cristo, A., Espesser, R., (2000), ‘Level of Representation and Levels of Analysis for Intonation’, in M. Horne (a cura di), Prosody: Theory and Experiment, Dordrecht: Kluwer Academic Publisher, pp. 51-87. 199 Hirst, D. J. , Espesser, R., (1993) ‘Automatic modelling of fundamental frequency using a quadratic spline function’ in Travaux de l’Institut de Phonétique d’Aix 15, 71-85. Hirst, D. J., Di Cristo, A. (1998), Intonation System: A Survey of Twenty Languages, Cambridge: Cambridge University Press. Hirst, D., J. (2005a), 'Form and function in the representation of speech prosody', in Speech Communication, Vol. 46, 3-4, pp. 334-347. Hirst, D., J. (2005b), ‘Phonetic and Phonological Annotation of Speech Prosody’, in R. Savy, C. Crocco (a cura di), Analisi prosodica. Teorie, modelli e sistemi di annotazione. Atti del secondo convegno AISV-Associazione Italiana di Scienze della Voce, Torriana: EDK, pp. 33-42. Hjelmelsv, L. (1988), Saggi linguistici, vol. 1, a cura di Romeo Galassi, Milano: Unicopli. Hjelmslev (1938) ‘Über die Beziehungen der Phonetik zur Sprachwissenschaft’, in Archiv für vergleichende Phonetik, II, pp. 97-109 e 212-22; tr. it ‘I rapporti della fonetica con la linguistica’ in Hjelmslev, 1991, pp. 217-32. Hjelmslev L. (1936), ‘On the Principles of Phonematics’, in Proceedings of the Second International Congress of Phonetics Sciences, University College, London, 22-26 July 1935, Jones D. Fry D. B. (a cura di) Cambridge: University press, pp. 49-54; trad. it, ‘Sui Principi della fonematica’, in Hjelmslev, 1991, Saggi linguistici, vol. 2, pp. 211-6. Hjelmslev, L. (1943), Omkring sprogteoriens grundlæggelse, København: Munksgaard, trad.it, I fondamenti della teoria del linguaggio, Torino: Einaudi, 1968. Hjelmslev, L. (1947), ‘The Basic Structure of Language’, in Travaux du Cercle Linguistique de Copenhague, XIV, 1973, pp. 119-53; trad it. ‘La struttura fondamentale del linguaggio, in Hjelmslev 1988, pp. 154-96. 200 Hjelmslev, L. (1963), Sproget. En introduktion, Charlottenlund: The Nature Method Center; trad. it Il linguaggio, Torino: Einaudi, 1970. Hjelmslev, L. (1991), Saggi linguistici, vol. 2, a cura di Romeo Galassi, Milano: Unicopli. Hockett, C. F. (1955), A manual of phonology. Indiana University Pubs. In Anthropology and Linguistic Memoir 11 of International Journal of American Linguistics (Baltimore: Waverley Press). Hockett, Charles F. (1942), ‘A system of descriptive phonology’, in Language, vol. 18(1), pp. 3-21. Howatt, A.P.R. (1994), ‘Palmer, Harold Edward (1877—1949)’, in Asher, R.E. (ed.), Encyclopedia of Language and Linguistics, Vol. 6, Oxford, Pergamon, 2915. Hultzén, L. S (1939), ‘Seventeenth-century intonation’, in American Speech, 14, pp. 39-43. Hultzén, L. S. (1962), ‘Significant and Nonsignificant in Intonation’, in 4th International Congress of Phonetic Sciences, Mouton: the Hague, pp. 658 – 661. Isačenko, A. V. e Scädlich H. J. (1970), A Model of Standard German Intonation, Den Haag: Moutib. Jakobson R. (1963), Essais de linguistique générale, Vol. I: Les fondations du langage, Paris, Editions de Minuit; trad. it. Saggi di linguistica generale, Milano: Feltrinelli, 1966. Jakobson, R. (1959), ‘Linguistic Aspect on Transaltion’, in Brower R. A. (a cura di) On translation, Harvard University Press, pp. 232-39; trad. it., ‘Aspetti linguistici della traduzione’, in Saggi di linguistica generale, prima ed. 1966, Milano: Feltrinelli, 2002, pp. 56-64. 201 Jakobson, R. (1960), ‘Closing statement: linguistics and poetics’, in Sebeok T. A. (a cura di) Style in language, atti della Conference on Style, Indiana University 1958, Cambridge: MIT Press., pp. 350-377, rist. Linguistique et poétique, in Essais de linguistique générale, Paris: Édition de Minuit, 1963, pp. 209-248, trad. it., ‘Linguistica e poetica’, in Saggi di linguistica generale, prima ed. 1966, Milano: Feltrinelli, 2002, pp. 181-218. Jakobson, R. (1966), ‘Henry Sweet's Paths Toward Phonemics’, in Jakobson (1971) Selected Writings, vol. 2. Paris: The Hague. Jakobson, R. (1976), Six leçons sur le son et le sens, Paris: Minuit; Trad.it 1978, La linguistica e le scienze dell'uomo, Milano: Saggiatore. Jespersen O. (1904), Lehrbuch der Phonetik, Leipzig, Berlin: B.G. Teubner. Jespersen, O (1933), ‘Notes in metre’, in Linguistica, Copenaghen, Levin & Munksgaard. Jones, D (1909b), The pronunciation of English, Cambridge: Cambridge University Press Jones, D (1922), An Outline of English Phonetics, New York: G. E. Stechert & Co. Jones, D (1938), ‘Concrete and Abstract Sounds’, in Proceedings of the Third International Congress of Phonetic Sciences, Ghent. Jones, D. (1909a), Intonational Curves, Teubner: Leipzig. Jones, D. (1944), ‘Some Thoughts on the Phoneme’, in Transactions of the Philological Society, 43, vol.1, 119-135. Jones, D. (1950), The phoneme. Its Nature and Use, Cambridge, Heffer & Son. (3nd edition Cambridge: Cambridge University Press, 1967) Jones, D.(1931), ‘On phoneme’, in Travaux du Cercle Linguistique de Prague, 4, 74-79. 202 Joos, Martin (1950), ‘Description of language design’, in Journal of the Acoustical Society of America, vol. 22(6), pp. 701-707. Karcevskyi, S. (1931), ‘Sur la phonologie de la phrase’, in Travaux du Cercle Linguistique de Prague, 4, pp 188-227. Károlyi, O. (1969), La grammatica della musica. La teoria, le forme e gli strumenti musicali, Torino: Giulio Einaudi Editore. Kassler, J. C. (2005), ‘Representing speech through musical notation’, in Journal of Musicological Research (24), 227-239. Klatt, D. (1987), 'Review of text-to-speech conversion for English', in Journal of the Acoustical Society of America, 82:737-793. Klinghardt, H. e De Fourmestraux, M. (1923), French intonation exercises, translated and adapted for English Readers by Barker M. L., Cambridge: Heffer. Klinghardt, H., Klemm, G. (1920), Übungen im englischen Tonfall, für Lehrer und Studierende, Cöthen: Schulze. Ladd R. (1996), Intonational phonology, Cambridge, Cambridge University Press. Ladd, D. R. (1980), The Structure of Intonational Meaning: Evidence from English, Bloomington, IN: Indiana University Press. Ladd, D.R. e Silverman K.E.A. (1984), ‘Vowel intrinsic pitch in connected speech’, in Phonetica, 41,31-40. Latour, B. (1987), Science in Action. How to Follow Scientists and Engineers Through Society, Cambridge Mass.: Harvard University Press; trad. it La scienza in azione. Introduzione alla sociologia della scienza, Torino: Edizioni di Comunità, 1998. 203 Lehiste, I. (1970), Suprasegmentals, Cambridge: MIT Press. Léon, P., Martin, Ph (1970), Prolègomènes a l’étude des structures intonatives, Studia Phonetica, Ottawa: Marcel Didier. Lepschy, G. (1966), La linguistica strutturale, Torino, Einaudi. Levis J. e Pickering L. (2004), ‘Teaching intonation in discourse using speech visualization technology’, in System, vol. 32, (4), pp. 505-524. Liberman, M. e Prince A. (1977), ‘On Stress and Linguistic Rhythm’, in Linguistic Inquiry, 8, 249-336. Lieberman P., Sawashima M., Harris K. S. e Gay T. (1970), ‘The Articulatory Implementation of the Breath-Group and Prominence: Crico-Thyroid Muscular Activity’, Language, Vol. 46, No. 2, pp. 312-327. Lieberman, P. (1967), Intonation, perception, and language, M.I.T. Research Monograph. Lombardi Vallauri E. (2002), La struttura informativa dell'enunciato, La Nuova Italia. Lombardi Vallauri, E. (2009), La struttura informativa, Forma e funzione negli enunciati linguistici, Roma, Carocci. Lucidi M. (1966) Saggi linguistici, Roma, Scuola grafica Don Bosco Lucidi, M. (1950), ‘L’equivoco de «L’arbitraire du signe». L’iposema’, in Cultura neolatina, 10, pp. 185-208; ora in Lucidi, M., Saggi linguistici, Napoli: Istituto Universitario Orientale di Napoli, 1966. MacMahon M. K. C. (2007), ‘Using Phonetics in a New Musical Notation: Henry Sweet’ s manuscript notes of 1904 and 1908’, in Henry Sweet Society Bulletin, Issue No. 48. 204 Magno Caldognetto E. e Poggi I. (2004), ‘Il parlato emotivo. Aspetti cognitivi, linguistici e fonetici’, in Albano Leoni F., Cutugno F., Pettorino M. e Savy R.(a cura di), Atti del convegno “Italiano parlato”, Napoli 14-15 febbraio 2003, Cd-rom, Napoli, D’Auria Editore. Magno Caldognetto, E. (2002), ‘I correlati fonetici delle emozioni, in Bazzanella C. e Kobau P. (a cura di) Passioni, emozioni, affetti, pp. 197-213. Milano: McGraw-Hill. Magno Caldognetto, E. e Poggi, I. (2001), ‘Dall’analisi della multimodalità quotidiana alla costruzione di Agenti Animati con Facce Parlanti ed Espressive’ in Magno Caldognetto E. e Cosi P. (a cura di) Multimodalità e Multimedialità nella comunicazione. Atti delle XI Giornate di Studio del GFS, pp.47-55, Padova: Unipress. Magno Caldognetto, E., Cavicchio F. e Cosi P. (a cura di) (2008) Comunicazione parlata e manifestazione delle emozioni. Atti del I convegno del Gruppo di Studio sulla Comunicazione Parlata (Padova, 29 novembre-1° dicembre 2004), Napoli: Liguori (ebook). Malberg, B. (1983), Analyse du langage au XX siècle. Théories et méthodes, Paris, Presses Universitaires de France; trad. it L’analisi del linguaggio nel XX secolo, Bologna: il Mulino 1985. Maldonado, T. (1974), Avanguardia e razionalità: articoli, saggi pamphlets, 1946-1974. Torino: Einaudi. Mancini, G. (1777), Pensieri e riflessioni pratiche sul canto figurato, terza edizione: Milano, Giuseppe Galeazzi. Ristampa anastatica, Bologna: Arnaldo Forni Editore, 1996. Mari N. e Schindler O., (1974) Colloquio fra canto e foniatria, Padova, Zanibon. Marotta G. (2003), ‘L’illusione prosodica’, in Id. (a cura di), Studi e saggi linguistici, supplemento a “L’Italia dialettale”, XLI, pp. 237-58. 205 Marotta G. (2010), ‘Sulla (presunta) morte del fonema’, in Studi e Saggi Linguistici, XLVIII, pp. 283-304. Martin, Ph. (2009), Inronation du français, Paris: Armond Colin. Martinet, A. (1960), Eléments de linguistique générale, Paris: Colin; trad. it. Elementi di linguistica generale, Bari: Laterza, 1971. Mayo, C., Aylett, M., Ladd, D. R. (1997), ‘Prosodic transcription of glasgow English: an evaluation study of glatobi’, in INT-1997, 231-234. Monboddo, J. Burnett (1774), Origin and progress of language, vol. II, Edimburgh: printed for J. Balfour. Nespor M. (1993), Fonologia, Bologna: il Mulino Nespor M. e Vogel I. (2007), Prosodic Phonology, Berlin: Mouton De Gruyter. Nyqvist, A. (1962), ‘Stress, Intonation, Accent, Prominence in Disyllabic Double-stress Compounds in Educated Southern English’ in 4th International Congress of Phonetic Sciences, Mouton: the Hague, pp. 710 – 713. O’ Connor, J. D. e Arnold, G.F. (1961), Intonation of colloquial English, London: Longman. Ochs E.e Schieffelin B. B. (1989), ‘Language Has a Heart’, Text, 9(1), pp. 7-25. Odell, J. M. (1806), An Essay on the Elements, Accents, and Prosody, Cambridge. Ohala, J. J., Hirano, M. (1967), ‘An experimental investigation of pitch change in speech (abstract)’, Journal of the Acoustical Society of America, 42, pp. 1208-1209. 206 Omond, T. S. (1921), English Metrists. London, New York e Toronto: Oxford University Press. Pagliaro A. (1957), La parola e l'immagine, Napoli, Edizioni Scientifiche Italiane. Pagliaro, A. e De Mauro, T. (1973), La forma linguistica, Milano: Rizzoli. Palmer, H. (1922), English intonation with systematic exercise, Cambridge: W. Effer & Sons LTD. Palmer, H.E. (1917), The Scientific Study and Teaching of Languages. A review of the factors and problems connected with the learning and teaching of modern languages with an analysis of the various methods which may be adopted in order to attain satisfactory results, Yonkers on Hudson, New York: World Book Company. Passy P. (1887), Les sons du français: leur formation, leur combinaison, leur représentation. Paris: Firmin-Didot; trad. eng D. L. Savory e D. Jones The sounds of the French language, their formation, combination and representation, Oxford, Clarendon, 1907. Pettorino, M., Giannini, A. (1997), ‘Il discorso politico: una questione di stile’, in Atti delle VI Giornate di Studio del GFS, Napoli. Pierrehumbert J. (1980), The phonetics and phonology of English intonation, PhD Thesis, MIT. Pierrehumbert J. e Beckman M. (1988), Japanese tone structure, Cambridge MA, MIT Press. Pierrehumbert, J. (2000), ‘Tonal elements and their alignment’, in M. Horne (a cura di) Prosody: Theory and Experiment. Studies Presented to Gosta Bruce. Kluwer, Dordrecht, 11-26 207 Pierson (1884), La métrique naturelle du langage, Paris: Vieveg. Pike, K. L. (1945), The Intonation of American English. Ann Arbor: The University of Michigan Press. Piston, W. (1941), Harmony, New York: Norton & Company. Poggi I., Magno Caldognetto E. (2004), ‘Il parlato emotivo. Aspetti cognitivi, linguistici e fonetici’ in F. Albano Leoni, F. Cutugno, M. Pettorino, R. Savy. (a cura di), Atti del Convegno “Italiano parlato” (Napoli 14-15 febbraio 2003), Napoli: D’Auria Editore, CDRom. Poggi, I. e Magno Caldognetto, E. (1997), Mani che parlano. Gesti e psicologia della comunicazione, Padova: Unipress. Poggi, I. e Pelachaud, C. (2000), ‘Performative Facial Expressions in Animated Faces’, in J. Cassell, J. Sullivan, S. Prevost, e E. Churchill (a cura di), Embodied Conversational Agents, pp 155-188. Cambridge, Mass.: The MIT Press. Price, P., Ostendorf, M., Shattuck-Hufnagel, S., e Fong, C. (1991), 'The Use of Prosody in Syntactic Disambiguation', in Journal of the Acoustic Society of America, 90: 2956-70. Prieto L. J. (1975), Pertinence et pratique. Essai de sémiologie, Paris: Édition de Minuit; trad it. Pertinenza e pratica, Milano: Feltrinelli, 1976. Pulgram E. (1951), ‘Phoneme and Grapheme: A Parallel’, in Word, 7, pp. 15-20. Puttenham, George (1589) The Arte of English Poesie, in Edward A. (a cura di), Westminster A: Constable and Company, 1895, Rastier F. (2007), ‘Semantica interpretativa. Dalle forme semantiche alla testualità’, in Paolucci C. (a cura di), Studi di semiotica interpretativa, Milano, Bompiani. 208 Reinhold Petersen, N. (1986), ‘Perceptual compensation for segmentally conditioned fundamental frequency perturbation’, in Phonetica, 43, 31-42. Richard Roe, A. B. (1823), The principles of Rhythm both in speech and music; especially as exhibited in the mechanism of English verse. Dublin: Graisberry. Ripman W. (1922), Good Speech. An introduction to english phonetic, New York: E. P. Dutton & Co. Roe, R. (1823), The Principles of Rhythm, both in Speech and Music; Especially as exhibited in the Mechanism of English Verse, Dublin, R. Gainsberry. Romportl, M. (1962), ‘Zum Wesen der intonation’ in 4th International Congress of Phonetic Sciences, Mouton: the Hague, pp. 749 – 752 Rossi, Mario (1997), ‘Intonation: past, present, future’, In INT-1997, 1-10. Rush, James (1827), The Philosophy of the Human Voice: Embracing Its Physiological History; Together with a System of Principles by Which Criticism in the Art of Elocution May Be Rendered Intelligible, and Instruction, Definite and Comprehensive. To Which Is Added A Brief Analysis of Song and Recitative. Philadelphia: Printed by J. Maxwell, 1827. Print. Russell J. A. e Barrett L. F. (1999), ‘Core Affect, Prototypical Emotional Episodes, and Other Things Called Emotions: Dissecting the Elephant’, in Journal of Personality and Social Psychology, 1999, Vol. 76, no. 5, 805-819. Sapir E. (1922), ‘The Takelma language of Southwestern Oregon’, in Boas, F. Handbook of American Indian Languages, Pt. 2, Smithsonian Institute, Bureau of American Ethnology Bulletin 40, 1-296. 209 Saussure, F. de (1916) Cours de linguistique générale, seconda ed. 1922, Paris: Payot, trad. e cura di Tullio De Mauro, Corso di linguistica generale, prima ed. 1967, Roma-Bari: Laterza, 2005. Saussure, F. de (1916), Cours de linguistiche générale, Paris, Payot; trad. it. Corso di Linguistica generale, 2° ed., introduzione, traduzione e commento di T. De Mauro, Bari: Laterza, 1968. Savastano E., Giannini A., Pettorino M. (1995), ‘Aspetti prosodici del parlato dei politici’, in AIA Atti del XXIII Convegno Nazionale, 171-176, Bologna. Scherer, K. R., Johnstone, T. & Klasmeyer, G. (2003), ‘Vocal expression of emotion’ in R. J. Davidson, K. R. Scherer , H. Goldsmith (a cura di), Handbook of the Affective Sciences' ( 433–456). New York and Oxford: Oxford University Press. Selkirk E. (1984), Phonology and sintax. The relation between sound and structure, Cambridge, Mass., M.I.T. Press. Selkirk, E. (1978), On prosodic structre and its relation to syntactic structure. Bloomington, Indiana University Press. Selkirk, E. (1986), ‘On derived domains in sentence phonology’, in Phonology Yearbook 3, 371-405. Sherer K. R. (2003), ‘Vocal communication of emotion: a review of research paradigms’, in Speech communication, 40 (1-2), pp. 227-256. Sheridan, T. (1796), A course of lectures on elocution, London. Sievers (1901), Grundzüge der phonetik zur einführung in das studium der lautlehre der indogermanischen sprachen, Leipzig, Breitkopf & Härtel. 210 Sievers, E. (1876), Grundzüge der Lautphysiologie zur Einführung in das Studium der Lautlehre der indogermanischen Sprachen, Lipsia, Breitkopf & Härtel. Silverman K. (1993), ‘Assessing the contribution of prosody to speech synthesis in the context of an application’, Proceedings of the ESCA Workshop on Prosody, Lund University. Silverman, K. E. A., M. Beckman, J. F. Pitrelli, M. Ostendorf, C. Wightman, P. Price, J. Pierrehumbert, e J. Hirschberg. (1992), ‘TOBI: A standard for Labeling English Prosody’ in Proceedings of the 1992 International Conference on Spoken Language Processing, Vol. 2, 867-870. Banff, Canada. Smith, R. (2011), ‘Harold E. Palmer’s alternative ‘applied linguistics’’, in Histoire Épistémologie Langage, Vol. 33, 1, pp. 53-67. Sorianello, P. (2006), Prosodia. Modelli e ricerca empirica, Roma, Carocci. Sornicola R. (2013), ‘Abbiamo bisogno di una linguistica delle emozioni?’, in Tempesta, I., Vedovelli, M. (a cura di), Di linguistica e sociolinguistica. Studi offerti a Norbert Dittmar, Roma, Bulzoni, pp. 49-76. Sproat R., Ostendorf M. e Hunt A. (1999), ‘The need for increased speech synthesis research’, Report of the 1998 NSF Workshop for discussing research priorities and evaluation strategies in speech synthesis. Steele J. (1775), En essay toward establishing the Melody and Measure of speech, to be expressed and perpetuated by peculiar symbol, printed by W. Bowyer and J. Nichols. Steele, J. (1779), Prosodia rationalis. Stern, H.H. (1983), Fundamental Concepts of Language Teaching, Oxford: Oxford University Press. 211 Stockwell Robert P., Bowen J. Donald and Silva-Fuenzalida I. (1956), ‘Spanish Juncture and Intonation’, in Language, vol. 32, no. 4, pp. 641-665. Linguistic Society of America. Sweet H. (1878), ‘English and Germanic Philology’, in Transactions of the Philological Society 1877-9; poi in Sweet H., Collected Papers, 95-140 Oxford: The Clarendon press, 1913. Sweet H. (1890b), A primer of Spoken English, Oxford: The Clarendon press. Sweet H. (1892), A manual of current shorthand, orthographic and phonetic, Oxford: The Clarendon press. Sweet H. (1893), A primer of historical english grammar. Oxford: The Clarendon press. Sweet H. (1913), Collected Papers, Oxford, The Clarendon press. Sweet, H. (1874), History of English sound from the Earliest Period, Including an Investigation of the General Law of Sound Change, and Full Word Lists, London,Trübner & Co. (2nd ed. Oxford: The Clarendon press, 1888). Sweet, H. (1876), 'Word, logic, and grammar', in Transactions of the Philological Society, 1875-6, pp. 470-503; in Sweet H., Collected Papers, 80-94 Oxford: The Clarendon press, 1913. Sweet, H. (1877a), Handbook of phonetics, Oxford, Clarendon Press. Sweet, H. (1877b), ‘Presidential address on English Philology and Phonology’ in Transactions of the Philological Society 1877-9, 1-16; poi in Sweet H. (1913) Collected Papers, 80-94 Oxford: The Clarendon press. Sweet, H. (1877c), 'Language and Thought', The Journal of the Anthropological Institute of Great Britain and Ireland, Vol. 6, pp. 457-482. 212 Sweet, H. (1880), ‘Sound Notation’, in Transactions of philological Society, 1880-1, 177235; poi in Sweet H. Collected Papers, 285-243 Oxford: The Clarendon press, 1913. Sweet, H. (1890a), A primer of phonetics, Oxford: The Clarendon press. Sweet, H. (1900), The pratical study of languages, New York: Henry Hold and company. 't Hart J., Collier R., Cohen A. (1990), A perceptual study of intonation: an experimentalphonetic approach to speech melody, Cambridge: Cambridge University Press. 't Hart, J. e Collier R. (1975), ‘Integrating different levels of intonation analysis’ in Journal of Phonetics, 3, p. 235-255. Trager, G. L. & Smith, H. L. Jr. (1951), An outline of English structure, Studies in Linguistics, Occasional Papers, 3. (Washington, American Council of Learned Society; Norman, Okla, Battemburg Press). Trubeckoj, N. (1939), Grundzüge der Phonologie, Prague, Travaux du Cercle Linguistique De Prague, VII; trad. it. Fondamenti di fonologia, Torino: Einaudi, 1971. Twaddel, W. F. (1935), ‘On defining the phoneme’, in Language Monograph, XVI, Baltimore: Waverly Press. Uhmann, S. (1992), ‘Contextualizing relevance: On some forms and functions of speech rate changes in everyday conversation’, in Auer, P., Di Luzio, A. (a cura di) The Contextualization of Language, Amsterdam: Benjamins, 297-336. van Fraassen, B. C (1980), The Scientific Image, Oxford: Oxford University Press; trad. it. l’immagine scientifica, Bologna: Editrice Clueb, 1985. Vasco, V. (2012), “Tu chiamale se vuoi emozioni”. Espressione e riconoscimento degli stati d’animo nel parlato, Tesi di dottorato, Roma «La Sapienza». 213 Venditti, J. J. (1997), 'Japanese ToBI Labelling Guidelines', in Ohio State University Working Papers in Linguistics, 50: 62-72. Vladimir, A. (1962), ‘Tone and intonation’, in 4th International Congress of Phonetic Sciences, Mouton: the Hague, pp. 403 – 406. Volli, U. (1974), ‘Some possible developments of the concept of iconism’, in Versus , 2, pp. 14–30. Volli, U. (1975), ‘Analisi Semiotica della comunicazione iconica’, in Ikon , 95, p.p 159186 Wells, R. S. (1945), ‘The Pitch Phonemes of English, in Language, Vol. 21, n° 1, pp. 2739. Wells, R. S. (1947), ‘The Intonation of American English by Kenneth L. Pike’, in Language, Vol. 23, n°3, pp. 255-273. Wightman, C. W., Shattuck-Hufnagel, S., Ostendorf, M., e Price, P. J. (1992), 'Segmental Durations in the Vicinity of Prosodic Phrase Boundaries', in Journal of the Acoustical Society of America, 91: 1707-17. Wodarz, H. W. (1962), ‘Über syntaktische und expressive Relevanz der Intonation’, in 4th International Congress of Phonetic Sciences, Mouton: the Hague, pp. 800 – 804. 214