!
!
!
Dottorato!di!ricerca!in!Filologia,!linguistica!e!letteratura!
!
!XXV!ciclo!
La#trascrizione#dell'intonazione.#
La#notazione#come#sistema#di#rappresentazione#del#sapere#linguistico#
Relatori:!
!
!
!
!
!
!
!
!
Prof.!Federico!Albano!Leoni!! !
!
!
!
!
!!!!!!!!!!!Matteo!Servilio!
Prof.ssa!Isabella!Chiari!
!
!
!
Anno!Accademico!!
2013/2014!
!
Tesi!di:!
Indice:
Introduzione
3
Cap. 1:
La rappresentazione linguistica dell’intonazione
7
QUESTIONI PRELIMINARI
7
1
1.1 Una breve storia / 1.2 Specificazioni terminologiche
2
L’INTONAZIONE E I CONFINI DELLA LINGUA
18
2.1 Il significante linguistico dell’intonazione / 2.2 Il significato linguistico
dell’intonazione / 2.3 Il caso delle emozioni
3
IL PROBLEMA DELLA RAPPRESENTAZIONE
35
La Musica delle Parole
47
1
MUSICA E INTONAZIONE
47
2
JOSHUA STEELE E LA MELODIA DELLA VOCE
51
Cap. 2:
2.1 Prosodia Rationalis / 2.2 Il pentagramma come organizzazione dello
spazio sonoro / 2.3 La dimensione temporale e ritmica del parlato / 2.4
Armonia della voce
3
HENRY SWEET E “IL SUONO DELLA LINGUA”
73
3.1 Suono e senso / 3.2 Fonetica e didattica delle lingue / 3.3 La scrittura
fonetica come dispositivo modellizzante / 3.4 La rappresentazione
dell’intonazione e dei tratti prosodici / 3.5 Intervalli di tono e variazioni
globali / 3.6 Tono, intensità e durata. Il sistema prosodico di Sweet
4
Cap. 3:
1
DANIEL JONES “LA MUSICA DELLA PAROLA”
88
L’intonazione della lingua tra forma e significato
103
HAROLD PALMER E L’INTONAZIONE COME SISTEMA
103
2
IL RUOLO DELLA SILLABA NELLA RAPPRESENTAZIONE DELL’INTONAZIONE
107
3
L’INDIVIDUAZIONE DELL’UNITÀ INTONATIVA
111
3.1 Divisione Fisiologica / 3.2 La divisione in Sense-group / 3.3 L’approccio
fonetico - fonologico
4
Cap. 4:
1
LA STRUTTURA INTERNA DELL’UNITÀ INTONATIVA
118
L’intonazione tra fonetica e fonologia
129
IL MODELLO A LIVELLI DELLO STRUTTURALISMO AMERICANO
129
1.1 Level vs Configuration / 1.2 Verso una fonologia dell’intonazione
2
IL MODELLO DI TRASCRIZIONE TOBI
147
2.1 Alle origini di ToBI / 2.2 Gli antecedenti di ToBI /2.3 La trascrizione nel
sistema di notazione ToBI / 2.4 principi guida per la selezione
dell’informazione / 2.5 Rappresentazione del livello tonale
3
IL MODELLO IPO. DALLA PARTE DELL'ASCOLTATORE
166
4
IL SISTEMA DI ANNOTAZIONE INTSINT
175
4.1 La rappresentazione dei toni nel sistema InTSInt / 4.2 Tra forma e
funzione della prosodia
Conclusioni
185
Bibliografia
190
2
Introduzione
"L’idea che nel parlare selezioniamo singole consonanti e vocali, che in qualche modo
spuntano nella nostra bocca allineate nell’ordine giusto, come perline su un filo, non è altro
che l’immagine dell’ortografia alfabetica proiettata all’indietro sulla produzione orale"
(Harris 1986 [1998], pp. 47-48).
In queste poche righe, tratte dal famoso testo di Roy Harris sull'origine della scrittura, è
condensato lo spirito che ha stimolato e guidato il presente lavoro di tesi. Nel passaggio dal
suono al segno grafico si insinuano infatti una rete di questioni di ordine teorico generale
che affondano le radici nelle nozioni di segno, di scrittura, di traduzione intersemiotica e
rappresentazione. Quest'ultima è di fatto un problema che ricorre in numerose forme nella
linguistica teorica del ventesimo secolo e non solo: da un lato vi è la 'rappresentazione' che
gli scienziati della lingua hanno realizzato del proprio oggetto di indagine, dall'altro vi è la
relazione tra questa 'immagine' e la 'rappresentazione' che è invece propria dei parlanti.
L'ipotesi di Harris vede ad esempio il modello alfabetico sovrapporsi a quello scientifico
ponendosi come principale motore interpretativo:
"[…] non vi è dubbio che sia stato l'alfabeto a offrire ai teorici del linguaggio il
modello più a portata di mano di come il problema della rappresentazione dovrebbe
essere affrontato […]. Un alfabeto "ideale" sarebbe un'esemplificazione di tale
corrispondenza, almeno in relazione alla pronuncia del linguaggio; ma analoghi
"alfabeti" possono facilmente essere costruiti per altri livelli linguistici, sempre
basandosi su tale modello" (Harris 1986 [1998], p. 45).
Una delle risposte più comuni riguardo a questo tipo di posizione è quella che vede
nell'alfabeto la più ovvia conseguenza di una 'rappresentazione' già presente nella mente dei
3
parlanti. L'ortografia alfabetica altro non sarebbe che la proiezione dell'immagine che gli
stessi parlanti hanno inconsciamente della lingua. Se questo dibattito è quantomeno
possibile nell'ambito del rapporto tra lingua scritta e parlata, cosa dire dell'intonazione?
Rimanendo in questi termini possiamo dire ad esempio che le più tradizionali forme di
scrittura hanno espunto quasi del tutto tale dimensione dalla loro rappresentazione. Se
accettassimo acriticamente l'idea della scrittura come proiezione fedele della lingua da parte
dei parlanti, dovremmo ammettere che, per questi ultimi, fenomeni quali accento e
intonazione, nel discorso orale sarebbero quantomeno marginali, rimanendo confinati nella
punteggiatura.
Da un altro punto di vista, che è quello che si è scelto di seguire, il trattamento
dell'intonazione nell'ambito linguistico, e in particolare la sua trascrizione o annotazione
grafica, manifesta in maniera ancora più evidente questo tipo di problematiche. Quale
informazione deve esser codificata in termini notazionali per poter analizzare
linguisticamente l'intonazione? Quale rapporto viene stabilito tra l'immagine scientifica
degli andamenti intonativi e l'effettivo uso che i parlanti fanno della lingua?
Da un punto di vista strettamente teorico non credo sia possibile giungere a una risposta
definitiva. Quello che sembra emergere invece dall’analisi di testi e approcci al problema è
una grande varietà di prospettive sullo stesso oggetto, prospettive che si traducono appunto
in diverse ‘rappresentazioni’.
La tesi consiste dunque in un’analisi diacronica dei principali sistemi di annotazione
utilizzati nell’ambito degli studi linguistici. La scelta di una prospettiva temporale ha avuto
due ragioni fondamentali: prima di tutto la necessità di collocare quanto più fedelmente
possibile gli autori e le teorie nei loro contesti originari e in seconda istanza, l’esigenza di
mettere in evidenza i principali sviluppi al problema.
In particolare il percorso tracciato in questo lavoro ha inizio con i sistemi di
rappresentazione elaborati prima del novecento, per poi guardare gli studi del novecento
con particolare riferimento alla scuola britannica e a quella dello strutturalismo americano,
4
sino agli ultimi modelli tuttora in uso.
Il primo capitolo, intitolato La rappresentazione dell’intonazione, affronta le questioni più
strettamente teoriche che riguardano i processi di rappresentazione. Verranno messi in luce
alcuni dei problemi riguardanti l’organizzazione del significante e del significato
intonativo, problemi da cui dipendono molte delle scelte teoriche che hanno determinato
l’inclusione o l’esclusione degli andamenti melodici dal dominio della lingua.
Il secondo capitolo, dal titolo La musica delle parole, prende spunto dalle evidenti
assonanze tra i fenomeni intonativi linguistici e musicali. Tono, durata, intensità ad
esempio costituiscono i parametri descrittivi su cui lavorano i due sistemi. Sarà proprio
questa vicinanza ad ispirare i primi lavori organici in tema di intonazione linguistica.
Johsua Steele (1775), ad esempio, si servirà di un modello notazionale preso in prestito
dalla partitura musicale per mettere in piedi un vero e proprio sistema di trascrizione e
analisi dei diversi livelli prosodici. In maniera non dissimile Daniel Jones si servirà nei
primi del 900 di sistemi di trascrizioni ispirati al modello musicale per la descrizione dei
movimenti tonali della lingua.
Nel terzo capitolo, dal titolo L’intonazione della lingua tra forma e significato, sono stati
invece presentati i principali lavori della scuola britannica. Lo sviluppo della disciplina in
questi anni porta alla luce alcuni dei problemi che si rincorreranno sino ai giorni nostri: il
rapporto tra suono e senso, il rapporto tra la forma dell’intonazione e le funzioni
linguistiche associate, la struttura del significante intonativo. Al contempo si assiste ad una
prima scomposizione del contorno: quest’ultimo sarà suddiviso funzionalmente in classi
astratte, determinate e determinabili mediante l’andamento tonale delle sillabe prominenti.
Tale astrazione conduce a individuare come pertinenti, e quindi graficamente trascrivibili, i
valori relativi della F0 occorrenti su ciascuna sillaba dell’enunciato e a definire
formalmente la funzione dell’enunciato sulla base del tono nucleare.
5
Nel quarto capitolo, L’intonazione tra fonetica e fonologia, sono stati infine presentati i
lavori e gli approcci più moderni. L’analisi linguistica dell’intonazione e la sua
corrispettiva rappresentazione grafica, trova nello strutturalismo americano un interessante
terreno di sviluppo. Studiosi come Pike, Bloomfield, Harris hanno affrontato il fenomeno
dell’intonazione cercando di trasferire su di esso alcuni dei principi che avevano portato
allo sviluppo dell’allora giovane fonologia. Il terreno di discussione sarà così incentrato
soprattutto sul tentativo teorico e pratico di trattare fonologicamente il tono nelle lingue
intonazionali. Su questa linea si assisterà negli anni ‘80 allo sviluppo della teoria
autosegmentale-metrica che condurrà negli anni ’90 all’elaborazione di ToBI (Tones and
break indices), il modello maggiormente utilizzato per la trascrizione dell’intonazione.
Negli stessi anni, in altri contesti culturali, in particolare Olanda e Francia, verranno alla
luce nuovi tentativi di descrizione dell’intonazione. Il primo, presentato nel volume di
Johan 't Hart, Rene Collier e Antonie Cohen (1990), è il risultato dell’équipe olandese
dell’IPO (Institute for User-System interaction di Eindhoven). Si tratta di un approccio di
tipo percettivo che si è posto come alternativa rispetto alla scuola americana dell’approccio
per livelli, e alla scuola inglese dell’approccio per configurazioni. Il secondo, denominato
InTSInt (International Trascription System for Intonation) è il risultato del lavoro di
Daniel Hirst e Albert Di Cristo (1998) e si basa su un metodo notazionale di tipo
fonetico.
6
Cap. 1:
La rappresentazione linguistica
dell’intonazione
1
Questioni preliminari
1.1
Una breve storia
Lo studio linguistico dell’intonazione nell’ambito delle scienze del linguaggio è piuttosto
recente. Se si escludono casi isolati, seppur di grande interesse storiografico, è possibile
segnalare una svolta decisiva in termini, soprattutto quantitativi, intorno alla metà degli
anni 60’ (Mario Rossi 1998). Anche i luoghi, gli sfondi teorici e gli ambiti di interesse
rendono il tema piuttosto variegato1.
Un modo indicativo per constatare il livello di interesse nei confronti dei fenomeni
intonativi delle lingue è quello di guardare gli interventi presentati al Congresso
Internazionale di Scienze fonetiche (ICPhS) che dal 1934 2 si tiene circa ogni tre anni. Nel
terzo incontro, organizzato a Ghent nel 1938, ad esempio, gli interventi dedicati alla
prosodia e in particolare all’intonazione furono solo tre 3 ; a Helsinki, nel corso del 4°
congresso del 1961, furono sette gli interventi dedicati al tema dell’intonazione 4; tre anni
1
2
3
4
Ricche bibliografie sull’argomento sono contenute nei lavori di Crystal (1969), Léon e Martin (1979), Di
Cristo (1975), Couper-Kuhlen (1986), Cruttenden (1986), Ladd (1996), Hirst e di Cristo (2000), Botinis et
al (2001), Nespor e Vogel (2007), Martin (2009). In lingua italiana sono disponibili i recenti lavori di
Sorianello (2006) e De Dominicis (2010).
Il primo incontro si tenne ad Amsterdam, in Olanda. Il prossimo si terrà invece dal 10 al 15 agosto del
2015 a Glasgow, in Scozia.
Rossi (1998) sottolinea che gli interventi furono incentrati tutti sull’intonazione dell’Olandese.
Vladimir Artemov (1962), J. Carnochan (1962), G. Faure (1962), Lee S. Hultzén (1962), Alvar Nyqvist
(1962), Milan Romportl (1962), Milan Romportl (1962), Hans-Walter Wodarz (1962).
7
dopo, a Münster, i contributi pubblicati negli atti furono solo 4 5 ; altri sette si trovano
invece nella pubblicazione relativa al 6° congresso di Praga del 1967. Solo quattro anni
dopo, a Montreal, le comunicazioni pubblicate furono ben 42. Il 1967 segnò infatti un
punto di svolta per quanto riguarda gli interessi dei linguisti sul tema della prosodia e
dell’intonazione. In una preziosa bibliografia sul tema, che copre un periodo che va dal
1900 al 1973, Albert Di Cristo raccolse circa 4390 contributi, metà dei quali furono
pubblicati proprio nei 5 anni dopo il Congresso di Praga.
Il tardivo e marginale interessamento della linguistica ai fenomeni intonativi ha ragioni
piuttosto stratificate. Tra le più immediate vi sono senza dubbio quelle di carattere
‘tecnologico’ e metodologico. L’assenza di strumenti di registrazione, archiviazione e
riproduzione dei dati fonici ha di fatto limitato ‘l’osservabilità’ del fenomeno e di
conseguenza consegnato alla esclusiva manualità dell’analista la responsabilità di
estrazione e oggettivazione dei dati. Una condizione che senza dubbio aveva ripercussioni
dal punto di vista metodologico poiché non consentiva ad altri studiosi l’eventuale
verifica e validazione dei risultati. Una delle principali critiche rivolte agli studi della
‘scuola inglese’, che faceva largo uso del metodo percettivo per l’annotazione e la raccolta
dei dati, fu ad esempio legata al metodo, considerato ‘non-scientifico’ e ‘impressionistico’
(Cruttenden 1986, pp. 6-7).
Vi è in seconda istanza un problema più profondo che riguarda non solo l’osservabilità
strumentale ma le condizioni stesse dell’osservabilità del fenomeno intonativo, che non
trovava collocazione in alcun tipo di rappresentazione linguistica. Mancavano cioè quelle
condizioni che avevano permesso, grazie alla scrittura, il necessario distanziamento tra
l’osservatore e l’oggetto osservato, creando i presupposti per una riflessione teorica
esplicita della lingua. Ne è convinto ad esempio Dwight Bolinger che riflettendo sul
possibile confronto fra fonologia e intonazione scrive:
5
8
Rossi (1998) segnala che altri dieci interventi furono annunciati dall’Unione Sovietica ma mai ricevuti.
Per lungo tempo infatti i linguisti sovietici mostrarono grande interesse per l’intonazione, motivati
soprattutto da finalità didattiche.
The literature on phonemics is new. But, looked at another way, the literature of
phonemics is very old. The common-sense knowledge of phonemics is as old as
alphabetic writing - has been with us for several millennia.
[…] By contrast, the common-sense knowledge of intonation is virtually nil. Aside
from the crude (and, where question are concerned, inconsistent) sign of
punctuation, there exist not even one system of representing English intonation has
been tested by widespread use. There is thus less literature of intonation than on it
(Bolinger 1949, p. 248).
La lingua scritta, in particolare quella alfabetica, restituiva agli occhi e alle orecchie dei
parlanti/lettori un’immagine svuotata del carattere fonico 6. La complessità semiotica del
fenomeno comunicativo veniva schiacciata dalla linearità e determinatezza delle ‘lettere’.
L’intonazione al contrario trovava nella scrittura un posto accessorio e una resa
abbondantemente semplificata mediante la punteggiatura. Non è forse un caso che, se si
escludono i trattati di ortografia, i primi tentativi di riflessione ‘scientifica’
sull’intonazione linguistica abbiano avuto come appoggio rappresentativo, notazioni e
concetti propri di un campo del sapere differente: la musica 7.
Si fanno risalire, infatti, ai lavori sulla punteggiatura le prime discussioni aventi per
oggetto la melodia del parlato inglese (Pike 1945, pp. 3-5; Crystal 1969, pp. 20-25). In
particolare ai lavori di John Hart e ai suoi Ortographie e The opening of the unrealsonable
writing of our inglish toung. Il primo, pubblicato nel 1569, presenta una lunga sezione
sull’intonazione (Danielsson 1955, pp. 199-201) che è essenzialmente una discussione
sulle regole per l’uso dei segni di interpunzione, con riferimento al punto esclamativo e
interrogativo. Altri riferimenti a forme di variazioni tonali nel parlato si trovano in
Charles Butler (1633) che nella sua grammatica distingueva due principali andamenti
6
7
George Boulakia (2002) parlerà di una linguistica ‘senza voce’ per evidenzire il disinteresse delle
discipline linguistiche al ruolo della sostanza dell’espressione.
Cfr. Capitolo 2
9
tonali: ascendente e discendente 8.
Tra i grammatici che, come Butler, hanno dato attenzione ai movimenti tonali della lingua
troviamo George Puttenham (1589), che enfatizzò ad esempio il ruolo delle pause; Ben
Johnson, che in maniera simile descrive un’opposizione tra frasi imperfette, segnalate con
la virgola, e frasi perfettamente conclusive, e Simon Daine (1640).
Non mancano esempi particolarmente interessanti che hanno anticipato di secoli questioni
e modalità di rappresentazione, oggetto del presente lavoro. È il caso di Joshua Steele e
del suo Prosodia Rationalis (1775). Come si vedrà nel cap. 2, Steele fu ben consapevole
del ruolo dell’intonazione nella lingua e riconobbe ad essa un carattere semanticamente
‘distintivo’ 9. Altri riferimenti si trovano negli studi di dizione. Tra questi si segnala il
lavoro di Sheridan (1762), che articolò la categoria del ‘tono’ distinguendo tra toni
naturali, universali, e toni artificiali, che sono invece linguo specifici, e James Rush
(1827) che pubblicò un elaborato sistema per l’indicazione delle altezze nella voce
parlata10.
Una prima importante svolta si ottenne tra la fine del XIX secolo e i primi decenni del XX
secolo con gli studi di fonetica della ‘scuola britannica’: tra gli autori più significativi si
segnalano Henry Sweet, Daniel Jones, Armstrong & Ward e Harold Palmer.
8
9
10
10
Di seguito alcune brevi citazioni “Ton’ is the natural and ordinari tun’ or tenor of the voic’: which is to
ris’, or fall, as the Primari points shall requir’, (Cap. 4 $ 3.1). “Period is a point of perfect sens, and perfect
sentenc’: which, in the last woord, falleth the Ton’ of the voic’ below its ordinari tenour, with a long
paus.” (Cap. 4 $ 3.1). “Comma is a point af mor’ imperfect sens, in a simple axiom, or in either part of a
compound: which continueth the tenour of the voic’ to the last, with the shorttest paus.” (Cap. 4 $ 3.1).
“Erotesis, if it bee pur’, raiseth the common Ton’ or tenour of the voic’ in the last woord’ unless Emphasis
draw it: buti f it begin with a woord interrogativ’; as, [who, what, how, where’, when, why, &c;] it falleth
as a Period...” (Chap. 4, $ 3.2). Per un’analisi del lavoro di Butler sull’intonazione cfr. Hultzén (1939).
La melodia tonale per Steele è il modo in cui “the different meaning of word formed by the same, or
nearly the same, literal sound and syllables, are distinguished” (Steele 1775, p. 188)
Rush (1827) suddivise in cinque categorie tutte le variabili legate al suono della voce umana: Quality
(rough, smooth, hars, full, thin, slender, soft, musical etc.) Force (strong, weak, feeble, loud, soft, forcible,
and faint), Time (long, short, quick, slow and rapid), Abruptness (sudden, gradual emission) e Pitch (rise,
fall, hight, low, acute, grave). Sempre in riferimento al Pitch, Rush pose particolare attenzione alla
distinzione tra andamento continuo (concrete) e andamento scalare (discrete).
Guardando ancora più indietro, l’attenzione ai ‘suoni musicali’ della lingua trova
collocazione anche nelle riflessioni dell’antica Grecia. Il termine προσωδία (gr. prosōidía
«accento, modulazione della voce», comp. di prós «accanto» e ōidḗ «canto») veniva
infatti impiegato per riferirsi alle caratteristiche del parlato che non erano indicate
nell’ortografia, specificamente al tono o accento melodico. L’espressione latina accentus
(ad e cantus) altro non sarebbe che un calco del termine greco.
La versione italiana migliore, che consideri la natura prevalentemente musicale
dell'accento antico, sarebbe "intonazione". Ma ora (e quest'uso ha precursori già in
tardi grammatici greci) è chiamata prosodia la dottrina delle quantità, cioè delle
vocali e sillabe lunghe e brevi (Pasquali 1935, p. 348).
Un altro uso del termine intonazione trova collocazione nel contesto musicale, in
particolare nei manuali di canto. La variazione melodica della voce umana deve, nel
canto, seguire precise regole armoniche e collocarsi all’interno del range discreto
costituito dalle note musicali:
[...] Poiché essendo la perfetta intonazione il principal cardine dell’armonia, ed
essendo questa composta di un perfetto accordo di consonanze, le quali, se in una
di esse parti si scostano dal loro vero punto, resta immediatamente tradita la
perfezione dell’armonia; di più essendo la voce la parte principale della Musica
vocale, se questa è stonata, guasta in quel medesimo tempo l’armonia degli
strumenti, quantunque fra loro perfettamente concordi (Mancini 1777 [1996], p.
68).
L’intonazione, nella tradizione musicale, corrisponderebbe quindi alla corretta
collocazione delle altezze mediante la voce cantata, in rispetto delle regole armoniche e
melodiche. Al contrario la stonatura altro non sarebbe che l’imprecisa esecuzione delle
note musicali tramite la voce (o un anche altro strumento): da qui le espressioni voce
11
calante (quando le note tendono a collocarsi ad un’altezza leggermente inferiore a quella
prevista) o voce crescente (quando le note tendono a collocarsi ad un’altezza leggermente
superiore a quella prevista). Tale uso è ancora oggi pienamente valido:
“l’intonare” significa riconoscere e/o eseguire suoni alla giusta altezza tonale (in
termini fisici, correlati con una frequenza di riferimento). Più semplicemente ci si
può riferire alla capacità, impressiva o esecutiva , di soddisfare con la massima
precisione l’andamento di qualsiasi parametro fisico del linguaggio musicale” (N.
Mari e Schindler , 1974, p. 11).
1.2
Specificazioni terminologiche
Sebbene generalmente i termini prosodia e intonazione siano utilizzati in maniera
indistinta, è possibile tracciare dei confini per un impiego meno ambiguo o quantomeno
più consapevole di essi. È bene inoltre ricordare che spesso le sfumature nell’uso tecnico
dei termini in letteratura possono risultare non sempre esplicite e soprattutto possono
variare in base all’autore.
Con una interpretazione generale si può intendere il termine prosodia come l’insieme
delle modulazioni temporali, tonali e dinamiche della voce, che si estendono oltre il
singolo segmento; con intonazione, le sole variazioni foniche del dominio tonale (Crystal
1969, Ladd 1996, Hirst e Di Cristo 1998, Hirst et al 2000, Botinis et al. 2001,
Gussenhoven 2004, t’Hart and Collier 1990).
In alcuni casi l’uso del termine intonazione può acquisire valenza generale integrando
anche i parametri della durata e dell’intensità. In questa accezione il termine viene spesso
impiegato per riferirsi alle variazioni foniche che pertengono il dominio postlessicale11.
11
12
È il caso di Ladd (1996, p. 4) “Intonation, as I will use the term, refers to use of suprasegmental phonetic
features to convey ‘post lexical’ or sentece-level pragmatic meanings in a linguistically structured way”.
Fig. 1 Schema tratto da Hirst e Di Cristo (1998)
Una seconda e frequente sovrapposizione riguarda l’uso del termine soprasegmentale per
indicare quelle caratteristiche dei suoni linguistici, tra le quali ci sono i fenomeni tonali e
prosodici12, che si estendono oltre il segmento. Il termine introdotto da Hockett nel 1942 è
spesso utilizzato come sinonimo13 di entrambi. In più occasioni tuttavia l’espressione ha
trovato resistenze per il suo carattere ‘ideologicamente’ indirizzato al rapporto asimmetrico con il livello segmentale. Da un lato ci sarebbe quindi il livello dei segmenti e
della lingua e dall’altro quello dei fenomeni soprasegmentali, sovrapposti ai primi e in un
certo senso secondari. È il caso di Albano Leoni (2009):
Il termine sovrasegmentale [...] è certamente un riflesso di questo argomento
(distinzione tra dominio linguistico e paralinguistico ndr.) e della marginalità della
prosodia perché la pone irrimediabilmente in una posizione subordinata rispetto ai
segmenti che ne rappresentano il prius (onto)logico: prima verrebbe la stringa
12
13
Occorre inoltre sottolineare che il dominio di riferimento delle funzioni e dei contenuti espressi dalle
variazioni di tono può costituire elemento di classificazione delle lingue. Si parla infatti di lingue tonali in
cui la variazione di tono può avere un valore distintivo a livello lessicale, e lingue intonazionali, in cui il
livello di pertinenza delle modulazioni melodiche si applica su un piano post-lessicale. In questo senso, il
dominio di pertinenza dell’intonazione si può stringere ulteriormente agli eventi tonali post-lessicali, o
semplicemente non lessicali.
“Features which clearly follow each other in the stream of speech are SEGMENTAL. Those which clearly
extend over a series of several segmental grouping are SUPRASEGMENTAL. Thus the positions of
articulation of final two consonant in crypt are segmental, while the modes of articulation voiceless and
fortis, are suprasegmental [Hockett 1942, p. 8]. […] A suprasegmental phone has a DOMAIN defined as
the type sequence of segmental phones which it covers [Hockett 1942, p. 14]".
Un tentativo di problematizzazione e approfondimento del tema è in Lehist 1970.
13
segmentale, poi verrebbe la modulazione soprasegmentale che si sovrappone alla
stringa (Albano Leoni 2009, p. 48).
Considerazioni simili sono espresse anche da autori come David Crystal 14 e Elizabeth
Couper-Kuhlen15.
Ulteriori specificazioni terminologiche sono possibili sulla base del punto di vista fonetico
con cui si osservano i fenomeni prosodici e intonativi. Si parlerà dunque di:
1 – Dimensione articolatoria: si pone nella prospettiva del parlante e consiste nella
descrizione del processo di produzione dei suoni.
2 – Dimensione percettiva: si pone dal punto di vista dell’ascoltatore si occupa dei
processi uditivi e di categorizzazione dei suoni percepiti.
3 – Dimensione acustica: descrive le caratteristiche del segnale trasmesso. Essa
costituisce una branca della fisica classica. (Albano Leoni e Pietro Maturi 1995, p. 15-18)
Le tre prospettive non hanno tra loro un rapporto simmetrico. Non tutto ciò che è presente
nel segnale acustico è pertinente da un punto di vista percettivo e non tutto ciò che è
percettivamente rilevante può trovare singoli movimenti articolatori corrispondenti. Molto
spesso infatti gli aspetti percettivamente e linguisticamente salienti non sono altro che il
frutto della complessa interazione tra un insieme di parametri compresenti.
I correlati principali grazie ai quali si realizzano le variazioni prosodiche sono: la
frequenza fondamentale della voce (o F0), generalmente considerata come responsabile
14
15
14
“I considered and rejected a number of alternative terminologies to the use of ‘prosodic’:
‘suprasegmenral’, for example, was unsatisfactory, as it carried too dominantly the implications of a
specific linguistic theory and method which is inadequate, and also because the prefix ‘supra-’ implies a
priority of segmental over non-segmental linguistic features which is linguistically suspect”. (Crystal
1969, p. 6)
“The term suprasegmental, [...] stems from a ‘bottom-up’ approach to language and carries the
connotation of being ‘non-inherent’, ‘overlaid’ or ‘secondary’”. (Couper-Kuhlen 1986, p. 4)
della percezione dell'altezza tonale (pitch) e corrispondente al numero di aperture e
chiusure della glottide durante il passaggio dell’aria fonatoria; la durata, dovuta al tempo
impiegato a compiere il gesto articolatorio e percepita come variazione di lunghezza
(duration); e infine l’ampiezza, correlata alla pressione esercitata dall’aria fonatoria sulla
glottide e percepita come variazione di intensità (loudness).
Dimensione Articolatoria
Dimesnione Acustica
Dimensione Percettiva
Vibrazione delle corde vocali
Energia
Movimenti articolari
Frequenza fondamentale (F0)
Ampiezza
Tempo
Altezza (Pitch)
Intesità (Loudness)
Durata (Duration)
Tabella 1 Sintesi delle caratteristiche prosodiche considerate sulla base dei tre livelli di descrizione fonetica
Le dimensione acustica può fornire una ulteriore specificazione terminologica sulla base
della descrizione fisica delle sue componenti. Le onde sonore sono tradizionalmente
rappresentate mediante una curva sinusoidale16 come riportato in fig. 2:
16
Occorre tuttavia sottolineare che la rappresentazione ottenuta mediante la funzione sinusoidale è una
semplificazione grafica che troverebbe corrispondenza con il suono puro, costituito da una singola
frequenza periodica. Molti suoni periodici tuttavia, come le note emesse da uno strumento musicale o
dalla stessa voce, non sono di questo tipo. Si parla infatti di suoni complessi, costituito cioè dalla somma
di più frequenze, una multipla dell’altra. Tali frequenze sono dette armoniche e la più bassa di queste è la
frequenza fondamentale (F0), principale parametro correlato alla percezione delle altezze.
15
Fig. 2 rappresentazione della curva sinusoidale
Il grafico, che riporta sull’asse delle ascisse il tempo e sull’asse delle ordinate la
variazione della pressione dell’aria, mostra intuitivamente l’andamento periodico, vale a
dire un andamento che a istanti di tempo uguali, presenta le medesime condizioni, ossia
gli stessi valori di pressione. Il tempo che separa due istanti in cui l’onda presenta le stesse
condizioni (es. due massimi o due minimi) è detto periodo e si indica con la T. Esso si
misura in secondi (sec) e suoi sottomultipli, millisecondi (msec = 10 -3 sec), microsecondo
(µsec = 10-6 sec) ecc.
Il valore di y in un punto di massimo o di minimo si dice ampiezza dell’onda. A parità di
condizioni l’ampiezza è il correlato fisico della sensazione di intensità. Maggiore è il
valore del parametro a, più forte sarà il suono percepito.
Il parametro della frequenza (f) è invece misurato in funzione del tempo. Essa si calcola in
base al rapporto tra periodi (T) e secondi, ovvero gli hertz (Hz). Tale misura indica il
numero di periodi compresi nell’unità di tempo e quindi il numero di volte in cui l’onda
sonora ripresenta le stesse condizioni. La frequenza dell’onda sonora è ciò che determina,
entro certi limiti, la sensazione di altezza di un suono (Pitch). A parità di condizioni una
frequenza più elevata corrisponde a un tono, una nota, più acuta; al contrario una
frequenza più bassa corrisponderà un suono più grave.
16
Di seguito è possibile vedere un esempio di rappresentazione fonetica della curva
melodica (F0) dell’enunciato ‘Anna’ (anːa):
Fig. 3 Fonte: Avesani, Gili Favela (2010)
Al centro è collocata la curva di F0 costruita sulla base del rapporto tra il valore delle
altezze (asse delle ordinate), calcolato in Hz, e tempo, calcolato in secondi; in alto è invece
visibile la forma d'onda dell'enunciato che è costruita ponendo, come per l’onda
sinusoidale, sull’asse delle ascisse il tempo e sull’asse delle ordinate la pressione
(corrispondente al valore dell’ampiezza); in basso e in corrispondenza dei rispettivi valori
acustici è collocata la trascrizione fonetica della parola ‘Anna’.
Anche limitando l’indagine alla sola curva melodica l’attività di analisi linguistica risulta
vasta e complessa. T’ Hart e Collier (1990) hanno ad esempio sottolineato l’importanza di
tener presente contemporaneamente differenti livelli di analisi. Un livello fonetico, che
dovrebbe interessarsi alle componenti fisiologiche, acustiche e percettive dell’intonazione,
17
spiegando al contempo le loro reciproche relazioni; un livello linguistico che dovrebbe
essere invece finalizzato ad un’interpretazione fonologica dei fatti fonetici e a una
spiegazione pragmatica che renda conto delle funzioni dell’intonazione nel corso delle
interazioni comunicative tra i parlanti (‘t Hart, Collier e Cohen 1990, p. 2).
2
L’intonazione e i confini della lingua
Nella complessità e nella vastità degli studi che si sono succeduti negli anni e che sono
cresciuti notevolmente negli ultimi decenni, è possibile rintracciare alcune questioni
centrali che fanno da sfondo alle diverse teorie e approcci al problema. Tali questioni
hanno alimentato costantemente discussioni e proposte di studio, trovando riflesso negli
strumenti di notazione.
Due in particolare sono problemi sui quali le ricerche hanno tentato, esplicitamente o
implicitamente, di rispondere: da un lato la possibilità di considerare l’intonazione e la
prosodia come fenomeni di pertinenza linguistica, dall’altro la possibilità di applicare alle
modulazioni intonative e prosodiche modelli di descrizione analoghi a quelli di tipo
segmentale.
Le possibili risposte a tali problemi non sono univoche né tantomeno indipendenti. Molte
delle riflessioni e delle descrizioni sulla struttura del segno linguistico hanno di fatto
costituito un discrimine importante per l’eventuale inclusione o esclusione dei fenomeni
intonativi all’interno della teoria linguistica. In alcuni casi a determinare chiusure più o
meno radicali nei confronti dello studio dei fatti intonativi è stata la costituzione del piano
dell’espressione, in altri casi invece il tipo di funzioni ad essi associate.
2.1 Il significante linguistico dell’intonazione
Gran parte degli autori del ‘900, con particolare riferimento allo strutturalismo europeo e
18
americano, hanno posto ad esempio tra i loro assunti teorici i concetti di articolazione,
linearità, e segmentalità. Alla continuità ed estrema variabilità del segnale fonico, il
linguista ha risposto mediante l’elaborazione di categorie descrittive in grado di metterne
in luce i caratteri di discretezza e invarianza. “Il paradigma segmentale”, noto e definito
formalmente con lo strutturalismo europeo e perfezionato dalla scuola di Leonard
Bloomfield, ha, semplificando, visto la lingua come costituita materialmente di ‘pezzi’,
segmenti prodotti ed elaborati in maniera discreta e combinati tra loro in maniera lineare a
formare unità via via più grandi.
Particolarmente esemplificative, rispetto a tale atteggiamento, sono le parole di André
Martinet:
Una lingua è uno strumento di comunicazione secondo il quale si analizza, in
maniera diversa nelle diverse comunità, l’esperienza umana, in unità dotate di un
contenuto semantico e di un’espressione fonica, i monemi; l’espressione fonica si
articola a sua volta in unità distintive e successive, i fonemi, in numero determinato
per ogni lingua, la cui natura e i cui rapporti reciproci differiscono anch’essi da una
lingua all’altra. Da ciò risulta 1) che si riserva il termine «lingua» alla designazione
di uno strumento di comunicazione doppiamente articolato e dotato di una
manifestazione vocale; 2) che, al di fuori di questa base comune, come indicano i
termini «diversa» e «differiscono» nella formulazione usata qui sopra, non c’è
nulla di propriamente linguistico che non possa variare da una lingua all’altra; è in
questo senso che va intesa l’affermazione secondo cui i fatti di lingua sono
«arbitrari» e «convenzionali» (Martinet 1960 [1971], pp. 28-29).
Sulla base di tali riflessioni il linguista francese collocherà l’intonazione e le modulazioni
prosodiche al di fuori dei ‘fatti di lingua’ (Martinet 1960 [1971], pp. 32, 98-100)17.
17
Lo stesso Martinet, pur riconoscendo alle modulazioni intonative un certo grado di funzionalità preferisce
in questo caso affidare il principio di classificazione alla “segmentazione” piuttosto che alla “funzione”
(Martinet 1962 [1971], p. 76). In questo modo la (non) pertinenza linguistica dell’intonazione è
determinata soprattutto dalla sua (non) segmentabilità e (non) discretizzabilità. Commentando queste
pagine Malberg (1983) scrive “I fatti soprasegmentali sono oppositivi proprio come gli altri fonemi (lo
dimostra la prova di commutazione), solo che sono integrati in paradigmi meno complessi di quelli dei
fonemi segmentali. L’unica differenza tra le due serie di fatti funzionali è il livello. La posizione di
19
Una posizione simile è espressa dal linguista danese Louis Hjelmslev nella distinzione tra
segni e figure. Queste ultime, nell’ambito della glossematica, rappresentano un insieme
limitato di elementi non significanti che, combinandosi, consentono la creazione di segni
sempre nuovi:
Se una lingua non fosse così organizzata, sarebbe uno strumento inutilizzabile per
il suo fine. Abbiamo dunque ogni ragione di supporre che questo tratto - la
costruzione del segno in base a un numero limitato di figure - costituisca un
elemento basilare essenzialmente nella struttura di qualunque lingua. Le lingue
dunque (…) sono in primo luogo (…) sistemi di figure che si possono usare per
costruire dei segni (Hjelmslev 1943 [1968], p. 51) 18
Tali figure e tali combinazioni di figure in segni saranno, a ciascun livello di analisi
glossematica, in relazione nella catena19.
Se provassimo ad articolare ulteriormente le due questioni da cui siamo partiti, ossia
18
19
20
Martinet porta alla strana conseguenza che il carattere distintivo dell’intonazione non andrebbe
riconosciuto” (Malberg 1983 [1985], p. 192).
È opportuno tuttavia specificare le differenti prospettive con cui si giunge alle seguenti osservazioni.
Martinet ad esempio lega la doppia articolazione, che come abbiamo visto è il parametro che permette di
discriminare i fatti d’intonazione rispetto ai fatti di lingua, al principio di economia e, a sua volta, alle
necessità comunicative dei parlanti. La spiegazione fornita dal linguista francese si rivolge quindi alle
condizioni del corretto funzionamento della lingua in termini di interpretabilità. La posizione di Hjelmslev
è invece più radicale: non sono i fonemi, nell’accezione più generale, ad essere considerati come unità
minime (Hjelmlsev chiama questi prefonemi e li colloca al livello intermedio della norma) ma i cenemi.
Questi ultimi sono, secondo l’autore, le unità minime del piano dell’espressione, assolutamente svincolate
da riferimenti alla sostanza fonica. Tali cenemi (genericamente detti glossemi) altro non sarebbero che
elementi della lingua, intesa come schema, i quali possono essere manifestati in sostanze differenti come il
suono, la grafia, il codice morse etc. Le unità minime in questo senso non sarebbero pezzetti di lingua ma
‘spazi topologici’ della forma linguistica (o sarebbe maglio dire semiotica). Questo punto è elegantemente
sintetizzato da Gilles Deleuze “Gli elementi di una struttura non hanno né designazione estrinseca né
significato intrinseco. Coma rimane? Come ricorda in modo rigoroso Lévi-Strauss, essi non hanno
null’altro che un senso: un senso che è necessariamente e unicamente di “posizione”. Non si tratta di un
posto in un’estensione reale, né di luoghi in estensioni immaginarie, bensì di posti e luoghi in uno spazio
propriamente strutturale, ossia topologico” (Deleuze [2004], p. 20). L’analisi strutturale dei casi effettuata
da Hjelmeslev (1935 [1999]). è un esempio del principio strutturale proprio della glossematica.
“Quando ascoltiamo un testo parlato, per noi esso si compone di segni, e questi segni si compongono a
loro volta di elementi che si svolgono nel tempo: alcuni vengono prima, altri dopo. I segni formano una
catena, e anche gli elementi di ogni segno formano una catena. Chiamiamo relazione la funzione
(differenza, rapporto) che esiste fra i segni o fra gli elementi all’interno di una stessa catena: i segni e gli
elementi sono relati fra loro nella catena” (Hjelmslev 1963 [1970], p. 36-37).
l’interpretazione
linguistica
dell’intonazione
e
l’analogia
tra
segmentale
e
sovrasegmentale, noteremo che la seconda contiene implicitamente una parte della
risposta e della problematica legata alla prima. Valutare l’opportunità di un’analogia tra
modello segmentale e modello soprasegmentale ha significato, in alcuni casi, subordinare
la rappresentabilità dell’uno sull’immagine dell’altro, in base ad una precisa
considerazione della lingua. Proviamo ora a considerare alcune possibili risposte ai due
quesiti.
La differenza terminologica può nascondere una differenza di dominio. Segmenti e
soprasegmenti sono diversi nella loro forma dell’espressione, agendo con modalità e su
livelli di pertinenza diversi. Tale differenziazione formale corrisponde così a una
distinzione di dominio che può essere sintetizzata nell’opposizione linguistico vs nonlinguistico o linguistico vs paralinguistico. È il caso citato di Martinet20.
Una seconda risposta consiste nel tentativo di trasferimento, in maniera più o meno
analogica, dei tratti tipici del modello segmentale sui fenomeni intonativi e/o prosodici,
applicando ai toni i principi della discretezza, distintività e segmentabilità. In sintesi è
l’esito del processo iniziato con lo strutturalismo americano (Pike, Wells, Trager and
Smith) e continuato fino alle più recenti forme di trascrizione binarie del tono, come
ToBI. La curva melodica viene quindi interpretata come costituita di fonemi tonali (pitch
phoneme), costruiti sulla base di una discretizzazione del Range in vari livelli di altezza
relativi.
20
Il rifiuto delle categorie di gradienza e continuità nell’ambito del dominio linguistico è stata
particolarmente evidente nell’ambito della scuola strutturalista americana. Joos (1950) o Hockett (1959),
ad esempio, includono nel ‘design of language’ esclusivamente la categoria della discretezza, rifiutando la
possibilità di considerare interno al problema linguistico qualsiasi tipo di gradienza categoriale: “All
continuity, all possibilities of infinitesimal, gradation, are shoved outside of linguistic in one of linguistics
in one direction or other. There are in fact two such direction in which we can and resolutely do expel
continuity: semantics and phonetics” (Joos 1950, p. 702). E ancora:“all phenomena, whether popularly
regarded as linguistic (such as the tone of anger in an utterance) or not, whichh we find we cannot describe
precisely with a finite number of absolute categories, we classify as non-linguistic elements of real world
and expel them from linguistic science” (Joos 1950, p. 703).
21
La terza possibilità risiede nell’integrazione dei modelli di analisi e di descrizione delle
lingue con categorie complementari a quelle segmentali: continue, non segmentali e
graduali. È il caso di Crystal (1969, 1974) il cui studio, orientato principalmente alla
descrizione di una teoria integrata dell’atto comunicativo, ipotizza una scala di
linguisticità sulla base della maggiore o minore strutturazione dei fenomeni
soprasegmentali (Vedi fig. 4).
Fig. 4 Scala di linguisticità delle categorie non segmentali dell'inglese (David Crystal 1969, p. 131)
Come è visibile dalla figura, l’intonazione (compresa nei parametri Pitch direction e Pitch
Range), nell’insieme delle caratteristiche non segmentali considerate, occupa una posizione
più vicina al dominio linguistico.
Una quarta e ultima risposta è quella fornita da Albano Leoni (2009) che pone a
fondamento della linguisticità il tema della significazione, proponendo una prospettiva più
ampia di pertinenza che valuti le caratteristiche specifiche del segnale fonico sulla base
della complessa interazione semiotica che contraddistingue ogni scambio comunicativo.
22
In questo quadro assumono spazio importante la dimensione pragmatica, la multimodalità,
il gioco delle inferenze, i rinvii al contesto e al cotesto, i ruoli dei locutori, le modalità
degli scambi comunicativi. Una prospettiva dunque che tende a integrare e fondere
completamente le due dimensioni del linguistico e del paralinguistico, a rivalutare il ruolo
giocato dall’intonazione e in generale dalla prosodia (Albano Leoni 2009, pp. 41-63), e a
considerare la variabilità non come accidente o residuo marginale della struttura
linguistica, ma come sua parte costitutiva. 21
2.2
Il significato linguistico dell’intonazione
Se da una parte le questioni relative alla linguisticità o meno dei fenomeni intonativi sono
state rivolte, come si è visto, soprattutto alla dimensione del significante, mediante la
definizioni e la circoscrizione di etichette più o meno condivise, non meno problematico è
invece il lato del significato. Uno dei principali problemi riguardanti l’analisi e la
conseguente rappresentazione dell’intonazione è infatti relativo alla costruzione della forma
del contenuto. Differenti prospettive teoriche sull’oggetto lingua hanno di fatto considerato
come pertinenti solo alcune delle innumerevoli funzioni svolte dalle variazioni della F0,
finendo per spostare di volta in volta il limite ‘interno’ della lingua e di conseguenza gli
interessi della disciplina. André Martinet, come si è accennato, non negava la rilevanza
funzionale delle variazioni intonative, ma ne marginalizzava il ruolo. Secondo il linguista
francese, a variazioni intonazionali non vi sarebbero cambiamenti nel valore del segno
linguistico:
Quel che importa soprattutto notare a proposito della melodia del discorso in una
lingua come l'italiano è che le variazioni della sua curva non possono cambiare
l'identità di un monema o di una parola: in Piove? con melodia ascendente si ha la
medesima parole piove come compare in Piove., con la melodia discendente.
Anche se la differenza fra le due curve si manifesta soltanto, non è in gioco il
21
“Se è vero che la prosodia e la voce concorrono alla generazione dei sensi, e sono tra gli strumenti per la
loro interpretazione, allora è vero che esse sono parte integrante del significante, dunque della lingua, di
cui vengono ad essere componenti anche funzionali” (Albano Leoni 2009, p. 78).
23
valore della parola isolata, ma quello di un segmento enunciato più vasto, che può
essere la frase intera (Martinet, 1960 [1971], p. 100).
Una simile posizione è riscontrabile anche in autori come Kenneth L. Pike (1945). Per il
linguista americano infatti la funzione principale dell'intonazione nella lingua inglese è
costituita maggiormente da quella relativa alle attitudini del parlante:
Most sentences or parts of sentences can be pronounced with several different
intonation contours, according to the speakers momentary feeling about the subject
matter (Pike 1945, p. 23).
Nell'ambito dello studio di Pike, tali contorni hanno la funzione di modificare in maniera
temporanea il valore del significato lessicale, riproponendo sotto una luce leggermente
diversa l'argomentazione di Martinet:
English word have basic, intrinsic meaning; these LEXICAL MEANING are the
ones found in the dictionary. […] all of the lexical meanings have this in common,
that they are indicated only by the requisite consonants, vowels, and stress, and a
context where such a meaning is possible; in that sense, the lexical meaning is
intrinsically a part of the word itself and not dependent upon extraneous
phenomena such as pitch produced by emotion. […] The intonation meaning is
quite the opposite. Rather than being a stable inherent part of words, it is a
temporary addition to their basic form and meaning. Rather than being carried by
permanent consonant and vowels, it is carried by a transitory extrinsic pitch
contour. Rather than contributing to the intrinsic lexical meaning, according to the
attitude of the speaker (Pike 1945, p. 21).
Inoltre, secondo Pike, uno dei pericoli maggiori insiti nell'analisi semantica di contorni
intonativi consiste proprio nella tendenza ad astrarre particolari significati da enunciati
linguistici occorrenti in specifici contesti grammaticali e fisici. L'errore che più facilmente
può essere commesso è dunque:
To select phrases of a particular grammatical construction, demonstrate that a
certain contour may appear on all of those phrases, and then claim that the contour
in question means or indicates that grammatical pattern-- in spite of available
24
evidence that contour appear on other grammatical phrase type, or that the phrases
used could receive any of dozen other contours (Pike 1945, p. 21).
La logica che segue l’argomentazione dei due autori è abbastanza chiara e ripropone la
tradizionale dicotomia tra denotazione e connotazione, ossia l’opposizione tra un
significato principale, o quanto meno privilegiato (il ‘significato intrinseco’ di cui parla
Pike) e un significato ‘estensivo’ variabile, secondario, sovrapposto al primo, e quindi, in
un certo senso, non pertinente da un punto di vista ‘interno’.
È evidente che da questa prospettiva l’intonazione e la prosodia troverebbero, come in parte
è avvenuto, uno spazio di considerazione ridotto. La loro azione è, come si è ripetuto più
volte, strettamente interrelata con le dinamiche comunicative e contestuali dei parlanti. Il
problema, quindi, come verrà mostrato nelle prossime pagine, risiede in particolare nel
modo in cui gli autori hanno considerato il rapporto tra la rappresentazione metalinguistica
e l’ipotesi relativa al funzionamento della langue. La distinzione tra denotazione e
connotazione diviene infatti applicabile, al modo di Pike, solo se si considera il sistema
linguistico al pari di un codice, con una organizzazione piuttosto determinata di significati e
di istruzioni per la produzione e interpretazione dei messaggi linguistici. Se si parte invece
dall’atto comunicativo nel suo complesso la gerarchia tra senso e significato andrebbe
rimodulata
22
22
. Il significato apparirebbe come amputato, artefatto e frutto di una
L’inversione del rapporto tra senso e singificato costringe a rivedere ad esempio la definizione delle unità
stesse della lingua. Se nell’ambito della langue l’unità linguistica ideale può essere ricondotta al segnoparola, nel discorso, e quindi nella pratica comunicativa, tale unità diviene problematica. È possibile
riscontrare tale tensione già nel Corso di linguistica generale di Ferdinand de Saussure dove, nelle pagine
dedicate al meccanismo della lingua, si può leggere: “Di regola, noi non parliamo per segni isolati, ma per
gruppi di segni, mediante masse organizzate che sono esse stesse segni” (Saussure 1922 [2005] p. 155)
oppure “Una teoria abbastanza diffusa pretende che le sole unità concrete siano frasi: noi non parliamo che
per frasi, e soltanto dopo ne estraiamo le parole” (ivi, p. 129).
Tra i più attenti lettori e commentatori di Saussure, vi è senza dubbio il linguista Mario Lucidi, il quale
propose di considerare segno la frase e di chiamare iposemi i suoi elementi funzionali, parole e monemi, in
modo da sottolineare anche a livello terminologico il primato dell’atto espressivo unitario: “[...] chiamare
segni tanto i prodotti complessivi dell’atto linguistico quanto le parti che lo costituiscono (unità lessicali,
morfologiche, ecc.), significa considerare nella stessa classe e sullo stesso piano entità manifestate non
solo diverse ma, per la loro stessa natura situate in piani diversi, e di conseguenza falsare inevitabilmente
25
rappresentazione astratta operata dall’analista e non dal locutore/ascoltatore 23 . Un caso
particolarmente significativo è ad esempio quello delle emozioni.
2.3
Il caso delle emozioni
È ormai noto come tra le differenti funzioni associate alle variazioni del contorno melodico
del parlato vi siano le espressioni delle emozioni. L’inserimento di tali funzioni nel
dominio del ‘linguistico’, del ‘non linguistico’ o del ‘diversamente linguistico’ non è del
tutto condivisa. Ancora una volta i limiti entro cui i fenomeni vengono classificati,
analizzati e rappresentati come pertinenti alla descrizione linguistica, risiedono nelle
prospettive con cui le diverse ‘scuole’ o anche i singoli studiosi hanno guardato al proprio
oggetto.
Nel campo della linguistica, l’idea di distinguere un livello di informazione affettiva interno
alla comunicazione non è nuova. Linguisti e studiosi del linguaggio come Sapir (1927),
23
26
la natura di una parte di essi[...]” (Lucidi 1950 [1966] pp 67-68). E ancora “L’atto linguistico come atto
espressivo ha la sua realizzazione unicamente e specificamente nel segno considerato nella sua totalità,
non in una o più parole, mai in una o più parole come tali. Non in quanto proferisce delle parole, ma in
quanto proferendole realizza nella sua compiutezza un atto linguistico, chi parla si esprime: non nelle
singole parole proferite in sé e per sé, ma nella compiutezza l’atto linguistico realizzato è un segno che
significa ciò che è stato espresso. L’atto linguistico, e solo esso, consti di una o più parole – e quando in
una sola parola viene realizzato, questa cessa di essere una parola – è l’unità significativa per eccellenza,
suscettibile quindi solo esso di realizzarsi in un’entità cui possa competere il nome di segno. Concludendo,
segno, anzi propriamente segno linguistico, va considerata quell’entità fonico-significativa, in cui si
realizza l’atto linguistico nella sua compiutezza; mentre parole, elementi lessicali, morfemi, ecc., mancano
delle caratteristiche essenziali che individuano qualsiasi segno, e se segni vengono considerati, se ne falsa
inevitabilmente la natura” (Ivi, p. 69).
Il rapporto tra senso e significato viene similmente considerato ad esempio nella semantica interpretativa
di Rastier. Per il semiologo francese il senso non sarebbe l’equivalente del significato deformato dal
contesto “Il significato è senso impoverito, perché amputato dal proprio contesto. Il tipo è un insieme di
accidenti, un riassunto convenzionale di occorrenze ritenute come pertinenti per la sua definizione. [...] Il
significato non sarà più un tipo variamente deformato nelle proprie occorrenze che costituiscono il senso:
pensato in questo modo esso si riduce ad un artefatto dell’ontologia, poggiando sulla lessicografia, anche
quando i sensi variano senza limite confermando l’intuizione che ogni occorrenza è potenzialmente
unica”.
Bühler (1934) o Jakobson (1960) 24 avevano assegnato un ruolo alla dimensione emotiva
della comunicazione
25
. Karl Bühler, ad esempio, fornì un modello generale e
sostanzialmente integrato (Organon-Modell, vedi fig. 5)
in cui alla funzione
rappresentativa, propria del rapporto tra i segni e gli oggetti, e fatti, del mondo a cui ci
riferiamo, vengono collegate le funzioni di appello ed espressione, rispettivamente rivolte
all’ascoltatore e, appunto, alla manifestazione dell’interiorità del parlante.
24
25
“Supporre con Saporta che la differenza emotiva è un carattere non linguistico ‘attribuibile all’attuazione
del messaggio e non al messaggio stesso’, significa ridurne arbitrariamente la capacità informazionale”
(Jakobson 1963, [2002] p.187).
In merito al rapporto tra lingua ed emozioni Elinor Ochs e Bambi Schieffelin (1989) hanno riconosciuto
all’interno della ricerca linguistica del ‘900 quattro principali filoni. Il primo è legato alla scuola
linguistica di Praga, in particolare a Roman Jakobson (1960) che riprendendo l’Organon-Modell di Karl
Bühler ha inserito la funzione emotiva nel suo modello comunicativo. Il secondo riguarda invece le
ricerche sull’intonazione. Autori come Bolinger (1948, 1978, 1982), Cruttenden (1981), Crystal (1969),
Halliday (1975) che nell’ambito delle loro studi linguistici hanno indagato l’interazione tra le variazioni
melodiche ed emozioni. Un terzo filone è invece legato agli studi di narratologia. Autori come Michail M.
Bachtin (1981) e Kenneth Burke (1962) hanno esaminato i modi in cui i parlanti/scrittori coloravano i loro
messaggi per creare un particolare mood o impatto sull’ascoltatore/lettore. Un quarto filone
corrisponderebbe agli studi sul linguaggio in età infantile e alla relazione tra emozioni e apprendimento
della lingua. A questi è possibile aggiungere il filone della semiologia di stampo strutturalista (Greimas
1983; Greimas e Fontanille 1991) che ha cercato di costruire una semantica della dimensione passionale
nel discorso, considerandola non nei suoi effetti reali e biologicamente determinati ma come effetti di
senso, e quindi come forme di significazione iscritte e codificate nel linguaggio.
27
Fig. 5 Organon-Modell tratto da Bühler (1934 [1983] p. 81)
Il grafico rappresenta le relazioni che l’emissione fonico-acustica stabilisce con le diverse
componenti del segno linguistico26. Ogni segno per Bühler:
[...] È simbolo in virtù della sua corrispondenza a oggetti e fatti, è sintomo (indice,
indicium) in rapporto alla sua dipendenza dall'emittente, della cui interiorità è
espressione, è segnale in forza del suo appello all'ascoltatore, di cui dirige come
altri segni di scambio il comportamento esterno o interno (Bühler K., 1934 [1983:
81]).
Nel modello dello psicologo tedesco la dimensione emotiva viene così ad integrarsi con
quella rappresentativa che invece sarà dominante ad esempio nello strutturalismo.
La tricotomia funzionale del segno descritta da Bühler fu parzialmente integrata ad
esempio nella fonologia strutturale di Trubeckoj. Partendo proprio dal modello
strumentale dello psicologo tedesco, Trubeckoj, nell’introduzione ai Grundzüge der
Phonologie, sottolineò come la fonologia dovesse mostrare preminente interesse alla
26
28
“Il cerchio in mezzo simboleggia concreto fenomeno acustico. Tre suoi momenti variabili sono incaricati
di promuoverlo per tre volte in modo diverso al rango di segno. I lati del triangolo disegnati entro il
cerchio simboleggiano questi tre momenti. Il triangolo per un verso include qualcosa di meno del cerchio
(principio della rilevanza astrattiva), e per un atro verso si estende oltre il cerchio per indicare che il dato
sensibile subisce sempre un’integrazione appercettiva. Gli insiemi di linee simboleggiano le relazioni
semanticamente definite del segno linguistico (complesso)” (Bühler 1934 [1983], p. 81).
funzione rappresentativa, rispetto a quella di appello ed espressione (presentazione).
Proprio sotto queste funzioni si manifestano ad esempio molte delle variazioni intonative
che trovano così poco spazio nella sua teoria fonologica strutturale 27. Il linguista russo è
infatti esplicito sul ruolo principale che la teoria linguistica fonologica deve riservare alla
funzione rappresentativa rispetto a quella di appello ed espressione:
Mentre dunque la «fonologia della rappresentazione» esamina tutto il campo dei
mezzi fonici di rappresentazione della lingua, gli altri due rami sopra ricordati della
fonologia si dovrebbero occupare solo di una piccola parte dei mezzi fonici di
espressione e di appello. Ci si può dunque domandare se veramente i tre rami della
fonologia si devono considerare su un piano di parità, e d’altra parte se è opportuna
la separazione dei mezzi di espressione e di appello convenzionali da quelli naturali
e se lo sia il loro inserimento nel campo della fonologia. (…) Nella descrizione
fonologica di una lingua la stilistica fonologica (dia della funzione espressiva che
della funzione di appello) va presa in considerazione ma il vero compito della
descrizione deve pur sempre restare l’esame fonologico del «piano della
rappresentazione (Trubeckoj 1939 [1971], p. 34).
Ancora più radicale è André Martinet che dichiara come non pertinenti all’analisi gli
elementi espressivi: “Bisognerà infine fare astrazione, nella parola registrata, da ogni
elemento con funzione espressiva” (Martinet, 1960 [1971], p. 79).
Già ad uno sguardo generale è possibile notare come l’articolazione tra funzione
rappresentativa ed espressiva, quest’ultima maggiormente legata alla modulazione
27
“Ci si domanda come devono essere considerate queste diverse sfumature dell’intonazione. Appartengono
tutte quante alla fonologia di appello e in genere alla lingua? Oppure appartengono solo alla parola? Sono
in genere veramente convenzionali? Intonazioni di tipo emotivo appaiono molto spesso anche in
manifestazioni non linguistiche (in esclamazioni indistinte o inarticolate), e la determinata emozione che
esse devono risvegliare è chiaramente riconoscibile. A quanto pare queste intonazioni extralinguistiche
tendenti a suscitare emozioni mostrano la stessa struttura di tono e di intensità delle parole provviste della
stessa colorazione emotiva (per la verità questo fatto non è mai stato studiato fino in fondo). Si può anche
dimostrare che molte di queste intonazioni hanno lo stesso significato nelle più disparate lingue del
mondo. […] Il compito della fonologia dell’appello non sta nella raccolta sistematica di queste inflessioni
della voce a sfondo emotivo né nella loro stretta coordinazione a precise emozioni, ma soltanto nello
stabilire quei segni fonici convenzionali che, a prescindere dalle suddette inflessioni della voce
distinguono un discorso che ha una certa colorazione emotivo da un discorso invece neutro o
calmo”(Trubeckoj 1939 [1971], p. 30-31].
29
melodica, fosse in qualche modo responsabile di una cesura piuttosto netta tra il dominio
del linguistico e del non-linguistico o più velatamente paralinguistico. Non vi è dubbio
che la prospettiva strutturale allo studio delle lingue abbia potuto favorire tale discrimine
operativo. L’attenzione allo studio scientifico della lingua intesa come forma pura, ha
condotto, e in alcuni casi anche in maniera estrema, all’estromissione dall’analisi
linguistica del ruolo del parlanti. Questi, nella loro viva corporeità e immersi nello
scambio comunicativo, rappresentano infatti il luogo privilegiato in cui le funzioni
espressiva e d’appello possono manifestarsi. Per Hjelmslev addirittura parlante e
ascoltatore sono logicamente secondari rispetto alla struttura fondamentale del linguaggio:
Mi asterrò dall’addentrarmi ora in queste controversie, non per il timore di
cacciarmi in un ginepraio, ma perché il problema non è rilevante ai fini
dell'argomento ora in discussione. È mia opinione che, pur essendo colui che parla
e l'ascoltatore (lettore) importante per il completamento dell'atto linguistico, lo
sono difficilmente per qualunque atto linguistico, e non lo sono per la struttura del
linguaggio. (…) Sarà opportuno precisare qui che, da un punto di vista logico, il
parlare è condizione necessaria per il parlante e ascoltatore, mentre non è vero
l’inverso. Sia il parlante che l'ascoltatore diventano tali solo grazie alla lingua,
mentre invece, come abbiamo visto, si può avere una lingua senza che vi sia alcuno
che parli o ascolti. Sono pertanto propenso a ritenere che il parlante o chi ascolta (o
legge), o la coscienza che sfocia nella parola, o il comportamento che ne deriva,
difficilmente siano rilevanti per ogni atto linguistico (Hjelmslev 1947 [1988], pp.
162-3]).
La considerazione della lingua basata sulla completa autonomia della forma da qualsiasi
principio semantico e fonetico conduce la glossematica a espellere le emozioni dal proprio
interesse scientifico. Marginalizzare il ruolo dei parlanti all’interno dello studio delle
lingue significa così marginalizzare il ruolo delle funzioni espressive e d’appello,
maggiormente legate alle dinamiche comunicative e, al tempo stesso, ai fatti prosodici e
intonativi.
Sempre sulla base della loro funzione, le variazioni emotive legate ai movimenti del
30
contorno intonativo sono classificate da Bertinetto e Magno Caldognetto (1993) come
appartenenti al dominio paralinguistico opposto a quello linguistico e extralinguistico28.
Questo tipo di suddivisione è rintracciabile in molta della letteratura linguistica. Antonino
Pagliaro ad esempio utilizzava l’espressione elementi parafunzionali per indicare tutti gli
elementi della parola che animano l’atto linguistico di ‘riflessi soggettivi’:
Essi consistono in riferimenti accentuativi e tonali, nella maggiore o minore
rapidità dell’articolazione fonica, nelle affinità che vengono avvertite fra una
immagine acustica e il reale (Pagliaro, 1973, p. 49).
In riferimento al tono infatti Pagliaro parla di zona di confine tra dominio funzionale ed
extrafunzionale:
Con atteggiamenti che variano da lingua a lingua, da una parte è fatto di parola,
dall’altro è fatto di lingua, cioè partecipa del sistema come elemento della sua
funzionalità, e, in taluni casi, ha addirittura valore fonematico nell’ambito del
singolo segno (Pagliaro 1957, p. 72).
Un secondo e importante problema riguarda inoltre il piano della categorizzazione dei
contenuti emotivi. Come rileva Sornicola (2013) nell’ambito della stessa psicologia, luogo
privilegiato dello studio dei fattori emotivi, non vi è ampio consenso su cosa si debba
considerare un’emozione. Al tempo stesso è ancora oggi difficile definire con chiarezza
uno stato emotivo: esso mostra infatti confini piuttosto sfumati, e soprattutto è difficile, se
non addirittura errato, tentare di isolare concettualmente e formalmente singoli stati. Il
piano del contenuto emotivo è graduale, sincretico e vago, e l’interpretazione di una forma
fonica risulta spesso non univoca e al contempo molto legata alla situazione discorsiva:
[...] Sul piano del contenuto è molto difficile trovare definizioni condivise di stati
d’animo o emozioni come, a titolo di esempio, ‘apprensione’, ‘timore’, ‘paura’,
‘terrore’, ‘panico’, e [...] sul piano dell’espressione, non è affatto detto che una
28
I fattori extrafunzionali sono definiti da Antonino Pagliaro come esterni al nesso significante-significato, e
perciò senza partecipazione formale al sistema della lingua (1957, p. 76)
31
manifestazione fonica venga interpretata ed etichettata come manifestazione di uno
stesso stato d'animo o sentimento da parte di soggetti diversi, perché tra le entità
appartenenti a ciascuno dei due piani non esistono discontinuità o confini
categoriali [...] (Albano Leoni F., 2003: 34-35).
Studi recenti hanno inoltre posto in evidenza l’influenza che la lingua ha sulle esperienze
emotive. Quest’ultime sarebbero infatti categorizzate linguisticamente in maniera arbitraria
e non troverebbero chiare corrispondenze nel comportamento emotivo dei soggetti. Russell
e Barrett (1999) hanno ad esempio mostrato che singoli eventi considerati appartenenti alla
stessa categoria emotiva possono presentare delle differenze nel modo in cui sono espresse.
Barrett (2006) ha rilevato inoltre come sia difficile far corrispondere a una stessa categoria
semantica una serie di configurazioni emotive, rendendo così complessa l’individuazione
delle estensioni di ciascuna categoria:
It is difficult, if not impossible, to characterize any emotion category by a group of
instances that resemble one another in their correlated properties. That is, it is
difficult, if not impossible, to empirically identify the extensions of each emotion
category" (Barrett 2006, p. 45).
A tutto questo si associa quindi la difficoltà di determinare quali parametri sia necessario
tenere sotto osservazione per poter studiare il fenomeno. Le emozioni possono essere,
infatti, più o meno intense, il più delle volte esse sono il risultato di una complessa
compresenza di componenti, non facili da astrarre, e soprattutto non sempre sono
interamente veicolate dal segnale fonico. Esse infatti sono comunicate il più delle volte in
maniera multimodale, sfruttando la compresenza e l’integrazione di più modalità espressive
(Poggi e Magno Caldognetto, 1997; Poggi e Pelachaud, 2000; Magno Caldognetto e Poggi,
2001).
Bisogna inoltre tenere in conto che ad indirizzare l’interpretazione del significato
complessivo di un enunciato emotivo concorre sensibilmente anche il piano lessicale. In
32
alcuni casi, la difficoltà di categorizzazione propria di alcune emozioni è supportata in
maniera determinante dall’informazione verbale. In un recente lavoro dedicato alla
manifestazione fonica delle emozioni Vincenzo Vasco descrive le difficoltà incontrate nella
classificazione del ‘disgusto’:
[…]L’informazione verbale è indispensabile al riconoscimento di almeno alcune
delle emozioni di base. In tutti i casi in cui l’informazione vocale non permette un
sicuro riconoscimento dello stato d’animo, il piano verbale interviene guidando i
giudizi degli ascoltatori. E ciò non solo attraverso gli indicatori lessicali,
morfologici e sintattici delle emozioni, che pure ho descritto presentando le
risposte dei partecipanti. Gli enunciati, per quanto siano stati isolati dal co-testo
linguistico e dalla situazione d’enunciazione in cui erano inseriti, permettono agli
ascoltatori di ricostruire, anche solo parzialmente, quella situazione e da questa gli
stati mentali ed emotivi del parlante. Un enunciato come “Mi fai vomitare, tu a me
mi fai vomitare, hai capito?” lessicalizza il disgusto del parlante perché ne descrive
una delle conseguenze fisiologiche, la nausea (Vasco 2012, p. 277).
Il caso della manifestazione fonica delle emozioni è particolarmente denso di implicazioni
teoriche. Da un lato, soprattutto grazie agli studi sulla comunicazione parlata, vi è sempre
maggiore consapevolezza e condivisione del ruolo determinante che le stesse hanno nello
scambio comunicativo tra i parlanti29; dall’altro il loro carattere costitutivamente graduale,
sincretico e dinamico le rendono un oggetto difficilmente integrabile con un modello
linguistico fondato storicamente sui tratti tipici del modello segmentale:
29
Magno Caldognetto e Poggi (2004) ricordano come le risorse che i parlanti hanno a disposizione per
manifestare il proprio stato d’animo possono essere di diverso tipo: lessicale, tramite la scelta di certe
parole emotive; sintattico, mediante l’uso di particolari strutture marcate, ad esempio la dislocazione a
sinistra; morfologico, come l’uso di vezzeggiativi, diminutivi e dispregiativi; fonologico di tipo
segmentale, attraverso le alterazioni della struttura spettrale delle unità segmentali fonologiche, e
soprasegmentale, attraverso le variazioni di durata, intensità e frequenza fondamentale.
Inoltre in un recente volume dedicato alla manifestazione fonica delle emozioni i curatori, Magno
Caldognetto, Cavicchio e Cosi (2008, vi), sottolineano l’importanza del dominio emotivo per l’analisi
linguistica: “I contributi che vengono presentati in questo volume dimostrano l’esigenza di integrare nelle
analisi linguistiche dedicate al parlato le emozioni, considerate non solo come componente paralinguistica,
ma piuttosto come base cognitiva dell’atto comunicativo che, in quanto tale determina le scelte
linguistiche tanto a livello funzionale quanto posizionale collocando il parlato nel più ampio scenario della
comunicazione multimodale”.
33
All’interpretazione linguistica deve corrispondere l’identificazione di un valore,
che tuttavia non pare affatto pacificamente definito. La minore trasparenza della
funzionalità degli elementi soprasegmentali rispetto a quelli segmentali è infatti
questione antica e può aver agito da limite all’approfondimento della conoscenza
dei fenomeni prosodici, generando una diversità di trattamento dei due piani della
fonologia nella storia della teoria linguistica (Giordano 2008, p. 150).
Dal punto di visto dei contenuti si è visto come non vi sia una chiara condivisione sul
modo in cui esse debbano essere etichettate e organizzate. Dal punto di vista del
significante è stato inoltre riscontrato come il meccanismo che regola la trasmissione e
l’interpretabilità degli enunciati emotivi non sia ancorato in maniera stabile a pattern
espressivi unici e discreti. Le stesse emozioni di base30, considerate in alcuni casi come
discrete e universalmente manifestate, trovano non poche resistenze sulla loro
riconoscibilità dal punto di vista fonico. La ricerca psicolinguistica ad esempio non è stata
in grado, ad oggi, di identificare forme espressive comunemente riconoscibili per le
emozioni di disgusto e sorpresa (Scherer K. R., 2003). Tutto ciò si riflette dunque nella
difficoltà di organizzare il piano del significante e con esso nella difficoltà della sua
rappresentazione31. In tale organizzazione e rappresentazione risiedono infatti le scelte sul
numero dei parametri da utilizzare per l’analisi e sulla conseguente delimitazione dei
confini categoriali su cui poggerebbero i valori emotivi corrispondenti 32. Al tempo stesso,
30
31
32
34
Con il termine emozioni di base si intendono solitamente le seguenti emozione: gioia, paura, collera,
tristezza, disgusto, paura, sorpresa. Esse sono comunemente indicate come innate, universali e manifestate
in maniera identica da individui appartententi a culture anche molto differenti tra di loro. Per una revisione
della vasta bibliografia sull’argomento cfr. Scherer (2003).
Anche limitamente allo studio delle sole emozioni di base, è stato possibile riscontrare una notevole
varietà nella raccolta e analisi di dati sia in studi a livello intra-linguistico che inter-linguistico (Magno
Caldognetto e Poggi, 2004). Le cause sono da attribuire a numerosi fattori: dalla scelta del materiale
(parlato spontaneo, letto, recitato o prodotto in laboratorio), dalla scelta dei parlanti (attori professionisti o
persone comuni), dalla scelta del metodo di elicitazione delle emozioni prescelte (presentazione di
etichette linguistiche, fotografie, scenari ecc.), fino al materiale linguistico prodotto (vocali o sillabe
isolate, interiezione, parole di diversa lunghezza etc.).
Problemi descrittivi sono stati evidenziati da Sherer: “[...] part of the problem in demonstrating the
existence of qualitative differences between the vocal expression for different types of discrete emotions
and the hypothesis that the voice might only reflect arousal, has been due to a limitation with respect to
the number of acoustic parameters extracted” (Sherer 2003, p. 249). E ancora: “Efforts to describe/analyze
da questa organizzazione e rappresentazione dipende, dal punto di vista scientifico, la
comparabilità dei dati e la successiva conferma e disconferma dei risultati.
3
Il problema della rappresentazione
In questo primo capitolo ho voluto presentare il mio studio attraverso alcune riflessioni
sulla terminologia in uso e sui livelli di analisi in potenza coinvolti nella ricerca.
Presentare alcune nozioni, affrontare distinzioni terminologiche e talvolta anche di
metodo, mi è parso come una buona base di partenza per lo sviluppo ulteriore del mio
lavoro di ricerca. Credo infatti che le due problematiche relative all’intonazione,
affrontate in questo primo capitolo, ossia la pertinenza linguistica e il modello di
descrizione possibile, riguardino molto da vicino il problema della notazione in generale e
le esigenze di metodo in particolare, offrendo insieme e di conseguenza quasi un
“apparato normativo” per la lettura e l’organizzazione dei significanti. La terminologia
manifesta di fatto una certa oscillazione tra posizioni tutte interne alla teoria linguistica e
al metodo. Il caso delle emozioni che ho scelto di citare dimostra come il rapporto tra
teoria, analisi e oggetto dell’analisi non sia immediato ma mediato e come esso passi dal
piano del significante e da quello del significato. Albano Leoni e Magno Caldognetto, per
esempio, considerano le emozioni linguisticamente e in stretto legame alla componente
intonativa. Integrare le emozioni nella teoria linguistica diventa così un passaggio
necessario per l’accettazione di esse come oggetto di possibile rilievo in un dato apparato
teorico e di ricerca.
Sarà utile a questo punto segnalare la distinzione terminologica presente in lingua tedesca
con i termini Vorstellung e Darstellung. Entrambe si riferiscono alla nozione di
rappresentazione. Nel primo caso il riferimento è a una “rappresentazione interna”, mentre
the intonation of actual emotional expressions have been limited by the use of simplified descriptors, such
as measures of overall pitch level, pitch range or overall rise/fall of pitch contours” (Bänziger e Scherer
2005, p. 254).
35
nel secondo caso il riferimento è a una “rappresentazione esterna” di tipo simbolico.
Quest’ultima, nell’accezione Kantiana, viene descritta come una sorta di presentazione
metaforica, una presentazione indiretta di ciò che non si può rappresentare
intellettualmente mediante concetti.
L’accezione che qui si intende dare alla rappresentazione vuole mettere in luce il carattere
‘creativo’ e ‘formativo’ di questa presentazione simbolica. L’analisi dei meccanismi e dei
problemi relativi ai modelli notazionali permette infatti di rendere ‘visibile’ gli elementi
del dato sonoro che le teorie hanno formalizzato e reso quindi pertinenti. Questi elementi
non fanno parte di un mondo scomponibile e analizzabile in maniera univoca, ma sono il
frutto di complessi processi di interpretazione, discussioni, spesso mediati da conoscenze
scientifiche o da altri tipi di rappresentazione elaborati in contesti diversi (è il caso della
musica ad esempio). Così come l’azione dei segni si staglia sul solco che separa i soggetti
dal mondo, allo stesso modo i modelli stessi che le teorie elaborano per analizzare i propri
oggetti subiscono le conseguenze di tale distanza 33. Su questa linea si può ricondurre ad
esempio la riflessione del filosofo Nelson Goodman che ha dedicato feconde pagine alla
nozione di rappresentazione:
Il modo più ingenuo di concepire la rappresentazione potrebbe essere formulato
così: «A rappresenta B se e solo se A somiglia apprezzabilmente a B» ovvero «A
rappresenta B nella misura in cui A somiglia a B». Tracce di questa concezione,
33
36
Condivisibili sono a questo proposito le considerazioni di Prieto (1975 [1976], p. 121-140) sul rapporto tra
pertinenza e ideologia in relazione alle conoscenza nell’ambito delle scienze della natura e delle scienze
umane “Per il fatto che la pertinenza non viene mai dall’oggetto si può già concludere che non c’è mai
conoscenza della realtà materiale che sia “oggettiva” nel senso che essa starebbe passivamente difronte
all’oggetto rispecchiandolo “così com’è” o, in ogni caso, in un modo che non dovrebbe niente se non
all’oggetto stesso. Ma è possibile andare ancora più lontano: dal fatto che la pertinenza è introdotta da un
soggetto che è sempre un soggetto sociale deriva che non può esserci conoscenza della realtà materiale che
sia socialmente “neutra”. E questa conclusione è valida, è chiaro, tanto per i modi non scientifici di
conoscere la realtà materiale quanto per i modi scientifici di conoscerla, cioè per le scienze della natura”
(Prieto (1975 [1976], p. 126-127). Di converso l’ideologia sarà intesa come “ogni discorso riferentesi a
una conoscenza della realtà materiale che miri a “naturalizzare” questa conoscenza, cioè a spiegarla o farla
apparire come la conseguenza necessaria di ciò che è il suo oggetto” (ibidem p. 136). Sul rapporto tra
scienza e attività scientifica come prassi socialmente determinata cfr. Latour (1987 [1998])
variamente modificata e corretta restano in gran parte della letteratura sulla
rappresentazione. Sarebbe tuttavia difficile concentrare una maggior quantità
d’errore in una formula così breve (Goodman, 1968 [2008], p. 11).
Il breve estratto del lavoro di Goodman affronta sinteticamente alcuni aspetti che si
ritengono di particolare utilità. In prima analisi la critica all’idea che vi possa essere un
rapporto immediato tra A (configurazione segnica) e B (il suo oggetto). Idea che
sostanzialmente si può far coincidere con quella di lingua come nomenclatura, ossia di
una lingua intesa come un elenco di etichette variamente applicate ad oggetti del mondo
già categorizzati. La rappresentazione non consiste, per Goodman, in una duplicazione
punto a punto dell’oggetto, né in una riproposizione in termini segnici di una sua
‘essenza’ che si colloca al di là dei soggetti e del loro modo di ‘conoscere’.
Il nodo centrale che viene posto in evidenza dal filosofo statunitense è il riconoscimento
di un processo di mediazione e al tempo stesso convenzionale che si stabilisce tra
l’oggetto e la configurazione segnica 34.
Non c’è, tra il simbolo e l’oggetto al quale il simbolo allude, alcuna relazione di
corrispondenza costretta dalla qualità dell’oggetto. La relazione al contrario può stabilirsi
in maniera ‘arbitraria’ mediante la selezione di aspetti e caratteristiche di volta considerati
pertinenti:
L’identità o invarianza di un mondo vuol dire identità rispetto a quel che all’interno
di quel mondo vale come organizzato (Goodman 1978 [2008], p. 9).
Un secondo aspetto che emerge dalla riflessione di Goodman è la critica nei confronti di
una nozione ingenua di somiglianza35. Quest’ultima altro non sarebbe che un effetto, una
34
35
“La verità è che un quadro, per rappresentare un oggetto, deve essere un simbolo di esso, stare per esso,
riferirsi ad esso; e che nessun grado di somiglianza è sufficiente per instaurare la relazione di riferimento
richiesta” (Goodman, 1968 [2008] p. 13).
Il problema dell’iconismo, iniziato sulla base della nozione di icona in Peirce, ha avuto, soprattutto
durante gli anni ’70, una centralità nel dibattito teorico sul linguaggio, e in particolare nelle arti visive
37
sorta di effetto di realtà, che si fonda su complesse costruzioni convenzionalmente
accettate. Il rifiuto della concezione di rappresentazione intesa come copia è sostituita
dall’idea che rappresentare è in prima istanza interpretare l’oggetto sotto un particolare
punto di vista. In questo senso anche la somiglianza è riconducibile alla riproposizione in
termini segnici di relazioni individuate tra proprietà dell’oggetto.
La teoria della rappresentazione come copia, dunque, si trova bloccata sin
dall’inizio dall’incapacità di specificare che cosa debba essere copiato. Non un
oggetto nel modo in cui è, né in tutti i suoi modi di essere, né nel modo in cui esso
appare all’occhio prima che la mente intervenga. Inoltre c’è qualcosa di sbagliato
nella nozione stessa di copiare un qualche modo di essere dell’oggetto, un qualche
suo aspetto. Poiché un aspetto non è propriamente l’oggetto-a-una-certa-distanza-eangolazione-e-sotto-una-certa-luce; ma è l’oggetto così come noi lo consideriamo o
concepiamo, una versione o un’interpretazione dell’oggetto. Rappresentando un
oggetto, noi non copiamo tale interpretazione – la otteniamo (Goodman, 1968
[2008], p. 16).
Mi soffermerò brevemente su un caso particolarmente significativo che coinvolge un
particolare tipo di rappresentazione: la mappa.
Le mappe geografiche sono un ottimo strumento esplicativo per indagare il ruolo e le
conseguenze della rappresentazione intesa come forma di interpretazione e conoscenza.
Una prima conseguenza del rappresentare qualcosa su una tavola è l’inevitabile
attribuzione ad essa di proprietà spaziali. Gli oggetti assumono una collocazione, una
distanza, divengono in qualche modo misurabili, comparabili e organizzabili.
Come si è visto, Goodman rifiutava l’idea di rappresentazione come copia. Fare la copia
di una città o di un territorio significherebbe a questo punto incarnare il famoso paradosso
di Jorge Luis Borges relativo alla Mappa dell’Impero in scala 1:1. Ovviamente oltre che
(Eco, 1968; 1975; 1997; 2007) (Fabbrichesi Leo, 1983; Gombrich, 1961; Goodman, 1968; Maldonado,
1974; Volli, 1974; 1975). La posizione di Nelson Goodman è molto vicina a quella semiotica: la
somiglianza che si stabilisce tra l’oggetto e il segno sarebbe frutto di scelte e costruzioni simboliche
convenzionali.
38
tecnicamente dispendioso ciò sarebbe soprattutto inutile. Una mappa geografica è infatti
uno strumento finalizzato a usi piuttosto determinati: possiamo usarla per orientarci in
luoghi circoscritti, per pianificare viaggi, itinerari, studiare la conformazione dei territori o
anche progettare un attacco militare. Ciò è reso possibile dal fatto che essa è ‘a portata di
mano’. In breve, ciò che risulta pertinente non è tanto la distanza assoluta tra gli elementi
simbolici e l’oggetto rappresentato, ma il rispetto delle proporzioni delle relazioni, in
breve il rispetto del rapporto tra le distanze. Vi è poi un secondo aspetto connaturato al
primo e che riguarda la selezione dell’informazione. Ciò che la carta geografica permette
di vedere non è l’oggetto come possiamo osservarlo ‘a occhio nudo’. In esso le
informazioni potenzialmente segnalabili vengono accuratamente selezionate e rese più
evidenti mediante artifici simbolici. Sulla base di questa selezione avremo tipologie di
mappe differenti: da quelle generiche (fisiche, politiche) a quelle speciali (carte
idrografiche, nautiche, geologiche etc.) fino alle carte tematiche (carte climatiche,
geomorfologiche etc.). Ciascuna di esse permette di scorgere aspetti di un oggetto
densamente composto e al tempo stesso fornisce indicazioni adeguate all’obiettivo per cui
ce ne serviamo36.
Aggiungiamo inoltre che, a loro volta, ciascuna di queste mappe può essere ‘manipolata’
per far emergere ulteriori aspetti del luogo o del territorio rappresentato, non
immediatamente visibili. In una carta topografica è possibile segnalare particolari
itinerari, segnalare tipologie particolari di edifici (storici, commerciali, etc.) e destinarla
quindi a obiettivi diversi.
36
La ‘destinazione d’uso’ di un particolare tipo di rappresentazione non è un criterio che può essere
considerato esterno o marginale. L’uso costituisce infatti un aspetto centrale del problema, divenendo
spesso condizione d’esistenza della rappresentazione stessa, o aspetto di influenza delle sue caratteristiche.
Basti pensare alle problematiche legate alla misurazione.
“Use enters the very concept of representation, as we have seen: to be a representation is to be something
used or taken to represent something. But in addition, representations have their uses. They are typically
produced for a certain use, with a certain purpose or goal” (van Fraassen 2008 p 76).
39
Nella trascrizione dell’intonazione è possibile rinvenire molte caratteristiche simili. Il
suono una volta proiettato sul supporto planare acquista proprietà spaziali e fisiche. Sarà
quindi misurabile, confrontabile e scomponibile in più parti. L’analisi acustica consente
ad esempio di individuare relazioni non percepibili dai sensi e di spiegarne le componenti
mediante formule matematiche. Le stesse possono essere utili per tradurre il tutto in
immagini su assi cartesiani attraverso complessi algoritmi che ne consentono una sorta di
‘trasduzione’ grafica. Al contempo tali immagini possono costituire termine di paragone
con altri livelli di pertinenza per l’analisi: alle modulazioni della frequenza fondamentale
è possibile sovrapporre l’andamento di intensità o sovrapporre un diagramma che
permetta di illustrare le formanti.
La sola analisi acustica tuttavia non può ‘mostrarci’ il meccanismo funzionale della lingua
che dovrebbe essere invece descritto mediante altri mezzi rappresentativi o almeno in
concomitanza37.
Se a questo confrontiamo ad esempio il modo di organizzare lo stesso fenomeno su un
supporto planare destinato alla rappresentazione musicale avremo risultati sensibilmente
diversi. La partitura sarà infatti ottimizzata per l’individuazione e la descrizione di
proprietà e relazioni proprie del sistema musicale. L’organizzazione discreta delle unità
foniche in note musicali è vincolata alle regole armoniche e melodiche e soprattutto è
vincolata alla possibilità che esse possano essere eseguite mediante uno strumento
musicale38.
37
38
40
Prendendo ancora in prestito la metafora della carta geografica, sarebbe difficoltoso studiare
l’organizzazione politica del territorio italiano (la precisa collocazione delle Regioni, Province e dei
Comuni ad esempio) partendo dalle informazioni estratte dalla sola cartina fisica. Avremmo forse
l’opportunità di intuire alcune forme di organizzazione sulla base di confini naturali (è il caso di catene
montuose o fiumi) ma difficilmente potremmo usarla per una descrizione adeguata al nostro obiettivo.
La stessa rappresentazione acustica della f0, corrispondente a un suono puro, sarebbe limitante rispetto
alla ricchezza timbrica degli strumenti musicali che il cui ‘carattere’, tra le altre cose, tra le altre cose è
dato proprio dalla diversa composizione delle frequenze armoniche.
Eppure l’utilizzo dello spartito musicale per la rappresentazione dell’intonazione
linguistica non è stata un’ipotesi isolata. Joshua Steele, si vedrà in particolare nel capitolo
2, la utilizzò per controbattere la tesi di Lord Monboddo e dimostrare l’esistenza nella
lingua inglese di variazioni tonali oltre a quelle di tipo dinamico. Jones si servì di questo
strumento notazionale per la trascrizione degli andamenti melodici sotto forma di contorni
continui e Fonagy e Madgics (1963) lo utilizzarono per dimostrare l’isomorfismo degli
andamenti melodici emotivi in musica e nella lingua.
Quest’ultimo aspetto è indicativo rispetto al ruolo che le precedenti interpretazioni e le
precedenti rappresentazioni ‘esterne’ di un fenomeno possono esercitare sui nuovi modelli
interpretativi. Lo studioso di filosofia della scienza Bas C. van Frassen ha approfondito i
meccanismi che regolano le immagini scientifiche, così come modelli e teorie in vari
campi del sapere: dalla matematica alla chimica, dalla fisica alla meteorologia. Egli stesso
ha rilevato l’impatto del linguaggio sulle nuove teorie:
Tutto il nostro linguaggio è profondamente contaminato da teorie. Se potessimo
purificare il nostro linguaggio dai termini carichi di teoria, a cominciare da quelli
introdotti di recente come «ricevitore VHF», continuando con «massa» ed impulso
fino ad «elemento» e così via nella preistoria della formazione del linguaggio,
potremmo trovarci, alla fine, senza alcun risultato utile. Il modo in cui parliamo, ed
in cui parlano gli scienziati, è guidato dalle immagini fornite dalle teorie
precedentemente accettate. Questo vale anche, come fu già sottolineato da Duhem,
per i resoconti sperimentali” (van Fraassen, 1980 [1985], p. 39) 39.
39
Nell’ambito della teoria dell’arte Ernst Gombrich (1960 [2002]) ha fornito ad esempio una folta
documentazione con l’obiettivo di mostrare come il modo in cui noi vediamo e raffiguriamo è influenzato
dall’esperienza, dalla pratica, dagli interessi e dalle disposizioni. In una intervista al sito dell’associazione
culturale ASIA Edoardo Boncinelli spiega come anche a livello percettivo e neurofisiologico vi sia una
forte influenza di ciò che noi sappiamo su ciò che in questo momento stiamo vedendo: “Gli stimoli nel
mondo non ci sono, ci sono soltanto onde elettromagnetiche, ci sono onde sonore, molecole, ma il colore
rosa, il LA, l’odore del gelsomino non ci sono, questi nascono da dentro di noi, sono sensazioni che
vengono colte dal mare degli stimoli fisici e chimici che evidentemente devono esserci. La corteccia
cerebrale fa questa sintesi, mette insieme le informazioni sugli angoli, sul colore, mette insieme anche
quello che io so su quello che vedo e comprendo, infatti il bambino vede abbastanza bene ma coglie molto
41
Il ritardo con cui gli studi linguistici hanno dato attenzione ai fenomeni intonativi e
prosodici della lingua potrebbe infatti essere letto anche secondo questa linea
interpretativa. L’assenza di una rappresentazione adeguata o di strumenti in grado di
rendere il fenomeno osservabile e di conseguenza analizzabile 40 ha tenuto in latenza
riflessioni e elaborazioni teoriche:
La prosodia è un fenomeno difficile da studiare per molti motivi. Il primo è
certamente il fatto che tutte le variabili fisiche che la determinano (il tempo e
l’intensità per il ritmo, la frequenza per l’intonazione) si dispongono lungo un
continuum del quale non esiste una rappresentazione discreta già data (come è
invece grazie alla scrittura, per la fonologia, morfologia, lessico e, in parte,
sintassi). E questo aspetto è alla base di numerosi problemi teorici ed applicativi
(Albano Leoni, 2009, p. 41).
Sorte opposta sembra invece essere stata quella legata al modello segmentale.
Recentemente Albano Leoni (2005, 2007, 2009) ha approfondito il rapporto tra la nozione
linguistica di fonema e la rappresentazione alfabetica, mettendo in luce tra le due una
stretta relazione:
Il concetto di unità minima, come elemento naturale della costituzione fonica delle
lingue, accompagna la cultura occidentale fin dall’antichità, e nasce dalla messa a
punto e dalla diffusione di scritture alfabetiche. La produzione di testi scritti in
forma alfabetica, cioè come successione lineare di elementi grafici discreti e (dopo
la loro canonizzazione) tendenzialmente invarianti, corrispondenti ciascuno a un
segmento fonico, è il frutto di un lavorio durato molti secoli e che ha visto il
succedersi, l’alternarsi e l’intrecciarsi di scritture ideografiche, sillabo grafiche,
miste, alfabetiche. [...] Il significante era dunque rappresentato nella scrittura che,
nella sua forma alfabetica, consentiva di vedervi quelle proprietà di linearità e
40
42
meno della realtà perché non ha ancora una stratificazione di conoscenza” (L’intervista è reperibile presso
il sito internet http://www.asia.it)
Basti pensare che il cimografo, il primo strumento che ha permesso di rappresentare graficamente il flusso
d’aria durante la fonazione è stato introdotto per la prima volta in fisiologia da Carl Ludwig nel 1855.
Esso fu successivamente ripreso e modificato per ricerche in campo fonetico dall’abate P. J. Rousselot nel
1897 (Giannini e Pettorino 1992). Il cimografo fu ad esempio utilizzato in combinazione con un supporto
basato sulla notazione musicale tradizionale da Daniel Jones (1922) nei suoi studi sperimentali
sull’intonazione.
discretezza che ho detto (Albano Leoni, 2009, p. 83).
Simili considerazioni non sono nuove. Diversi linguisti e studiosi del linguaggio hanno
visto nella scrittura alfabetica un modello determinante per l’elaborazione del principio
delle unità foniche: è il caso di Leopardi 41, Croce42, Harris 43, Saussure44.
Le caratteristiche di discretezza e segmentalità, che, come si è visto, hanno caratterizzato
l’immagine scientifica della lingua, e al tempo stesso hanno determinato il dominio dei
fenomeni ascrivibili alla linguisticità, altro non sarebbero che il riflesso delle
caratteristiche della lingua come pertinentizzate dalla scrittura alfabetica.
La sovrapposizione fra le caratteristiche della scrittura e l’immagine scientifica della
lingua è rintracciabile in numerosi autori. A tal proposito si possono leggere le parole di
Hjelmslev:
41
42
43
44
“L’alfabeto è la lingua col cui mezzo noi concepiamo e determiniamo presso noi medesimi l’idea di
ciascuno di detti suoni. Quegli che non conosce l’alfabeto, parla, ma non ha veruna idea degli elementi che
compongono le voci da lui profferite. Egli ha ben l’idea della favella, ma non ha per niun conto le idee
degli elementi che la compongono [...] Ma per determinare gli elementi della voce umana articolata,
l’unica lingua, come ho detto, è l’alfabeto” (Leopardi in Gensini 1998, pp. 48-54).
De Mauro (1965, p. 92) ricorda che: “Il Croce intendeva negare che fonemi, sillabe, parole avessero un
grado di realtà pari a quello dell’atto espressivo-intuitivo, e intendeva asserire che le unità linguistiche di
cui si discorre nelle grammatiche o si fa l’elenco nei dizionari sono il prodotto dell’attività estraente degli
individui, ossia [...] sono il frutto della prassi: esso sono create non dai parlanti, ma dei grammatici e dai
linguisti nella loro attività schematizzatrice e catalogatrice”.
"L’idea che nel parlare selezioniamo singole consonanti e vocali, che in qualche modo spuntano nella
nostra bocca allineate nell’ordine giusto, come perline su un filo, non è altro che l’immagine
dell’ortografia alfabetica proiettata all’indietro sulla produzione orale" (Harris 1986 [1998], p. 47-48).
Harris giunge addirittura a negare l’idea che l’alfabeto, in origine, avesse l’obiettivo di rappresentare la
struttura fonica della lingua. Per il linguista, agli inventori dell’alfabeto: “Non interessava rappresentare
quella che oggi sarebbe chiamata morfologia, vale a dire la scomposizione grammaticale interna delle
forme di una parola o la variazione sistematica fra forme correlate di una parola. Né interessa
rappresentare la composizione sintagmatica di gruppi di parole. Né ancora [...] interessava rappresentare
gli aspetti dell’accento e dell’intonazione. Ma la conclusione più paradossale è che essi non erano
interessati al principio alfabetico in sé stesso – o almeno non al principio alfabetico così com’è di solito
interpretato dai moderni studiosi: vale a dire, il principio “una lettera: un suono” (Harris 1986 [1998], p.
131).
“Quando mentalmente si sopprime la scrittura, chi è privato di questa immagine sensibile rischia di non
percepire più niente altro che una massa informe di cui non sa che fare. È come se si levasse il salvagente
a chi sta imparando a nuotare” (1922 [2005], p.44).
43
Con l’invenzione della scrittura alfabetica si era capito che dovevano essere creati
tanti segni diversi quante erano le differenze di espressione rese necessarie dalla
lingua per assicurare la comprensione linguistica. Dunque, con l’invenzione
dell’alfabeto è stata individuata, o si è cercato di individuare, non la struttura della
pronuncia, bensì la struttura della lingua stessa. Non è avvenuta una trasposizione
della sostanza fonetica in quella grafica, ma la forma dell’espressione linguistica è
stata direttamente calata nella materia grafica per poterla fissare. Ovviamente,
questa analisi primitiva non si è presentata come riflessione teoretica, ma piuttosto
come un’intuizione pratica e perciò non possiamo meravigliarci che non abbia
colto la situazione reale abbastanza profondamente da evitare la confusione di
forma e sostanza (Hjelmslev 1938 [1988], p. 223)
La posizione del linguista danese sintetizza due importanti questioni. La prima, e
condivisibile, consiste nel considerare l’espressione scritta come una delle modalità
semiotiche con cui si attualizza una più generale facoltà di linguaggio45, la seconda, non
condivisibile, è quella di considerare i due tipi di manifestazione come equipollenti e
dunque distinguibili esclusivamente dal punto di vista della sostanza:
La fonematica deve considerare i fonemi come elementi del sistema di una lingua,
senza considerare il modo articolare in cui sono realizzati. Essi, infatti, possono
essere realizzati per mezzo di suoni, ma anche in molti altri modi, ad esempio per
mezzo di lettere o di altri segnali che siano comunemente adottati da due o più
individui. Fra suoni e linguaggio non vi è una connessione necessaria: lo dimostra
il fatto che per esprimere fonemi possono essere utilizzati simboli diversi dai suoni
(Hjelmlsev 1936, p. 213).
Alcuni autori non si soffermano ad una equipollenza strutturale dei due sistemi e si
spingono alla formulazione di ipotesi relative ai meccanismi cognitivi che regolerebbero
45
44
La scrittura in questo senso può essere considerata come una delle tante forme semiotiche in cui il
linguaggio umano in senso più ampio può trovare espressione. Vi è tuttavia un’ulteriore considerazione
che credo debba essere esplicitata. Mi riferisco alla tendenza, in più luoghi criticata (Cardona 1981, Harris
1986 [1998], p. 65-82), di vedere nell’alfabeto una ‘naturale’ evoluzione dei processi di scrittura verso uno
stadio ideale di perfezione: Roy Harris parla a tal proposito di ‘fallacia evoluzionistica’. Ammettere
l’ipotesi evoluzionistica della scrittura, significherebbe infatti appiattire tale nozione su un punto di vista
‘fonocentrico’, esautorando invece il complesso di manifestazioni espressive, riconducibili alla stessa
facoltà di linguaggio, che comprende anche la produzione e l’uso di sistemi grafici con fini comunicativi e
non solo. Non sarebbe del tutto improbabile vedere in questo diffuso appattiamento delle implicazioni sul
destino linguistico della prosodia.
in maniera del tutto similare la manifestazione e l’interpretazione della lingua scritta e
l’elaborazione e l’interpretazione della lingua parlata:
It is precisely that parallelism of phonemics and graphemics which renders feasible
a phonemic transcription, that is, a transcription in which each grapheme represent
one phoneme, and in which no phoneme can be rendered by more than one
grapheme. In such a writing the function and properties of the phoneme and
grapheme are exactly equivalent, except that different processes of production and
different perceptive sense are involved: the hand and the eyes for the grapheme, the
vocal apparatus and the ears for the phoneme. In such an alphabet ‘letter’ and
‘sound’ are synonymous. If today we distinguish between letter (o better
grapheme) and speech sound (or better phoneme), the reason is that there has
hardly ever existed in any language with some tradition of writing a strictly one to
one ratio between the two (Pulgram 1951, p. 19) 46.
Il punto su cui credo debba essere condotta la riflessione risiede, nuovamente, sulle due
accezioni di rappresentazione prima proposte, e quindi nel rapporto tra la darstellung,
come
rappresentazione
simbolico-convenzionale
‘esterna’
e
vorstellung
come
rappresentazione ‘interna’ propria dei parlanti. Mi sembra che nei casi appena mostrati si
tenda a far coincidere la seconda, e quindi la ipotetica capacità inconscia dei parlanti di
servirsi della lingua, con la prima, ossia con il modello metalinguistico storicamente e
convenzionalmente elaborato.
È evidente che se si accetta questo tipo di sovrapposizione, che porta a considerare i
fenomeni linguistici costitutivamente, discreti, segmentabili, è difficile riservare un ruolo
centrale alla prosodia e alla melodia del parlato.
Una delle soluzioni proposte per la rappresentazione linguistica dell’intonazione è stata,
come si è visto nelle pagine precedenti, quella di trasferire sul significante intonativo le
46
Secondo Ernst Pulgram anche gli animali farebbero uso delle distinzioni fonemiche dell’uomo per
riconoscere gli ordini: “Even animals can do better than that, since they react to phonemes (hardly to
intellectual, semantic content) of a human command regardless of the speaker’s allophonic habits Once a
dog has learned to obey the order ‘Down’, he will behave accordingly no matter who pronounces the
word” (Pulgram 1951, p. 16).
45
caratteristiche considerate peculiari dal ‘modello segmentale’.
Questa operazione trova tuttavia diverse resistenze, alcune delle quali saranno approfondite
nel corso del lavoro47. Vi è prima di tutto la profonda differenza tra la nozione di fonema48
applicata all’ambito segmentale e la stessa applicata in ambito prosodico. I due livelli,
infatti, sono tradizionalmente basati su elementi fonologici le cui proprietà e i cui tratti
fonetici sono ritenuti intrinseci nel primo caso e relativi nel secondo:
Un segmento intonativo di prosodia ritagliato dal suo contesto è in sé totalmente
privo di significato e di funzione, perché i valori che determinano la prosodia, e
dunque anche l’intonazione, sono sempre e tutti radicalmente relativi, valutabili e
interpretabili solo in rapporto a ciò che segue e a ciò che precede all’interno
dell’intera unità prosodica considerata. Quindi, di un segmento vocalico in sé, del
quale posso descrivere in modo ‘oggettivo’ l’altezza, la durata e l’intensità (oltre
che il timbro), non posso dire se sia linguisticamente acuto o grave, lungo o breve,
intenso o debole (Albano Leoni 2001, p. 58).
Uno stesso suono sarà considerato basso, quando ciò che precede e/o segue ha valore, in
termini di altezza, maggiore, al contrario sarà considerato alto se ciò che precede e/o
segue ha valore, sempre in termini di altezza, minore. La proposta derivata dallo
strutturalismo americano, di organizzare i valori delle altezze in 4 livelli astratti (chiamati
pitch phoneme) fu criticato proprio per l’ambiguità con cui una stessa manifestazione
fonica poteva essere ricondotta a trascrizioni, e di conseguenza a combinazioni di fonemi
intonativi, differenti49.
Vi è poi la differenza dal punto di vista dei contenuti. L’individuazione dei fonemi
segmentali è determinata infatti dalla rilevazione di discontinuità dal punto di vista dei
contenuti, una discontinuità che non è riconducibile, se non riduzionisticamente, al livello
47
48
49
46
Cfr. Capitolo 4
La definizione della nozione di fonema è stata oggetto, nel corso della sua elaborazione, di un acceso
dibattito. Nel presente studio si è fatto riferimento ai resoconti disponibili in Trubeckoj (1939 [1979], pp.
49-55), Jones (1950 [1967], pp. 253 - 269), Twaddel (1935) e su Albano Leoni (2005; 2009, pp. 82-109).
Cfr. Capitolo 4
prosodico, in cui le differenze tra i significati sono molto spesso sfumate e graduali e sono
il più delle volte legate all’atto linguistico nel suo complesso.
Nel contesto britannico invece, caratterizzato soprattutto per l’attenzione rivolta alla
didattica delle lingue, il rapporto tra rappresentazione ‘interna’ e rappresentazione ‘esterna’
sembra invertito. Il punto di partenza è infatti l’atto comunicativo, la quotidiana
comunicazione parlata, la possibilità dei comuni parlanti di capire e farsi capire. In questa
prospettiva che pone al centro, inevitabilmente, la trasmissione e l’interpretazione dei sensi,
risulta particolarmente complesso eliminare o marginalizzare il ruolo della prosodia.
Tutto ciò, come immaginabile, ha ricadute decisive sulla scelta dei modelli, sui modelli
rappresentativi e, come si è visto, sulla ‘taglia’ del dominio linguistico50.
Cap. 2:
1
La Musica delle Parole
Musica e intonazione
Uno dei tratti che ricorre in molti tentativi di descrizione dell'intonazione linguistica è il suo
50
Come sottolinea Marotta (2003) richiamando la distinzione tra linguistica ‘interna’ e linguistica ‘esterna’,
la propensione all’una o all’altra interpretazione del dominio della linguistica implica l’esclusione o
l’inclusione del modulo intonativo nel piano del significante.
47
continuo confronto con l'ambito musicale. Sono numerosi gli ‘esperimenti’, soprattutto
nella tradizione di studi britannici, volti a servirsi della musica come modello di confronto
per indicare le variazioni melodiche del parlato.
Tra le conseguenze di questa scelta metodologica vi è il riconoscimento di un'affinità
sostanziale tra i due sistemi semiotici, consistente nel medesimo utilizzo del materiale
fonico come mezzo di espressione. Numerosi sono gli studi che hanno indagato lo stretto
rapporto che lega espressione musicale ed espressione verbale. In ambito musicologico ad
esempio l'incontro tra parole e musica è stato esplorato nella poesia o nella musica vocale
(Dalmonte 1993, 2005); negli studi etnomusicologici si è prestata molta attenzione alle
diverse pratiche che collocano il parlato e il cantato lungo un continuum 51 ; anche la
psicologia ha mostrato, mediante esperimenti percettivi (Deutsch, Lapidis, Henthorn, T
2008; Deutsch, Henthorn, Lapidis, 2011), la possibilità di 'trasformare' il parlato in cantato.
È evidente che operare una netta suddivisione tra i due ambiti non è operazione da poco.
Un primo problema potrebbe essere di ordine strettamente semantico. Qual è il valore della
parola musica e qual è invece il valore del termine lingua? Un altro problema ad esso affine
potrebbe essere di tipo socio-culturale. L'uso del canto o della musica strumentale può non
essere vincolato al semplice intrattenimento, ma entrare a far parte di contesti quotidiani
con finalità comunicative diverse da quelle estetiche e più vicine invece a quelle del
linguaggio verbale. Un altro esempio è nella poesia dove le componenti acustiche
dell'espressione verbale e gli stessi segmenti possono essere organizzati per finalità
esclusivamente 'musicali', arrivando addirittura a forme di poesia sonora (Fontana, 2003).
Quest’ultima fonda la sua specificità sulla completa disarticolazione del livello verbale, a
51
48
“Nelle tradizioni orali di ogni società la contiguità tra parlato e cantato trova ulteriori conferme nelle
numerose modalità di formalizzazione del discorso caratterizzate dalla presenza enfatica di uno o più tratti
soprasegmentali nell’enunciazione del messaggio linguistico. Slogan, proverbi, forme di saluto, detti
sapienziali, comandi e incitazioni militari, scongiuri, formule magiche, incantesimi, preghiere, discorsi
rituali, cantilene infantili, annunci di banditori e di venditori ambulanti - ma la lista potrebbe estendersi a
dismisura - sono tutti eventi in cui la caratterizzazione fonica (in particolare ritmica e/o intonativa)
assume, nell’atto comunicativo, un ruolo coessenziale, quando non addirittura predominante, rispetto ai
tratti più specificatamente referenziali dell’enunciato verbale” (Giattanasio 2002, p. 1004).
vantaggio invece delle sole caratteristiche sonore della lingua. D'altro canto anche la
nozione di musica non ha mai smesso di definire e ricostruire i suoi confini. Il compositore
John Cage si impegnava a "esplorare tutte le possibilità strumentali non ancora repertoriate,
l'infinito delle fonti sonore possibili" (Cage, 1976); Luciano Berio nel definire la musica
chiarisce come essa sia "tutto ciò che si ascolta con l'intenzione di ascoltare musica" (Berio,
1981). È evidente dunque che l'ammissibilità o meno di un confronto tra i due domini è
vincolata inevitabilmente alla prospettiva e al valore che associamo ai due termini.
Il nostro ambito di indagine, quello relativo allo studio dei modelli linguistici
dell'intonazione, non ha l'obiettivo di rovistare tra le pieghe di questo complesso rapporto
ma si limita a riferirne i contatti. L'attenzione alle variazioni melodiche della lingua non è
recente. David Crystal (1969) spiega che tra le prime riflessioni sulla melodia della voce
umana vi sono le teorie della liturgia medievale. Peter Alan Martin Clemoes (1952)
racconta, infatti, che il canto gregoriano era essenzialmente uno sviluppo dei contorni
intonativi del parlato quotidiano, una specie di speech-song e mostra che all'interno della
liturgia medievale era stato sviluppato un sistema ortografico di guide in grado di indicare
al lettore le giuste inflessioni della voce 52.
Il primo e più completo sistema di annotazione e analisi dell'intonazione linguistica è, però,
quello di Joshua Steele (1775).
Steele nacque in Irlanda ma visse per molti anni a Londra. Nel 1756 fu eletto membro, e nel
1779 vice presidente, della Society of Arts Manufactures and Commerce, la principale
società per lo sviluppo di nuove tecnologie, incluso nuove notazioni musicali.
Come verrà mostrato in dettaglio nel presente capitolo, l'autore si servirà di un modello
notazionale preso in prestito dalla musica per mettere in piedi un vero e proprio sistema di
52
Si tratta della notazione neumatica, forma embrionale della nostra rappresentazione musicale ordinaria.
Notazione particolarmente interessante perché ad essa può essere fatta risalire la prima rappresentazione
spaziale dei suoni, che, prima di allora, era vincolata a forme simili a quelle alfabetiche (Machabey 1952
[1963]). Essa consistevana nella simbolizzazione grafica degli andamenti generici della voce, senza
riferimenti al valore assoluto dell’altezza, ai relativi intervalli e nemmeno alla durata dei suoni. La
notazione doveva servire quindi come ausilio mnemotecnico, e rinviare a un sapere convenzionalmente
condiviso, e quindi non necessariamente inscrivibile nella notazione, le precise regole di esecuzione.
49
trascrizione e analisi dei diversi livelli prosodici: tono (accent), durata (quantity), intensità
(force), pause (pause), prominenza e scansione metrica (emphasis).
La musica, o meglio il suo sistema teorico interpretativo, ha permesso, nel caso appena
citato, di osservare il proprio oggetto da quel particolare punto di vista, inserendolo in un
metalinguaggio descrittivo ad esso fino ad ora estraneo. A mio avviso sarà proprio la
condivisione di questo stesso schema di codifica 54 che permetterà l’uso di espressioni quali
melodia o armonia della parola. Anche Daniel Jones si servirà in vari modi dello spartito,
che utilizzerà soprattutto come mezzo per mettere in forma, attraverso linee continue, i
contorni intonativi della frequenza fondamentale. Altro aspetto che sembra ricorrere in
molti degli autori presi in esame è la grande importanza che viene conferita alla pratica di
trascrizione. Steele, Jones e Sweet sono autori che mostrano particolare interesse verso le
tecniche di annotazione del parlato. Sweet, ad esempio, dichiarerà “The notation of sound
is scarcely less important than their analysis: without a clear and consistent system of
notation it is impossible to discuss phonetic structure of a language” (Sweet 1877a, p. 100).
Se da un lato le tecniche di scrittura del suono si caratterizzeranno per il loro utilizzo
pratico, in particolare ai fini della memorizzazione e della didattica delle lingue, dall'altro
favoriranno la riflessione su nozioni, come quella del fonema, che entreranno a far parte del
dibattito linguistico moderno. La distinzione riscontrata da Sweet tra suoni semanticamente
distintivi e suoni semanticamente non distintivi, trova infatti la sua applicazione nel doppio
sistema di trascrizione fonetica (broad e narrow).
In ultima analisi credo che il tentativo operato nelle prossime pagine possa essere non solo
di utilità storiografica, attraverso la presentazione di lavori lontani nel tempo e nello spirito
da quelli attuali, ma soprattutto teorica, per l’attenzione che impone all’analisi stessa delle
pratiche descrittive, e quindi al modo in cui costruiamo il nostro oggetto d’indagine.
54
50
Un’interessante riflessione sugli schemi di codifica in ambito scientifico è presente in Goodwin: "Per
poter dar vita a un insieme strutturato di dati, a insiemi di osservazioni che possano esser confrontati gli
uni con gli altri, gli scienziati utilizzano schemi di codifica in grado di circoscrivere e delineare il mondo
che analizzano. Quando eventi diversissimi sono visti attraverso un unico schema di codifica, diventano
possibili osservazioni equivalenti" (Goodwin 1994 [2003], p. 23).
2
Joshua Steele e la melodia della voce
Il primo autore che qui ci apprestiamo ad analizzare è ricco di aspetti di indubbio interesse.
Come ho più volte affermato, i motivi che hanno indirizzato lo studio verso
l’approfondimento dei modelli di rappresentazione della prosodia sono legati alla
convinzione che tali pratiche possano essere viste come espressioni di particolari sguardi
sull’oggetto di studio. La prospettiva e al tempo stesso la distanza dall’oggetto sono infatti
variabili, e da questo, a mio avviso, possono dipendere i risultati delle ricerche stesse. Il
caso di Joshua Steele e del suo Prosodia Rationalis è emblematico rispetto a quanto appena
asserito. Lo scopo del suo lavoro è infatti proprio quello di elaborare un modello che
contrastasse con la visione della lingua comunemente accettata. In questo senso egli si
trova ad operare su un oggetto non del tutto determinato, in cui alcuni aspetti sono ancora
privi di una codificazione e per questo semioticamente “amorfi”.
Detto in altri termini, il linguista si trova a dover costituire ex novo la forma del suo
oggetto, definendone gli elementi pertinenti e individuandone i tratti che istituirebbero così
la correlazione tra espressione e contenuto.
Nella prefazione del suo saggio, infatti, Steele afferma programmaticamente la necessità di
andare oltre i classici studi sulla lingua, vincolati alle due sole proprietà accent e quantity, e
per questo insufficienti ad una più chiara descrizione del fenomeno sonoro linguistico:
The puzzling of obscurity relative to the melody and measure of speech, which has
hitherto existed between modern critics and ancient grammarians, has been chiefly
owing to a want of terms and characters, sufficient to distinguish clearly the several
properties or accidents belonging to language; such as, accent, emphasis, quantity,
pause and force; instead of which five terms, they have generally made use of two,
only, accent and quantity, with some loose hints concerning pauses, but without
any clear and sufficient rules for their uso and admeasurement; so that the
definition required for distinguishing between the expression of force (or loudness)
51
and emphasis, with their several degrees, where worse than lost; their difference
being tacitly felt, though not explained or reduced to rule, was the cause of
confounding all the rest. (Steele 1779, p. viii).
Per poter fare ciò, l’autore si troverà a lavorare in maniera del tutto peculiare con un
modello interpretativo già esistente, quello musicale. Quest’ultimo infatti, diversamente
dagli studi classici sulla lingua, aveva da tempo messo in forma quelle dimensioni del
fenomeno sonoro, pertinentizzandone i tratti e legandoli alla stessa grammatica musicale.
Altezze, durate, battute, pause etc. trovavano nella musica una secolare formazione, tale da
mettere in luce proprio quelle proprietà che Steele considerava pertinenti anche in una
teoria della lingua. La prassi musicale, la sua riflessione meta-semiotica e la sua
formalizzazione, rappresentavano per l’autore un ottimo strumento di analisi.
Le continue pratiche di risegmentazione del contenuto, la scoperta o invenzione di nuove
correlazioni tra espressioni e contenuti permettono infatti ai sistemi linguistici e nonlinguistici di modificarsi ed evolvere continuamente per mezzo soprattutto della loro
continua trasduzione. Nel nostro caso specifico, la traduzione tra sistemi è resa possibile
dall’utilizzo di un particolare strumento di misurazione. Steele infatti, per poter trasporre in
unità musicali il flusso parlato, utilizza una viola. Tramite quest’ultima, egli può controllare
i movimenti melodici della propria voce, eseguirli sullo strumento e trasporli infine sul suo
nuovo metodo di annotazione. Tale operazione non è affatto ingenua. Al contrario, essa
porta con sé una serie di conseguenze teoricamente importanti.
La viola può essere considerata come un vero e proprio trasduttore. Le frequenze delle onde
sonore della lingua, una volta misurate mediante lo strumento musicale, cambiano statuto
semiotico, ed entrano a far parte di un nuovo sistema di riferimento. La melodia della voce
diviene melodia musicale, trasformandosi in sequenza di note, e per questo motivo potrà
essere trasposta nel sistema notazionale proprio della musica, la partitura. Senza questa
traduzione, tutta l’operazione di Steele sarebbe impossibile. Tuttavia tale passaggio, come
vedremo, non sarà privo di conseguenze. La lingua, pur mostrando somiglianze con il
52
sistema musicale, non è un suo calco. Le pertinenze e le stesse unità di misura sono
costruite sulla base di contrasti e funzioni armoniche che, sebbene illuminanti sotto certi
aspetti, possono risultare obsolete rispetto alle finalità del linguista.
2.1
Prosodia Rationalis
Iniziamo il percorso storico con una figura importante soprattutto per lo sviluppo di un
modello rappresentativo dell'intonazione linguistica. Come abbiamo già detto nelle note di
apertura, musica e parlato presentano interessanti aspetti di convergenza, che possono
essere indagati mediante l’analisi dei modi in cui tali aspetti sono percepiti, elaborati e
infine rappresentati su supporti cartacei, attraverso una vera e propria trasduzione 55 su un
altro sistema semiotico, la scrittura.
Johsua Steele sembra essere stato il primo a porre in essere un vero e proprio sistema di
annotazione del parlato, con il chiaro intento di registrare anche altre proprietà riscontrabili
nel flusso orale. Insomma un metodo di annotazione che, in mancanza di strumenti
automatici, permettesse di rendere conto di livelli di pertinenza molteplici. Steele viene
infatti ricordato per il suo studio sui tratti soprasegmentali 56, analisi resa possibile proprio
grazie all'elaborazione di un sistema di notazione capace di rendere conto di tali
caratteristiche della voce parlata.
Nel 1775 egli concluse il suo volume dal titolo En essay toward establishing the Melody
and Measure of speech, to be expressed and perpetuated by peculiar symbol, un vero e
proprio trattato per un nuovo studio della lingua.
L’opera fu “commissionata” dall’allora presidente della Royal Society, Sir John Pringle,
55
56
Con il termine trasduzione, preso in prestito dalle scienze fisiche e naturali, ci riferiamo a un particolare
tipo di traduzione che intercorre tra sistemi semiotici differenti (traduzione intersemiotica). Secondo la
tripartizione di Jakobson (1959) si può parlare infatti di traduzione endolinguistica (quando
l’interpretazione dei segni linguistici avviene all’interno di una stessa lingua), interlinguistica (quando
l’interpretazione avviene tra due sistemi linguistici differenti) o intersemiotica (quando vi è un passaggio
da un sistema semiotico ad un altro).
Cfr. Alkon, P.K. (1952).
53
dopo l’uscita del trattato filosofico sull’origine del linguaggio, The Origin and Progress of
Language di Lord Mondobbo. Come ricorda Omond (1921) la prima parte del volume (fino
a pagina 55) era circolata privatamente come manoscritto. Nel frattempo Mondobbo, a cui
era stata recapitata la recensione al suo lavoro, rispose ammettendo alcuni punti critici e
chiarendone altri. La risposta e la successiva corrispondenza tra i due autori furono riprese
dallo stesso Steele che le integrò, inserendole come III e IV parte del suo volume.
Nel 1779 venne pubblicata una seconda edizione dal titolo Prosodia rationalis con una
parte intitolata Aggiunte e che conteneva le discussioni avute con altri commentatori del
suo lavoro. Fino alla chiusura del primo volume (corrispondente a p. 193) le due edizioni
sono praticamente identiche.
La controversia avuta con Lord Monboddo e che dà avvio alle riflessioni di Steele, si basa
sulla convinzione, del primo, che nella lingua inglese non vi siano cambiamenti
significativi di altezze:
That there is no accent, such as Greek and Latin accent, in any modern language and lastly, the impossibility for us, that are not accustomed to it, to found those
antient accents, has persuaded many people that it was impossible for the antients
to do it (Monboddo 1774, p. 276).
E ancora:
As to accents in English, Mr. Foster, from a partiality, very excusable, to his
country, and its language, would fain persuade us, that in english there are accents,
such as in Greek or Latin. But to me, it is evident that there are non such; by which
I mean, that we have no accent upon syllables, witch are musical tone, differing in
acuteness and gravity. For though, no doubt, there are changes of voice in our
speaking, from acute to grave, and vice versa, these changes are not upon syllables,
but upon words or sentences (Monboddo 1774, p. 298).
Infine:
And there is another difference betwixt our accents and the antient, that ours
neither are, nor can by their nature, be subject to any rule; [...] We have, no doubt,
54
accents in English, and syllabic accent too: but they are of a quite different kind
from the antient accents; for there is no change of the tone in them; but the voice is
only raised more, so as to be louder upon one syllable than another. [...] That there
is no other difference is a matter of fact, that must be determined by musicians.
Now I appeal to them, whether they can perceive any difference of tone betwixt the
accented and unaccented syllable of any word; and if there be none, then is the
music of our language, in this respect, nothing better than the music of a drum, in
which we perceive no difference except that of louder or softer, according as the
instrument is mote or less forcibly struck (Monboddo 1774, p. 299 - 300).
Per Lord Monboddo, dunque, la voce umana, sempre secondo la metafora musicale,
sarebbe più vicina a uno strumento a percussione, che sfrutta principalmente differenze di
tipo dinamico, articolando i piani e forti.
Le sillabe prominenti sarebbero differenti non sulla base di un mutamento melodico, ma su
di uno esclusivamente dinamico "we perceive no difference except that of louder or softer".
Come ricorda Barker (1924) le posizioni di Mondobbo erano condivise da molti dei suoi
contemporanei, e Steele, di contro, risponde:
"The sound or melody of speech is not monotonous, or confined like the sound of a
drum, to exhibit no other changes than those of loud or soft" (Steele 1779, p. 17).
L'aspetto che risalta immediatamente all'occhio, e che diviene evidente anche attraverso
l'osservazione del modello elaborato da Steele, è la necessità di un continuo rimando alla
terminologia e alla metafora musicale. Non è difficile comprendere il perché. Come
abbiamo più volte accennato, la mancanza di una chiara codificazione degli eventi
linguistici intonativi, rendeva necessario l'ausilio di un sistema di interpretazione che
potesse rendere conto delle pertinenze, e allo stesso tempo rendesse possibile una
trattazione, una descrizione. Il sistema notazionale musicale, e il suo relativo bagaglio
categoriale e descrittivo, era infatti il primo e immediato modello a disposizione:
55
In devising a scheme for expressing on paper musical slides of voice, in the melody
speech, I chose one which might come as near as possible to modern notation of
music, in order to make it the easier to be comprehended by those whose ideas of
sounds and measure of time are already formed on that plan (Steele 1779, p. 8).
È dunque solo attraverso il filtro, solo attraverso l'occhio musicale che era possibile
guardare e soprattutto ascoltare la lingua dal punto di vista dell'intonazione. In assenza di
tale filtro infatti era necessario elaborare, sulla base di determinate pertinenze, un sistema in
grado di rendere conto di tale fenomeno. Monboddo e Steele si riferiscono alla voce parlata
attraverso la metafora degli strumenti musicali, e il secondo giunge addirittura ad attingere
dal campo semantico e simbolico della musica per costruire il proprio modello 57.
Se da un lato tale approccio gli consente di mostrare delle somiglianze strutturali tra i due
sistemi, come ad esempio il movimento melodico dell’intonazione, dall’altro proprio il
confronto tra i due sistemi mostra delle discrepanze, delle differenze, che rendono
necessarie delle modifiche al modello notazionale. Come vedremo, gli stessi movimenti
melodici che nel parlato sono meno ampi e “continui” necessitano di un modello
rappresentativo che renda conto anche di variazioni di altezza inferiori al semi-tono.
Il fine di Steele, come da lui stesso dichiarato, non è quello di prescrivere il corretto modo
di pronunciare una determinata enunciazione, ma quello di lasciare una traccia, di lasciare
una memoria scritta in grado di rendere successivamente accessibili le enunciazioni
passate:
If the method, here effayed, can be brought into familiar use, the types of modern elocution may be
trasmitted to postery as accurately as we have receved the musical composition of Corelli (Steele
1779, p. 14).
2.2
57
56
Il pentagramma come organizzazione dello spazio sonoro
La stessa unità di misura è ricavata a partire dalla musica. Si prende come strumento di misura infatti il
quarto di tono, ricavato dalla ulteriore suddivisione del semitono (distanza minima tra una nota e la
successiva)
Il primo e immediato elemento che viene trasportato nel modello di Steele è il
pentagramma (vedi figura 6). Il supporto per la registrazione delle variazioni tonali viene
costruito a partire dal sistema di registrazione proprio della rappresentazione musicale.
In quest’ultima lo spazio sonoro è strutturato all’interno di un sistema di righe e di spazi in
cui le note assumono determinati valori posizionali, reinterpretabili a loro volta mediante
l’unità di misura fisica dell’Hertz (Hz), la quale esprime la frequenza di oscillazione di
un’onda sonora.
Fig. 6 - L'estensione delle altezze tonali in musica. In basso la corrispondenza con il valore espresso in Hz
La successione di righe e di spazi delimitano la serie di altezze discrete del sistema
musicale (note), secondo l’articolazione alto–basso / acuto–grave. Il valore delle note, in
termini di altezze, varierà all’interno della rappresentazione musicale mediante la posizione
dei simboli grafici.
57
Fig. 7 Intervallo ascendente
Fig. 8 Intervallo discendente
Come è possibile vedere nelle due immagini, alla dimensione verticale del supporto
notazionale corrisponde l’organizzazione del valore delle altezze, e a loro volta righe e
spazi saranno d’ausilio per la discretizzazione del range. L’altezza del tono cambierà in
maniera crescente nel momento in cui il simbolo grafico verrà posizionato più in alto. Al
contrario essa sarà decrescente man mano che i simboli grafici saranno posizionati nella
parte inferiore del pentagramma.
L’asse orizzontale, secondo l’articolazione sinistra/destra – prima/dopo avrà invece la
funzione di determinare la successione lineare delle configurazioni sonore: come nella
nostra scrittura destrorse (vedi figura 9).
Fig. 9 disposizione delle altezze secondo la scala musicale di Do maggiore
Tale sistema di rappresentazione permette al musicista di avere una chiara immagine
dell’andamento melodico che dovrà essere riprodotto per mezzo dello strumento. È bene
58
sottolineare che se da un lato vi è una corrispondenza biunivoca tra livello posizionale e
nota, esso non ha una corrispondenza spaziale precisa. Uno stesso spostamento sul supporto
planare, da rigo a spazio o da spazio a rigo, non corrisponde sempre a uno stesso
cambiamento dal punto di vista tonale. Le righe e gli spazi insomma non sono suddivisi
seguendo una stessa unità, in quanto tale unità segue un principio funzionale chiaramente
connesso alla teoria musicale. Come possiamo vedere nella figura 9, i simboli grafici sono
disposti ciascuno seguendo una stessa progressione posizionale.
Non vi è tuttavia un isomorfismo tra distanza grafica e “intervalli” musicali 58. A uno stesso
spostamento sul supporto planare (passaggio da rigo a spazio o viceversa) non si ha lo
stesso spostamento sonoro. Se facciamo riferimento alla figura 9 è possibile notare che il
rapporto tra le note mi – fa (primo rigo – primo spazio) pari a un semi-tono59 è differente da
quello tra le note sol – la (secondo rigo –secondo spazio) che è invece di un tono. Il
principio di organizzazione segue infatti lo schema della scala maggiore60.
Il supporto notazionale di Steele, partendo dal pentagramma, giunge all’elaborazione di un
nuovo sistema di annotazione. Come si può osservare nella figura 10, lo spazio tra le righe
del pentagramma è ulteriormente suddiviso mediante l’ausilio di altre 3 linee orizzontali.
Tali righe diventano espressione di una nuova segmentazione dello spazio sonoro che rende
58
59
60
L’intervallo può essere definito come la distanza tra due note successive o simultanee. Più tecnicamente il
termine può essere inteso come la “relazione esistente tra due suoni emessi simultaneamente e/o
susseguentemente da una e/o più fonti diverse; tale relazione è esprimibile in termini relativi come
differenza tra le frequenze dei due suoni (la relazione tra i due suoni è allora una relazione di ampiezza,
che dà un’indicazione della distanza fra i due suoni nella scala delle frequenze udibili), ed in termini
assoluti come rapporto numerico (ossia come proporzione) fra tali frequenze (la relazione tra i due suoni è
allora una caratteristica tipologica). In questo senso si dirà quindi che, dati due suoni a e b di frequenza 𝑓a
e 𝑓b, l’intervallo (a,b) è la relazione tra i suoni a e b esprimibile o in termini relativi come differenza:
x=𝑓a - 𝑓b o in termini assoluti come proporzione: y=𝑓a /𝑓b. A seconda che l’emissione dei due suoni sia
consecutiva oppure simultanea, si parla di intervallo melodico (intervallo «orizzontale», diacronico)
oppure di intervallo armonico (intervallo «verticale», sincronico)” (Azzaroni 1997, p. 211).
Il semi-tono rappresenta in musica, almeno nella teoria moderna, la distanza minima tra due note.
Lo schema della scala consiste nell’insieme delle relazioni che stringono le note di cui è composta.
Ciascuna nota sarà infatti collocata a una certa distanza l’una dall’altra, secondo una determinata
successione di intervalli. La scala maggiore è, ad esempio, composta dalla seguente successione T – T – st
– T –T –T –st (dove T=Tono e st=semi-tono). La scala di do maggiore, presentata in figura 9, è infatti
caratterizzata da queste relazioni.
59
misurabili variazioni pari a un quarto di tono. Le lettere a loro volta stanno per le note
musicali secondo la denominazione anglosassone (A= La, B=Si, C=Do, D=Re, E=Mi,
F=Fa, G=Sol), mentre i simboli x (croce singola) , ⨳ (doppia croce) e ⩩ (tripla croce)
servono a specificare l’aumento di altezza della nota sul pentagramma. In particolare, x
indica che la nota a cui si applica deve essere maggiorata di un valore in altezza pari a 1/4
di tono (es. Ax si riferisce alla nota A maggiorata di 1/4 di tono). Discorso simile per la
doppia e tripla croce: la variazione di altezza applicata alla nota corrisponderà
rispettivamente di 2/4 e 3/4 di tono.
Fig. 10 La disposizione delle altezze sul supporto notazionale di Joshua Steele (1779)
Questa necessità grafica è in realtà il riflesso di una presa di coscienza da parte dell’autore
che considera la distanza minima musicale (il semi-tono) insufficiente a rappresentare le
variazioni melodiche del parlato:
The change of voice from acute to grave, and vice-versa, do not process by pointed
degrees coinciding with the divisions of the chromatico-diatonic scale [of music];
but by gradations that seem infinitely smaller (which we call slides); and though
altogether of a greater extent, are yet too rapid (for inexperienced ears) to be
distinctly subdivided: consequently they must be submitted to some other genus of
music than either the diatonic or chromatic (Steele 1779, p. 17).
60
La melodia del parlato è per Steele differente rispetto a quella musicale 61 . Se in
quest’ultima il valore delle altezze varia in maniera discreta lungo livelli di range definiti
secondo la scala cromatico-diatonica (12 note, ciascuna a distanza di un semitono da quella
immediatamente adiacente), nella voce i movimenti melodici dell’intonazione sono
continui e con differenze di pitch inferiori al semitono. Tale constatazione indurrà l’autore a
suddividere ulteriormente la notazione musicale secondo una scala avente unità pari al
quarto di tono.
È interessante notare che cent’anni dopo un fonetista come Alexander John Ellis definì le
differenze tra voce cantata e voce parlata in termini molto simili:
In speech, pitch is uncertain, unsustained, and “gliding” through several pitches but
slightly differing from each other. In song, pitch is (or should be) quite certain,
sustained, and rarely gliding off to another pitch. Occasionally this is permitted in
portamento, but then the passage is from one definite susteined pitch to another
(Ellis 1878, p. 10).
Oltre all’aggiunta di righe Steele si servirà di ulteriori ausili grafici per rendere conto delle
micro variazioni tonali continue.
61
Di seguito alcune definizioni “In senso fisico la melodia non è nient’altro che una successione di suoni”
(Ottó Károlyi, 1965); “If two tones are not heard at the same time, bur are consecutive tones of one
melodic line, the interval is called melodic interval, as distinguished from the harmonic interval, in wich
the two tones are sounded together” (W. Piston, 1941); “Il “segmento melodico” è costituito da almeno
due altezze (frequenze) distinte sull’asse del tempo: l’unità minima della “dimensione orizzontale” della
musica risulta essere allora l’intervallo, o più precisamente l’intervallo melodico” (Azzaroni 1997 p. 316).
61
Fig. 11 Esempio di trascrizione dell'espressione oh!
Nella notazione sono inseriti anche nuovi segni in grado di mostrare i movimenti continui
(Slides) propri del parlato, da Steele definiti accents o notes of melody:
“Instead of using round or square heads for the notes to be maked on this scale (as
in the ordinary music) let us substitute sloping or curving lines, such expression
may require;
,
,
,
; which lines, when drawn on the foregoing
scale, will easily shew through how many quarter tones the voice is to slide: and
these I call accent or notes melody” (Steele 1779, p. 7).
In questo modo l’autore può servirsi di una serie di elementi grafici in grado di descrivere
andamenti continui tramite accenti lineari o circonflessi.
- accento lineare verso l’alto descrive un andamento crescente
- accento lineare verso il basso descrive un andamento decrescente
- accento circonflesso – alto/basso
- accento circonflesso – basso/alto
La figura 11 mostra l’esempio della trascrizione di una interiezione (oh!). Oltre alla
dimensione verbale, introdotta nella partitura tramite i caratteri alfabetici, la
rappresentazione permette di osservare la variazione del tono.
62
2.3
La dimensione temporale e ritmica del parlato
Ciò che è stato mostrato fino ad ora è l’analisi della dimensione intonativa del suono. La
categoria del tono è stata descritta osservando l’articolazione delle altezze e i suoi modi di
rappresentazione che si estendono lungo i due assi, verticale e orizzontale, della partitura.
Nel costruire il proprio modello Steele si servirà ancora del sistema di rappresentazione
musicale, grazie al quale potrà mettere in forma altre tre proprietà del suono che l’autore
chiamerà: quantity, force and emphasis.
Le prima, corrispondente alla durata, si riferisce al valore relativo del suono e del silenzio
lungo il continuum temporale e riguarda “the distinction of longer and shorter notes or
syllables, or of longer and shorter pauses” (Kassler 2005, p. 233). Nel supporto notazionale
musicale l’indicazione del tempo di durata avviene mediante la forma dei segni grafici: la
maggiore o minore lunghezza di una singola nota viene espressa tramite precisi simboli
organizzati secondo uno schema binario:
62
Fig. 12 Articolazione del tempo in musica 63
Tale indicazione è inoltre relativa: per determinare la lunghezza effettiva di una nota
occorre infatti stabilire un tempo, solitamente espresso in bpm (battiti per minuto).
Ciascuna figura musicale, tramite la sua forma, esprimerà quindi non il valore assoluto in
secondi ma il numero di battiti necessari ai fini della sua esecuzione e dipenderà quindi
dall’unità temporale di riferimento. Sullo stesso principio, il sistema musicale organizza le
pause. A ogni nota di durata corrisponde un identico valore di durata pausale.
63
Il simbolo in alto con forma circolare (denominato breve), pari al 4/4, indica la durata del suono relativa al
tempo di riferimento, espresso in battiti al minuto (bpm). Su un tempo di 120bpm (pari a un battito ogni
mezzo secondo) il simbolo avrà valore di 4 battiti, dunque 2sec. I valori posti immediatamente sotto hanno
un valore dimezzato, pari a 2/4 e così via. Nella notazione musicale moderna i valori di durata intermedi si
ottengono mediante l’utilizzo di altri segni denominati punto di valore e legatura di valore.
64
Fig. 13 Articolazione delle pause
Nel sistema di Steele la durata degli elementi linguistici assume la stessa strutturazione di
quella musicale appena illustrata. La rappresentazione del tempo, e in particolare della
durata, ha dunque la forma già definita dal sistema musicale, secondo una suddivisione
binaria.
Fig. 14 Il sistema delle durate in Joshua Steele
Allo stesso modo egli inserisce nel sistema simbolico un secondo segno tipografico per
segnalare le pause, seguendo sempre la stessa articolazione binaria:
65
Fig. 15 Il sistema delle pause in Joshua Steele
Attraverso la combinazione dei due elementi grafici, coda e testa, Steele è in grado di
rappresentare la durata e l’andamento melodico.
Fig. 16 Esempio di elementi rappresentativi
Mediante la forma della testa e della coda è possibile esprimere accento e durata, mentre
per mezzo della posizione lungo l’asse verticale della partitura Steele può invece rendere
conto del valore tonale del suono linguistico (vedi figura 11). La seconda proprietà,
indicata con il termine force (o quality of suond), si riferisce a ciò che in italiano
designiamo con il termine volume, o intensità (Loudness), e che contribuisce a determinare
la dinamica della produzione orale. Per segnalare tali cambiamenti di volume (expression
of loudness), l’autore di Prosodia Rationalis introduce un’altra serie di elementi grafici,
non presenti nel sistema di notazione musicale. Mediante i segni
e
può segnalare un
aumento puntuale del volume su un determinato segmento di frase secondo l’articolazione
forte e piano o più forte (
e
) e più piano (
), mentre attraverso i simboli
,
può invece indicare rispettivamente i processi di
incremento progressivo del volume (crescendo), di decremento e di andamento uniforme
dell’intensità.
Con l’ultima proprietà, emphasis, l’autore interpreta due fenomeni. Il primo, detto poize,
66
corrisponde al peso, è quello che in linguistica viene definito come stress 64 e che i musicisti
chiamano beat. Distintamente dall’accento dunque, che rendeva conto di una modulazione
tonale, il poize descrive i cambiamenti locali di prominenza a partire dalla dinamica:
Therefore, in order to avoid the confusion made by moderns in the misuse of word
accent, let us call the note or syllable on which the cadence falls, heavy, and where
necessary, denote it by this mark
; and the note, or syllable, erroneously called
unaccented, we will call light, and the mark it thus
; and as we shall find, there
are two sorts of light notes, let the lightest be represented thus
20).
(Steele 1779, p.
Il secondo aspetto contenuto nella proprietà emphasis è quella che Steele definisce
cadences. A differenza della musica in cui il termine cadenza ha valore armonico65, per
Steele essa assume un carattere propriamente ritmico. Un corrispondente musicale della
cadenza in questione è infatti la battuta. Senza entrare nel profondo dibattito musicologico,
e con l’intento di chiarire soprattutto l’influenza del modello musicale su l’elaborazione
notazionale di Steele, possiamo riferire il termine battuta alle “unità che dividono il
continuum temporale in valori di durata stabili”. La battuta dunque ha la funzione di
organizzare il flusso temporale in segmenti che hanno un determinato valore di durata 66.
64
65
66
In linguistica i termini accent e stress sono utilizzati per indicare un certo tipo di prominenza. Essi sono
principalmente distinti a seconda della proprietà del suono che si incarica di determinare tale prominenza:
“The different between stress and accent, then, is based on wich of the attributes of sound is perceptually
most dominant feature of utterance: in the case of stress, the dominant perceptual component is loudness;
in the case of accent, the dominant perceptual component is pitch” (Crystal 1969, p. 120).
Con il termine cadenza si indica in musica una determinata sequenza stereotipica di accordi.
“Al principio di preservazione dei gruppi mensurali nelle singole voci dell’insieme polifonico [...]
subentra ora il principio di aggregazione delle durate secondo gruppi accentuativi periodici e regolari,
ovvero secondo segmenti di pari durata il cui inizio è caratterizzato da un accento comune che ritorna con
regolarità” (Azzaroni 1997, p. 140). Sempre Azzaroni definisce battuta “un raggruppamento di durate
organizzate non più secondo i criteri della variabilità della mensura, bensì secondo una successione
regolare e ripetitiva di accenti forti e deboli che, quanto meno in questa fase iniziale, sono il relazione
diretta con il movimento e le figure richiesti dalla danza” (Azzaroni 1997, p. 161).
Con la battuta, che sostituisce l’antico gruppo mensurale, entra in campo quindi un nuovo concetto di
raggruppamento di durate: “determinate quantità di tempo, rappresentate da corrispondenti quantità di
valori di durata delle note, tendono a porsi come costanti e successivi frazionamenti del continuum sonoro
- alla stregua di una serie di «pacchetti» contigui di tempo - grazie ad un tratto significativo, un
67
In musica (ma integrata ugualmente nel sistema notazionale di Steele) tale segmentazione
viene resa graficamente attraverso l’uso della stanghetta, ossia una linea verticale che
suddivide il pentagramma in veri e propri box isocronici:
Fig. 17 Esempio di rappresentazione delle battute
Il numero frazionario posto all’inizio, indica il valore dell’unità di durata che verrà
localmente articolata secondo differenti combinazioni di note e di pausa:
Il significato attribuito alla frazione quale indicazione del tempo è connesso
all’idea (concretamente e totalmente realizzata nella composizione musicale,
oppure realizzata solo in parte) di una pulsazione continua di accenti forti e deboli
che scorre nel tempo e lo modella secondo “unità” determinate dalla frazione
numerica: ad es. 4/4 ci dice che il tempo musicale viene organizzato secondo una
serie continua di insiemi di quattro semiminime alternativamente accentuate, 9/8 ci
dice che gli insiemi che modellano il tempo sono costituiti da nove crome accentate
a tre a tre, e così via. Da questo punto di vista la globalità del fenomeno musicale
sembra contrassegnata, al suo livello profondo, dallo scorrere di una pulsazione
non uniformemente accentata, caratterizzata dal ritorno di determinati timepoints di
accenti forti che segmentano nel tempo musicale certe “unità”: questo flusso di
accenti che organizza e modella il livello temporale della struttura profonda della
composizione lo si può identificare con il metro (Azzaroni 1997, p. 169).
«marcatore» invisibile, ma percepibile ai sensi, come momento di discontinuità: un accento che cade
all’inizio di ciascun «pacchetto» sull’attacco del primo valore di durata, un «punto nel tempo» (un
timepoint) che è contemporaneamente appoggio (momento di riposo, momento finale) e avvio (momento
dinamico, momento iniziale) di ogni successivo raggruppamento di durate” (Azzaroni 1997, p. 160).
68
Tale suddivisione ha uno strettissimo legame sia con la dinamica della composizione e
produzione sia con quella della percezione: il compositore ha dei punti di appoggio metrici
per la scrittura, mentre l’ascoltatore può, mediante la battuta, collegare il flusso musicale
secondo un ordine relazionale67.
In Steele il termine cadenza assume il ruolo di una vera e propria cellula temporale che
organizza il flusso linguistico secondo unità di durata assoluta. L’autore anticipa in questo
modo quello che più avanti verrà indicato come il principio dell’isocronia68.
La cadenza consiste, per Steele, nell’espressione di una tendenza a organizzare la vita
secondo movimenti alternanti di elementi prominenti e elementi deboli:
Our breathing, the beating of our pulse, and our movement in walking, make the
division of time by pointed and regular cadences, familiar and natural to us. Each
of these movements, or cadences, is divided into two alternate motions,
significantly expressed by the Greek words arsis and thesis, raising and posing, or
setting down; the latter of which, coming down as it were with weight, is what
mean to call heavy, being the most energic or emphatic of the two; the other, being
more remiss, and with less emphasis, we call light (Steele 1779, p. 20).
Attraverso la nozione di cadenza Steele può dare forma a questa idea di regolarità di
pulsazioni che traspare in molte parti del suo libro e al tempo stesso può integrarla nel suo
sistema di rappresentazione trapiantandola dalla musica. A questo punto avremo chiara
anche la sua nozione di ritmo come risultato della successione di cellule isocroniche
(cadenze) all’interno di un’enunciazione.
67
68
“È una nuova visione della composizione musicale, ma anche della percezione della musica: i ritorni e le
simmetrie, le relazioni e le corrispondenze tra eventi musicali scanditi e unificati dall’unità della battuta
costituiscono per il compositore i punti di appoggio del decorso musicale, e per l’ascoltatore una sorta di
traliccio mediante il quale riconoscere e collegare fra loro gli eventi musicali” (Azzaroni 1997, p. 161).
La moderna discussione sul principio dell’isocronia viene fatta risalire a Pike K. L. e in particolare nella
sua distinzione tra stress-timed e Syllable-Timed “the units tend to follow one another in such a way that
the lapse of time between beginning or their prominent syllables is somewhat uniform. [...]The tendency
toward uniform spacing of stresses in material which has uneven numbers of syllables within its rhytm
groups can be achieved only by destroying any possibility of even time spacing of syllables. Since the
rhythm units have different numbers of syllables, but a similar time value, the syllables of the longer ones
are crushed together, and pronounced very rapidly, in order to get them pronounced at all, within that time
limitation” (Pike 1945, p. 34).
69
2.4
Armonia della voce
Un conciso e completo sommario delle principali innovazioni di Joshua Steele può essere
letto in una recensione al volume scritta da Marie L. Barker (1924):
“1 – English speech is not monotonous; it has a melody peculiar to itself.
2- We do not always perceive that melody because we are so familiar with it; but
we notice immediately a melody that differs from the one we are accustomed to
use.
3 – The melody of speech moves up and down by “slide”
4 – The intervals between the tones in speech are not definite musical intervals.
5- The recording of the melody of speech can be reduce to a system.
6 – It is advisable to use sloping or curving lines instead of musical notes to
indicate the melody.
7 – A rising tone denotes uncompleted thought, a falling tone denotes completed
thought.
8 – The “tone of the court” and other “polite circles” differ s from that of the
provinces chiefly on account of the extremes of inflection heard in the latter
9- The range of inflection is greater in emotional than unemotional utterances
10 – Study the living language! (Barker 1924, P. 174).
70
Fig. 18 Esempio di trascrizione tratta da Steele (1779)
Nell’esempio proposto in Fig. 13 sono presenti tutti gli elementi grafici e di conseguenza
tutte le proprietà sonore che intervengono nell’eloquio. Tramite il pentagramma è infatti
possibile rendere conto dei movimenti del tono indicati dai segni grafici degli accenti o
notes of melody. Sebbene quasi identici, l’aumento di pitch che occorre sulla prima parola
“oh,” ha un valore di altezza tonale maggiore rispetto ad “aim!”. Possiamo al contempo
notare come l’intero enunciato sia suddiviso in sei cadenze, ognuna di valore pari a una
semi-breve. Interessante, inoltre, notare il ruolo attivo della pausa (terza battuta).
Quest’ultima non è infatti una semplice assenza di suono, ma viene anch’essa regolata
secondo il principio dell’isocronia. Il tempo di durata della pausa e del suono linguistico
infatti si conforma all’unità di battuta, rendendo così ritmicamente funzionale l’uso delle
stesse pause.
Tra i punti interessanti di questo lavoro vi è senza dubbio la capacità del modello di
mostrare dimensioni del suono co-occorrenti, e soprattutto pertinenti, all’interno di ogni
enunciazione. Steele può così mostrare che nell’uso della lingua i parlanti si servono di
livelli molteplici e compresenti: altezza, durata, pause, enfasi (cadence) e intensità
costituiranno, sempre all’interno della terminologia musicale, l’armonia della voce.
Ciascuna proprietà sarà suscettibile di entrare in funzione con gli usi della lingua. Lo stesso
Steele in più punti del suo lavoro anticiperà risultati che ancora oggi sono utilizzati per
71
illustrare il funzionamento della prosodia: il ruolo della stessa nella determinazione dei
significati degli enunciati, il contrasto tra il pitch discendente nelle frasi conclusive o
crescente nelle frasi sospensive, oppure la particolare modificazione di tali proprietà negli
enunciati emotivi.
Come abbiamo accennato in apertura, le unità musicali hanno
rappresentato per Steele un’arma a doppio taglio. Se da un lato gli hanno permesso di far
luce su aspetti del parlato fino a quel momento oscuri, dall’altro lato sono state del tutto
inadatte ad una chiara percezione delle funzioni linguistiche. La stessa variazione di
altezza, ad esempio di un semitono, pertinente nella teoria musicale per la distinzione di
due diversi accordi (ad esempio maggiore e minore) può non essere parimenti pertinente
per un contrasto sul piano linguistico.
Altri punti deboli, messi in luce anche da Crystal (1969), sono soprattutto di tipo
metodologico, connessi alla evanescenza dei dati in un contesto “en plain air”, e dunque
all’inaffidabilità dei risultati:
The main inadequacy with Steele’s approach, as pointed out by a critic in The
Monthly Review (1776) was procedural, namely, that it is impossible to achieve
any accurate and verifiable description of sound (as Steele had achieved with his
controlled study) when they occur in actual speech: “What ear can be so quick,
nice, and discerning, as to keep pace with, discriminate, and ascertain the rapid and
evanescent musical slides of the human voice...so as to enable a person to mark the
limit of each syllable, with regard to gravity and acuteness, and to express them on
paper?” The answer, of course, was provided by the invention of the phonograph
and tape recorder, which allowed repeated hearings and multiple checking (Crystal
1969, p. 25).
Al di là dei comprensibili limiti, dovuti soprattutto ad una inadeguata tecnologia, il lavoro
di Steele deve essere ritenuto senza dubbio una pietra miliare nella storia della linguistica,
soprattutto della linguistica orientata allo studio dell’intonazione.
72
3
Henry Sweet e “il suono della lingua”
Negli anni successivi alla pubblicazione del volume di Steele non mancarono seguaci che
continuarono e sistematizzarono il suo lavoro 70 . Tuttavia, come ricorda David Crystal
(1969, p. 25), dopo Joshua Steele non ci furono contributi significativi sul tema
dell’intonazione fino alla fine del XIX secolo, con l’opera del fonetista inglese Henry
Sweet.
Il problema dell’intonazione torna così ad essere affrontato in maniera più approfondita in
Inghilterra intorno alla fine dell’ 800. A stimolare la ripresa del dibattito contribuì
notevolmente il lavoro di Hermann von Helmholtz Die Lehre von den Tonempfindungen
als physiologische Grundlage für die Theorie der Musik (1863), che i lettori inglesi
poterono conoscere grazie alla traduzione di A. J. Ellis nel 187571.
Henry Sweet affrontò in molti dei suoi lavori, e in particolare quelli sulla fonetica della
lingua inglese, il tema dell’intonazione. Come sarà illustrato di seguito, gran parte delle sue
idee e delle sue anticipazioni in ambito linguistico trovano stimolo in tre principali nodi
tematici. Ci riferiamo all’interesse di Sweet nei confronti del primato della lingua parlata,
della didattica, e della scrittura.
3.1
Suono e senso
Language is essentially based on the dualism of form and meaning, and all attempts
to reduce language to strict logical or psychological categories, by ignoring its
formal side, have failed ignominiously. The form of language is its sounds (Sweet
1877b [1913], p. 85).
L’attenzione alla dimensione sonora della lingua è infatti l’architrave di tutta la produzione
70
71
Segnaliamo Odell (1806), Chapman (1818), Roe (1823).
“It was during the eighth decade of last Century thath a really new prosody, after some false start, fairly
began its course. The researches of Helmholtz - made accessible to English readers by A. J. Ellis in 1875 had laid bare the nature and working of those “tones” wich create verse among other form of vocal music”
(Omond 1921, p. 184).
73
di Sweet, il quale giungerà in più occasioni a sottolineare la centralità della fonetica 72 nello
studio dei fenomeni linguistici e a formulare esplicitamente due principi assiomatici:
1. ogni studio linguistico deve essere basato sulla fonetica
2. ogni studio linguistico (sia teorico sia pratico) deve essere basato sulla lingua parlata 73.
3.2
Fonetica e didattica delle lingue
La stretta relazione tra ‘forma fonica’ e dimensione semantica è un aspetto molto evidente
nella pratica d’insegnamento. La corretta pronuncia dei suoni è infatti per Sweet
indispensabile nella comunicazione quotidiana: senza un adeguato insegnamento
dell’articolazione dei suoni, i parlanti rischierebbero l’errata trasmissione e interpretazione
dei sensi74.
È proprio all’interno di questi ambiti che è possibile approfondire alcune delle importanti
intuizioni del Maestro, come le "distinzioni di suono significanti" (significant sounddistinction) e "distinzioni di suono non significanti" (superflous Sound-distinction):
Again, for practical purposes we have to distinguish between differences of sound
on which differences of meaning depend - significant sound-distintions - from
those which are not significant (Sweet 1900, p. 18).
La 'scoperta' di suoni della lingua capaci di rendere conto di mutamenti di significato
permette a Sweet di collocarsi tra gli anticipatori della controversa nozione di fonema 75,
72
73
74
75
74
In rapporto alle altre scienze linguistiche la fonetica avrebbe lo stesso valore della matematica nei
confronti delle scienze fisiche: “Phonetics is to the science of language generally what mathematics is to
astronomy and the physical sciences. Without it, we can neither observe nor record the simplest
phenomena of language. It is equally necessary in the teoretical and in the pratical study of language”
(Sweet 1900, p. 4).
“The main axiom of living philology is that all study of language must be based on phonetics” (Sweet
1900, p. 4). “The second main axiom of living philology is that all study of language , whether theoretical
or pratical, ought to be based on the spoken language” (Ivi, p. 49).
"Experience shows that even the slightest distinctions of sound cannot be disregarded without the danger
of unintelligibility" (Ivi, p. 6).
Tra gli anticipatori della nozione di fonema segnaliamo von J.Winteler che nel suo volume del 1876,
studiando il dialetto svizzero, aveva avanzato la necessità di distinguere due tipi di opposizioni foniche:
come unità funzionale della lingua, e del conseguente sviluppo della fonologia 76.
In un contributo dedicato alla figura del fonetista inglese, Annibale Elia (1974) pone in
evidenza l’attenzione che Sweet ha riservato alla lingua parlata in ambito didattico e al
ruolo che essa ha avuto nell’individuazione di opposizioni foniche semanticamente
distintive:
C’è da chiedersi come mai nessun altro nel campo dell’insegnamento linguistico
sia arrivato, prima di Sweet o in definitiva prima dei contributi della scuola
fonetica, alla definizione funzionale del suono (cioè alla scoperta del fonema) [...].
Probabilmente, proprio lo spostamento dell’oggetto dell’insegnamento linguistico
dallo scritto al parlato ha portato, in ambito della scienza dell’educazione
linguistica a prendere in considerazione le variazioni più minute del parlato
(fonetica), e con ciò stesso si è posta l’esigenza di scoprire i limiti funzionali di tali
variazioni (Elia 1974, p. 10).
Da un lato quindi la tendenza a studiare la lingua nella sua ‘forma fonica’, dall’altro la
pratica didattica trasferitasi dal piano scritto al piano orale, spinge Sweet a dover rendere
76
quelle che esprimevano mutamenti di significato e quelle che non lo esprimevano. Sull’approccio
innovativo di Winteler, incentrato sul puro principio fonetico nello studio delle lingue, si esprime anche
Sweet nel suo Presidential Address: on English Philology and phonology (Sweet 1877b). Su Winteler
anche Lepschy (1966, p. 60), Trubeckoj (1939), De Mauro in Saussure (1922) e Belardi (1959). Anche
Sievers si è avvicinato a tale nozione ponendo in essere, implicitamente, la distinzione tra foni, come
occorrenze linguisticamente indifferenti, e fonemi, come classi astratte linguisticamente differenti: “Die
vielen Spielarten von a, die ein aufmerksamer Beobachter constatieren und unterscheiden kann, werden
nur deshalb als eine Einheit betrachtet, weil sie sammt und sonders in einen bestimmten Gegensatz zu den
ebenso mannigfachen Spielarten der Gesammttypen o oder ä oder anderer Laute gesetzt werden” (Sievers
1876, p. 34).
Trubeckoj nel suo Grundzüge der Phonologie (1939) riconosce a Sweet il merito di aver individuato il
ruolo distintivo di alcuni suoni linguistici, sottolineando tuttavia la sua mancata scissione tra un punto di
vista fonetico e un punto di vista fonologico: “Ci sono però anche certi studiosi che riconoscono senz’altro
la differenza fra parola e lingua, e anche la differenza fra opposizioni di suoni distintivi e non distintivi
riguardo al significato, ma non vogliono tuttavia dividere la fonologia dalla fonetica. Ci si richiama allora
volentieri ai classici manuali della scuola inglese, a Sweet e Jespersen, che trattavano la fonologia insieme
alla fonetica, pur essendo essi perfettamente convinti della fondamentale differenza fra opposizioni di
suoni distintive e non distintive” (Trubeckoj 1939, p. 11).
Anche Bloomfield dichiarò, nel 43, di aver tratto ispirazione per la parte fonemica del suo manuale (cap
V-VIII), oltre che da Sapir e Trubeckoj, da Henry Sweet, le cui riflessioni lo spinsero verso l’idea delle
‘caratteristiche distintive’ (cfr. Jakobson 1966).
75
conto di sfumature foniche pertinenti per un parlante nativo ma difficilmente individuabili
da parlanti stranieri.
3.3
La scrittura fonetica come dispositivo modellizzante
È necessario rilevare che a spingere Sweet verso la ‘scoperta’, mai raggiunta
esplicitamente 77 , del fonema, sia stata oltre che l’attenzione alle dinamiche interlinguistiche 78 , anche la sua continua pratica di traduzione inter-semiotica. Ci riferiamo,
come prima anticipato, alla sua attenzione nei confronti della scrittura fonetica, e in
generale nei confronti dei procedimenti notazionali. La ricerca di un sistema di simboli in
grado di poter ‘proiettare’ su carta l’infinita varietà fonica di una o più lingue, costringe
irrimediabilmente lo studioso, in questo caso Sweet, ad individuare pertinenze con cui
costruire veri e propri gruppi o famiglie di ‘suoni simili’ (sarà proprio la definizione di
fonema nella tradizione britannica 79). Solo dopo questo primo passo è possibile condensare
ad unità grafica tali classi di suoni. L’interesse di Sweet per la trascrizione fonetica è
anch’esso relato alla didattica: la scrittura diveniva strumento ausiliario del parlato, in
grado di rendere ‘visibili’ le sfumature di suono espresse da ciascuna lingua 80. La notazione
77
78
79
80
76
“Winteler e Sweet, precursori della elaborata definizione di fonema data da Trubeckoj, non arrivano a
definire propriamente «il fonema», ma solo il doppio livello delle opposizioni foniche (quelle significanti
o funzionali e quelle non significanti e non funzionali)” (Elia 1974, p. 31).
A questo proposito è eloquente un passaggio presente nel suo The practical study of languages: “In
comparing the sound of a variety of languages - still more in dealing with sound generally - we require a
much more elaborate system of notation than in dealing with a single language; we can no longer content
ourselves with marking significant distinction in the simplest and shortes way: it becomes necessary to
mark such distinction as that between the first elements of English (ai, au), for the insignificant distinction
(au) and the (aa) of ask may be a significant one in some other language - as it actually is in Portuguese,
one of whose a-sound is like English (aa), while the other is the first element of English (au)" (Sweet
1900, p. 20).
“A phoneme may be defined as a family of sounds in a given language, consisting of an important sound
of the language together with other related sound, which take its place in particular sound-sequences”
(Jones 1931, p. 74).
Fondamentale per Sweet a questo proposito è la lettura del volume Visible Speech (1867) di Alex Melville
Bell, tra i principali precursori dell’alfabeto fonetico. L’idea di fondo del lavoro di Bell era appunto la
ricerca di un sistema simbolico ‘ideale’ in grado di poter rappresentare la dimensione fonica di tutte le
assume inoltre un’importante funzione teorica. Su questo il maestro inglese è molto chiaro:
The notation of sound is scarcely less important than their analysis: without a clear
and consistent system of notation it is impossible to discuss phonetic structure of a
language (Sweet 1877a, p. 100).
In questo senso la notazione dimostra di non consistere in una mera mnemotecnica, ma di
essere parte stessa della conoscenza metalinguistica della dimensione fonetica. La scrittura,
quindi, non si limita alla semplice sostituzione del segno sonoro con un segno scritto: il
nuovo dispositivo viene ad imporsi come vero e proprio strumento di modellizzazione della
lingua, costruendo una diversa prospettiva di osservazione e consentendo al linguista di
‘vederne’ la struttura e le relazioni81.
Non è quindi un caso che la citata distinzione tra significant sound-distinction e superflous
sound-distinction, trovi una corrispondenza con l’elaborazione di un doppio sistema di
trascrizione che Sweet chiamerà: Narrow Romic e Broad Romic. Se il primo servirà a
indicare le diverse sfumature di suono, anche quelle non pertinenti alle distinzioni
semantiche, il Broad invece, sarà d’ausilio per la segnalazione dei soli suoni ‘distintivi’82. È
lingue esistenti. A questo proposito lo stesso Sweet scrive: “In Mr. Bell's 'Visible Speech', accordingly, an
entirely new set of symbols is used, which indicate the action of the organs in every case, all the symbols
being made up of a few simple elements, which can be combined to any extent. If the phonetic analysis on
which Visible Speech is based were perfect, the alphabet itself might, with a few alterations, easily, be
made practically perfect, and capable of representing all possible sound whatever with the minutest
accuracy” (Sweet 1876, p. 100).
81
È forse questo il motivo per cui lo stesso Sweet ritene fondamentale, per la pratica fonetica, avere
padronanza della notazione: “Next to the power of forming sounds correctly and easily, and recognising
them by ear, the most important requisite for the practical phonetician is facility in handling phonetic
notation” (Sweet 1880, p. vi).
82
L'idea di utilizzare un alfabeto fonetico per scopi pratici e quindi privo di elementi grafici in grado di
rappresentare un numero elevato di sfumature foniche, è presente anche in Ellis (1848) il quale, proprio in
apertura del suo libro, scrive: "The Ethnical Alpfabet being a pratical universal alphabet, many of the
delicate distinctions which are necessary in a complete phonetical alphabet are neglected; and the writer
may therefore find it necessary in particular case, to make a distinction between two vowels which are
here represented by the same sign, for with purpose he must have recourse to the more delicate symbols of
the complete alphabet" (Ellis 1848, p. 1).
Il debito da parte di Sweet nei confronti di John Ellis è chiaramente esplicitato in più occasioni. Sul doppio
sistema alfabetico scrive “I thus formed the two systems, Broad and Narrow Romic, mainly on the basis of
Mr. Ellis's Pulaeotype, from which the latter differs mainly in the values assigned to the letters. To the
77
bene tuttavia chiarire che le riflessioni di Sweet sul rapporto tra fonetica e proto-fonologia
rimarranno ancorate soprattutto all’uso pratico didattico. Gli obiettivi del fonetista inglese e
il contesto in cui venivano alla luce i suoi lavori erano ancora lontani dalla svolta
saussuriana e strutturalista che spinsero a guardare l’oggetto lingua nel complesso sistema
di pertinenze e funzioni83.
3.4
La rappresentazione dell’intonazione e dei tratti prosodici
L’intera produzione bibliografica del maestro inglese è intrisa di riflessioni sui
procedimenti notazionali che lo stesso considera fondamentali nello studio della lingua e
che non si fermano al solo alfabeto fonetico. Quest’ultimo inoltre si configura come un
potente strumento descrittivo e analitico, capace di rendere conto non solo della
rappresentazione di segmenti articolati ma anche di più ampie porzioni di suono. Il sistema
di simboli verrà infatti utilizzato da Sweet per trasferire graficamente anche variazioni di
toni, dinamiche e durate, fino a comprendere interi enunciati. Ogni sfumatura sonora
considerata linguisticamente pertinente viene in questo modo inclusa all'interno
dell'alfabeto fonetico85.
Rispetto alla trascrizione dei suoni articolati, l’intonazione occupa nell’opera complessiva
83
85
78
relation between my two systems corresponds that between Mr. Ellis's Glossic and Universal Glossic”
(Sweet 1878 [1913], p. 117-18) e ancora “For rougher phonetic notation, and for purely pratical purposes,
digraphs are perfectly admissible, as is show both in Mr. Elli's Glossic and my Broad Romic” (Ivi 120).
La portata teorica della ‘scoperta del fonema’ è fatta risalire a Baudouin de Courtenay, contemporaneo di
Sweet, che negli stessi anni, precisamente 1870, giungeva ‘ufficialmente’ a porre l’accento sulla natura
funzionale dei suoni linguistici 83:
Dans la linguistique, l’idée de phonème, de son distinctif, ou, mieux, l’idée de ce qui est distinctif dans le
son, ne date pas d’hier. C’est surtout à Baudouin de Courtenay qu’appartient le mérit d’avoir inauguré la
discussion de ce problème dans l’histoire de notre science. Le grand linguistique polonais a abordé l’idée
de phonème dès 1870, à l’âge de vingt-cinq ans, dans sa conferénce inaugurale à l’université de Saint
Pétersbourg (Jakobson 1976, p. 48).
Il grande interesse per il tema della scrittura e della notazione in Sweet non si limita al rapporto tra suono
linguistico e alfabeto fonetico ma si estende anche alla stenografia (è il caso del volume "A manual of
current shorthand orthographic and phonetic" del 1892) e alla notazione musicale, come si evidenzia in
alcune note manoscritte risalenti al periodo tra il 1904 e il 1908, di cui si parla in MacMahon (2007).
del fonetista inglese uno spazio ridotto. Un sistema dunque graficamente semplice, se si
considerano gli sviluppi futuri nel contesto britannico o statunitense, ma capace di
descrivere in maniera complessa le diverse forme e funzioni della lingua. Lieberman nel
suo Intonation, perception, and Language (1967) metterà in evidenza proprio questa
capacità del modello rappresentativo di Sweet:
Recent research shows that Sweet's intonation can be used to transcribe the
intonation patterns of English utterances quite accurately. A trained linguist can
accurately transcribe the change in fundamental frequency of a segment of speech
relative to its immediate surround using this notation (Lieberman 1967, p. 254).
Va ricordato che, nonostante la presenza di esempi importanti nel passato, come quello già
mostrato in Prosodia Rationalis da Johsua Steele, il contesto di studi dell’epoca non
presentava lavori influenti e mirati in tema di trascrizione dell’intonazione. Ciò avverrà,
però, nei primi decenni del ‘900 soprattutto nella tradizione linguistica inglese. Come
evidenzia Sweet:
The whole relation of tone to language has as yet been only imperfectly studied,
and all that can be expected from student in our present state of knowledge is the
power of discriminating the four inflections /, \, ⋁ and ⋀”. (Sweet 1877a, p. 95).
L'intonazione viene descritta da Sweet come "Changes of pitch or tone", dipendente dalla
rapidità delle vibrazioni sonore, le quali dipendono a loro volta dalla lunghezza delle corde
vocali. Dal punto di vista della forma sonora, tali variazioni tonali presentano tre principali
forme: piatta, ascendente e discendente. A sua volta l'intonazione può presentare variazioni
continue o discrete86, oppure combinarsi sotto forma di composti su una stessa sillaba 87.
Il modello è dunque molto semplice: tre forme melodiche generali il cui utilizzo nel parlato
permette ai soggetti della comunicazione di trasmettere e interpretare informazioni non
contenute nel solo segnale articolatorio. Nei suoi scritti Sweet sottolinea ad esempio
86
87
“Changes of pitch or tone may proceed either by leaps or glides” (Sweet 1888, p. 8).
“There are also compound tones, formed by uniting a rise and fall in one syllable: (1) the compoundrising, (2) the compound-falling” (ibidem).
79
l’importanza dell’intonazione per la specificazione delle modalità di frase 88 (ad. es
interrogative o affermative), per sottolineare l’atteggiamento del parlante (es. esitazione,
dubbio) o per esprimerne lo stato emotivo.
3.5
Intervalli di tono e variazioni globali
Nell’individuazione degli elementi sonori pertinenti alla differenziazione dei sensi
linguistici, Sweet segnala, oltre all’andamento della melodia, anche l’ampiezza
dell’escursione tonale generale. Tale caratteristica verrà poi indicata come pitch range89.
Secondo Sweet infatti:
All these tones can be varied indefinitely according to the interval through wich
they pass. As general rule, the greater the interval, the more marked the character
of the tone (Sweet 1877a, pp. 94-5).
L’importanza linguistica degli intervalli tra i toni è riscontrabile nella progressiva
specificazione simbolica degli stessi all’interno della produzione di Sweet. Confrontando i
lavori è possibile osservare un’integrazione nel sistema dei caratteri utilizzati dal maestro.
L’ampiezza dell’escursione tonale viene infatti codificata successivamente e non risulta
essere presente nel suo Handbook of phonetics, sebbene Sweet ne descriva gli effetti:
88
89
80
“Intonation or tone is either level, rising, or falling marked respectively. The level tone is not much used
in speech. The rising tone is heard in questions, such as what’, the falling in answers, such as no`” (Sweet
1893, p. 14).
Tra i contributi più interessanti segnaliamo Crystal (1969, pp. 143-151) che distingue due principali
sistemi di contrasto linguistico determinato dalle differenze di pitch range, che definisce Simple e
Complex. Sul ruolo distintivo dell’escursioni tonali anche O’ Connor e Arnold (1961) o Clements (1979),
il quale sottolinea il ruolo semantico e grammaticale del pitch range: "Among the intonational processes
affecting the frame are those of RANGE EXPANSION and RANGE CONTRACTION, as well as register
shift. The first two involve the magnitude of the largest interval over which all tones may range. In range
expansion (which is widely characteristic of excited or emotional speech), the peaks and valleys of the
fundamental frequency contours are more widely separated than in normal or unmarked speech; while as a
result of range contraction, they are more compressed.[…] These two processes not only serve semantic
(expressive) functions in many languages, but may also become integrated into the grammatical system"
(Clements 1979, p. 549).
Thus, a rise through a small interval (a second for istance) denotes mere enquiry,
through a large one (such as a sixth) surprise. Again, the semitone (minor) interval
has a plaintive effect, but here the less the interval the more marked its minor
character, most of all therefore in the simple semitone or half-tone. The reason of
this is that sadness, like all un-energetic emotion, naturally expresses itself in
inflessions of narrow range (Ivi, p. 95).
Come è possibile constatare, non vi è un mezzo rappresentativo in grado di rendere conto di
tali differenze di intervalli. Una mancanza che in termini di trascrizione renderebbe
impossibile la disambiguazione di due frasi pronunciate sfruttando una diversa escursione
tonale, e di conseguenza renderebbe impossibile una corretta lettura e interpretazione
dell’enunciato.
Nella sua opera del 1890, A primer of phonetics, Sweet supererà questo ‘vuoto’ grazie
all’introduzione di un espediente grafico:
For ordinary purposes it is enough to distinguish between a high rise (′) and a low
rise (,) the former passing through a less interval than latter. Conversely a high fall
(`) passes through a greater interval that a low fall ( 、) (Sweet 1890, p. 66).
La riflessione di Sweet sul ruolo dell’intonazione non si ferma tuttavia alla descrizione dei
movimenti ascendenti e discendenti, considerati localmente, e si spinge ad evidenziarne il
ruolo anche nell’insieme complessivo dell’enunciato. Tali variazioni globali del tono
prenderanno così il nome di chiavi (Key).
Fig. 19 Variazioni globali di tono
Besides the separate inflections of which it is made up, each sentence, or sentencegroup, has a general pitch or key its own. Key is marked by prefixing the voiceleap symbols in the same way as with the other group-modifiers [...]. For ordinary
purposes it is enough to distinguish three keys: the middle being generally left
81
unmarked (Sweet 1890, p. 66).
Per il fonetista anche la melodia, così come l’ampiezza del suo range, diviene elemento
linguistico, elemento utile nell’economia della lingua e pertanto codificabile attraverso il
sistema notazionale. Tali contorni melodici infatti avranno un importante ruolo
nell’espressione delle emozioni: un pitch generale alto sarà più frequente nei casi di
manifestazioni gioiose, mentre uno prettamente basso sarà più frequentemente riscontrabile
in enunciati di rabbia. I cambiamenti di chiave non sono tuttavia legati esclusivamente alle
manifestazioni delle sfumature emotive:
Change of key has also a purely logical significance. Thus question are naturally
uttered in a higher key than answers, and parenthetic clauses in a lower key than
those wich state the main fact. In all natural speech there is incessant change of
key. Changes of key may proceed either by leaps or progressively. Progressive
change of key may be expressed by prefissing / or \ to the sign of key-change. Thus
′o is heard in all cases of passion rising to a climax (Sweet 1877a, p. 96).
Fig. 20 Articolazione del Pitch nel sistema notazionale di Henry Sweet
3.6
82
Tono, intensità e durata. Il sistema prosodico di Sweet
Lo studio della ‘categoria’ del tono (pitch) entra a far parte dell’architettura teorica del
linguista inglese all’interno della sezione da lui stesso definita Sintesi. Lo scopo di questa
distinzione è ben annunciata dallo stesso Sweet. Mentre lo studio analitico si interessa
all’articolazione dei suoni linguistici presi isolatamente 90 , la parte dedicata alla sintesi
osserva questi ultimi nelle loro relazioni con altri suoni (è il caso dello studio della
divisione in sillabe o dei cosiddetti glides) e con altre dimensioni del suono, come il caso
del tono.
Synthesis looks mainly at the beginning and end of each sound, as the point where
it is linked on to other sounds; while analysis concerns itself only with the middle
of the fully developed sound. Synthesis is thus the science of sound-joints or
‘glides’. There is also a more general kind of synthesis which deals with the
relations of sounds to one another in sound-group-their difference in length,
loudness, pitch, etc. Synthesis, lastly, deals with the organic and acoustic
ingrouping of sound into syllables, etc., and the divisions between these group
(Sweet 1890, p. 41).
Fra i tratti più importanti della sintesi Sweet segnala la quantità o durata e l'accento (stress),
costituendo così uno dei primi e articolati sistemi per la trascrizione e analisi del sistema
prosodico.
La categoria della durata viene articolata in cinque livelli, tutti contraddistinti dai
corrispondenti simboli:
90
“We have hitherto considered sound from a purely analytical point of view, that is, each sound has been
considered by itself, as if it were a fixes, isolated element. But in language sounds are combined together
to form sentences, and many sounds occur only in certain fixes combinations. Analysis regards each sound
as a fixed, stationary point, synthesis as a momentary point in a stream of incessant change” (Sweet 1890,
p. 41).
83
Fig. 21 Articolazione della durata
Il fonetista inglese descrive la categoria della durata non solo in riferimento ai segmenti ma
estende la sua riflessione anche a espressioni linguistiche più estese comprese in un breathgroup o in enunciati più ampi91. Sweet non approfondirà ulteriormente la questione della
‘rapidità’ del parlato in riferimento agli usi linguistici che di questa fanno i parlanti.
Tuttavia tali considerazioni apriranno le porte allo studio della velocità di eloquio (speech
rate) come tratto del sistema prosodico in grado di occupare un importante ruolo nella
comunicazione linguistica92.
Anche l’intensità (force o stress in Sweet) trova la sua importante collocazione nel
91
92
84
“We can also distinguish degrees of rapidity of speech in different breath-groups or longer periods”(Ivi, p.
43).
È possibile incontrare riflessioni sul ruolo della rapidità del parlato in Sievers (1901), che sottolinea la
necessità di distinguere tra durate assolute e durate relative. Anche Jespersen si esprime a questo proposito
nel suo Lehrbuch der Phonetik (1904). Altri riferimenti si trovano in Karcevskyi (1931), Fónagy &
Magdics (1960), Goldman-Eisler (1961). Crystal (1969) articola la dimensione temporale in due tipologie
di sistema che lui definisce ‘Simple tempo system’ e ‘Complex tempo system’.
La velocità di eloquio è inoltre parametro importante negli studi di analisi della conversazione. Uhmann
(1992) la inserisce tra gli indici di contestualizzazione (Cook-Gumperz & Gumperz 1976). Per la sua
analisi Uhmann si serve di una doppia distinzione: density of all syllables e density of accented syllable.
Mentre la prima misura il numero di sillabe incluse in un’unità di tempo, la seconda analizza, all’interno
dell’unità di tempo, esclusivamente il numero di sillabe accentante. Incisi, segnalazioni di parti non
rilevanti all'interno del discorso, ripensamenti e riparazioni, vengono così interpretate alle luce dei valori
di densità variamente articolati. Sorianello (2006) ha sottolineato come ad influenzare tale parametro
posssano essere diverse variabili come "il contesto enunciativo in cui avviene la comunicazione, lo stile,
l'intento comunicativo, la tipologia testuale del messaggio prodotto" (Sorianello, 2006 p. 31).
Negli studi sul parlato emotivo la velocità di eloquio compare tra i parametri fonetico-acustici legati
all’espressione vocale delle emozioni (Scherer, Johnstone, Klosmeyer 2003). Fluency e Speech Rate sono
così organizzati nei seguenti indici: Number of syllables per second, Syllable duration, Duration of
accented vowels, Number and duration of pauses, Relative duration of voiced segments, Relative duration
of unvoiced segments. Altre applicazioni e analisi sono state effettuate nell'ambito degli studi della
comunicazione politica (Savastano, Giannini, Pettorino, 1995; Pettorino, Giannini, 1997).
‘disegno’ del fonetista inglese. A livello fisiologico essa è determinata dal diverso sforzo
impiegato nel processo di emissione 93, a livello fisico corrisponde all’ampiezza delle onde
sonore, mentre a livello uditivo il parametro fa riferimento al volume della voce.
Per Sweet: “The comparative force with which the syllables that make up a longer group
are uttered is called ‘stress’” (Ivi, pp. 45-46).
La variabilità dell'accento può essere acusticamente infinita, tuttavia Sweet identifica 4
livelli 94 segnalati anche per mezzo della trascrizione: weak, half-strong o ‘medium’ (:)
(secondary), strong (˙) e very strong o extra-strong (¨)95.
L’accento (stress) è dunque dipendente dalla variazione relativa dell’intensità, e quindi
dalla diversa distribuzione della forza di emissione applicata alle sillabe. Lo stesso tipo di
variazione, in riferimento al livello di enunciato, sarà indicato da Sweet con il termine
Emphasis:
In speaking of the stress of words in a sentence as opposed to that of syllables in a
word the term 'emphasis' is commonly used (Sweet 1890a, p. 46).
Nei sui studi strettamente fonetici tuttavia Sweet si occuperà esclusivamente dell’accento
sillabico, lasciando in latenza il ruolo e le funzioni dell’accento applicato a porzioni più
ampie di enunciato. In effetti tale nozione è approfondita dal maestro inglese nel libro A
Primer of spoken English del 1890 e precisamente in apertura alla sezione del volume
dedicata alla sintassi. Lì Sweet indicherà con maggiore chiarezza proprio le funzioni
93
94
95
Sul piano fisiologico il parametro dell’intensità è legato a diversi fattori quali quantità di energia
articolatoria, pressione dell’aria proveniente dai polmoni, grado di tensione delle pliche vocali.
In realtà il numero oscilla tra 3 e 4. In Handbook of Phonetics i livelli di accento indicati sono tre: weak,
medium (secondary) e strong con una menzione dell’esistenza del ‘very strong’.
Come sottolinea Crystal (1969, p. 157) ci sono stati due principali punti di vista sulla quantità di livelli di
stress nella lingua inglese. Tra questi si segnalano Jespersen (1933) che nel saggio ‘note on metre’ ne
individua quattro: weak, half weak, half strong, strong, il quale tuttavia nota come sia difficile, data la
mancanza di strumenti di misurazione, distinguere le differenze tra gli accenti intermedi. Trager e Smith
(1951, p. 36), sotto un profilo teorico molto diverso da quello del maestro inglese, parlano invece di
Primary, Weak, Secondary e Tertiary stress.
85
associate alle diverse varietà di sentence stress, tra cui quelle di emphasis 96.
The emphatic stress. The general principle of sentence-stress is to stress the
logically prominent words - those which are most indispensable for expressing the
sense (Sweet, 1890b p. 28).
L’accento enfatico entra dunque in relazione con quella che in tempi più recenti la
linguistica pragmatica ha analizzato come la struttura informativa97 degli enunciati.
Sebbene in termini generali rispetto agli sviluppi attuali, Sweet metterà a fuoco la
cosiddetta dicotomia dato/nuovo, evidenziando la stretta connessione tra dimensione
prosodica, sintattica e semantica. La dinamica dei suoni linguistici viene così incaricata, a
livello frasale, di sottolineare, mediante prominenze acustiche, le parti salienti del discorso
portatrici di nuova informazione. Su questo Sweet si esprime molto chiaramente:
All words that express new ideas are more or less emphatic; while words that
express ideas already familiar or that can be taken for granted are unemphatic
(Sweet 1890, p. 29) 98.
Avremo dunque una ulteriore articolazione, quella tra positive emphasis e negative
emphasis: il primo sarà utilizzato da Sweet per indicare l’accento posto su porzioni di
enunciato semanticamente salienti, e quindi maggiormente prominenti; il secondo sarà
utilizzato per indicare le parti dell’enunciato familiari ai parlanti e dunque acusticamente
96
97
98
86
Tra i vari tipi di sentence stress descritti da Sweet ci sono: intensive stress, contrasting stress, the
modifying stress, the grouping stress, the distributed stress (Sweet 1890b, p. 29).
Cfr. Halliday (1967), Lombardi Vallauri (2002; 2006).
Coleman (1914) distinguerà tra “Prominence” e “Intensity”. Decenni più avanti Lieberman (1967)
articolerà ulteriormente le nozioni suddividendo tra Prominence “perceptually, is [...][...] the perceived
‘loudness’ of a vowel relative to its environment” i cui correlati acustici sono “duration, fundamental
frequency, and sound pressure level (or amplitude)” (Liebermann 1967, p. 225); Stress “abstract entities
that are generated by phonologic rules of the “stress cycle”. L’accento infatti secondo la teoria di
Liebermann “is a phonetic element that has definite acoustic correlates in the speech signal that are
independent of the acoustic correlates of the segmental phonemes” (Liebermann 1967, p. 226). Infine
l’Emphasis è il termine utilizzato “to identify instances where the distinctive feature [+P𝗌] produces extra
prominence on the vowels of a word (and its consonants), apart from the stress that the vowel of the word
would have received from phonologic stress cycle. In other words emphasis is prominence that is not
predicted by the stress cycle” (Liebermann, 1967 p. 228).
meno salienti.
Fig. 22 Il sistema di trascrizione in Henry Sweet
Il sistema di trascrizione dei fenomeni prosodici e intonativi creato da Henry Sweet, trova
la sua collocazione nella complessa costruzione del sistema di scrittura fonetica elaborato
dal linguista inglese. In questo senso, l'alfabeto non viene limitato alla rappresentazione dei
segmenti, ma esteso alla descrizione di fenomeni della lingua operanti in domini più ampi,
come la sillaba o l'enunciato. Tali elementi grafici verranno così impiegati per descrivere
dettagliatamente la 'forma fonica'. Le articolazioni dei suoni linguistici saranno considerate
quindi nel contesto globale della pronuncia, e della comunicazione. In tale prospettiva tono,
intensità, e durata saranno dunque dimensioni del suono linguisticamente pertinenti alla
trasmissione e comprensione dei significati.
Abbiamo inoltre visto come l'intera architettura teorica e pratica ruoti intorno a tre
importanti ambiti, rappresentati dal primato della fonetica nello studio della lingua,
dall'interesse per la notazione e dalla pratica d'insegnamento. Sono questi infatti i 'luoghi' in
cui si articolano la maggior parte delle intuizioni del maestro, come il valore distintivo dei
suoni linguistici, che anticiperanno di decenni la 'scoperta del fonema' o, l'attenzione alla
relazione tra struttura intonativa e struttura informativa degli enunciati.
87
4
Daniel Jones “La musica della parola”
Henry Sweet può essere considerato senza dubbio un autore di riferimento per gli studi
sull’intonazione grazie ai suoi interessi e alle sue numerose intuizioni. Scrittura, didattica
delle lingue e primato della fonetica sono infatti elementi che ricorreranno nella scuola
linguistica britannica, influenzando e arricchendo il campo di studi sull'intonazione.
Dal punto di vista della rappresentazione dell’intonazione linguistica, tra la fine dell‘800 e
la prima metà del ‘900, non sono mancati tentativi di sviluppo. Tra questi è di indubbio
interesse quello operato dal linguista inglese Daniel Jones, il cui modello si caratterizzerà
per l’utilizzo della notazione musicale e di un sistema costituito da linee continue e punti
con il quale tracciare gli andamenti intonativi. Altri tentativi in questo senso, sebbene con
sfumature differenti, erano state fatte, come abbiamo visto precedentemente, da Johsua
Steele (1799) e dai suoi principali seguaci, ad es. Chapman, J. (1818). Nello stesso periodo
altri studiosi sfrutteranno il sistema notazionale musicale come supporto di iscrizione dei
fatti linguistici. Nell’ambito della metrica, ad esempio, si segnala Pierson (1884) che userà
proprio lo spartito per la trascrizione sia delle variazioni metriche che dell’intonazione:
88
Fig. 23 Pierson 1884 p. 33
Fig. 24 Pierson 1884 - Esempio di frase interrogativa99
Medesimo tentativo è da ascrivere, in tempi più recenti a Ivan Fonagy e Klara Magdics. In
un loro famoso intervento del 1963 dal titolo Emotional patterns in speech and music essi
faranno riferimento al modello notazionale musicale (Fig. 3) per operare un vero e proprio
confronto tra l’espressione delle emozioni in musica e nel linguaggio verbale:
99
In figura 23 le note musicali sono considerate esclusivamene nei loro valori di durata; in figura 24 la
disposizione delle note sul pentagramma, in corrispondenza del testo, consente la visualizzazione
dell’andamento tonale di una frase interrogativa. L’ultima nota è infatti collocata, rispetto alla precedente,
in posizione più elevata. In questo modo Pierson può segnalare l’innalzamento del tono sulla parte finale
della frase.
89
Fig. 25 Fonagy e Magdic (1963, p. 294) 100
L’obiettivo del loro studio è quello di mostrare, attraverso l’analisi dei principali indicatori
prosodici di dieci emozioni 101 , le corrispondenze tra i due sistemi semiotici, quello
linguistico e quello musicale. Diversi sono i parametri pertinenti per l’analisi, tra questi si
trovano il pitch-range, l’andamento dell'intonazione e il suo valore, la distribuzione delle
sillabe accentate, il tempo e le pause.
Mediante lo spartito dunque è possibile segmentare il flusso parlato in successioni di toni e
durate ed avere, come vedremo, un sistema di riferimento anche a livello acustico. Come
noterà anche Crystal (1969), tra i difetti principali di questo mezzo di trascrizione c’è il
differente valore funzionale degli intervalli in musica e nella lingua: nel primo caso le
funzioni melodiche e armoniche si sviluppano a partire da intervalli di tono definiti, nel
secondo caso invece la successione dei toni nella loro relazione con funzioni linguistiche
non avviene mediante intervalli definiti102.
100
101
102
90
Le note musicali disposte sul pentagramma sono utilizzate per trascrivere gli andamenti tonali e la
scansione ritmica in corrispondenza testo verbale. La figura rappresenta il confronto fra un enunciato
neutrale (linea 2) e uno di gioia (linea 1) in lingua ungherese. Tra i parametri che risaltano maggiormente
c’è l’incremento del pitch-range, che si mantiene costantemente più alto sul primo enunciato rispetto al
secondo. Esso misura infatti la differenza (o escursione) fra i valori massimi e quelli minimi della
frequenza fondamentale (resa in questo caso dalla successione delle note), che caratterizzano una certa
catena fonica.
Le analisi sono state fatte su conversazioni, drammi e composizioni strumentali e vocali. Le dieci
emozioni selezionate riguardavano invece (1) gioia, (2) tenerezza, (3) nostalgia, (4) civetteria, (5)
sorpresa, (6) paura, (7) protesta, (8) disprezzo, (9) rabbia, (10) sarcasmo.
In riferimento al modello di rappresentazione mediante lo spartito musicale Crystal (1969, p. 35) scrive
“such an approach (conventional musical symbols ndr.) was unsatisfactory, not merely for the practical
that it was extremely difficult to read, but also for theoretical reason that the voice does not pass from one
pitch to another by definite intervals”.
Altri esperimenti notazionali di questo tipo sono riscontrabili nell'ambito dello studio delle
lingue tonali. Un esempio è quello di Bien - Ming Chiu (1930) nella descrizione del dialetto
cinese Amoy:
Fig. 21 Bien - Ming Chiu (1930)103
Il sistema qui impiegato è molto simile a quello utilizzato da Sapir (1922) nella descrizione
del takelma:
Fig. 22 Sapir (1922)
Il metodo di trascrizione utilizzato da Daniel Jones combina, invece, il potenziale offerto
dallo spartito con una rappresentazione melodica continua, mediante l’impiego di linee e
punti. Una tecnica molto simile a quella descritta Paul Passy nel 1887:
103
La trascrizione sulla partitura rappresenta i diversi andamenti tonali utilizzati nel dialetto cinese. Ogni
battuta, segnalata mediante i numeri, contiene una diversa tipologia di tono, di cui le note trascrivono
l’andamento.
91
Fig. 23 fonte Paul Passy (1887)104
Come vedremo il sistema è del tutto simile, con i dovuti aggiustamenti, a quello impiegato
da Daniel Jones nel suo Intonational curve del 1909. Non è forse un caso, infatti, che fu lo
stesso Jones a curare l’edizione inglese del volume di Passy nel 1907.
Il procedimento sviluppato dal fonetista inglese, in linea con la tradizione britannica, pone
in evidenza la necessità di inserire l’intonazione al centro degli studi sulla pronuncia e di
farlo mediante un mezzo di trascrizione adeguato 105. In questo modo si tenta di superare i
precedenti studi che consistevano nell’impiego di simboli fonetici generali per indicare
l’andamento del pitch106, come abbiamo mostrato nelle pagine dedicate a Henry Sweet.
Secondo Jones, infatti, in una completa analisi della pronuncia devono essere rappresentate
le seguenti caratteristiche del fenomeno sonoro107:
- Qualità dei vari suoni
- Quantità del suono (lunghezza)
104
105
106
107
92
L’immagine si riferisce alla trascrizione elaborata da Passy sulla base del testo tratto dalla Grammaire di
Labiche. Il linguista segnalerà mediante una linea continua gli andamenti melodici delle frasi. Il testo è
scritto senza segnali di interpunzione ed è diviso in breath-groups. La curva si interrompe del tutto tra i
breath-groups mentre presenta dei punti quando le pause si verificano nel mezzo.
“The branch of phonetic science know as Intonation, i. e. the variations in the pitch of speaking voice, has
not hitherto met with equate treatment in book on pronunciation owing to the want of satisfactory method
of indicating these variations” (Jones 1909a, p. IV).
“Intonation, when marked at all, has generally been indicated by sign such as `,´,ˇ, etc. placed at the
beginnings and ends of words or sentences. Such marks may give a rough idea of the kind of intonation
required, as for instance that the pitch is to rise or fall, but they fail to show with any sort of accurancy the
precise points of the sentences at which the changes of pitch begin and end, and they do not profess to
indicate absolute pitch, or the subtle variations of pitch which are perpetually occurring in speech” (Jones
1909a, p. IV).
In a complete analysis of pronunciation the following elements of speech must be represented: (i) the
quality of various sounds, (ii) the quantity of the sound (lenght), (iii) their relative loudness, and (iv) the
pitch of the voice in pronuncing them” (Jones 1909a, p. V).
- Il loro volume relativo (intensità, dinamica)
- L’altezza della voce nella pronuncia dei suoni (pitch, intonazione ndr.)
Il fine del modello notazionale è, quindi, quello di trasferire mediante un sistema di
rappresentazione queste quattro principali caratteristiche del fenomeno sonoro. Per fare ciò,
Jones si serve sia di strumenti tratti dalla tradizione linguistica, che di strumenti elaborati
fuori dall’ambito disciplinare propriamente linguistico. Le prime tre caratteristiche infatti
sono trascritte mediante l’uso di simboli dell’alfabeto fonetico: articolazione dei singoli
suoni, accenti (dinamiche) e lunghezza vengono posizionati nello stesso spazio attraverso i
simboli fonetici.
Per quanto riguarda l’ultimo dei quattro parametri elencati, il pitch, e precisamente per
l’andamento melodico generale, l’autore sceglie di utilizzare uno nuovo strumento di
misurazione e analisi che sarà costituito, come abbiamo anticipato, da un sistema formato
da linee continue e punti, inserito in uno spartito musicale.
Fig. 26 fonte Daniel Jones (1909a) 108
Il frammento qui riproposto ci mostra, nella sua interezza, il sistema di trascrizione
utilizzato da Daniel Jones nel volume Intonational curves. In basso sono trascritte le tre
caratteristiche di qualità, intensità, lunghezza proiettate sul dispositivo attraverso la
simbologia fonetica. Nella parte alta del frammento abbiamo invece il più complesso
sistema rappresentativo composto dalle linee orizzontali del pentagramma, linee verticali,
punti e linee curve. Queste ultime hanno il compito di rendere conto della variazione
108
L’immagine riporta una parte della trascrizione fonetica di un brano tratto da Richard the second di
Shakespeare. Lo spezzone riportato in figura si riferisce alla seguente frase “Let’s talk of graves, of
worms, and epitaphs”.
93
melodica del flusso parlato.
Analizzando più nel dettaglio il dispositivo planare sarà possibile osservare alcune
peculiarità e alcune consonanze con il metodo di scrittura musicale. Come è possibile
osservare, lo spazio grafico si compone di un pentagramma del tutto corrispondente a quelli
usati nella pratica musicale. All’interno di tale spazio, l’analista potrà annotare le variazioni
del pitch109.
Fig. 27 Daniel Jones (1909a)
Come abbiamo avuto modo di mostrare precedentemente, l'utilizzo della partitura permette
all'analista di servirsi di un metro, di uno strumento in grado di sezionare il parametro
dell’altezza in grandezze definite da valori tonali. In questo caso l'unità di misura è stabilita
a partire dalla suddivisione dello spettro sonoro in grandezze musicali. La dimensione
verticale del supporto articola la categoria del tono secondo il seguente rapporto alto :
basso = acuto : grave. Procedendo dal basso verso l’alto, e sfruttando come riferimento le
righe e gli spazi, avremo note con un valore di pitch maggiore. L’unica differenza con il
supporto originale è l’assenza di segni per le alterazioni (diesis e bemolle), che hanno il
compito di indicare l’aumento o la diminuire del valore tonale della nota a cui si applicano.
109
94
“The quality of the sound is shown by phonetic symbols, their lenght by the use of the mark : e ; their
loudness by stress mark ‘ by lines being placed at every point where there is a minimum loudness (i e at
the limits of the syllables) – and lastly the pitch of the voice by curves on musical staves” (D. Jones 1909a
p. V).
In questo caso i punti indicanti le note sul pentagramma possono occupare 4 diverse
posizioni: rigo (il punto è attraversato centralmente dal rigo del supporto planare), soprarigo (la parte inferiore del punto è adiacente al rigo musicale), spazio (il punto si trova al
centro dello spazio e non ha contatti con alcun rigo), sotto-rigo (la parte superiore del punto
è in contatto con il rigo musicale) 110.
I simboli grafici posti a sinistra, definiti chiavi musicali, hanno il compito di fissare il
valore delle note e quindi della loro relativa altezza.
Dunque i simboli, rispettivamente chiave di fa (chiave di basso) e chiave di sol (chiave di
violino), definiscono lo spettro di frequenza che è possibile rappresentare in quello spazio.
I punti posti in basso avranno un valore di pitch inferiore a quelli posti in alto, e a loro volta
i punti posti nello stesso rigo o spazio del pentagramma, ma contestualizzati da due chiavi
differenti, avranno valori diversi. Le lettere scritte in basso esemplificano quanto appena
detto, indicando il valore delle note musicali secondo la denominazione anglosassone 111.
Tale dispositivo ha il vantaggio di consentire una misurazione prossima anche al dato
acustico. Ciascuna posizione sul pentagramma, una volta contestualizzata a partire dalla
chiave, ha un suo valore corrispondente in Hertz, ossia l'unità di misura del sistema
internazionale della frequenza. Il difetto, che Jones supererà tramite l’utilizzo delle curve, è
la natura discreta della rappresentazione sonora: il pentagramma è costituito da una vera e
propria scala discreta di altezze. Il risultato ottenuto dall’autore è, sotto certi aspetti, non
lontano da quello raggiungibile mediante più moderni, e potenti, mezzi strumenti di analisi.
Per osservare le variazioni della F0 è possibile attualmente servirsi di software in grado di
rappresentare graficamente una curva di frequenza fondamentale mediante un grafico che
ha il tempo sull’asse delle ascisse e gli Hz in sull’asse delle ordinate. Il grafico risultante
renderà visibile e misurabile, momento per momento, il valore tonale della voce. L’esempio
110
111
Si nota in questa operazione il tentativo di adattare il supporto notazionale musicale alle esigenze di
misurazione. Operazione simile era stata già effettuata da Johsua Steele (cfr.)
Ogni lettera corrispondente a una delle sette note della scala diatonica A = La, B = Si, C = Do, D = Re, E
= Mi, F = Fa, e G = Sol.
95
seguente è tratto da De Dominicis (2010) che esemplifica l’utilizzo del software Praat:
Fig. 28 Finestra di editing della F0 con Praat (Fonte: De Dominicis (2010 p. 96) 112
Il modello rappresentativo musicale segue lo stesso principio, collocando sull’asse verticale
la variazione delle altezze e sull’asse orizzontale la successione temporale. Leggendo da
sinistra verso destra il pentagramma si avrà così lo stesso tipo di rappresentazione.
L’utilizzo delle linee curve permette infatti a Jones di trasferire all’interno del sistema di
riferimento del pentagramma la variazione melodica continua della voce, operando
sostanzialmente una rappresentazione della F0. Ad esempio, nel primo pentagramma di
Fig. 8 la prima nota in basso, ‘E’, ha un valore pari a 82,4 Hz mentre nel secondo
pentagramma la nota più bassa è ‘G’ che ha un valore pari a 196 Hz: i valori oscilleranno
rispettivamente tra gli 82,4 Hz e i 349,2 Hz, e tra 196 Hz a 585 Hz.
Nei volumi dedicati alla pronuncia dell’inglese D. Jones (1909b, 1918) affronta il tema
dell’intonazione e il suo metodo di trascrizione, descrivendone tecniche e strumenti. Un
primo mezzo, semplice ma adatto a finalità pratiche, consiste nel riportare su un supporto
cartaceo, sempre attraverso l’uso di linee curve, l’impressione del dato acustico appena
112
96
La schermata si riferisce alla frase Antonio canta una canzone
ascoltato113.
Fig. 29 Daniel Jones (1918)
Un secondo, lo stesso utilizzato nel volume Intonational curve, consiste nella trascrizione
della melodia, sempre a orecchio e sempre mediante il supporto dello spartito, attraverso
l’ausilio di un grammofono o un fonografo. Il vantaggio è chiaramente quello di poter
interrompere, riascoltare e focalizzare l’attenzione su punti particolari delle registrazioni
vocali114. Altri metodi di trascrizione, ulteriormente più accurati, sono quelli che si servono
del tracciato cimografico, ossia di una rappresentazione meccanica a forma di curva,
risultante dall’azione di variazioni foniche 115. Tale metodo di misurazione può servirsi di
un tratto lineare di riferimento, come quello generato da un diapason con frequenza nota, da
confrontare simultaneamente con quello della voce registrata, oppure di una griglia di
riferimento, costituita da linee perpendicolari al tracciato, che permettono di calcolare il
113
114
115
“A rough musical notation may be determined or approximate curves may be drawn free-hand by anyone
with a really good musical ear. This method is generally sufficiently accurate for practical linguistic
purposes” (Jones 1922, p. 167).
“A more accurate method of obtaining curves is the following. If while a gramophone, phonograph, or
other similar instrument, is in operation, the needle is lifted from the revolving record, the car will retain
the impression of the sound heard at the instant when the needle is lifted. If the record is of speaking voice
and the needle is removed in the middle of a voice sound, the ear retain in particular the pitch of the
musical note with the voice is producing at that instant; this may be marked on some kind of musical
stave, and by taking similar observations at a large number of points in any sentence and joining the points
by lines, a complete intonation curve of the sentence result” (Jones 1922, p. 168).
Il cimografo è uno strumento per la registrazione grafica delle variazioni di pressione dell’aria, come
emesse dal naso o dalla bocca, e dei movimenti di varie parti degli organi coinvolti nella fonazione. Per
una descrizione dettagliata del cimografo e delle parti di cui è composto cfr Jones (1922 p. 168-171) o
97
valore della curva melodica in unità di vibrazioni al secondo. Quest’ultimo è il caso delle
immagini in fig. 28 e 29.
Fig. 30 Tracciato cimografico 116 dell'espressione Good morning
Fig. 31 Trascrizione su supporto notazionale dei valori misurati con il cimografo
Jones spiega in questi termini il metodo di calcolo:
The calculation is worked out thus. The length of the first 4 vibrations is measured
in terms of the scale of hundredths of a second shown in the bottom line of tracing.
The length proves to be 27 units. The average duration of each vibration in the
group is therefore one - quarter of this, viz. 00675 sec. Therefore at that rate of
vibration 1 sec. would contain or 148 vibrations. This corresponds a note between
D and D# in the bass clef (Jones 1922, p. 181).
Sulla base di quanto appena affermato il fonetista elabora la seguente tabella con la quale
116
Il cimografo è in sostanza un tamburo ricoperto da un foglio spesso affumicato con il nerofumo che ruota
alla velocità voluta mediante un meccanismo ad orologeria. Sul foglio del tamburo in rotazione uno stilo
gratta via il nerofumo producendo il tracciato del fenomeno fisiologico considerato, recepito da un apposito
trasduttore e trasmesso per via meccanica, idraulica, pneumatica o elettrica. La rappresentazione in figura 30
mostra il tracciato derivante dalle misurazioni effettuate contemporaneamente sul naso, bocca e laringe.
98
analizzare il dato acustico risultante dal tracciato cimografico.
Tabella 2 I valori dei parametri misurati nelle diverse sezioni del tracciato
Come è possibile osservare, il meccanismo è alquanto lungo e complesso e consiste nella
trasposizione punto a punto dei valori acustici delle variazioni di tono. Se si esclude la
difficoltà di realizzazione, il risultato può essere paragonato, per qualità e dettaglio, a
quello ottenuto dai moderni strumenti di analisi fonetica.
Quel che viene focalizzato dall’autore in questi esempi, come quelli mostrati in
Intonational curve, è la natura continua e complessa del fenomeno intonativo. Il vantaggio
è sicuramente quello di mostrare l’enorme variabilità e instabilità delle altezze nella voce
parlata e di rendere oggettivabile il suo valore, attraverso un sistema di misurazione più
99
accurato e rendendo il dato disponibile ad altri studiosi117. Quel che sembra mancare nelle
pagine appena descritte è, invece, una maggiore attenzione alle funzioni linguistiche
connesse alle variazioni di tono. I metodi analitici più precisi, infatti, consentono di
approssimare la rappresentazione con il dato acustico, fornendo informazioni circa la
corretta pronuncia di quel brano specifico, di quella specifica occorrenza linguistica, senza
tuttavia mostrare la relazione tra forma e funzione linguistica. A questo scopo e con finalità
prettamente pratiche 118, si conforma il metodo di trascrizione mostrato in figura 32. La
registrazione a mano libera e l’assenza di supporti di registrazione acustica, rendono
necessaria una trascrizione più generica, relativa ed astratta. Al valore assoluto del dato
acustico si sostituisce una rappresentazione che potremmo definire “proto-fonologica”119: il
formato, svincolato dai valori musicali della partitura può esprimersi entro uno spazio di
valori relativi. In questo modo Jones può mostrare curve ‘tipiche’ che si correlano a un
determinato significato o un determinato atteggiamento del parlante. In questa direzione
Jones inscrive la curva all’interno di uno spazio continuo (e non discreto come il
pentagramma) in cui sono indicati solo dei valori relativi (alto e basso) 120.
117
118
119
120
Così Jones spiega l’impiego di questo metodo di trascrizione “Accurate records of intonation, have it is
true, been produced by means of tracings of voice vibrations, obtained by use of a kimograph or
otherwise. The vibrations may in this way be measured, or the number occurring in short unit of time
counted and the result plotted on squared paper, the variations of pitch being thus expressed by curved
lines. Such curves are, however inconveniently large and elaborate, and the phonetic symbols to witch the
various parts of the curves correspond have to be placed far apart and at irregular intervals, thus rendering
the text difficult to read. Besides this the work of preparing curves by this method is so aborious, that no
one has ever yet analysed texts so sufficient length to be of any practical value to language students”
(Jones 1909a, p. IV).
"Some teachers have cast doubt on the utility of intonation curves in practical teaching. I can assure them
from experience that most learners find such curves a considerable help. I have even known a foreigner
acquire a perfectly accurate intonation of a passage of English by this means, without ever having heard
the words read aloud" (Jones 1922, p. IV).
“Fonologicamente l’intonazione consiste nella ricorrenza di determinate successioni di altezze tonali
diverse, detti contorni (o profili) intonativi, ognuno dei quali viene usato con un significato costante entro
un costituente di lunghezza variabile [...]” (Nespor 1993, p. 265).
Questo tipo di esemplificazione viene presentata nel volume del 1909, Pronunciation in English. Nel suo
lavoro del 1922 i grafici manterranno contemporaneamente le due forme.
100
Fig. 32 Esempi di trascrizione Daniel Jones
Lo spazio rappresentativo riduce i suoi tratti: mancano le righe orizzontali della partitura
che segnalavano i valori acustici del pitch, mancano le linee verticali che segnalavano i
punti di variazione nell’andamento della melodia. La dimensione verticale del dispositivo è
sempre connessa al valore delle altezze: la curva intonativa assume valori relativi crescenti
nella zona più alta dello spazio di rappresentazione (delimitata dalla linea orizzontale
segnalante high pitch) mentre decresce di valore con il progressivo avvicinamento alla parte
bassa (low pitch).
In questo modo Daniel Jones può trattare in maniera linguisticamente pertinente anche altre
funzioni dell’intonazione come ad esempio il carattere emotivo degli enunciati:
101
Fig. 33 Esempi di enunciati emotivi
Oppure legare l’intonazione a differenti tipi di enunciato:
Fig. 34 Esempi di trascrizione (Jones 1922)
102
Cap. 3:
1
L’intonazione della lingua tra
forma e significato
Harold Palmer e l’intonazione come sistema
Palmer è considerato il padre della linguistica applicata 121 inserendosi a pieno nell’ambito
dell’area di studi interessati alla didattica, in linea con la tradizione britannica presentata
nel capitolo 2. Seguendo la traccia solcata da Henry Sweet (1900), sulla necessità di
individuare dei principi generali per l’insegnamento delle lingue, Palmer cercherà di
istituire una nuova ‘scienza linguistica pedagogica’.
Tuttavia quest’ultima sarà concepita in maniera più aperta: mentre il suo predecessore
concentrerà sulla fonetica il ruolo fondamentale per lo sviluppo della ‘living philology’122,
Palmer estenderà gli interessi della linguistica applicata ad altre branche degli studi
linguistici123 (filologia, fonetica, grammatica e lessicologia ad esempio). L’obiettivo della
nuova linguistica applicata sarà quello di ispirarsi al metodo scientifico, mediante la
creazione di un accurato metalinguaggio descrittivo
121
122
123
124
124
e mediante un processo di
Stern (1983, p. 100) riporta che “Palmer is often considered “the father of British applied linguistics”’.
Howatt (1994, p. 291) concorda con questa descrizione e considera Palmer “the founder, with Daniel
Jones [...], of what eventually became the British school of applied linguistics”. Sull’importanza di Harold
Palmer nell’ambito della linguistica applicata cfr. Smith (2011).
“The main axiom of living philology is that all study of language must be based on phonetics” (Sweet
1900, p. 4).
“[…]Philologists tell us what language is, phoneticians can give us the most accurate information
concerning sounds and the methods of theaching them, most of the essential facts of grammar can be
expleined clearly by grammarians, and the nature of words, including their etymological, morphological,
semantic, and ergonic aspects, is already known to the lexicologist” (Palmer 1917, p. 22).
“If the study of language is a science, a scientific terminology must have been formed and must exist,
consisting of an adequate number of terms both old and new, all accurately defined by the creators of such
terms and perfectly understood by all who use them” (Palmer 1917, p. 20) .
103
sistematizzazione125.
Con lo stesso spirito Palmer si avvicinerà ai problemi riguardanti l’intonazione. Nel volume
del 1922, interamente dedicato al tema, procederà con estrema cura alla descrizione di un
sistema intonativo della lingua inglese, integrando in esso novità a livello di
metalinguaggio e di trascrizione. Rispetto ai tentativi della scuola britannica (in particolare
Steele (1779) Sweet (1877a), Jones (1909a, 1909b, 1922) e Armstrong e Ward (1926)),
concentrati soprattutto sulla descrizione di principi generali di funzionamento
dell’intonazione e di una sua rappresentazione in termini di contorni globali 126 , Palmer
guarderà ad essa come un sistema di cui è possibile descrivere forma e organizzazione.
Nel suo lavoro l’autore non si fermerà alla sola elencazione di possibili occorrenze. Gli
andamenti intonativi non saranno considerati, e rappresentati, come ‘forme inarticolate’, ma
come unità complesse, composte da ulteriori elementi funzionali. Su questo Palmer sembra
essere abbastanza esplicito:
The object of this book is fourfold: (…) 2 – To suggest a scheme of classification
and terminology by which these tone and tone-compounds may be divided into
classes according to their degree of resemblance or difference (Palmer 1922, p. V).
La teoria linguistica, che in questo caso ha un principale obiettivo didattico, si rivolge alla
costruzione di un sistema intonativo organizzato secondo classi, secondo forme generali in
grado di rendere conto delle manifestazioni variabili del parlato.
Inoltre l’autore non si limiterà alla trattazione del livello espressivo. L’organizzazione di
quest’ultimo sarà funzione del livello semantico della lingua, mediante l’esposizione di
variazioni e contrasti semantici in funzione del differente impiego di toni. Una parte
sostanziale del volume sarà infatti dedicata: “to formulate in a series of law or rules the
125
126
“To lay the foundations of the science of language-study it will not be necessary to make new discoveries ;
it will be quite sufficient to collect factors which are perfectly well known and to coordinate them into one
comprehensive system” (Palmer 1917, p. 22).
Bolinger (1951) indicherà l’approccio britannico con il termine “configurazionale” in opposizione a quello
di americano che invece definirà “a livelli”.
104
facts which have so far been discovered concerning the relation between tones and
meaning” (Palmer 1922, p. V).
Il grande merito degli studi di didattica delle lingue, soprattutto nella nostra prospettiva, è
stato quello di aver posto al centro il problema della trasmissibilità dei significati della
lingua come mezzo di comunicazione. È in questo senso che l’intonazione può essere
considerata come linguisticamente pertinente, in quanto elemento indispensabile soprattutto
per la quotidiana conversazione:
No one who wishes to use the English language in the manner of English speakers
can anymore ignore the phenomena of its intonation than he can ignore the
phenomena of its pronunciation. It may be no more than a personal opinion of
mine, but I am convinced that the two things, pronunciation and intonation, are so
bound up with each that it is futile to teach or to learn one without the other
(Palmer 1922, p. V).
L’insegnamento della lingua in questo senso non può prescindere dall’intonazione. Parlare
e insegnare una lingua non può consistere nella mera descrizione grammaticale, e nemmeno
nella corretta pronuncia di singole parole. Per poter ‘vivere’ una lingua è necessario
inserirsi nella quotidiana prassi comunicativa, e con essa saper cogliere il potenziale
linguistico-semiotico di tutte le sue componenti, compresa l’intonazione:
What is often diagnosed as a foreign “pronunciation”, or foreign “accent”,
frequently turns out to be a foreign intonation. Many foreign speakers of English
may be faultless in their English sounds, and even English stress, but they intone in
such a manner that we at once detect that they are not English, and often we fail
even to understand the meaning of what they are saying. […] Many characteristic
tones are as important as or even more important than characteristic sound (Palmer
1922, p. 4).
Il parlato per Palmer non consiste dunque nella semplice trasposizione della lingua scritta.
Nei processi comunicativi quotidiani il parlante si servirà dell’enorme ricchezza del
‘segnale acustico’. Una stessa espressione verbale può infatti risultare ambigua nel caso in
105
cui si tratti di una forma scritta e al contrario essere facilmente interpretabile se espressa
invece mediante il canale fonico acustico. Se nel primo caso l’ambiguità dell’espressione
può essere risolta solo mediante l’introduzione di elementi contestuali o co-testuali, il
parlato può fare uso delle diverse e compresenti modalità comunicative. Tra questi ausili vi
è il tono o ‘musical pitch’128.
Il primo elemento ad essere descritto è il tono, o meglio lo ‘spazio di possibilità’ dei valori
tonali. Non vi è nel dispositivo notazionale un riferimento alla misurazione assoluta delle
altezze, come avveniva ad esempio in alcune modalità di analisi realizzate da Johsua Steele
o da Daniel Jones (cfr. cap. 2.4), ma un vero e proprio campo di valori relativi.
Fig. 35 Lo spazio di trascrizione delle altezze 129 (Palmer 1922, p. 2)
Lo spazio di rappresentazione del pitch è suddiviso in tre aree: High, Mid e Low. Non vi
sono unità di misura e riferimenti precisi per la misurazione del pitch. Ciò che emerge
dunque come pertinente è il valore relativo delle altezze tonali: una stessa ‘nota’ potrebbe,
di principio, occupare luoghi diversi dello spazio rappresentativo poiché, il suo valore
128
129
Palmer H. E. (1922, p. 1).
La trascrizione permette dunque di collocare ciascuna sillaba della parola (nell’esempio mostrato vi è la
parola Anybody), o dell’enunciato, in corrispondenza dei tre valori.
106
sarebbe dipendente da quello delle altre note compresenti 130.
Per Palmer infatti il valore linguistico dei toni non risiede nella loro misura fisica assoluta,
ma nel rapporto reciproco che essi stringono nel corso di un atto linguistico:
“We see, then that the meaning of a given word or sentence may depend upon the
relative pitch of the note or notes upon which it is sung” (Palmer 1922, p. 2).
2 Il ruolo della sillaba nella rappresentazione dell’intonazione
Altro aspetto di rilievo è l’importanza teorica che viene ad assumere la sillaba. Nello
schema in fig. 35 si può notare come la suddivisione del materiale linguistico e la
variazione tonale vengano annotate in corrispondenza di ciascuna sillaba. Nell’ambito
britannico e non solo, a livello di trascrizione, non è un assoluto caso isolato. È del 1923 ad
esempio il volume di Klinghardt & Fourmestraux in cui si utilizzano dei punti di varia
grandezza per segnalare l’andamento del tono sulle sillabe. Armstrong & Ward (1926)
utilizzeranno un sistema composto da linee curve e punti.
130
Questo aspetto del lavoro di Palmer sembra essere un elemento di contatto tra l’approccio
‘configurazionale’ e a ‘livelli’.
107
Fig. 36 Klinghardt e De Fourmestraux (1923)
Fig. 37 Armstrong e Ward (1926)
Nella prima figura sono rappresentati rispettivamente gli andamenti di enunciati formati da
due e tre sillabe. I punti di maggiore spessore indicano le sillabe finali 131, mentre la linea
orizzontale ha lo scopo di creare un punto di riferimento per indicare un valore medio132. Se
la sillaba finale, indicata dal punto più grande, è posta in basso, l’andamento è discendente,
e viceversa.
Anche nel secondo esempio la sillaba è assunta come unità minima della rappresentazione.
La dimensione verticale, entro cui sono collocati i simboli, indica il valore relativo delle
altezze. Linee e punti posizionati sulle vocali saranno invece utilizzati per indicare
rispettivamente le sillabe accentate e quelle non accentate. Per gli andamenti ascendenti e
discendenti verranno infine sfruttate linee curve.
Rispetto a Palmer in cui, come verrà mostrato di seguito, le sillabe assumono ruolo
strutturale importante, in Armstrong e Ward la loro valorizzazione a livello grafico sembra
essere dettata da scopi esclusivamente pratici.
131
132
"A thick dot represents the final syllable of a tone-group, and signifies at the same time that this syllable is
to be slightly accented” (Klinghardt e De Fourmestraux 1923, p. 19).
“The horizontal line found in each intonation-picture is, in the first instance, merely a guiding line
enabling the reader to determine at a glance the relative positions of the dots. But it also represents an
approximate middle pitch” (Klinghardt e De Fourmestraux 1923, p. 20).
108
It should be noted that though the pitch is shown by a series of disconnected marks,
the whole of one intonation group is continuous line, and that the connections
between them are made quite naturally (Armstrong e Ward 1926, p. 2).
Altri esempi più vicini alla rappresentazione di Palmer saranno poi impiegati, sempre
nell’ambito della linguistica britannica, da Crystal (1969) o Cruttenden (1986).
Fig. 38 Crystal (1969 p. 224)
Fig. 39 Cruttenden (1986)
Anche in questi ultimi esempi è ben visibile la pertinenza grafica, e teorica, che la sillaba
ricopre ai fini della rappresentazione linguistica dell’intonazione. Nella ‘Tonetic
Transcription’ dei due autori presentati trovano posto le altezze tonali, mediante lo spazio
verticale del supporto, la prominenza delle singole sillabe, tramite la dimensione del punto,
e gli andamenti tonali, grazie all’uso di linee curve continue 133. La sillaba assumerà infatti
sempre maggiore rilievo, ai fini della rappresentazione, della descrizione e dell’analisi
linguistica dei fatti intonativi.
Basti pensare che il riferimento implicito dell’approccio britannico e americano su cui è
133
Un medesimo modello rappresentativo è presente in O’ Connor, Arnold (1961).
109
modellato il gruppo tonale (tone group) è costitituito proprio dalla struttura della sillaba134 :
Si tratta della nozione sintagmatica più antica negli studi di fonologia. Le prime
riflessioni sulla sillaba possono essere fatte risalire al mondo greco classico. Perciò,
non ci stupisce che la medesima ipotesi venga adottata per dare supporto alla
scomposizione della curva adoperata sulla base di analoghe restrizioni
paradigmatiche e sintagmatiche (De Dominicis 2010, p. 60).
Fig. 40 Struttura fonologica della sillaba - De Dominicis (2010)
Secondo De Dominicis la struttura fonologica della sillaba (Fig. 6), sembra riproporsi nella
forma interna dell’unità intonativa. La rappresentazione della sillaba presenta infatti un
elemento obbligatorio che strutturalmente assume la massima prominenza:
Il nucleo sillabico è l’unico componente obbligatorio della sillaba e, quindi,
gerarchicamente domina i margini (attacco e coda sillabica). Esso non è definito in
modo sostanziale, ma solo per la sua funzione formale di vertice gerarchico della
struttura sillabica (De Dominicis 2010, p. 61).
Allo stesso modo, segnala De Dominicis, il vertice gerarchico di IP è segnalato dal Nucleo
134
Nell’ambito della fonologia dell’intonazione di stampo generativo essa assume il ruolo di unità. Nespor e
Vogel parlano della sillaba come “the smallest costituent of the prosodic hierarchy” (Nespor e Vogel
2007, p. 61). Più in generale, nell’ambito della linguistica generativa, l’integrazione teorica della sillaba
giunge intorno agli anni 70: “In the early and mid 1970s, the main discussion surrounding the syllable was
whether or not it belonged in a theory of generative phonology. […] Once the syllable was accepted, there
was a rapid increase in the amount of research dealing with various aspect of its nature and role in
phonology” (Nespor e Vogel 2007, p. 61-62). Nella linguistica strutturale Trubeckoj ha inserito la nozione
di sillaba all’interno dello studio fonologico della prosodia: “Le caratteristiche prosodiche non sono
proprie delle vocali come tali, ma delle sillabe. Una parte dei fonemi che compongono la sillaba può
essere prosodicamente non-pertinente” (Trubeckoj 1939 [...], p.207).
110
intonativo, che, come verrà illustrato successivamente, sarà il costituente linguistico su cui
si avrà il picco di prominenza gerarchica.
3
L’individuazione dell’unità intonativa
Con Palmer (1922) l’intonazione viene organizzata, per la prima volta, in un sistema di
unità funzionali tra loro connesse secondo precise regole di combinazione. Il tone-group è
definito come: "a word or series of word in connected speech containing one and only one
maximum of prominence" (Palmer 1922, p. 7).
Tuttavia nel corso degli anni il modo con cui i linguisti hanno basato i loro tentativi di
identificazione delle unità intonative non è stato univoco.
La natura continua ed estremamente variabile delle componenti prosodiche ha
rappresentato per gli studiosi dell’intonazione un ostacolo notevole nella definizione e
nell’individuazione di unità tonali che potessero essere utilmente impiegate a fini analitici e
descrittivi. A complicare il quadro vi è anche l’irriducibilità dei fenomeni prosodici al
modello della doppia articolazione. Per Martinet (1960) infatti:
Si classificano nella prosodia tutti i fatti di parola che non entrano nel quadro
fonematico, cioè quelli che sfuggono, in un modo o in un altro, alla seconda
articolazione. Fisicamente si tratta di fatti fonici necessariamente presenti in ogni
enunciato parlato […]. In tali condizioni è comprensibile che linguisticamente tali
fatti non possano valere per la loro presenza o per la loro assenza, ma piuttosto per
le loro modalità, variabili da una parte all’altra di un enunciato. Di conseguenza
essi si prestano meno alla caratterizzazione di unità discrete, in confronto ad altri,
come la nasalità o occlusione labiale, che possono figurare o non figurare in un
enunciato (Martinet 1960 [1971], p. 98).
È possibile infatti descrivere in maniera accurata ciascun punto dell’andamento melodico di
un enunciato, rivelandone con estrema precisioni i dati acustici. Allo stesso tempo questo
valore assoluto è insufficiente ai fini di una descrizione linguistica in quanto, in assenza del
111
suo contesto di occorrenza, non è possibile stabilire se tale frammento di suono abbia un
tono alto o basso, intenso o debole, lungo o breve 136. La relatività del valore intonativo è
per Abercrombie (1967), ad esempio, un elemento che accomuna la melodia musicale e
quella della lingua:
Not only are both based on pattern arising from pitch fluctuation, but in bot hit is
the position of the points in the pattern relative each other that counts, not their
frequency in terms of number of vibration per second. Speech melody and musical
melody can both be ‘transposed’ without loss of identity (Abercrombie 1967, p.
107).
Ma non è tutto. Se è vero che, come mostreremo tra poco, tale meccanismo di
segmentazione è intimamente connesso alla dinamica fisiologica dell’emissione fonica, non
mancano riflessioni che hanno messo al centro l’importanza dell’ascolto e dei processi
interpretativi dei parlanti.
La questione della segmentazione del discorso in unità tonali e della individuazione
del punto focale all’interno di ciascuna unità tonale è forse l’aspetto determinante
per individuare la centralità del ruolo dell’udito nella decodifica del parlato. Ciò è
confermato anche dall’importanza della prosodia nell’apprendimento linguistico da
parte dei bambini e nello sviluppo della loro capacità di segmentare il continuum
della catena parlata (processo che avviene senza che il bambino abbia ancora alcun
controllo consapevole sul meccanismo laringeo, e quando il suo controllo degli
schemi prosodici della sua lingua è ancora ad uno stadio aurorale) (Albano Leoni
2001, p. 60).
Cruttenden (1986) pone in evidenza il modo con cui studiosi differenti si sono avvicinati al
problema, e la difficoltà nell’individuare un criterio unico e semplice.
136
“[…]Un segmento intonativo di prosodia ritagliato dal suo contesto è in sé totalmente privo di significato
e di funzione, perché i valori che determinano la prosodia, e dunque anche l’intonazione, sono sempre e
tutti radicalmente relativi, valutabili e interpretabili solo in rapporto a ciò che segue e a ciò che precede
all’interno dell’intera unità prosodica considerata. Quindi, di un segmento vocalico in sé, del quale posso
descrivere in modo ‘oggettivo’ l’altezza, la durata e l’intensità (oltre che il timbro), non posso dire se sia
linguisticamente acuto o grave, lungo o breve, intenso o debole” (Albano Leoni 2001, p. 58).
112
In reading, or in speaking prepared texts, most intonation-group boundaries are
clearly marked. But even with the most experienced readers and speakers, there are
many cases where it remains difficult to decide whether a boundary is present or
not. And with inexperienced readers and speakers (adults’ intonational competence
is extremely variable) the difficulties are multiplied. When we consider
spontaneous speech (particularly conversation) any clear and obvious division into
intonation-group is not so apparent because of the broken nature of much
spontanuous speech, including as it does hesitation, repetitions, false start,
incomplete sentences and sentencese involving a grammatical caesura in their
middle (Cruttenden 1986, p. 36).
Tra i numerosi e differenti approcci al problema, in accordo con Couper-Kuhlen (1986), è
possibile metterne a fuoco tre. Il primo pone al centro della definizione di unità intonativa il
meccanismo fisiologico dell’emissione fonica. In questo senso le unità si organizzerebbero
tendenzialmente entro i confini di «gruppi respiratori», facendo così affidamento quasi
esclusivamente a criteri esterni della suddivisione degli enunciati. Il secondo dà, invece,
maggior peso a criteri interni, o semantico/grammaticali, cercando di far coincidere le unità
tonali a porzioni di enunciato aventi unità semantica e grammaticale. Il terzo e più recente
ha infine cercato di determinare i confini intonativi tramite criteri fonetico/fonologici.
3.1
Divisione Fisiologica
Le prime riflessioni sul ruolo del meccanismo fisiologico di emissione nella scomposizione
del flusso parlato in unità prosodiche possono essere trovate in Sweet. In varie occasioni il
fonetista inglese (Sweet 1876, 1877a, 1877b, 1890) ha posto l’accento sulla necessità di
basare il criterio di suddivisione del continuum fonico linguistico su gruppi respiratori
(breath-groups), a cui corrisponderebbe parzialmente anche la divisione logica
dell’enunciato.
The only division actually made in language is that into ‘breath groups’. We are
unable to utter more than a certain number of sounds in succession without
renewing the stock of air in the lungs. These breath-groups correspond partially to
113
the logical division into sentences: every sentences is necessarily a breath-group,
but every breath-group need not be a complete sentence (Sweet 1890, p. 42).
Nel suo articolo dal titolo Language and Thought Sweet inserisce la divisione degli
enunciati come prima e importante questione nello studio delle lingue:
The first and most obvious is the organic necessity of taking breath - we are unable
to utter more than a certain number of sounds in succession withoutrene wing the
stock of air in our lungs, which unavoidably necessitates a pause. Speech in its
simplest form consists mainly of short questions and answers expressed in simply
constructed phrases-in this case there is not merely a pause, but an absolute
cessation of voice. Within these "breath-groups, or phonetic sentences, there is no
pause whatever. This is importanto observe, as many people, misled by our
ordinary word-division, imagine that they make a pause at the end of every word.
But a very little observation will be enough to convince them that the words of a
sentence run into one another exactly in the same way as the syllables of a word do
(Sweet 1877b, p. 459).
Sempre all'interno della tradizione britannica, sarà Jones a riferirsi al breath-group come ad
un gruppo di suoni pronunciati nello spazio compreso tra due pause 137. In linea con Sweet,
Jones assegnerà alla scomposizione del parlato una duplice funzione, fisiologica e
semantica. Per il linguista inglese le pause hanno, infatti, il compito di consentire al
parlante di riprendere fiato e contemporaneamente di rendere più chiaro il significato delle
parole:
Pauses are continually being made in speaking. They are made (1) for the purpose
of taking breath, (2) for the purpose of making the meaning of the meaning of the
words clearer (Jones 1922, p. 135).
Circa sessanta anni più tardi Lieberman diede corpo, nell’ambito delle sue ricerche
fisiologico-acustiche, alle intuizioni Sweetiane sul breath-group. Per Lieberman,
richiamandosi alla Motor Theory, i processi interpretativi dei parlanti troverebbero
sostegno nell’organizzazione articolatoria delle emissioni foniche:
137
"Group of sound which are pronounced without pause are called breath-groups"(Jones 1922 p. 135).
114
However, under certain conditions, listeners appear to 'decode' intonational signals
in terms of the articulatory mechanisms that could underlie the acoustic signal
(Lieberman 1967). The listeners, in other words, appear to be acting as though they
make use of a 'motor theory' of speech percep-tion to interpret the acoustic signal
(Lieberman, Sawashima, Harris e Gay 1970, p. 313).
L’autore sostenne infatti che i parlanti producevano e percepivano l’intonazione in termini
di “unmarked” e “marked” breath groups, risultanti dall’interazione tra respirazione e
sistema muscolare laringale 138 . Secondo Lieberman i cambiamenti nel valore della
frequenza fondamentale sarebbero intimamente connessi alla pressione subglottidale
dell’aria. Proprio la riduzione della pressione dell’aria a ridosso dei confini del breathgroup provochere l’abbassamento finale del pitch negli enunciati non marcati 139.
L’abbassamento, secondo Lieberman, sarebbe dunque il risultato di una caratteristica
involontaria del parlante “che non dipenderebbe da regole linguistiche, ma che si trova a
cooccorrere con le caratteristiche linguistiche della produzione di F0 relative alla
produzione dell’accento” (Bertinetto, Magno Caldognetto 1993, p. 179).
Nel caso dei breath group marcati, quelli che presentano un incremento nel valore della F0
nella loro parte finale, interverrebbero invece i muscoli laringali la cui attività avrebbe lo
scopo di evitare il fenomeno dell’abbassamento del pitch140.
138
139
140
“The breath-group is a suprasegmental feature (…). The breath-group at the articulatory level involves a
coordinated pattern of muscular activity that includes the subglottal, laryngeal, and the supra glottal
muscles during an entire expiration” (Lieberman 1967, p. 167).
The data shows that the sub glottal respiratory muscles start to force air out from the lungs while the
laryngeal muscles close the glottis to its "phonation neutral position" and adjust the tension of vocal cord.
The super glottal vocal tract simultaneously begins to move into position and phonation commences at a
specified fundamental frequency which the speaker can repeat at will. At the end of the sentence the sub
glottal respiratory muscles lower the sub glottal air pressure during the last 150-200 msec. of phonation.
The tension of the laryngeal muscles for the unmarked American English breath-group appears to remain
relatively steady throughout the sentence. The fundamental frequency of phonation is thus a function of
the sub glottal air pressure function and it falls during the last 150-200 msec of phonation" e ancora "The
falling terminal fundamental frequency contour that result from absence of an increase in the laryngeal
tension at the end of unmarked breath-group apparently is a universal aspect of the unmarked breathgroup" (Lieberman 1967, p. 167 - 168).
"The marked breath-group contrasts with the unmarked breath-group during the last 150-200 msec of
phonation where the tension of the laryngeal muscles increases in the marked breath-group. The increased
115
Controevidenze sono state avanzate da Ohala e Hirano (1969) i quali, tramite
l’elettromiografia, hanno mostrato che i muscoli laringali sono coinvolti attivamente nel
controllo del pitch durante la fonazione. In questo modo gli studiosi limitano il ruolo della
pressione subglottidale dell’aria, che occuperebbe una parte minore nella variazione del
pitch 141 . Detto in altri termini, l’intonazione e la sua articolazione appaiono fortemente
influenzate nella loro organizzazione dalla base fisiologica 142.
3.2
La divisione in Sense-group
Altre ricerche hanno orientato le loro attenzioni alla relazione tra intonazione e significato
ipotizzando un’unità strutturale di intonazione corrispondente a un sense-group. Per
Armstrong e Ward (1926) ad esempio la lingua parlata consiste di uno o più sense-group in
cui ciascuno è un gruppo intonativo: “Connected speech consist of sense-group (either one
or a series), each of wich is a sense-group” (Armstrong & Ward 1926, p. 25).
Il loro famoso manuale sull’intonazione inglese è infatti organizzato in modo da presentare
agli studenti esempi di andamenti melodici semplici e complessi (formati da più sensegroup) sulla base della loro completezza semantica.
141
142
tension of laryngeal muscles counters the falling sub glottal air pressure and the marked breath-group thus
has a terminal not-falling fundamental frequency contour” (Lieberman 1967, p. 169).
“The data provided no confirmation of a recent hypothesis by Liberman that, for American English,
during other than YES-NO question, the laryngeal tension remains relatively steady and that pitch
variation is a function of the subglottal air pressure. On the contrary, the muscles studied participated
actively in pitch control, and variations in subglottal pressure could account for but a fraction of the
observed pitch changes” (Ohala e Hirano 1967, p. 1208-1209).
L’importanza della componente biologica è messa in evidenza anche da Albano Leoni (2009) il quale,
descrivendo il meccanismo articolatorio dell’intonazione commenta: “Questo meccanismo è perfettamente
congruente con le capacità uditive e riflette dinamiche fonatorie generali di ordine probabilmente
biologico, dunque naturali e universali: la sua articolazione in unità tonali è legata ai cosidetti «gruppi
respiratori»; le unità tonali si concludono sempre (tranne che nei casi di marcatezza) con una declinazione
naturale di tutti gli indici (intensità e frequenza tendono a zero e l’eloquio rallenta), e anche la marcatezza
(cioè l’andamento terminale ascendente) non è che il rovesciamento di un andamento naturale. Le
caratteristiche prosodiche, proprie di ciascuna lingua, sono dunque la componente arbitraria che si innesta
su una base solidamente naturale (come del resto fanno altre manifestazioni linguistiche)” (Albano Leoni
2009, p. 45 – 46).
116
Secondo Klinghardt e Klemm (1920) l’intonazione avrebbe il compito di rendere i
significati più chiari. Essi parlano di intonatorischer Sinntakt che Couper-Kuhlen (1986)
traduce con l’espressione intonational sense-group, spiegando che in questo termine l’idea
di unità base dell’intonazione e di sense-group viene a sovrapporsi, e che quindi l’una è
dipendente dall’altra.
Sebbene in maniera non del tutto esplicita anche il manuale di O’Connor e Arnold (1961)
ha enfatizzato il ruolo dell’intonazione nell’organizzare gruppi di parole (word group)
rilevanti a livello grammaticale.
We need some neutral term to refer to these groups of words which are
grammatically relevant - they are not always clauses or subject or phrases - and the
term we shall use in this book is simply word groups (O' Connor e Arnold 1961, p.
3).
3.3
L’approccio fonetico - fonologico
Un’alternativa agli approcci prevalentemente fisiologici o semantici è quella sviluppata da
autori come Crystal, che definiscono le unità tonali a partire da criteri fonologici, cercando
di integrare i criteri esterni a quelli legati all’organizzazione interna delle unità 143.
The approach presented here may be described as being phonological without
being phonemic; it tries to avoid the constrictions such as would be placed upon
intonation analysis based on grammar or semantics. It also tries to adopt a more
‘open’ view of the subject, by beginning with the question of identification of the
units relevant for intonational study (Crystal 1969, p. 200).
L’unità tonale (tone-unit) sarà dunque identificabile mediante la presenza di picchi di
prominenza in corrispondenza dell’elemento strutturale interno definito nucleo (nuclear
143
“Alternatively we might adopt a semantic approach to definition, and introduce some such amorphous
notion as the ‘sense group’; or we might try and identify it with reference to some extra-linguistic
phenomenon, such as the ‘breath-group’; or we might adopt a wholly phonological definition” (Crystal
1969, p. 205).
117
tone). Quest’ultimo secondo Crystal è quell’elemento la cui presenza è necessaria e che
consente all’ascoltatore di percepire il senso di completezza di un enunciato: “If it is
omitted, the auditory effect is one of ‘being cut short’” (Crystal 1969, p. 207). Altri
elementi fonetici sono incaricati di indicare con relativa precisione i confini dell’unità
tonale. È possibile ad esempio osservare dei mutamenti nell’andamento del pitch,
dipendenti dal movimento del tono nucleare. Un ulteriore criterio consiste nella presenza di
indicatori in prossimità del confine: è il caso delle pause144 o di altre forme di modificazioni
fonetiche, come ad esempio l’allungamento e la declinazione finale o resetting intonativo
iniziale. Secondo Crystal questo criterio fonetico-fonologico è sufficiente per indicare
senza ambiguità la posizione dei confini delle unità tonali all’interno del parlato connesso.
4
La struttura Interna dell’unità intonativa
Come si è anticipato in precedenza, al riconoscimento del tone-group, Harold Palmer fece
corrispondere una scomposizione interna di tale unità, sulla base di elementi organizzati in
maniera sistematica che prenderanno il nome di nucleo (Nucleus), testa (Head) e coda
(Tail)145.
Il nucleo è il luogo intorno al quale viene organizzata la forma degli altri componenti. Esso
corrisponde alla sillaba accentanta della parola più prominente dell’unità intonativa 146 .
144
145
146
Crystal (1969) rileva tuttavia che non sempre le pause sono in grado di far emergere chiaramente le unità.
Questa stessa suddivisione sarà adottata, con lievi differenze sia da autori appartenenti alla tradizione
americana che quella britannica. Kenneth L. Pike ad esempio dichiara esplicitamente alcune affinità con lo
studioso inglese: “My own analysis of intonation was largely complete before this particular work of
Palmer’s came to hand, but I consider a similar series of observations, made independently, to be one of
the most important factors contributing to my result. Roughly, his term nucleus correspond to the primary
contour described in this present study, and head correspond to pre-contour” (Pike 1945, p. 6). Crystal
(1969, p. 208) organizza l’unità tonale secondo una struttura interna (Internal structure of the tone-unit)
composta da un elemento obbligatorio (Nucleus) e tre opzionali (Head, Prehead e Tail); Halliday (1963)
utilizzerà una formula simile mediante l’uso dei termini tonic, pretonic etc.
“Each Tone-Group contains a Nucleus, which is the stressed syllable of the most prominent word in the
Tone-Group” (Palmer 1922, p. 7).
118
Come sottolinea l’autore stesso, il nucleo corrisponde a ciò che usualmente viene definito
accento di frase147. A loro volta i termini tail e head saranno costituiti rispettivamente dalla
sillaba o dalle sillabe che seguono e che precedono il nucleo nello stesso tone-group.
Schematizzando avremmo dunque:
Fig. 41 Struttura del Tone Group secondo la descrizione di Palmer (1922)
La prima parte del lavoro di Palmer consisterà nel tentativo di descrizione della forma del
sistema intonazionale inglese. In tale sistema il nucleo avrà il ruolo principale di
determinare le varie tipologie di Nucleus Tones, ossia gli andamenti di tono caratteristici
dei diversi e specifici Tone Groups148, che a loro volta esprimeranno determinate funzioni
semantiche.
Palmer illustra quattro distinte forme di Tone Groups a seconda dell’andamento del tono
nucleare:
Tone group 1 – presenta nell’immediata vicinanza del nucleo un tono con
andamento discendente.
Tone group 2 – presenta nell’immediata vicinanza del nucleo un tono con
147
148
“The nucleus correspond to what is usually called sentence stress” (Palmer 1922, p. 7).
Come sottolinea Sorianello, la nozione di Nucleo sarà centrale in tutte le prospettive teoriche interessate
all’intonazione: “In tutti i modelli intonativi, la nozione di Nucleo rappresenta l’asse portante intorno al
quale si dispongono le altre categorie tonali. Nonostante le difficoltà relative alla sua identificazione
formale, su un punto gli esperti sembrano concordare: il Nucleo è l’elemento della stringa tonale che
convoglia il grado più elevato di prominenza melodica, e dunque il significato intonativo dell’intero
contorno. Il suo statuto è speciale, ovvero obbligatorio e unico. Questo corollario teorico si rinviene tanto
negli approcci intonativi di tipo olistico, ad esempio nella Scuola inglese, quanto negli approcci lineari e
composizionali” (Sorianello 2006, p. 89).
119
andamento ascendente.
Tone group 3 – presenta nell’immediata vicinanza del nucleo un tono con
andamento ascendente discendente.
Tone group 4 - presenta nell’immediata vicinanza del nucleo un tono con
andamento lievemente ascendente.
Anche in questo caso il valore degli andamenti non è assoluto ma relativo e l’ampiezza
dello spettro tonale effettivamente coinvolto potrebbe cambiare in contesti di eloquio
differenti149.
Potremmo dunque osservare che lo studio di Palmer sembra andare nella direzione di una
descrizione che si colloca nello iato tra fonetica e fonologia, operando un’astrazione
‘analogica’ degli andamenti tonali e contestualizzandoli in un sistema di regole di
combinazione. Il contorno melodico infatti non è rappresentato punto a punto nelle sue
variazioni, esso viene suddiviso funzionalmente in classi astratte determinate e
determinabili mediante l’andamento tonale delle sillabe prominenti. Tale astrazione
conduce a individuare come pertinenti, e graficamente trascrivibili, i valori relativi del
contorno occorrenti su ciascuna sillaba dell’enunciato e a definire formalmente la funzione
dell’enunciato sulla base del tono nucleare. Come si vedrà in seguito sarà proprio
l’andamento dell’altezza sulla sillaba più prominente dell’enunciato a determinare la
tipologia del tone group, e ad esso corrisponderanno delle particolari forme della testa e
della coda.
149
“The ‘Falling’ and ‘Rising’ are relative, not absolute; the Range of a falling or rising tone varies according
to the degree of animation speech” (Palmer 1922, p. 8).
120
Fig. 42 L'organizzazione del Tone Group sulla base del Nucleo
La Coda (Tail) viene definita dall'autore come la sillaba o le sillabe che seguono il nucleo
nello stesso Tone Group. A seconda della tipologia di Tone Group Palmer individua codes
differenti che, sostanzialmente, non faranno altro che seguire il movimento tonale del
nucleo.
Nel Falling Nucleus (Tone Group 1) il pitch si mantiene sul livello basso. Tale andamento
sembra essere una regola costante, e proprio per questo motivo viene escluso dalla
rappresentazione tonetica:
Fig. 43 Rappresentazione tonetica del Tone Group 1 (discendente)
Nei casi in cui si è in presenza di un nucleo avente andamento ascendente (Tone Group 2 e
4), la coda partecipa nella salita del valore di tono. In questo senso il contorno ascendente si
distribuisce progressivamente sul nucleo e sulla coda come mostrano gli esempi:
121
Fig. 44 Rappresentazione tonetica del Tone Group 2 e 4
Le sillaba o il gruppo di sillabe appartenenti alla coda nei gruppi tonali con nuclei
ascendenti e discendenti (Tone Group 3), queste ultime seguono l’andamento ascendente e
discendente del nucleo: la curva si distribuisce lungo il nucleo e la coda.
Fig. 45 Rappresentazione tonetica del Tone Group 3
La sezione dedicata alla testa è quella a cui Palmer dedica il maggiore spazio. Se ne
distingono diversi tipi. Una prima classificazione viene fatta sulla base del numero di
sillabe da cui è costituita, rispettivamente 1, 2 e 3 o più; una seconda classificazione viene
fatta sulla base del rapporto tra l’altezza delle sillabe prenucleari e del nucleo. Nel caso in
cui i toni della testa siano più alti del punto iniziale del tono nucleare avremo una testa
definita superior 150; se l’altezza della testa non è mai più alta della punto iniziale del nucleo
la testa sarà definita inferior 151; quanto invece i toni tendono a salire da una posizione
media fino al punto più alto dell’intero tone group avremo una testa definita scandent152;
etherogeneus verrà infine utilizzato per riferirsi a una combinazione delle teste appena
150
151
152
“A Superior head is one the tones of which are higher in pitch the initial point of nucleus-tone” (Palmer
1922. p. 18).
“An Inferior head is one the tones of which are never higher in pitch than the initial point on the NucleusTone” (Palmer 1922, p. 17).
“A Scandent head is one the tones of which rise or climb from the mid-level to the highest pitch of the
whole tone-group. This highest point (which may be termed the “vertex”) is therefore higher in pitch than
the initial point of any nucleus” (Palmer 1922, p. 18).
122
introdotte. Di seguito lo schema di un gruppo tonale:
Fig. 46 Struttura completa del Tone Group elaborata sulla base della descrizione di Palmer
Come abbiamo già accennato nelle pagine precedenti, l’articolazione interna del Tone
Group realizzata da Palmer nel suo volume, non si limita alla sola descrizione della forma
fonica dell’intonazione. Quest’ultima viene elaborata in funzione dell’organizzazione
semantica degli enunciati. Il linguista individua differenze semantiche in corrispondenza di
organizzazioni espressive diverse e viceversa153:
We have so far considered the English Tone-Groups from the point of view of their
form; we have divided them into four classes according to the nature of the
nucleus. […] We have however said little concerning the significative (or
153
In alcuni casi, in particolare quello del tone group 4, l’autore ammette di aver considerato come pertinente
alla sua definizione la specificità dei significati di cui quest’ultimo era incaricato: “The significative value
of this tone-group is peculiar, and appears to bear no analogy whatever to the High-Rising Tone-Group,
nor are there apparently any intermediate or transitional forms between the two. This, I think, justifies its
right to be considered as an independent tone-group, and not a variety of [high-Rising Tone Group]”
(Palmer 1922, p. 84).
123
“semantic”) value or values of the tone-groups; we now have to take each of these
in turn and endeavour to specify the meaning or meanings implied by them; we
shall see how a given word or group of words may change its meaning according to
the way in which it is intoned. We shall conclude that a coherent and consistent
system of semantic laws underlies all these tonetic phenomena (Palmer 1922, p.
72).
Seguendo gli esempi e le descrizioni dell’autore è possibile ricostruire l’organizzazione del
suo sistema intonativo relativo alla lingua inglese. In questo si può notare come per l’autore
nucleo e testa abbiano il ruolo maggiore nella comunicazione dei significati, mentre la coda
sembra essere ininfluente.
In molti degli esempi proposti, l’autore confessa di aver avuto difficoltà nella definizione di
formule generali in grado di rendere conto perfettamente di tutte le possibili sfumature di
significato per ciascun Tone Group.
Scorrendo le varie esemplificazioni si può notare infine come la maggior parte delle varietà
semantiche ruotino intorno alle due tipologie di Tone Group corrispondenti all’andamento
discendente e ascendente (rispettivamente 1 e 2): gli stessi che nel lavoro di Armstrong e
Ward occuperanno l’intero spazio di attenzione, e che verranno definiti con la formula
Unemphatic sentences e Emphatic sentences 154 . A questi ultimi sono generalmente
associati gli enunciati che hanno un carattere di conclusione. Palmer utilizza il termine
finality pur ammettendo le numerose eccezioni e varianti.
Al Tone Group 2 (nucleo con andamento ascendente) sono invece legati enunciati con
carattere prevalentemente dubitativo e incerto.
Nei due restanti (tone group 3 e 4) Palmer individua un carattere rispettivamente
concessivo e rassicurante. Di seguito lo schema riassuntivo:
154
“English intonation can be reduced to two tunes, with variations of these due to special circumstances.
The exeples given are divided into two section: A. Unemphatic sentences in wich the two tunes are used in
their simplest form; B. Emphatic sentences where the intonation expresses a special meaning in the
speaker’s mind” (Armstrong e Ward 1926, p. 4).
124
Tone Group I
TIPOLOGIA TESTA:
Inferior 1 – Categoric Statement*
2 – Special Question*
3 – Command*
4 – General Question*
5 – Isolated Words – When quoted or contrasted
* la prominenza è confinata quasi interamente nella parola del nucleo
Superior 1 – Statements con la prominenza distributa sulla testa
2 – Special Question – Forma normale
3 – Commands – Forma normale
4 – General Questions – che implicano la “La risposta è nel contrario”
Scandent
1 – Statements – Animata con prominenza distributa sulla testa
2 – Special Question – Animata, forma normale
3 – Commands – Animata, forma normale
4 – General Question – Animata, che implicano la “La risposta è nel contrario”
5 - Esclamazione
Tone Group II
TIPOLOGIA TESTA:
Inferior -
125
1 - Statements quando implica “Then why...?”
2 - Statements che implicano dubbio esitazione etc.
3 - Special Question quando ripetuta
4 - General Question con prominenza confinata sulla parola-nucleo
5 - Words or word groups modifying nucleus-word of adjacent Tone Group
Superior 1 - Statement*
2 - Commands*
3 - Special Question - echoed
4 - General Questions - forma normale
5 - Echoed Statements
* Che hanno carattere di protesta
Scandent 1 - Special Question - echoed (in maniera animata)
2 - General Questions - animata
3 - Echoed Statements - animata
Tone Group III 1 - Statements*
2 - Commands*
* implicanti concessione. Usati principalmente per contrasto.
Tone Group IV
TIPOLOGIA TESTA:
126
Scandent
1 - Parting Greetings.
2 - Statements aventi carattere rassicurante
Con i lavori di Harold Palmer l’immagine scientifica dell’intonazione inizia a mostrare
interessanti cambiamenti. Al contorno continuo e globale che aveva caratterizzato il
metodo di trascrizione di Daniel Jones, si sostituisce il tentativo di strutturare l’intonazione
in diverse unità organizzate funzionalmente. Ciò consente all’autore di mettere in forma
l’ipotesi di un sistema dell’intonazione che investe sia il piano dell’espressione che quello
del contenuto. Un aspetto questo che può essere considerato come elemento di novità
rispetto ai lavori di Jones, in cui l’elemento della sistematizzazione sembra mancare.
Va rilevato inoltre come la centralità del senso sia una delle caratteristiche peculiari
dell’approccio britannico, fondamentalmente legato alla didattica delle lingue.
Se è vero che le caratteristiche prosodiche sono difficilmente collocabili all’interno delle
teorie linguistiche per il loro carattere instabile e variabile, è altrettanto vero che le pratiche
di insegnamento hanno ampiamente dimostrato il ruolo fondamentale della prosodia e
dell’intonazione negli scambi comunicativi ordinari. All’atto pratico queste componenti si
dimostrano essenziali al corretto funzionamento della lingua. Per capire e farsi capire
quindi non basta pronunciare correttamente le singole parole o porzioni di parole.
Studi più recenti nel campo della didattica hanno confermato l’inestricabile legame tra
rappresentazione, comprensione delle funzioni dell’intonazione e apprendimento. Levis e
Pickering (2004) spiegano come nell’ambito dell’insegnamento della lingua inglese sia
risultato cruciale l’impiego di tecnologie per la visualizzazione degli andamenti intonativi.
Cruciale inoltre sembra essere la capacità degli insegnanti di mostrare le corrispondenze tra
andamenti melodici e funzioni semantiche. La rappresentazione e la maggiore
consapevolezza
dell’organizzazione
semantica
dell’intonazione,
ossia
i
caratteri
127
dell’approccio britannico, sarebbero quindi componenti essenziali per un rapido
apprendimento della lingua stessa.
128
Cap. 4:
1
L’intonazione tra fonetica e
fonologia
Il modello a livelli dello strutturalismo americano
Nel corso degli anni 40-50 del ‘900, soprattutto nel contesto linguistico americano, possono
essere rintracciati i primi interessanti tentativi di applicare in maniera sistematica
all’intonazione i risultati raggiunti dalla nascente fonologia. Solo un decennio prima infatti,
tra il ‘29 e il ’39, si era assistito alla pubblicazione dei Travaux du cercle linguistique de
Prague che avevano testimoniato il fermento per la nuova scienza della lingua e culminato
nei Grundzüge der Phonologie di Trubeckoj. Lo strutturalismo americano dunque, con
Leonard Bloomfield, Kenneth L. Pike, Zellig Harris, Wells R. S., George Trager, pose le
basi per i successivi sviluppi nello studio dell’intonazione. La scomposizione del contorno
in livelli di pitch assolutamente relativi, ma anche le riflessioni teoriche che ne scaturirono,
aprì numerose questioni che trovano eco anche negli approcci più moderni. Tra queste, la
plausibilità di trasferire punto a punto il concetto di fonema alla dimensione tonale, e la
conseguente plausibilità di un’analisi fonologica dell’intonazione. Su questo terreno di
indagine si collocò una parte importante del lavoro di Bolinger che, in numerosi interventi
sul tema, mostrò i limiti e le problematiche dell’approccio a livelli.
L’analisi linguistica dell’intonazione e la sua corrispettiva rappresentazione grafica, trova
nello strutturalismo americano un interessante terreno di sviluppo. Studiosi come Pike,
Bloomfield, Harris hanno affrontato, sebbene con grado di approfondimento differente, il
fenomeno dell’intonazione, cercando di trasferire su di esso alcuni dei principi che hanno
portato allo sviluppo dell’allora giovane fonologia. Come vedremo, il terreno di discussione
sarà incentrato soprattutto sul tentativo teorico e pratico di trattare fonologicamente il tono
129
nelle lingue intonazionali.
Leonard Bloomfield, ad esempio, nel suo famoso ‘Language’ (1933) colloca i cambiamenti
di pitch, e il loro ruolo nel complesso sistema linguistico, nel capitolo dedicato alle
modificazioni, subito dopo la descrizione della nozione di fonema e delle sue tipologie
(Bloomfield 1933 [1996], pp. 125 – 145). Tali elementi saranno definiti da Bloomfield
fonemi secondari:
Il tono rappresenta il tratto acustico in cui le variazioni gestuali, non distintive ma
socialmente efficaci sono più vicine alle distinzioni linguistiche vere e proprie
(Bloomfield 1933 [1996], p. 131).
Tra gli elementi che fanno parte di tali modificazioni il linguista americano inserisce la
lunghezza, il volume e il tono musicale. I modificatori, in sostanza, interverrebbero sulla
base segmentale di cui farebbero parte i fonemi. Tuttavia lo stesso Bloomfield nota come:
Questa distinzione tra suoni linguistici di base e modificazioni è conveniente dal
punto di vista espositivo, ma non è sempre riconosciuta nel sistema fonetico delle
lingue; molte lingue considerano alcuni di questi ultimi tratti sullo stesso piano dei
fonemi del primo tipo (Bloomfield 1933 [1996], p. 125).
Prendendo spunto dal tono finale Bloomfield distinguerà ad esempio diverse "differenze
fonemiche". Affermazione [.], domanda (a sua volta suddivisa in domanda polare [?] e
domanda di informazione [¿]), a questi poi aggiunge il fonema esclamativo [!] che può
essere combinato con i precedenti; il tono causale o tono di sospensione [,].
Rulon S. Wells (1945), nell'applicare al pitch inglese il metodo già adottato per i fonemi
segmentali, definisce come soprasegmentali i fonemi che non sono né vocali né consonanti,
ed evidenzia i diversi livelli di utilizzo di questo termine (Wells 1945, pp. 28 -31).
130
Un contributo influente verso la progressiva apertura della fonologia al campo
dell'intonazione è sicuramente quello offerto da Kenneth Lee Pike. Se con Bloomfield,
come ricorda Crystal (1969, p. 45), abbiamo avuto il primo tentativo di trattare
fonemicamente la categoria del tono, è con Pike che si ha indubbiamente un modello più
esplicito e articolato di trattamento dell'intonazione. Lo studioso è infatti considerato il
primo strutturalista americano ad elaborare una metodologia per lo studio dell'intonazione
basata su livelli155.
Per il linguista americano nella descrizione dell'intonazione non è sufficiente affermare che
un contorno melodico è ascendente, discendente o ascendente discendente ma bisogna tener
conto di altre relazioni interne come l’ampiezza degli intervalli tra i punti iniziali o finali
del contorno:
Even the simplest rise has a complex series of relationships to other contours, and
complex internal structure. The size of the interval between beginning and ending
points, the height of the beginning point relative to the general pitch level of the
sentence, paragraph, conversation, or speaker's norm, the relation to timing,
phrasing, stress, and pausing, -- these and other characteristics need to be described
for the complete understanding of any contour (Pike 1945, p. 25).
Allo stesso modo di Harold Palmer, ma in maniera del tutto indipendente 156, Pike considera
l'andamento melodico di un enunciato suscettibile di una scomposizione in più parti
funzionali157. Gli elementi discreti riconosciuti sono essenzialmente il contorno primario,
che ha inizio da una sillaba tonica, e il precontorno, costituito dalle sillabe atone precedenti
155
156
157
Non mancano tuttavia esempi di tentativi di trascrizione precedenti all’opera di Pike che abbiano fatto in
qualche modo uso di livelli tonali astratti. È il caso di Walter Ripman 1922 che nel suo volume di
introduzione alla fonetica, si servì di simboli numerici per indicare le variazioni dell’intonazione. Anche
Harold Palmer nel 1922 inserì nel suo sistema complesso di descrizione una classificazione che serviva di
3 livelli di altezza relativa (high note, mid note, low note).
Pike (1945, p. 6)
Palmer scomporrà il tone group in nucleo, testa e coda (Cfr. Cap. 3).
131
il contorno primario.
Pike articola infatti la categoria del tono secondo quattro livelli di altezza relativa. Tali
livelli, che lo stesso linguista definisce pitch phoneme, sarebbero infatti pertinenti alla
differenziazione delle varie funzioni intonative nella lingua inglese.
The pitches of intonation are relative. The absolute pitch of a syllable -- the number
of vibrations per second -- has no significance as such. The significance of pitches
is determined by their height relative to one another (Pike 1945, p. 25).
Secondo l’autore, la scelta di istituire quattro livelli non è arbitraria. Un numero inferiore di
livelli non sarebbe stato sufficiente alla distinzione di molti contorni melodici, mentre un
numero maggiore avrebbe potuto portare alla costruzione di un grande numero di
combinazioni di pitch inutilizzati.
The four levels are enough to provide for the writing and distinguishing of all the
contours which have differences of meaning so far discovered, provided that
additional symbols are used for stress, quantity, pause, general height of the voice,
general quality of the voice, and so on (Pike 1945, p. 26).
Tuttavia, a differenza del livello segmentale in cui la nozione di fonema è collegata ad unità
asignificanti, in grado di permettere, mediante una sostituzione, l’individuazione dello
scarto di significato tra due elementi (parole) 158, al pitch phoneme o fonema intonativo Pike
non riconosce questa caratteristica:
The pitch levels appear to be nearly or completeely meaningless by themselves. It
158
Il riferimento è al metodo delle coppie minime utilizzato in fonologia per l’identificazione dei fonemi:
“Quando due suoni ricorrono nelle medesime posizioni e non possono essere scambiati fra loro senza con
ciò mutare il significato delle parole o renderle irriconoscibili, allora questi due suoni sono realizzazioni
fonetiche di due diversi fonemi” (Trubeckoj 1939: 59).
132
is the intonation contour as a whole which carries the meaning while the pitch
levels contribute end points, beginning points, or direction-change points to the
contours--and as such are basic building blocks which contribute to the contours
and hence contribute to the meaning (Pike 1945, p. 26).
Per Pike dunque non è sufficiente sostituire un singolo livello con un altro per ottenere un
cambiamento ‘significativo’, al contrario è il complesso intervento delle componenti del
contorno intonativo a contribuire in maniera determinante alla dimensione del significato.
Dal punto di vista notazionale i livelli entrano a far parte della rappresentazione sotto forma
di numeri: da 1 a 4 in corrispondenza di valori decrescenti (1 - extra-high; 2 - high; 3 - mid;
4 - low). Diversamente dalle rappresentazioni 'configurazionali' in cui il contorno
intonativo, sia pure stilizzato, tendeva ad essere posto in evidenza nella sua interezza
all'interno delle rappresentazioni, con l'introduzione dei livelli, l'intonazione subisce sia a
livello teorico che notazionale una progressiva segmentazione. Sebbene, come abbiamo
ricordato, Pike consideri l'intervento complessivo delle componenti intonative decisivo per
l'identificazione dei significati, egli, a proposito del tono, non riconosce come determinanti
tutti i movimenti, ma solo quei punti, chiamati CONTOUR POINTS, che sono cruciali per
la loro identificazione:
In determining the pertinent level or level contour, one does not classify the pitch
of every syllable or part of a syllable, but only those points in the contour crucial to
the establishment of its characteristic rises and falls; these may be called
CONTOUR POINT (Pike 1945, p. 26).
In questa prospettiva, sempre più vicina all'approccio fonologico all'intonazione, si
potranno intendere i contour points come luoghi astratti in cui determinare l'altezza relativa,
pertinente all'identificazione di una generale tipologia di enunciato. La 'forma' intonativa
coinciderà dunque con la successione di livelli di altezza relativi, rappresentabili
133
semplicemente mediante la successione di numeri.
Una delle immediate conseguenze è la sempre più pressante autonomia del livello
intonativo da quello segmentale. Una caratteristica riconosciuta anche da linguista Rulon S.
Wells (1945, p. 29)159.
Per essere intesa fonologicamente una certa forma intonativa dovrà rimanere costante al
variare del livello segmentale (ad esempio enunciato formato da un maggior numero di
sillabe), e viceversa, sarà possibile applicare differenti forme generali a uno stesso
materiale segmentale160. In questa direzione vanno infatti gli esempi proposti dall'autore:
Fig. 47 Esempio tratto da Pike (1945, p. 26)
Al di là del materiale segmentale e dalla sua lunghezza, ciò che conta sono, secondo Pike,
la successione dei contour point.
In the first five samples each syllable had at least one contour point, so that the
relative pitch of each syllable was important to establishing of contours and their
meanings. In the last two samples, there were more syllables than contour points.
These extra syllables can be pronounced with intermediate pitches in a general
descending scale, or with considerable variation in the amount of drop from
syllable to syllable. There may be many more than four actual levels, but it is the
contour-point levels which are pertinent to the system (Pike 1945, pp. 26-27).
159
160
Tra le caratteristiche dell’intonazione Wells (1947) segnala come fondamentale il fatto che i contorni si
comportino come un sistema separato. Ad esso si associa, come rilevato già nel pensiero di Pike l’idea di
una scomposizione dell’intonazione in punti pertinenti: “For otherwise there would be no reason to speak
of contours at all; there would only the individual pitch phonemes by themselves, each of which generally
coincides with less then a phrase” (Wells 1947, p. 255).
“L’intonazione consiste nella ricorrenza di determinate successioni di altezze tonali diverse, detti contorni
(o profili) intonativi, ognuno dei quali viene usato con un significato costante entro un costituente di
lunghezza variabile” (Nespor 1993, p. 265).
134
In questo modo la rappresentazione del contorno può mettere in rilievo i tratti comuni del
livello intonativo e operare una ripartizione di livelli. I profili intonativi in questa
prospettiva tendono ad acquistare autonomia rispetto al materiale segmentale, operando di
fatto un passo molto importante verso il processo di fonologizzazione dell'intonazione.
Riassumendo, per la trascrizione dell'intonazione inglese Pike si servirà di un sistema di
notazione particolarmente semplice che gli permetterà di porre sotto osservazione
contemporaneamente: il valore dei livelli relativi di tono, i punti rilevanti del contorno e i
confini delle unità ritmiche161.
I livelli sono mostrati mediante l'uso dei numeri, da uno a quattro rispettivamente per il
livello più alto e il livello più basso di pitch. Il punto iniziale del primary contour è
generalmente indicato dal simbolo °. Il contorno primario può essere ulteriormente
scomposto in tre punti (Pike 1945, pp. 26-29): beginning point (punto iniziale che occorre
sempre sulla sillaba accentata), ending point (punto finale, quando il contorno copre più di
una sillaba) e direction-change point (punto in cui l’andamento intonativo cambia
direzione):
"The advantage of this system lies in its unambiguous indication of the contrastive levels,
the contour point, and the like, with resultant presentation of the structural organization of
the material. Further, the printing difficulty is moderate" (Pike 1945, p. 42).
Fig. 48 Esempio tratto da Pike (1945, p. 42)
La frase dell'esempio si compone di due unità ritmiche: If he can e he'll cooperate. Inoltre if
161
Per un’analisi approfondita cfr. Wells (1947)
135
e he'll essendo in posizione precedente al simbolo ° devono esser letti come i precountours
mentre su -op- e la prima parte di can rappresentano i punti iniziali del prymary contour
mentre la parte centrale di can presenta un punto in cui il contorno modifica la sua
direzione (direction-change contour). Infine tra can e he’ll è segnalato un confine
intonativo.
L'aspetto interessante del modello di Pike è che, oltre ad essere il primo tentativo di
descrivere un complesso sistema fonologico dell'intonazione, rappresenta il risultato di una
progressiva astrazione notazionale. Lo stesso autore racconta come nel 1942, e quindi a soli
3 anni dalla pubblicazione del suo volume sull'intonazione, l'English Language Institute,
presso l'Università del Michigan dove Pike lavorò per circa 30 anni, utilizzava una forma di
trascrizione che si avvicinava molto a quella già incontrata precedentemente nei lavori dei
fonetisti inglesi. Un approccio notazionale più vicino quindi al modello 'configurazionale',
che solitamente è storicamente opposto a quello 'a livelli'.
In un primo momento vennero utilizzati una serie di simboli grafici, quattro come i livelli
di pitch individuati dal linguista americano, che indicavano sommariamente l'andamento
del tono. Un esempio è il seguente:
Fig. 49 Primi esempi di trascrizione (Pike 1945, p. 42)
Benché tale metodo fosse ‘tecnicamente’ corretto, Pike ricorda che nella pratica didattica
esso risultava scomodo da leggere, dato che i parlanti inglesi erano abituati all’uso della
punteggiatura. Quest’ultima infatti, oltre a segnalare sommariamente l’andamento
intonativo, era posizionata al termine delle frasi e non all’inizio come in questo caso.
Ma non è tutto. Pike racconta inoltre come i membri dell'istituto si cimentarono nell’uso di
una trascrizione che sfruttava linee continue in grado di mostrare visivamente l'andamento
136
dell'intonazione lungo i quattro livelli di pitch162. Di seguito un esempio:
Fig. 50 Esempio di trascrizione tratta da Pike (1945, p. 42)
Il sistema qui riproposto ebbe un rapido successo grazie alla facilità con cui gli studenti
riuscivano ad utilizzarlo e venne così adottato nel 1943.
Non mancarono tuttavia i problemi: se da un lato la linea continua assicurava una più
semplice comprensione dell’andamento melodico generale, dall’altro rendeva difficoltosa
la scomposizione funzionale del contorno. In questo modo l’interpretazione del lettore era
orientata verso determinati valori relativi di pitch per ciascuna sillaba e non esclusivamente
su quelle pertinenti al “contrasto fonologico”:
Since it is the contour point which actually are the only ones in which the relative
pitches are within the four-level phonemically-contrastive system, while the
intermediate syllables may have considerable fluctuation or intermediate pitch, an
implication of contrastive pitch on each syllable brings a mild distortion (Pike
1945, p. 43).
Queste distorsioni furono ancora più evidenti con studenti di lingua straniera. Così, sempre
nel 1943, testando i materiali, fu scoperto che vi erano ulteriori problemi e per questo
162
“[...] A line was drawn continuously over an entire sentence; for pitch one, the line passed well above the
letters; for pitch two it came at the top of short letters; for pitch three it came immediately below the line;
and for pitch four, further below” (Pike 1945, p. 42).
137
motivo furono adottati altri accorgimenti grafici. Alla linea continua fu sostituito un sistema
grafico che utilizzava quest’ultima solo in riferimento ai contour points, e una linea
tratteggiata per il resto del contorno. Qui di seguito le due trascrizioni:
Fig. 51 Esempi di trascrizione tratte da Pike (1945, pp. 110-111)
Un’ulteriore modifica venne infine introdotta per far sì che la linea continua potesse
indicare esclusivamente il punto iniziale del primary contour:
Fig. 52 Esempio di trascrizione (1945, p. 111)
In questo modo, si riuscì a semplificare ulteriormente la notazione, rendendo obsoleta
l’indicazione dell’accento di frase [‘] e facendo coincidere nell’unico mezzo grafico (linea)
accento, intonazione e ritmo.
Tuttavia, come nel precedente caso, i problemi furono soprattutto relativi alla segnalazione
del pitch per ciascuna sillaba. Le linee, continue o tratteggiate, fornivano, nel complesso,
informazioni ‘non-pertinenti’, spingendo i lettori ad interpretare in maniera vincolante le
indicazioni degli andamenti tonali su ciascuna sillaba e non solo su quelle ritenute
pertinenti. Da qui dunque la progressiva scelta dei livelli per l’annotazione delle variazioni
138
‘significative’.
Sulla linea del lavoro di Pike e di Wells si collocherà anche l'influente contributo di Trager
e Smith (1951) 163. Analogamente a come fatto dai loro colleghi, essi introdurranno nella
trascrizione fonemica 4 classi corrispondenti ai 4 livelli astratti di pitch: da [1] per il più
basso sino a [4] per il più alto, insieme ad altri elementi simbolici per l’indicazione delle
giunture164 e per le variazioni fonetiche interne a ciascun livello.
1.1
Level vs Configuration
Una posizione critica nei confronti dell'approccio definito "a livelli" è quella di Dwight
Bolinger. Anche per il linguista americano il problema circa la plausibilità di un'analisi
fonemica dell'intonazione è centrale. Tra i temi principali nella sterminata ricerca di
Bolinger vi è infatti l’approfondimento delle basi teoriche dell’intonazione. Il linguista
americano in più occasioni si è mostrato critico nei confronti degli approcci che, ignorando
il tratto di gradualità, sono orientati ad applicare sul dato categorie puramente discrete.
Altri nodi centrali del lavoro di Bolinger sono quelli relativi alle teorie del fonema
intonativo presenti nelle pubblicazioni dello strutturalismo americano (Bolinger 1947,
1949, 1951, 1961).
Is English intonation susceptible of phonemic analysis? If not now, will it be so
later? What kinship there between tonal and phonemic event, and is there such a
163
164
"Extensive testing of spoken English material has convinced us of the correctness of the independent
conclusions of Pike and Wells that there are four pitch phonemes in English. Our presentation of the
supporting data will be in terms of this conclusion" (Trager and Smith 1951, p. 41). Oltre alla suddivisione
per livelli i due linguisti introdurranno ulteriori elementi di descrizione. All’interno di ciascun livello
furono segnalate variazioni di altezza mediante i seguenti simboli [ˆ°ˇ ]̄ per il valore che va
rispettivamente dal basso verso l’alto.
Tali giunture, indicanti i movimenti intermedi tra due pitch o tra un pitch e il suo andamento finale,
avranno dunque il seguente valore: [ ̈] per segnalare un andamento finale costante rispetto al tono
precedente; [+] per segnalare un andamento ascendente rispetto al tono precedente e [ ̄] per segnalare un
andamento discendente rispetto al tono precedente. Questi tipi generali di giunture saranno declinate
all’interno di ciascun livello mediante i seguenti simboli: barra singola (/) doppia (//) o doppia croce (#).
139
thing as a tonal segment? How successful have been the attempts thus far to subject
English intonation to phonemic analysis? (Bolinger 1949, p. 248).
Bolinger in queste poche righe riassume i punti controversi della questione, e quindi la
possibilità di trasferire in maniera analogica le tecniche e le conoscenze che hanno
caratterizzato la fonologia segmentale ad un oggetto d'analisi del tutto differente, per
caratteristiche e funzioni, come il tono.
Il luogo di discussione su cui si sviluppa la riflessione del linguista americano è quello
dell'unità teorica e analitica del fonema. È possibile, in pratica, applicare il concetto di
fonema utilizzato nell'analisi fonologica segmentale alla categoria del tono, in una
prospettiva orientata alla fonologizzazione dell'intonazione?
Come abbiamo appena anticipato, e come incontrato anche nelle pagine precedenti (Cfr.
Cap. 1), non vi è dubbio che alla base della giovane fonologia vi fosse il concetto di unità
distintiva rappresentata dalla nozione di fonema.
Ed è questo l'elemento su cui Bolinger individua il potenziale terreno di confronto teorico.
Un primo e importante conflitto viene riscontrato nell'opposizione tra discreto/continuo che
caratterizzerebbe i due domini.
Il fonema segmentale è infatti 'semantically discontinuous'. Come abbiamo discusso nei
precedenti capitoli uno dei tratti fondanti di tale categoria linguistica è la sua proprietà
differenziante: "I suoni dotati di un valore distintivo, i suoni capaci di differenziare le
parole, hanno ricevuto un nome speciale nella scienza del linguaggio, vengono detti
fonemi" (Jakobson 1976 [1978], p. 48).
Secondo Bolinger, se non con rare eccezioni, i movimenti del tono tendono a prendersi
carico di variazioni semantiche continue:
If a note of warning consist in an upward movement of pitch, the intensity of the
warning varies proportionately as the range increases or decreases (Bolinger 1949,
p. 249).
140
Un tale aspetto ha un riflesso diretto e conseguente nei confronti del modello
rappresentazionale. Trasferire in maniera analogica il modello segmentale sulla categoria di
tono, ed è quanto sostanzialmente accaduto alla linguistica americana negli anni 40-50,
significa individuare un sistema grafico in grado di discretizzare a livello fonico e
semantico l'intonazione. Significa in breve rendere discontinuo l'andamento continuo del
tono e al contempo far corrispondere a quelle discontinuità pertinenze a livello semantico.
La proposta elaborata da Kenneth Pike, consistente nella scomposizione della categoria del
pitch in quattro livelli astratti, va in effetti verso questa direzione 165.
L'applicazione del test delle coppie minime o di "commutazione", per usare l'espressione
indicata da Hjelmslev (1943), è, nell'ambito delle variazioni graduali di significato,
estremamente complicata. Ne è convinto ad esempio Hockett (1955, p. 144 sg): il problema
di se e come due eventi linguistici suonino "uguali" o "differenti" pone il parlante nativo in
una situazione di perplessità, perché diverse sfumature di significato, soprattutto le varianti
emotive spogliate di valore discriminativo di senso, possono da lui essere ragionevolmente
giudicate come "aventi suono diverso". Anche se cambiamo la domanda e ci chiediamo se i
due enunciati "significano la stessa cosa o no", può facilmente verificarsi un
fraintendimento, perché il verbo "significare" può ancora racchiudere per l'informante
differenze emotive166.
165
166
Per necessità di completezza si segnala che nel suo modello Pike prevede accanto alle differenze
fonemiche del pitch altri tipi di modificazioni (Pike 1945, p. 76-100). Tali variabili possono essere
raggruppati in tre classi: 1) puramente fonetiche 2)di natura fonemica e graduale 3) sovraimposti.
Per la
seconda classe in particolare, seguendo la strada già segnata da Bloomfield circa la presenza di tratti non
distintivi ma socialmente significanti, Pike introduce una ulteriore distinzione tra fenomeni linguistici in
suoni che rappresentano costrasti fonemici e fenomeni linguistici che invece sono gradazioni socialmente
significanti. Quest’ultime secondo l’autore “affect the meaning of utterance but are not organized into a
rigidly limited number of contrastive units”. Un esempio citato è quello della velocità di eloquio che
secondo Pike appare essere graduale: “Rapid speech tends to use fewer primary contours than does slow
speech. The rate of talking, therefore, affect general contour pattern of a sentence, and may militate
against the use of certain specific contours such as the deliberative one” (Pike 1945, p. 77).
In particulare Hockett scrive: "To the field situation, the informant brings native control of his language,
including the whole system of what "sounds same" and what "sounds different" to him. The investigator
141
Come e quanto queste riflessioni possano avere ripercussioni sul sistema notazionale
dell'intonazione è ben mostrato dallo stesso Bolinger. In un suo famoso articolo dal titolo
Intonation: level versus configuration del 1951, il linguista americano pone sotto la lente di
ingrandimento le scelte operative dei suoi colleghi (Pike, Wells, Trager e Smith) e in
particolare quella di suddividere il valore del pitch in livelli astratti.
A fondare tale suddivisione del pitch phoneme, come abbiamo avuto modo di vedere in
precedenza, vi è la presa di coscienza dell'assoluta relatività del fenomeno intonativo. Ciò
che dà valore linguistico a un determinato profilo melodico è la relazione tra le altezze e
non i suoi valori assoluti. In questo senso i livelli astratti avrebbero l’obiettivo di indicare,
mediante la trascrizione, proprio quelle relazioni significative tra i toni astraendole
dall’insieme dei valori acustici assoluti.
La critica di Bolinger si fonda infatti sull'ambiguità della trascrizione grafica, a cui
ovviamente si collegano problemi riguardanti le modalità teoriche di trattamento
dell'intonazione. Il metodo di trascrizione basato sui 4 livelli di pitch presenta infatti
potenziali luoghi di ambiguità:
Assume, first, that the pitch phonemes are entirely relative. Each pitch phoneme
would be free to range over the whole register of the speaker's voice, with no
brings several things: (1) his understanding of the fundamental assumption, including an understanding of
what it means for items to "sound same" or "sound different" to a native speaker; (2) some training in
general phonetics, by which he will be able to tell, at least in part, what articulatory motions are probably
responsible for any particular bit of speech-sound he elicits from his informant, and in terms of which he
can put down in a written notation something which represents more or less accurately each elicited
speech-event; (3) most important, his ability, as a human being, to be enculturated, to learn a new
language, to empathize. The basic problem in phonologic field work is to bring it about that there reside,
in a single nervous system, both the native or native-like active control of the phonologic system, and the
clear understanding of what is meant by "sounding same" and "sounding different." For, when this has
been accomplished, it becomes possible to tabulate the various articulatory motions which differentiate
utterances that sound different, ignore differences of articulation which do not make any such difference,
and thus achieve a description of the phonologic system. Until the basic problem is solved, this is quite
impossible: the investigator cannot be sure whether two items that sound the same to him actually sound
the same to the informant, and cannot be sure that clear differences to his own ears have any relevance for
the informant" (Hockett 1955, p.145).
142
limitation save /4/ would at a given moment always be higher than /3/, /3/ than /2/,
and /2/ than /1/. Give the four pitches the benefit of the doubt and say that all
intonation morphemes are expressible in terms of this number of variables.
On this assumption we gather that if there is a pitch morpheme that is keyed to four
different pitches, the entire morpheme might be shifted to a higher or a lower set of
frequencies without disturbing the internal relationships of the four pitches;
similarly the tonal range of pitch could be expanded or compressed without
disturbing these relationships. It would follow that no pitch phoneme could be
identified out of some context, and that a given absolute pitch could correspond to
any of the four pitch phonemes (Bolinger 1951, p. 199).
Per il linguista americano le conseguenze sono "imbarazzanti". La relatività assoluta dei
livelli di pitch rende, come abbiamo anticipato, i contorni parzialmente indeterminabili: è
possibile infatti che ad un identico contorno intonativo possa essere potenzialmente
applicata una pluralità di trascrizioni. Gli esempi sono portati da Bolinger stesso:
There would be no way to distinguish 123 from 234, 121 from 232 or 242 or 343 or
141, and a morpheme contesting of but one pitch phoneme might be 1,2,3, or 4.
If pitches were completely relative we could not, to take an example, fall back on a
preceding morpheme such as 1342 to establish a kind of scale by which a 4 might
be judged to be 4-1342 itself might be shifted up a fifth without having its identity
destroyed" (Bolinger 1951, p. 200).
Bolinger sottolinea l’ambiguità dello strumento di trascrizione e con essa la difficoltà che
l’analista incontra nel determinare, e rendere visivamente a livello notazionale, le funzioni
linguistiche. Se si pone ad analisi per esempio una curva ascendente, il sistema notazionale,
costituito dai quattro livelli (1-2-3-4), consente l’uso di diverse forme di trascrizione:
12,23,34 se si interpreta la salita del tono all’interno di livelli adiacenti; 13,24 se invece si
considera l’escursione tale da coinvolgere due livelli non adiacenti; e infine 14. Situazione
ancora più paradossale riguarda poi il singolo suono che, preso isolatamente, e quindi in
mancanza di altri riferimenti, può entrare a far parte di tutti e 4 i livelli.
143
Un altro aspetto che contrasta con l'immediato passaggio concettuale, e con esso teorico e
applicativo, tra la nozione di fonema a livello segmentale e la stessa, trasferita a livello
sovrasegmentale, è quello del rapporto tra la natura arbitraria del primo, e quella
prevalentemente motivata del secondo.
I fonemi sono infatti definibili linguisticamente solo sulla base dei loro rapporti
differenziali, e quindi sulla base della dipendenza dalle relazioni 'interne', senza riferimento
ai valori sostanziali. Con l'intonazione per Bolinger questo sembra non accadere:
Intonation contains a few arbitrary uses, but they are embedded in a matrix of
instinctive reaction; even the arbitrary uses may generally assigned values
consistent with the nervous interpretation (…). The purely arbitrary uses of
intonation are hardly more numerous then the expressive uses of the articulations
of phonemics; they are opposite in the frequency of their respective kind of use
(Bolinger, 1949, p. 249).
Vi è infine, per Bolinger, un ulteriore livello di attrito nell'applicazione del concetto di
fonema al dominio dell'intonazione:
The phonemes comprise numerous variables, each of which depends upon a
different special function of the articulatory organs (Bolinger 1949, p. 249).
Se si pone l'articolazione come base per la determinazione del fonema, vi sarebbe per
l'intonazione una sola variabile: il tono. Inoltre, come già abbiamo ampiamente illustrato, la
distinzione di quest'ultimo non avviene per valori assoluti, ma per 'assolutamente relativi'.
The consequences of this are serious, for they suggest that the proper phonemes of
pitch are to be found not in position, but in direction: not high versus low, but up
versus down. This result in yet another contrast with the ordinary phonemes: it is as
if we were unable to treat of m as an entity, but had to take as our fundamental unit
the shift from m to something else (Bolinger 1949, p. 249).
144
Per Bolinger, quindi, ad accentuare la difformità sull’ipotetica analogia tra il fonema
segmentale e quello intonativo vi sarebbe lo ‘spessore’ delle variabili implicate.
I fonemi segmentali possono essere distinti con relativa facilità per il fatto di essere
composti da elementi complessi: ognuno di essi contiene un insieme di tratti distintivi167, la
cui articolazione garantirebbe la loro differenziazione. Per quanto riguarda il Pitch invece,
il tratto interessato riguarderebbe, come abbiamo anticipato, esclusivamente la variazione
della frequenza fondamentale (F0):
So it is impossible to isolate a pitch as one can isolate a segmental phoneme: an
untrained listener can identify a prolonged english /s/ without benefit of context; no
amount of training will enable him to distinguish one linguistically significant pitch
from another, however much, unless it occurs in context 168 (Bolinger 1958, p. 110).
E ancora:
That pitch functions in the same way as the segmental phonemes - the vowels and
consonants - and that a sequence of different pitches will produce something
potentially meaningful in the same way that a sequence of vowel and consonants
may produce a word. In order to manage this, it is necessary to decide when one
pitch is different from another (Bolinger 1958, p. 109).
Perplessità furono infine espresse anche sullo status morfemico del pattern intonativo. In
un’analisi effettuata sull’intonazione e sulle giunture nella lingua spagnola, Stockwell,
167
168
Jakobson, Halle and Fant (1952) e Jakobson and Halle (1956)
In realtà sulla capacità dei parlanti di riconoscere isolatamente un suono linguistico riconducibile al
singolo segmento sono state espresse forti perplessità. Anche in questo caso a livello percettivo la
comprensibilità sarabbe compromessa dall’impossibilità di avere informazioni derivanti dal contesto
comunicativo e al tempo stesso dal co-testo del messaggio linguistico, luoghi in cui si radica molta
dell’informazione necessaria alla disambiguazione o semplicemente alla corretta interpretazione del
messaggio (cfr. Albano Leoni, 1998).
145
Bowen e Silva-Fuenzalida (1956), citati dallo stesso Bolinger 169, hanno espressero dubbi
sul fatto che sequenze di elementi soprasegmentali potessero essere o meno morfemi:
A sequence of pitches up to and including a terminal juncture will be referred to as
an INTONATION PATTERN. Whether or not such a sequence of suprasegmental
elements is a morph remains to be demonstrated on the morphological level of
analysis (Stockwell, Bowen e Silva-Fuenzalida 1956, p. 661).
1.2
Verso una fonologia dell’intonazione
Il tentativo dello strutturalismo americano di applicare un trattamento fonologico
all’intonazione tracciò così il solco per i successivi studi linguistici. Le tematiche e le
domande che abbiamo incontrato in queste pagine continuarono infatti ad essere affrontate
e sviluppate alla luce di nuovi approcci teorici. È il caso ad esempio del modello
autosegmentale e metrico.
Elaborato inizialmente da Goldsmith (1976) per lo studio delle lingue tonali africane, fu
successivamente applicato anche a livello delle lingue intonazionali. Cruciale sarà quindi il
lavoro di Janet Pierrehumbert del 1980. Seguendo la linea tracciata dalla proto-fonologia di
stampo strutturalista, tale modello si fondò sul tentativo di descrivere i toni su un livello
diverso da quello segmentale. Parallelamente, anche la notazione subì in questi anni
importanti modificazioni. Venne così elaborato un modello descrittivo che negli anni si è
imposto come standard per l’analisi di un numero svariato di lingue. È il caso del metodo di
trascrizione ToBI (Tones and Break Indices) che si basa su un sistema binario di simboli
per la rappresentazione dei toni semplici (alto o H e basso o L) e delle loro eventuali
composizioni bitonali (ad esempio, H+L o L+H).
169
“It is hard to see on what basis the levels and junctures are contrastive units, if sequences or them are not
morphs” (Bolinger 1958, p. 111).
146
2 Il modello di trascrizione ToBI
Come si è mostrato nelle precedenti pagine, e come è emerso analizzando anche i diversi
modelli di trascrizione dell'intonazione, uno dei tratti che caratterizza gli approcci orientati
a descrivere fonologicamente l'intonazione consiste principalmente nella scomposizione
dell'andamento tonale in una sequenza di eventi intonazionali discreti. È proprio in questo
scarto, tra la continuità del dato e la necessità di individuare schemi interpretativi adeguati
alla descrizione linguistica, che si alimentò negli anni 50 il dibattito tra descrizione
dell'intonazione in termini di ‘configurazioni’ o ‘livelli’.
Dalla metà degli anni 70, numerose teorie hanno cercato di spiegare l'intonazione, il ritmo
ed anche le variazioni segmentali dell’enunciato in termini di gerarchie di costituenti
prosodici e di relazioni di prominenza tra tali costituenti (ad es., Selkirk, 1984; Ladd, 1986;
Nespor e Vogel, 1986; Beckman e Pierrehumbert, 1986; Pierrehumbert e Beckman, 1988).
Comune a queste teorie è la concezione di prosodia come componente autonoma della
grammatica.
La teoria linguistica si è posta il compito di definire quali siano le categorie tonali rilevanti
della melodia, come queste si associno alla sequenza dei segmenti che compongono il testo,
quali rapporti di prominenza esistano tra le categorie tonali, e quali siano gli usi
linguisticamente significativi dell’estensione melodica (pitch range), sia a livello di
enunciato sia a livello di discorso. È il caso dell'approccio autosegmentale - metrico.
Come indica la sua denominazione, tale approccio nasce dall'incontro di modelli
autosegmentali e metrici. In particolare l'elemento comune ai modelli autosegmentali
(Goldsmith, 1976a, 1976b, 1990) è la concezione della rappresentazione profonda delle
unità fonologiche. Essa è costituta da un insieme di livelli autonomi a cui sono riconosciute
determinate proprietà. Negli anni 70 infatti, attraverso l’analisi di alcuni tratti
147
soprasegmentali, in particolar modo dei toni, è stato osservato che il dominio di un tratto
può essere sia più piccolo che più grande di un segmento. Queste osservazioni hanno così
condotto alla conclusione che alcuni aspetti dei sistemi fonologici devono essere specificati
in termini di domìni più piccoli del segmento, altri di domìni più grandi. Alcuni tratti
vennero così rappresentati su livelli separati da quello segmentale e non come
caratteristiche distintive delle vocali o consonanti. In questo modo la rappresentazione
fonologica passò quindi ad essere non più lineare ma multilineare: in questo senso alcuni
tratti non sono più considerati caratteristiche intrinseche di un segmento, ma caratteristiche
fonologiche indipendenti dal materiale segmentale, da cui il termine autosegmento, usato
originariamente per i toni e, in lavori successivi, per un numero sempre maggiore di
elementi fonologici. Vi saranno poi dei principi di associazione che determineranno in che
modo gli elementi situati a diversi livelli possano essere messi in corrispondenza.
Entro il quadro autosegmentale-metrico delineato ad esempio in Beckman (1996), i
costituenti della gerarchia prosodica rilevanti per l’intonazione sono sillaba, sintagma
intermedio (ip) e sintagma intonativo (IP).
148
Fig. 53 Schema esemplificativo dell’albero prosodico e metrico
I toni che a livello fonologico sono associati al sintagma intermedio e intonativo, si
allineano170 al confine destro di tali unità: essi sono chiamati rispettivamente phrase accents
(T) e boundary tones (T%). I toni associati invece alle sillabe metricamente "forti" che
formano la testa di un costituente prosodico (parola fonologica, in italiano; piede, in
inglese) assegnano a tali sillabe un ulteriore grado di prominenza: la sillaba con accento
lessicale (stressed) diviene intonativamente accentata (accented). Questi toni sono chiamati
pitch accents (T*).
Questo progressivo cambio di prospettiva influenzerà notevolmente anche l’annotazione. Il
rapporto tra l’oggetto d’analisi e la rappresentazione grafica subirà infatti un ulteriore
processo di astrazione. Se Pike (1945) aveva in qualche modo isolato i caratteri pertinenti
dell’andamento melodico, è in questi anni che vengono alla luce i primi elaborati sistemi di
trascrizione fonologica dell’intonazione. In questo quadro, la descrizione non è più la
170
Con il termine allineamento si indica la sincronizzazione dei toni con i segmenti finali del costituente.
149
trasduzione punto a punto del dato acustico o la descrizione in qualche modo omologica,
seppure astratta, dell’andamento intonativo. Essa diviene un elemento che deve in qualche
modo adattarsi alla dimensione fonologica della lingua. Come verrà mostrato nei prossimi
paragrafi, all’interno delle riflessioni teoriche dell’approccio autosegmentale vedrà la luce
uno dei principali sistemi di annotazione tutt’ora in uso: il sistema ToBI (Tones and Break
Indicies). In riferimento a tale sistema di trascrizione De Dominicis (2010) scrive:
Il sistema ToBI (Tones and Break Indices) non trascrive l’andamento reale del
contorno intonativo (per quanto stilizzato), ma quello che potremmo definire il
sistema di associazioni tra fatti tonali registrati e grandezze fonologiche segmentali
(come i vari tipi di accents o prominenze intonative) e soprasegmentali (come le
sillaba, le unità prosodiche e i loro confini). Si tratta, in sostanza, di un modo di
concepire la fonologia, piuttosto che di un semplice metodo di annotazione
intonativa (De Dominicis 2010, p. 125).
2.1 Alle origini di ToBI
Il termine ToBI è stato utilizzato in due principali accezioni. Originariamente era riferito
alla modello di trascrizione sviluppato tra il ‘91e il ’94 per l’etichettatura prosodica
dell’inglese-americano standard (Beckman and Hirschberg, 1994). In maniera più generica
è stato impiegato per riferirsi allo sviluppo del sistema di trascrizione in altre varietà
dell’inglese (e.g. Mayo et al. 1997 [Glasgow]) e in altre lingue (e.g. Grice et al. 1996;
Venditti 1997).
Prima di passare alla descrizione del sistema di trascrizione ToBI è utile ripercorrerne
brevemente i suoi sviluppi in termini temporali. Questo perché rispetto ai suoi precedenti
presenta diversi elementi di novità. I modelli fin qui descritti hanno subito tutti, in maniera
più o meno pervasiva, l’influenza di un medesimo contesto di applicazione. Sia i britannici
che i principali esponenti dello strutturalismo americano, penso a Pike, avevano come
primario obiettivo quello dell’insegnamento della lingua inglese. Non erano infatti rari dei
150
cambiamenti nella forma della rappresentazione dovuti alle difficoltà di lettura degli allievi
(es. Amstrong e Ward, Pike). Le conseguenze teoriche di quelle scelte spesso erano tenute
in secondo piano o addirittura non considerate.
Vi è poi un secondo elemento di differenza che riguarda il contesto culturale e storico
all’interno del quale queste tipologie di studi sono emerse. Se i primi tentativi di
trascrizione erano il frutto di opere individuali, in alcuni casi elaborate da illuminati
intellettuali fuori dal contesto accademico (es. Harold Palmer), in questi anni la
specializzazione delle conoscenze e l’integrazione dei campi del sapere acquistano una
valenza differente rispetto al passato. In questo senso è difficoltoso giustapporre in maniera
acritica simboli, e tipologie di trascrizione, che si instaurano all’interno di complessi
sistemi di conoscenze e basi teoriche. Il sistema di annotazione ToBI in questo senso è
particolarmente rappresentativo. La sua elaborazione fu infatti il risultato di un serrato
confronto tra studiosi provenienti da ambiti disciplinari differenti e soprattutto con obiettivi
differenti. Lo sviluppo originario del sistema di annotazione avvenne nel corso di quattro
appuntamenti con delegati di Università e discipline differenti. Ai workshop parteciparono
ingegneri interessati al riconoscimento automatico del parlato 171 e a un migliore sistema
text-to-speech, psicologi interessati alla relazione tra elaborazione del linguaggio umano e
prosodia, informatici interessati all'elaborazione di sistemi di generazione del parlato e
modelli di dialogo, fonetisti che volevano testare le loro teorie sull’associazione del tono e
171
Ormai diversi anni fa Dennis Klatt, maestro e pioniere degli studi sulla sintesi del parlato, sostenne che la
prosodia è un fattore fondamentale nel determinare la qualità di un sistema di sintesi, anche dei sistemi più
intelligibili a livello segmentale (Klatt 1987). Tale affermazione rimane valida anche ai nostri giorni. Un
alto grado di intelligibilità a livello di parola, infatti, non garantisce la qualità di un sistema di sintesi da
testo scritto (Silverman, 1993), poiché una prosodia “povera” a livello di enunciato rende difficile da
processare sintatticamente e semanticamente anche il parlato sintetico più intelligibile a livello di parola
(Sproat, Ostendorf e Hunt, 1999).
151
sull’allineamento (Beckman, Hirschberg e Shattuck-Hufnagel, 2004)172.
Gli obiettivi a breve e lungo termine di questo incontro pluridisciplinare possono essere
rintracciati nella volontà di costruire una serie di strumenti omogenei per l’etichettatura, in
grado di rendere possibile la condivisione di corpora di parlato, finalizzati a una vasta
gamma di impieghi nel campo delle tecnologie e delle scienze della voce.Al contempo si è
cercato di costruire un vocabolario comune per ricercatori dislocati in luoghi differenti che
permettesse loro di arricchire e sviluppare da punti di vista differenti il modello originario.
Proprio per questo motivo fu elaborato un sistema di trascrizione relativamente accessibile
all’uso da parte di comunità di ricerca aventi una varietà di interessi e convinzioni teoriche
disparate:
One corollary principle is that the conventions should be easy enough to teach that
their use is not limited to a few experts to do transcription and to themselves train
apprentice labellers (Beckman, Hirschberg, Shattuck-Hufnagel 2004, p. 13).
2.2
Gli antecedenti di ToBI
Possiamo indicare tra gli immediati antecedenti del sistema di annotazione ToBI, tra gli
altri, il lavoro di Pierrehumbert (1980) e Beckman e Pierrhumbert (1986) per la
scomposizione del contorno intonativo in gruppi funzionalmente distinti di target tonali alto
(H) vs basso (L); Price et al. (1991) e Wightman et al. (1992) per il trattamento delle
172
Questa pluralità di approcci e interessi trovò espressione nei luoghi in cui si svolsero gli incontri. Il primo
workshop dedicato alla trascrizione prosodica fu organizzato da Victor Zue, professore di ingegneria
elettronica e scienze informatiche, presso il MIT Laboratory for Computer Science nell’agosto del 1991; il
secondo fu invece organizzato al NYNEX da Kim Silverman nell’aprile del 1992; il terzo venne
organizzato Mary E. Beckman presso il dipartimento di linguistica dell’ Ohio State University. L’ultimo
incontro, nell’agosto del 1994, fu organizzato da Mari Ostendorf al dipartimento di elettronica e
ingegneria della Boston University.
152
giunture e Ladd (1980) per il trattamento dei fenomeni di downstep 173. È bene tuttavia
sottolineare che molti degli aspetti legati al modello possono essere rintracciati nella lunga
storia delle ricerche sulla prosodia e sull’intonazione nel linguaggio, che trovano spazio
anche nel presente lavoro. Un esempio è la relazione tra l’intonazione e la scomposizione
del flusso parlato. È ormai noto che una delle funzioni fondamentali della prosodia è quella
di facilitare la scomposizione (parsing) del flusso parlato in raggruppamenti acusticamente
coerenti, in modo da guidare l’ascoltatore nel decidere quali suoni o insiemi di suoni
vadano integrati in singole unità, passibili di ulteriori analisi linguistiche. Riflessioni in tal
senso sono ad esempio presenti già nei lavori di Sweet (cfr. Cap. 2.3). Anche la nozione di
pitch accent, presente nel lavoro di Pierrehumbert, è sedimentata nella storiografia
linguistica, basti pensare agli importanti lavori di Bolinger (1958).
Our modern understanding of the inventory of SBE intonation pattern traces its
roots to astute observations by teachers of English as a foreign language beginning
in the first decades of the last century (Palmer 1922; Armstrong e Ward 1926) and
studies of large corpora in the 1960s (Halliday 1967; Crystal 1969) and later (e.g.
Gussenhoven 1984) (Beckman, Hirschberg, Shattuck-Hufnagel 2004, p. 16).
Per quanto riguarda il trattamento del tono, ad esempio, è possibile rintracciare una
assonanza tra l’approccio a livelli introdotto nello strutturalismo linguistico americano e
quello autosegmentale-metrico di Pierrehumbert (1980, 2000).
To our mind, a theory framed in terms of target levels is attractive because it
affords good facilities for describing how the same intonation pattern lives up with
different text; the crucial point in the contour, the F0 target, con be lined up with
crucial points in the text, with stretches in between computed accordingly. The
behavior of given contour under changes in pitch range can be modeled in a similar
fashion, by transforming the target points (Pierrehumbert 1980, p. 54).
173
Come segnala Albano Leoni (2009) la prospettiva fonologizzante binaria ha un precedente importante in
Isačenko e Scädlich (1970). I due studiosi, sebbene inseriti in un quadro teorico differente, individuavano
come elementi dell’intonazione di frase tedesca due Tonbrüche, uno ascendente /↑/ e uno discendente /↓
/. Questi toni formerebbero sul piano paradigmatico un’opposizione binaria, nella quale il tono ascendente
sarebbe l’elemento marcato e il tono discendente quello non marcato.
153
Come si è illustrato nei paragrafi introduttivi del presente capitolo (v. p.) la critica di
Bolinger si instaurava su alcuni punti nodali dell’approccio a livelli. In particolare sulla
possibilità di utilizzare per la rappresentazione degli andamenti tonali i fonemi intonativi
(tone target), sotto forma di quattro livelli astratti piuttosto che cambiamenti di pitch
dinamici (dynamic tones). La proposta di Pierrehumbert a cui seguì la successiva
elaborazione del modello originario di ToBI, cercò di risolvere tale diatriba considerando
pertinenti alla descrizione due e non più quattro, o cinque, livelli e al contempo fornendo un
più elaborato modello di relazione tra il target tonale e il pitch range.
2.3
La trascrizione nel sistema di notazione ToBI
Possiamo riassumere a questo punto alcuni dei principi fondamentali che sono alla base alla
base del modello Autosegmentale Metrico originario174.
1. La struttura prosodica di una frase può essere proiettata su livelli separati che
corrispondono nella teoria a tipi strutturali indipendenti.
2. Il contorno intonativo viene scomposto in un sistema binario di livelli di pitch, secondo
la distinzione tra relativamente alto (H) e relativamente basso (L). Questi livelli sono
bersagli, o target, statici. Inoltre la relatività del livello è definita in riferimento al range
di pitch del sintagma intonativo piuttosto che dai valori di pitch adiacenti175.
3. Il range locale di pitch è determinato da una varietà di effetti, come relazioni
174
175
Nel corso dello sviluppo del modello metrico-autosegmentale e del sistema ToBI è possibile infatti
distinguere un paradigma teorico iniziale ed uno più recente (Beckman, Hirshberg, Shattuck-Hufnagel,
2004). In quest’ultimo si assiste infatti a un progressivo incremento di attenzione riservata ai movimenti,
oltre che ai bersagli tonali e contemporaneamente a un decremento di interesse per il riferimento della
struttura dei toni alla gerarchia metrico-prosodica.
In questo aspetto sembra riverberarsi lo sfondo della scuola americana.
154
sintagmatiche di prominenza o la presenza di downstep176 e di upstep177. Tali effetti sono
indipendenti dal livello del tono, così che un tono alto (H) in una parte del contorno
intonativo può essere in un altro punto più basso di un tono L presente nella stessa frase.
4. I toni vengono distinti per la loro funzione. Avremo dunque edge tones e pitch accent. I
primi sono associati ai confini delle unità e sotto-unità prosodiche, mentre i secondi sono
associati alle sillabe prominenti o metricamente forti (Silverman et al., 1992), secondo il
modello di Liberman e Prince (1977). In questo senso il valore assoluto di pitch di un
tono dipende dalla sua funzione così, come dalla sua posizione; per esempio un tono L
che definisce l’inizio di un pitch accent ascendente L+H* può essere più alto di un tono
L% al confine di sintagma intonativo seguente. La funzione di un tono determina anche
la sua associazione relativa alla proiezione autosegmentale di consonanti e vocali; un
pitch accent è in connessione con la sillaba accentata interessata, mentre un tono di
confine maggiore è associato ai costituenti che si trovano al confine del sintagma del
sintagma interessato.
5. I toni di confine (H vs L) sono associati a diversi gradi di giuntura o forza di confine;
quello del sintagme intermedio (ip) e quello del sintagma intonativo (IP).
A questo punto è possibile vedere come anche la rappresentazione notazionale subisca
l’influsso della stratificazione propria della teoria autosegmentale. Hirshberg, Beckman
(1994) e Beckman, Ayers Elam (1997) nelle loro linee guida per la trascrizione mediante il
modello ToBI prevedono quattro livelli (tiers) di pertinenza:
1. Un livello ortografico (orthographic tier) nel quale vengono annotate le parole e i loro
confini.
176
177
Per downstep si intende una compressione di range di pitch nel sintagma che abbassa un successivo target
tonale alto non-iniziale e tutti i toni H che lo seguono nel sintagma.
Per upstep si intende un innalzamento di range di pitch nel sintagma che comincia da un tono di confine
minore alto.
155
2. Un livello tonale (tonal trier) all’interno del quale vengono etichettati i pitch accent, i
phrase accent e i boundary tones.
3. Un livello degli indici di giuntura (break-index trier) che indica il grado di disgiuntura,
compreso tra i valori 0 e 4, presente tra le parole che formano l’enunciato. Maggiore sarà
il valore numerico assegnato al confine, minore è il grado di coesione prosodica tra i due
costituenti178.
4. Livello misto (miscellaneous tier), dove si indicano disfluenze, pause piene, tosse,
respiro e altri tipi di fatti paralinguistici.
2.4
I principi guida per la selezione dell’informazione
Si è in più occasioni specificato come la trascrizione, e più in generale i processi di
notazione, abbiano come tratto comune la selezione delle pertinenze entro le quali viene a
configurarsi ‘l’immagine scientifica’ dell’oggetto.
Anche la trascrizione ToBI non cerca di trascrivere tutti gli aspetti della prosodia o anche
tutti gli aspetti che sono suscettibili di trascrizione simbolica. Nel decidere cosa includere e
cosa lasciare fuori possono essere rintracciati tre principi:
First, we wanted to be able to distinguish in our transcription all of the
categorically distinct intonation patterns and prosodic units of the language (or
rather of the three intonationally similar dialects that we claim to cover). Second,
we felt we should not transcribe aspects of prosody which are more amenable to
quantitative measures than to the categorical divisions of a symbolic transcription.
Finally, we did not want to squander the user’s energies in transcribing even
categorical aspects of prosody which are predictable from other parts of the
178
Le etichette disponibili sono le seguenti: ‘0’ quando non viene percepito il ‘distacco’ tra due parole; ‘1’ se
la distanza tra due parole è percepita come normale; ‘2’ se si percepisce separazione, ma questa non è
attribuibile con certezza alla presenza di un confine intonativo; ‘3’ se la separazione percepita è dovuta
alla presenza di un confine intonativo di tipo intermedio (di questi casi, sul livello tonale si trova un
phrase accent); ‘4’ se la separazione percepita è motivata dalla presenza di un confine intonativo
gerarchicamente superiore (sul livello tonale si trova un boundary tone).
156
transcription or from auxiliary tools such as dictionaries” (Beckman e Ayers Elam
1997, p. 9).
Gli aspetti della prosodia che invece si cerca di catturare nella loro completezza sono di due
tipi. Il primo è la struttura prosodica (il ritmo di parole più o meno accentate che si
alternano l’una con l’altra, e il raggruppamento di parole in costituenti prosodici di varia
grandezza); il secondo riguarda i pattern intonativi (la sequenza di eventi tonali contrastivi
che prendono il nome di pitch accent, phrase accent, e boundary tones). Un esempio di
aspetti della prosodia che vengono tenuti al di fuori dalla trascrizione è il tempo locale di
ciascuna parola nell’enunciato, che può essere registrato in maniera molto più accurata da
misurazioni quantitative rispetto a una divisione arbitraria in categorie astratte, collegate a
un valore generico di velocità (Campbell 1992). Un aspetto categoriale della prosodia che
non viene introdotta nella trascrizione è invece la marcatura delle sillabe accentate e atone
all’interno di ogni parola. Questo tipo di informazione, in virtù del terzo principio prima
introdotto, è infatti abbastanza prevedibile e non necessita quindi di specificazione
notazionale. Un’eccezione è invece quella di segnalare all’interno di ciascuna frase i punti
più alti della frequenza fondamentale [HiF0], solitamente utilizzati per calcolare il valore
del pitch range al fine di facilitare le ricerche sul rapporto tra quest’ultimo e la struttura del
discorso (es. Grosz e Hirschberg 1992; Avesani e Vayra 1992).
Se da un lato l’accento interno delle parole può essere il più delle volte predetto, vi sono al
contempo altri aspetti dell’accento che non possono essere previsti con la stessa
sicurezza179. Nel processo di etichettatura e analisi in ToBI un grande aiuto è fornito dalla
registrazione del contorno relativo alla frequenza fondamentale. Come ricordano Beckman
e Ayers Elam:
179
“The distribution of sentence accents is not determined by syntactic structure but by semantic and
emotional highlighting. Syntax is relevant indirectly in that some structures are more likely to be
highlighted than others. But a description along these lines can only be in statistical terms. Accents should
not be mashed down to the level of stresses, which are lexical abstractions” (Bolinger 1973, p. 644).
157
The transcription of events on the tone tier is closely linked to this record. In the
case of pitch accents, the labeller can make this link explicit by choosing to place
the label for the pitch accent specifically at the F0 maximum or minimum that
realizes the starred tone of the accent, if this F0 event is within the interval of the
accented syllable nucleus. [...] There is a more practical connection, as well,
inasmuch as most transcribers find the fundamental frequency contour an
invaluable aid in making the analysis of the intonation pattern that is embodied by
the transcription on the tone tier (Beckman e Ayers Elam 1997, p. 13).
Ma quale informazione relativa alla frequenza fondamentale può essere considerata
pertinente alla trascrizione? Anche in questo caso il processo di trascrizione deve ‘allargare
le maglie‘ per l’individuazione delle variazioni pertinenti alla segnalazione del tono.
Nell’interpretazione della F0 per la trascrizione tonale è importante infatti tenere a mente
che molti aspetti dell’enunciato possono influenzare, anche di molto, l’andamento della
frequenza fondamentale. Un esempio è costituito dall’effetto delle consonanti sorde [es. p,
t, s] nella rilevazione del contorno. Queste ultime infatti, ostacolando il flusso d’aria
necessario alla vibrazione delle corde vocali, rallentano la vibrazione stessa, e quindi
abbassano il valore del pitch o addirittura lo arrestano rendendone impossibile la sua
rilevazione (Gussenhoven 2004).
Altre perturbazioni del contorno intonativo possono verificarsi a causa delle varie qualità
della voce o della modalità di fonazione dei parlanti:
For most speakers, subglottal pressure falls very sharply at the very end of an
utterance. If the cross-glottal pressure difference becomes very weak, there may no
longer be good glottal closings — i.e. the phonation may become quite breathy —
so that even fairly robust pitch-tracking algorithms can easily fail. For some
speakers this switch to breathy voice might happen even earlier if the utterance has
a long low-pitched stretch corresponding to a L- phrase accent. Or, a speaker might
break into creaky voice in such a region. In fact, many speakers break into creaky
voice in almost any region with very low fundamental frequency. Since creaky
voice is typically characterized by very irregular glottal periods (i.e., the
fundamental frequency is physically not well- defined), pitch-tracking algorithms
158
often do not do well during these portions of the utterance, creating a messy
‘spattering’ of values (Beckman e Ayers Elam 1997, p. 14).
Per quanto riguarda invece più da vicino la pratica di trascrizione di un enunciato mediante
il sistema ToBI, essa è composta almeno da sei parti. Di queste, due riguardano la
registrazione fonetica e quattro sono invece composte da una successione di simboli. Qui la
tabella riassuntiva presente in Beckman, Hirschberg, e Shattuck-Hufnagel (2004):
Tabella 3 Gli aspetti pertinenti della trascrizione ToBI Beckman, Hirschberg, e Shattuck-Hufnagel (2004)
La primaria registrazione fonetica avviene sulla base della registrazione audio
dell’enunciato: il flusso sonoro è quindi catturato e trasdotto digitalmente in una forma
d’onda. La seconda informazione fonetica è quella riguardante invece la rappresentazione
della frequenza fondamentale. Esistono software in grado di estrarre in maniera immediata
dal segnale audio la forma d’onda e la frequenza fondamentale. Di seguito è possibile
vedere come sono rappresentate due delle sei parti che compongono l’annotazione in ToBI:
159
Fig. 54 Rappresentazione ella forma d'onda e della F0 in Praat180
La schermata, tratta dal software Praat, mostra nella parte superiore la forma d’onda
dell’enunciato e in basso l’andamento della F0. Già ad una prima osservazione superficiale
sono individuabili alcune caratteristiche importanti che possono entrare a far parte
dell’analisi. La forma d’onda ad esempio, tramite l’ampiezza delle curve, consente di
collocare visivamente l’intensità delle varie parti dell’enunciato 181 . In questo senso è
possibile, anche in maniera impressionistica, avere una prima idea delle salienze, dei luoghi
di interesse dell’enunciato (ad es. vari tipi di accento, o informazioni derivanti dalla
struttura informativa). Stesso discorso vale per la F0: picchi e avvallamenti consentono di
puntare l’attenzione sui luoghi di prominenze ed eventuali luoghi di confine tra costituenti
prosodici.
180
La frase proposta è la seguente ‘Luisa fingeva di guardare da un’altra parte‘ ed è stata tratta dal corpus
CLIPS (cod. LFp1B04r_#11).
181
Sempre in Praat sono presenti strumenti che consentono di estrapolare anche una curva relativa
all’informazione dell’intensità.
160
2.5
Rappresentazione del livello tonale
Il livello tonale è la parte di trascrizione che corrisponde più da vicino all’analisi
fonologica. Come abbiamo più volte accennato, i toni sono espressi con simboli (H, L),
marcati con dei diacritici che ne indicano le funzioni intonative. Il tono alto H è realizzato
come un picco o un massimo locale di frequenza fondamentale, il tono basso L è realizzato
come un minimo locale di frequenza fondamentale. La loro differenza è paradigmatica: in
una stessa posizione strutturale H sarà sempre più alto di L. Vengono marcati due tipi di
toni, quelli associati a sillabe accentate (pitch accents) e quelli associati a confini intonativi
(phrasal tones: phrase accents, boundary tones), che delimitano costituenti prosodici di
due livelli: intermediate phrase (sintagma intermedio) e intonational phrase (sintagma
intonativo). Più in dettaglio avremo:
Pitch Accent: accento intonativo. Il diacritico usato è “*” e indica l’associazione del tono
alla sillaba accentata.
Phrase Accent: letteralmente accento (tono) di sintagma, identifica un sintagma intermedio
(composto da almeno un accento intonativo e uno di sintagma). Il diacritico usato è “-” e ha
funzione delimitativa (L-, H-)
Boundary Tone: tono di confine, identifica un sintagma intonativo (composto da uno o più
sintagmi intermedi). Il diacritico usato è “%” e ha funzione delimitativa (L%, H%)
I toni di confine che si possono annotare con ToBI sono quindi i seguenti:
L-L% discendente semplice (senso di conclusione)
H-H% alto ascendente
161
L-H% basso ascendente (senso di continuazione)
H-L% medio
%H inizio di contorno molto alto: in genere nelle esclamative
Per quanto concerne l’accento, ToBI ne marca di due tipi:
1. a) Accenti monotonali:
H* si manifesta come un picco raggiunto dalla curva F0.
L* target tonale realizzato nella parte più bassa dell’estensione melodica del parlatore,
spesso senza variazioni considerevoli di F0.
1. b) Accenti bitonali:
Negli accenti bitonali un tono è associato alla sillaba tonica – e l’associazione esplicitata
dalla notazione con l’asterisco - mentre l’altro tono che può precedere o seguire, non è
associato ad alcuna sillaba, ma realizzato “con riferimento al tono asteriscato”. Questo ha
come conseguenza che la realizzazione fonetica di un tono asteriscato vedrà il target alto o
basso del tono centrato stabilmente entro la sillaba tonica, mentre il target del tono non
asteriscato sarà più variabile e potrà allinearsi a segmenti diversi della sillaba pretonica o
postonica in dipendenza del contesto segmentale o della velocità di elocuzione.
H+L* movimento discendente su sillabe contigue
L+H* movimento ascendente su sillabe contigue
(H+L)* movimento discendente nella stessa sillaba
162
(L+H)* movimento ascendente nella stessa sillaba
H* !H down-step: sequenza scalare di toni alti con andamento “a gradino”.
Di seguito invece un esempio di trascrizione proposto da Beckman; Hirschberg, Julia Bell;
Shattuck-Hufnagel (2004):
Fig. 55 Forma d’onda, contorno F0 ed etichettatura ToBI. Fonte Beckman et al. (2004)
Nell’esempio sono ben visibili tutti i livelli di pertinenza dell’annotazione introdotti fin qui.
In particolare, nella finestra in alto è visibile la forma d’onda ricavata automaticamente
dall’input del segnale audio e nella finestra in basso l’elaborazione della F0. Tuttavia è
nella finestra disposta nella parte centrale dell’immagine che si colloca il cuore
163
dell’etichettatura, in cui sono presenti le trascrizione del livello tonale e la marcatura degli
indici di (dis)giuntura. Sempre nella sezione centrale sono presenti le indicazioni di
importanti eventi fonetici. Ad esempio l’etichetta [HiF0] che come abbiamo visto in
precedenza viene utilizzata di solito per calcolare il valore del pitch range a partire dal
livello massimo. Non è un caso quindi che al punto di massima escursione sia associato un
accento monotonale alto, o peak accent, [H*]. Quest’ultimo, che rappresenta il bersaglio
tonale alto, è associato alla sillaba prominente. Inoltre la salienza è ben visibile anche dal
punto di vista dell’intensità: in corrispondenza dell’accento vi è infatti anche un incremento
dell’ampiezza dell’onda. Tra gli elementi annotati è riscontrabile il fenomeno di downstep
in corrispondenza del tono [!H*], quest’ultimo fornisce il riferimento per indicare l’inizio
di una compressione del range. Sono segnalati inoltre i toni di confine: il primo [L-L%] è
presente in una pausa di ‘riflessione’ in corrispondenza della stringa uh... Mentre il secondo
tono di chiusura, che conclude l’ascesa dovuta alla modalità interrogativa dell’enunciato, è
medio e quindi marcato dal tono [H-L%].
Vi è infine il livello dei Break Indices. Questi ultimi, come si è visto, hanno la funzione di
segnalare i luoghi di rottura più o meno marcata tra porzioni di enunciato. Maggiore è il
valore (da 0 a 4) maggiore sarà la separazione tra i due elementi. Nell’esempio qui proposto
sono presenti 3 Break Indices di valore massimo: il primo subito dopo l’esitazione iniziale
Uh..., il secondo in corrispondenza della seguente esitazione Uh... e l’ultimo nella parte
finale dell’enunciato Cab?. Proprio in corrispondenza di questi sono collocati i toni di
confine precedentemente descritti.
Problemi di trascrizione
Anche il modello di trascrizione fonologica di ToBI presenta aspetti che sono stati più volte
ritenuti problematici. Allo stesso modo dei primi modelli a livelli, infatti, la trascrizione
ToBI presenta zone di ambiguità dovute all’eccessiva genericità dell’opposizione binaria
164
dei target tonali alto (H) vs basso (L). Il problema era stato affrontato in maniera simile da
Bolinger in riferimento vaghezza della trascrizione. Ambiguità che consisteva nella
trascrizione di fenomeni differenti sotto la stessa etichettatura o al contrario di fenomeni
uguali con etichettature differenti. Il linguista francese Philippe Martin (2009) ha
esemplificato uno dei possibili errori di trascrizione che si verificherebbe mediante l’uso di
ToBI:
La transcription d’une variation mélodique montant rapidement ou lentement, ou
montant faiblement ou fortement, ou encore de variation concave ou convexe sera
toujours la même (Martin 2009 p. 77).
L’esempio grafico è il seguente:
Fig. 56 Diverse variazioni del contorno melodico ascendente trascritte con la notazione ToBI (Martin 2009)
Martin spiega come il risultato di questa ambiguità notazionale sia dovuto alla mancanza di
un parametro temporale, che conduce la trascrizione a sintetizzare il movimento con
l’etichetta LH*. In questo senso avremo per tutti i diversi movimenti del tono lo stesso tipo
di trascrizione:
Le paramètre temporal ayant disparu, chacun de ces mouvements de F0 sera a
priori transcrit par la même séquence LH*: a) plus court que b) sera noté LH*,
ainsi que c) moins ample que a) LH. De même a) linéaire, d) concave et e) convexe
seront tous trois transcrits LH*, avec une variante possible L+H* pour d) (Martin
2009, p. 78).
165
Sulla stessa linea si colloca ad esempio Marotta (2002-3) che segnala la povertà descrittiva
del modello, dovuta al ridotto numero di etichette:
“Nella T(eoria) A(autosegmentale) dell’I(ntonazione) le categorie ammesse sono
[…] due P(itch) A(ccent) semplici (A* e B*) e quattro PA complessi (B*+A,
B+A*, A*+B, A+B*) per un totale massimo di sei PA, che dovrebbero essere in
grado di esprimere la competenza fonologica relativa al dominio intonativo per i
parlanti di una qualsiasi lingua naturale” (Marotta 2002-3, pp. 241-242).
Albano Leoni (2009) considera questo tipo di rappresentazioni fonologiche binarie
insufficienti rispetto al potenziale semantico della prosodia 182.
Altri tipi di problematiche sono riconducibili infine al carattere fonologico del modello,
nato e pensato in una specifica lingua e spesso difficilmente applicabile ad altri sistemi.
3 Il modello IPO. Dalla parte dell’ascoltatore
La sigla IPO è riferita alla teoria dell’intonazione sviluppatasi presso l’istituto per la ricerca
sulla percezione (l’Instituut voor Perceptie Onderzoek) di Eindhoven. Tale teoria trova nel
lavoro di ‘t Hart, Collier, Cohen del 1990 il punto di riferimento più importante.
L’equipe olandese si concentra esclusivamente su una delle dimensioni della prosodia e
precisamente nell’intonazione, definita:
The esemble of pitch variations in speech caused by the varying periodicy in the
vibration of the vocal cord (‘t Hart, Collier, Cohen, 1990, p. 2).
182
“[…] Se si mettono in relazione la complessità e la potenza semiotica della prosodia, […] con la povertà
analitica dei modelli oggi più ricorrenti, si vede come almeno nell’opinione di chi scrive, una
rappresentazione fonologica della prosodia basata sulle combinazioni di pochi tratti sia non solo poco
efficace ma addirittura infondata e l’abbandono di un apparato teorico e descrittivo sottile e penetrante
come quello qui descritto [modello analitico della tradizione britannica ndr.] , appare un regresso (Albano
Leoni 2009, p. 62).
166
Tra i principi postulati dal loro metodo di analisi vi è il tentativo di coniugare l’aspetto
fonetico a quello più strettamente linguistico. Il carattere di novità rispetto alla teoria
Autosegmentale Metrica riguarda principalmente l’attenzione riservata al ruolo
dell’ascoltatore. Come abbiamo visto nei precedenti paragrafi, il punto di vista teorico sui
fatti intonativi era concentrato soprattutto sulla elaborazione di un sistema metalinguistico
in grado di spiegare il carattere fonologico dell’intonazione attraverso la ricerca dei suoi
elementi costanti. Punto di vista che è ritenuto ancora insufficiente:
Early attempt to apply the distinctivity criterion to speech melody have not
successful. The semantic distinction was commonly limited to the dichotomy of
‘statement’ vs ‘question’, which led to typology of ‘falling’ vs ‘rising’ intonation
pattern” (‘t Hart, Collier, Cohen, 1990, p. 3).
Al contrario, in questa nuova prospettiva, acquista maggiore peso il ruolo occupato dai
parlanti e in particolare dall’ascoltatore nel processo di decodifica del dato acustico. Il
modello percettivo (‘model of the listener’) opera così una sorta di filtro in grado di
selezionare dal segnale acustico solo le informazioni pertinenti ai fini della comunicazione.
Such a model should eventually answer the many question subsumed under more
general one: what does the listener make of pitch in speech? (‘t Hart, Collier,
Cohen, 1990, p. 3).
La risposta a tale domanda dovrebbe così fare luce sulle distinzioni operate dall’ascoltatore
a livello di unità melodiche, sul modo in cui egli struttura tali unità nella percezione
complessiva del contorno intonativo, su come vengono collegati i percetti alle entità
melodiche più astratte, fino all’integrazione di queste informazioni con quelle testuali del
messaggio linguistico. Al tempo stesso gli autori sono convinti che le impressioni uditive
vadano indagate sistematicamente in relazione alle proprietà del segnale acustico e in
particolare a quelle che risultano dall’azione fisiologica volontaria. La metodologia
sviluppata dai ricercatori si basa così su serie di stadi la cui progressiva applicazione
permette il raggiungimento di un grado di astrazione maggiore.
167
L’approccio IPO prende in considerazione solo i movimenti del pitch che sono
percettivamente rilevanti, e in particolare quelle variazioni di F0 che sono state prodotte
intenzionalmente
dal
parlante.
Il
primo
passo
dell’analisi
consisterà
dunque
nell’elaborazione di una versione stilizzata del contorno intonativo, attraverso
l’eliminazione dalla curva di F0 di tutti i movimenti tonali privi di rilevanza percettiva. Il
risultato di questa stilizzazione dovrà fornire una copia fedele (close-copy) contenente il
minor numero di dettagli irrilevanti ed essere percettivamente indistinguibile dall’originale.
Since a close-copy stylization is, by definition, auditory indistinguishable from the
resyntetized original, it contains all the perceptually relevant pitch movements; and
since it is made with the smallest possible number of straighline segments, it
contains only the perceptually relevant pitch movements, whereas irrelevant detail
has been removed (‘t Hart, Collier, Cohen, 1990, p. 43).
Fig. 57 Rappresentazione della F0 in una copia percettivamente equivalente ('t Hart, Collier, Cohen 1990)
Il risultato, come è possibile vedere dalla figura, sarà una linea continua comparabile con
una rappresentazione di tipo configurazionale. A garantire inoltre la correttezza
dell’operazione di sintesi saranno test percettivi.
Il primo stadio dell’analisi effettuata mediante il modello IPO suscita da subito una serie di
168
importanti riflessioni. Ciò che la rappresentazione grafica tenta di mostrare è la pertinenza
percettiva di determinati elementi del segnale fonico. La validazione del percetto, operata
dall’ascoltatore rispetto alla manipolazione del segnale, realizzata mediante il primo
processo di sintesi, consente dunque di mettere in evidenza i movimenti del contorno
intonativo utili ai parlanti nel processo di comunicazione. Di conseguenza dalla
rappresentazione saranno amputate tutte quelle fluttuazioni involontarie della F0
considerate ininfluenti, e coincididenti con le microintonazioni solitamente dipendenti da
due principali fattori (Reinholt Petersen, 1986): il valore di pitch intrinseco delle vocali
(Ladd, D.R. e K.E.A. Silverman 1984) e le perturbazioni dovute a fenomeni di
coarticolazione. L’ipotesi avanzata dagli autori è che tali microvariazioni della frequenza
fondamentale, dovute soprattutto ad aspetti fisiologici involtari, siano percettivamente
meno rilevanti in riferimento alla melodia del parlato.
La seconda operazione del processo di analisi consisterà in quella che viene detta
standardizzazione. Essa consiste nella sostituzione dei movimenti stilizzati della frequenza
fondamentale con altrettanti movimenti standardizzati, in base al calcolo delle soglie di
tolleranza linguistica:
If, for example, three rising movements in a close copy have slopes of 30, 40 and
90 ST/s respectively, we can already be sure that, on the basis of - smaller perceptual tolerance, those of 30 and 40 ST/s will not be distinguished from each
other. Taking linguistic tolerance into account might even provide the possibility
that the three different slopes can be replaced by one of 55 or 60 ST/s for all three
movements without the loss of perceptual equivalence (‘t Hart, Collier, Cohen,
1990, p. 43).
Nel passaggio tra stilizzazione e standardizzazione verranno dunque rimosse tutte le
perturbazioni micro e macroprosodiche. Inoltre, al fine di ottenere dei risultati
standardizzati, gli autori segnalano due condizioni da seguire. In primo luogo la
generalizzazione non dovrebbe influenzare eventuali differenze categoriali tra i diversi
movimenti del pitch. A tal proposito si prosegue mediante una seconda validazione
169
percettiva che possa verificare l’equivalenza delle standardizzazioni rispetto alle precedenti
stilizzazioni. In secondo luogo le standardizzazioni dovrebbero ‘suonare’ in maniera
accettabile, ed essere quindi rappresentazioni eque delle intonazioni linguistiche.
Fig. 58 close copy (linea tratteggiata) e standardizzazione (linea continua) della F0
L’immagine presenta la misurazione della F0 per la frase Alan’s in Cambridge, studying
botany. Le sillabe prominenti sono segnalate tramite la sottolineatura del testo; la curva
originale è segnalata mediante i puntini; la close-copy mediante una linea tratteggiata; la
curva standardizzata tramite una linea continua. Benché tutte le rappresentazioni del
contorno presentino specificità di forme e grandezze, è possibile notare come vi siano delle
corrispondenze nella configurazione complessiva: le stilizzazioni consistono infatti di una
F0 di livello medio (M) prima della prominenza alta (H) che si trova in corrispondenza
della sillaba accentata (Cam) seguita da una discesa della curva sino al livello basso (L).
Tra i due movimenti, la curva passa dal livello basso (L) a quello medio (M), in modo tale
che le sillabe situate prima della seconda sillaba prominente si situano a livello medio (M).
Dopo aver verificato sperimentalmente, mediante test percettivi, l’adeguatezza della
standardizzazione, si passa alla scomposizione della curva in una stringa di movimenti di
170
F0 (pitch movement). In questo processo di astrazione saranno dunque identificati gli
intonation patterns, categorie astratte per mezzo delle quali si giunge alla definizione del
lessico intonazionale della lingua. Tali pattern intonativi saranno costituiti dalla
combinazione di movimenti. Il pitch movement rappresenta l’unità minima di curva di F0;
il suo movimento è specificato per mezzo di alcune dimensioni percettive suddivise in
categorie e identificate durante il processo di standardizzazione. I tratti che
contraddistinguono ciascuna categoria sono: la direzione (ascendente o discendente),
l’allineamento del movimento rispetto alle sillabe (anticipato, ritardato, molto ritardato), la
velocità di variazione (veloce e lenta) e infine l’ampiezza della variazione (completa o
parziale).
Fig. 59 fonte 't Hart, Collier, Cohen (1990)
Queste stringhe di movimenti standardizzati della F0 stabiliscono tra loro relazioni sia
paradigmatiche che sintagmatiche. La corretta definizione dei movimenti tonali è una fase
fondamentale della teoria, in quanto la loro concatenazione permetterà di determinare unità
di rango superiore come la configurazione tonale o il pitch contour.
Per costituire tali relazioni i ricercatori olandesi hanno cercato di capire se in tali
171
combinazioni di movimenti vi fossero delle restrizioni e se, in caso affermativo, vi fossero
delle regole. Da ciò, mediante una procedura di prove ed errori, si può giungere ad una
grammatica provvisoria intonativa, relativa a una data lingua:
We adopted a strategy in which we postulated which combinations would be
permitted and which not, and subsequently predicted that the former would, but the
latter would not, be found in a new, independent corpus of considerable length. The
postulates were based on experiences with previous material, but extended with
expectations about the possibility of certain new combinations being permitted or
not. This strategy led to what might be called a 'tentative grammar', an algorithm
intended to generate all permitted strings of movements, and none but these” (‘t
Hart, Collier, Cohen 1990, p. 57).
In uno schema di sintesi ‘t Hart, Collier, Cohen illustrano tutte le varie fasi della procedura
IPO:
172
Fig. 60 Diagramma della procedura IPO
Partendo da un certo numero di frasi (speech utterances) e seguendo il diagramma in senso
antiorario, avremo come primo passo la misurazione della frequenza fondamentale (F0
mesurement) e l’ottenimento delle curve F0 (F0 curve) che tuttavia contengono ancora
molte variazioni involontarie. Tramite il criterio della uguaglianza percettiva (perceptual
equality) si costruiscono copie fedeli (close copy) che contengono soltanto i movimenti di
F0 percettivamente rilevanti. Utilizzando il criterio dell’equivalenza percettiva (perceptual
equivalence) le copie sono trasformate in stilizzazioni standardizzate (standardized
stylization). Se la loro accettabilità viene confermata (acceptability test), i movimenti
percettivamente rilevanti standardizzati possono essere inclusi nell’inventario dei
movimenti di pitch (pitch movements). La loro combinatoria e le regole che la governano è
173
oggetto dello studio di una grammatica le cui regole sono soggette a continua conferma
(tentative rules).
Dall’analisi di questo modello emerge una linea interpretativa che punta alla convergenza
di aspetti teorici per molto tempo considerati contrastanti. L’obiettivo teorico consiste
dunque nella ricerca di integrazione tra livello ‘atomistico’ e ‘globale’. Seguendo lo
schema proposto da ‘t Hart e Collier (1975) avremo:
Global
Abstract
Concrete
Atomistic
Intonational pattern
F0 curve
Pitch movement
Pitch contour
Tabella 4 - sintesi dei caratteri globali e atomistici adattato da 't Hart e Collier (1975)
I pitch movements costituiscono le sole unità atomistiche del sistema, la loro natura è
concreta, in quanto unità dalla valenza percettiva. La curva F0 e i pitch contours non sono
altro che la manifestazione delle corrispondenti categorie astratte, ovvero gli intonation
patterns. Essi saranno inoltre globali poiché il loro dominio di applicazione è l’enunciato.
Il modello dell’equipe olandese mediante l’attenzione all’aspetto complessivo e percettivo
dell’intonazione, insieme al riconoscimento dell’importanza riservata ai movimenti tonali,
piuttosto che ai target, si avvicina all’approccio configurazionale della scuola britannica.
L’analisi IPO è quindi lontana dalla scomposizione in livelli intonativi (pitch levels) tipica
della scuola strutturalista americana e successivamente del metodo metrico-autosegmentale
(Ladd 1983, Pierrehumbert 1980). Il rifiuto dei livelli si basa sul fatto che le variazioni di
F0 richiedono una certa quantità di tempo per realizzarsi; l’impressione percettiva è quindi
quella di un movimento tonale risultante dall’inevitabile transizione fisiologica che si
174
produce tra i livelli coinvolti dalla variazione. Se i livelli fossero le unità minime
dell’intonazione, le transizioni prodotte dal passaggio da un livello a un altro (i pitch
movements) avrebbero delle proprietà melodiche invariabili. Problema che, come
accennato, emerge con forza dalle critiche rivolte al modello ToBI.
4
Il sistema di annotazione InTSInt
Il sistema di annotazione InTSInt (International Trascription System fot INTonation) è stato
elaborato per codificare le variazioni rilevanti della F0 ed è basato su un approccio
esclusivamente fonetico. A differenza di ToBI, quindi, in cui l’etichettatura è strettamente
connessa alla struttura fonologica linguo-specifica, con InTSInt l’analisi può essere
effettuata più agevolmente su diverse lingue. Le ricerche che hanno dato origine a tale
metodo di annotazione erano infatti finalizzate all’elaborazione di un sistema che fosse in
grado di comparare, su una base il più possibile omogenea, gli andamenti prosodici di varie
lingue. Da questo punto di vista quindi tale sistema si pone obiettivi che possono essere
comparati con quelli di IPO e che al tempo stesso divergono da quelli di ToBI. Come si è
visto in precedenza nel corso dei primi anni ’90 venne proposto un nuovo sistema di
trascrizione dell’inglese americano (Silverman et. al. 1992) basato sulle ricerche di
Pierrehumbert (1980), Pierrehumbert e Beckman (1988). Il grande interesse suscitato dalla
comunità scientifica si trasformò nel tentativo di adattare questo nuovo sistema alle altre
lingue, sebbene gli stessi autori avessero mostrato perplessità sulla immediata applicazione
del modello alla descrizione di dialetti o lingue straniere.
Uno dei motivi ispiratori del progetto InTSInt fu proprio la possibilità di trasferire in
maniera pressoché inalterata gli strumenti di descrizione in lingue differenti:
One specific original motivation for INTSINT was an attempt to develop a system
which could be used for transcribing both English and French (Hirst e Di Cristo
1998, p. 14).
175
e ancora:
The hypothesis behind the distinction between physical and phonetic levels of
representation is that all languages obey the same physical constraints in the
production and perception of variations in fundamental frequency, intensity and
duration. A phonetic representation, then, is one where such universal constraints
have been factored out (Hirst et al 2000, p. 54).
InTSInt costituisce, dunque, per il livello soprasegmentale il sistema di rappresentazione
speculare all’IPA (International Phonetic Alphabet) (Hirst 2005a).
Come ricorda Rosa Giordano (2005) i simboli e il sistema stesso sono entrati a far parte
degli apparati di trascrizione nel progetto SAM (Speech Assesment Method ) che ha definito
lo standard per la transcodifica dei sistemi di annotazione linguistica in caratteri leggibili
con sistemi operativi per computer.
L’annotazione si sviluppa in due fasi principali. Nella prima il contorno della frequenza
fondamentale viene tradotto in una sequenza di bersagli tonali (target points); nella seconda
invece viene effettuata l’etichettatura di ogni punto rilevante fisicamente.
La prima stilizzazione della curva avviene dunque mediante l’elaborazione di una serie di
target piuttosto che di movimenti di pitch primitivi, come avveniva invece per IPO. Questi
target saranno collegati a quelli adiacenti mediante un appropriata funzione di transizione.
L’algoritmo utilizzato per l’estrazione della curva è MOMEL (MOdelling MELody) (Hirst,
Espesser, 1993; Hirst, Di Cristo, Espesser, 2000). Quest’ultimo sostituisce in maniera
automatica il tracciato intonativo originario con un’approssimazione matematica
percettivamente identica a quella di partenza.
In questo aspetto l’obiettivo è lo stesso ricercato dall’approccio IPO: la rimozione di
eventuali errori di calcolo presenti nel tracciato e contestualmente, la rimozione di punti
linguisticamente irrilevanti:
176
The analysis of raw fundamental frequency curves for the study of intonation needs
to take into account the fact that speakers are simultaneously producing an
intonation pattern and a sequence of syllables made up of segmental phones. The
actual raw fundamental frequency curves that can be analysed acoustically are the
result of an interaction between these two components and this makes it difficult to
compare intonation patterns when they are produced with different segmental
material (Daniel Hirst 2005, p. 34).
L’eliminazione delle componenti macroprosodiche e microprosodiche mediante l’algoritmo
MOMEL viene ulteriormente ottimizzata mediante una particolare funzione (quadratic
spline function) che permette la produzione di una curva stilizzata percettivamente
equivalente all’originale. Di seguito la differenza tra una codifica della F0, realizzata
tramite una interpolazione quadratica, e una codificazione mediante linee rette:
Fig. 61 Fonte Hirs e Espesser (1993)
177
4.1 La rappresentazione dei toni nel sistema InTSInt
Una volta terminato il processo di stilizzazione della curva è prevista la fase di annotazione
prosodica, che viene realizzata mediante l’utilizzo di un insieme di etichette. Tali simboli
saranno impiegati per indicare i punti salienti della F0. Il contorno intonativo sarà quindi
suddiviso in unità tonali individuate mediante una serie di caratteristiche fonetiche 183, che
saranno indicate etichettanto i confini per mezzo di parentesi quadre ([ per l’inizio
dell’unità tonale e ] per la fine). All’interno di ciascuna unità i punti di variazione verranno
considerati sia in modo globale (toni assoluti) sia in modo locale (toni relativi). Nel primo
caso il riferimento sarà quello del range frequenziale del parlante, mentre nel secondo caso
i valori saranno determinati in maniera relazionale sulla base dei bersagli precedenti e
successivi. Avremo così:
a) TONI GLOBALI:
- “T” o “⇑” (Top) per indicare il target point con il valore più alto dell’intero contorno.
- “B” o “⇓” (Bottom) per indicare il target point con il valore più basso dell’intero
contorno.
- “M” o “⇒” (Mid) per indicare il target point con il valore pari a quello medio del
contorno.
b) TONI RELATIVI:
- “H” o “↑” (Higher) per indicare un target point più alto rispetto al precedente;
- “L” o “↓” (Lower) per indicare un target point più basso rispetto al precedente
- “S” o “→” (Same) per indicare un target point di altezza simile al precedente
183
“Per la definizione e l’identificazione di questa unità [unità tonale] gli autori rimandano ad una serie di
caratteristiche acustiche e percettive che sono generalmente riscontrate in molte lingue nella strutturazione
di sintagmi prosodici di varia estensione; l’unità presa in considerazione, quindi, è individuata in base a
caratteristiche fonetiche e alla modulazione dei principali parametri prosodici, mentre i criteri fonologici
non interferiscono né nella segmentazione né nell’etichettatura” (Giordano 2005, p. 238).
178
InTSInt prevede inoltre altri due toni iterativi che segnalano una leggera variazione rispetto
al target point precedente:
- “U” o “<“ (Upstepped) per indicare un target point leggermente più alto rispetto al
precedente
- “D” o “>” (Downstepped) per indicare un target point leggermente più basso rispetto al
precedente.
Fig. 62 Cofigurazioni associate ai relativi simboli nel sistema InTSInt (Hirst et al. 2000)
4.2
Tra forma e funzione della prosodia
La descrizione del sistema elaborato dal Laboratoire Parole et Langage dell’Université
d’Aix-en-Provence ci porta ancora una volta dentro alla questione relativa al rapporto tra
forma e funzione nella prosodia. La prosodia può essere descritta dal punto di vista della
sua forma e della sua funzione. I molteplici approcci teorici nel corso degli anni hanno
cercato in maniera più o meno consapevole di mediare tra questi due ambiti con risultati
non sempre soddisfacenti. Hirst (2005b) inoltre sottolinea come una delle caratteristiche
peculiari della prosodia del parlato, in relazione agli altri aspetti del linguaggio, sia la quasi
universalità del rapporto tra forma e funzione. Dal punto di vista della forma tutte le lingue
sembrano fare uso di distinzioni di quantità, intensità, e variazioni di tono. Inoltre quasi
tutte le lingue sembrano collegare la prosodia alla dimensione semantica delle parole, alla
struttura informativa, e quindi alla prominenza delle stesse all’interno di enunciati più
complessi. Sempre Hirst ricorda come un altro aspetto universalmente riscontrato sia la
179
grande quantità di informazioni che la prosodia veicola a livello di attitudini, emozioni e
affetti in generale. La specificità delle lingue in fatto di prosodia si collocherebbe, secondo
l’autore, non nell’organizzazione della forma o delle funzioni in sé ma nel modo in cui tali
lingue stabiliscono le relazioni tra questi due domini.
Più che mai in questi anni la problematica notazionale in senso stretto si coniuga con quella
più generale di ‘rappresentazione’. Hirst, Di Cristo e Espesser chiariscono che il termine
dovrebbe essere scisso in due ambiti di specificità riferendosi ora alla rappresentazione
cognitiva ora alla rappresentazione analitica. Inoltre, mentre sembra esistere un ampio
consenso sull’esistenza di rappresentazioni cognitive astratte, minore sembra essere il
consenso, secondo gli autori, relativo alla natura di queste rappresentazioni. Come si
collocano i livelli fonologici, sintattici e semantici rispetto al livello della pronuncia? Come
si collocano quindi i livelli funzionali rispetto a quello fisico-fonetico?
Gli autori suggeriscono che le soluzioni adottate siano state diverse. Da un lato c’è chi
considera la rappresentazione cognitiva come composita, per cui l’enunciazione si serve
delle informazioni provenienti dai diversi componenti:
Fig. 63 Fonte: Hirst, Di Cristo, Espesser (2000)
Per altri invece, come ad esempio Selkirk (1978, 1984, 1986), ci sarebbe un livello
autonomo di rappresentazione fonologica che decodifica tutte le informazioni concernenti
la pronuncia di un enunciato:
180
Fig. 64 Fonte: Hirst, Di Cristo, Espesser (2000)
Altre interpretazioni infine vedrebbero la componente sintattica (includendo il lessico)
comunicare sia con la dimensione semantica che fonologica. Tuttavia non ci sarebbe
collegamento diretto tra semantica e fonologia:
Fig. 65 Fonte: Hirst, Di Cristo, Espesser (2000)
Una distinzione simile può essere quindi fatta tra rappresentazione funzionale e
rappresentazione formale. Nel primo caso si tratterà di decodificare l’informazione
necessaria per l’interpretazione semantica e sintattica della prosodia, nel secondo invece
l’informazione necessaria per la sua pronuncia. Come si è visto in precedenza uno dei
181
limiti, e al tempo stesso delle sfide, del sistema ToBI, sviluppatosi sulla scia dell’approccio
autosegmentale-metrico, è quello di essere fortemente vincolato dalle caratteristiche
fonologiche delle lingue su cui si applica 184.
Il fatto che diverse lingue facciano uso di forme prosodiche differenti per codificare le
stesse funzioni ha spinto gli autori del sistema InTSInt a pensare in maniera separata queste
due dimensioni:
The inventories of prosodic forms and prosodic functions might then both be part
of universal linguistic theory while the specific mapping between forms and
functions in any given language would be defined by language specific parameters
(Hirst, Di Cristo, Espesser 2000, p. 53).
In questa prospettiva la descrizione della prosodia delle lingue può essere vista come un
processo che dal dato acustico si sposta via via su livelli funzionalmente più dettagliati
sulla base di trascrizioni puramente fonetiche.
184
“It is important to emphasize, however, that the four labelling tiers [...], together with the audio and Fo
records, are only the obligatory parts of the MAE_ToBI record. We had no expectation that these four
tiers and two types of continuous record would suffice for tagging systems for all languages or even for all
users of MAE databases. Rather, the originators of MAE_ToBI fully expected individual sites to add other
ToBI tiers or other completely independent annotations as needed, in order to customize shared databases
to their own purposes”. (Beckman, Hirschberg e Shattuck-Hufnagel 2004, p. 71).
182
Fig. 66 Fonte: Hirst, Di Cristo, Espesser (2000)
A partire dunque dagli enunciati le descrizioni potranno stratificarsi su tre principali livelli:
il primo di rappresentazione fonetica (phonetic representation) attraverso una prima
astrazione, quanto più fedele possibile, della frequenza fondamentale; una rappresentazione
fonologica superficiale (surface phonological representation) in cui vengono applicate
categorie discrete alle variazioni del contorno intonativo in rapporto diretto con il segnale
acustico; una rappresentazione fonologica più profonda (underlying phonological
representation) che avrà legami con le funzioni più astratte della struttura linguistica e sarà
legata solo indirettamente al segnale acustico. In questa panoramica il sistema InTSInt si
concentrerà dunque principalmente sui primi due livelli di rappresentazione con l’obiettivo
di fornire una descrizione universalmente applicabile e al tempo stesso fungere da base su
cui indagare le relazioni linguo-specifiche tra livello formale e livello funzionale.
Nel rapporto tra forma e funzione si inseriscono dunque le principali differenze tra gli
approcci più recenti. Hirst sottolinea come l'intonazione e la prosodia, a differenza degli
altri livelli linguistici, presentino una universalità di forma e funzione. In sostanza le lingue
si servirebbero universalmente delle variazioni prosodiche per veicolare un insieme
pressochè omogeneo di funzioni. Le costrizioni di cui le lingue particolari si servirebbero,
183
sarebbero dunque riferibili al modo in cui esse mettono in relazione le due facce del segno,
differenziando quindi questo tipo di rapporto tra forma e funzione. La notazione ToBI,
collocandosi in una prospettiva fonologica, si troverebbe nella condizione di dover
rappresentare mediante il suo sistema di trascrizione la specifica articolazione tra forma e
funzione, spesso non direttamente ricavabile dalla sola F0, della lingua a cui si applica.
Molti dei problemi di adattabilità e trasferibilità del modello su altri sistemi linguistici
potrebbero dunque essere letti come derivanti da questa caratteristica.
In netta opposizione si colloca invece il tentativo del progetto InTSInt della scuola francese
che punta invece a una rappresentazione prettamente fonetica dell'intonazione. In questo
modo, evitando le costrizioni linguo-specifiche del rapporto tra significante e significato, si
cerca di costituire un modello di descrizione, universalmente applicabile alle diverse lingue,
del solo piano espressivo.
184
Conclusioni
Prima di proporre delle riflessioni e indicare i possibili sviluppi del tema, è utile
sottolineare alcuni degli elementi che sono emersi dall'analisi dei modelli di
rappresentazione dell'intonazione. Il primo è di tipo strettamente semiotico e fa da sfondo ai
commenti e alle riflessioni che si sono succedute nei vari capitoli del lavoro. Il processo di
traduzione grafica, attraverso la costituzione di un modello notazionale simbolico destinato
alla rappresentazione della lingua, in questo caso dell'intonazione, non è un passaggio
'naturale'. Vi sono prima di tutto delle costrizioni di tipo materiale. La rappresentazione
permette ad esempio di rendere visibili aspetti della materia fonica che difficilmente si
riuscirebbero a cogliere senza un adeguato addestramento. È questo il punto che emerge
dalla critica di Roy Harris alla 'tirannia dell'alfabeto'. Ed è questo tipo di problematica che
emerge chiaramente anche nei primi lavori sistematici sull'intonazione. Lo studio di Johsua
Steele si colloca ad esempio in questa frattura tra oggetto e segno. L'autore inglese si trova
in qualche modo a dover costruire un sistema interpretativo capace di 'mostrare'
l'importanza delle variazioni di tono nella lingua. Per fare ciò si rifugerà in un modello
notazionale in un certo senso già pronto all'uso: la partitura musicale. Mediante questo
sistema egli riuscirà a classificare e ad analizzare diversi livelli prosodici: tono (accent),
durata (quantity), intensità (force), pause (pause), prominenza e scansione metrica
(emphasis).
Un'altra considerazione da fare riguarda la notevole perdita di informazione che questa
trasmutazione di materia comporta. Il processo di astrazione del simbolo grafico dovrà
quindi cogliere gli aspetti del segnale fonico che l'analista reputerà importanti e per cui la
notazione stessa è stata costruita. La nota sul pentagramma utilizzata da Steele permetterà
allo studioso di cogliere in termini assoluti l'altezza del suono, e con i dovuti calcoli anche
185
il valore in termini di Hz, ma difficilmente riuscirà a rendere conto del 'colore timbrico’ di
quella nota. Lo stesso sistema potrà agevolare la descrizione dell'andamento della
frequenza fondamentale (lo farà ad esempio Daniel Jones), ma difficilmente potrà far
'vedere' le diverse armoniche che compongono il suono nel suo complesso.
Da un punto di vista scientifico il lavoro mostra, attraverso la descrizione dei numerosi
approcci al problema, come vi sia una netta distanza tra le difficoltà incontrate dagli
studiosi nell'elaborazione dei propri modelli descrittivi e l’assoluta efficienza con cui i
parlanti utilizzano queste dimensioni della lingua per trasmettere e interpretare
informazioni. Cosa deve dunque considerarsi pertinente ai fini di uno studio linguistico
dell'intonazione? Nei fatti la risposta non né univoca né definitiva.
Vi è un primo ordine di problemi che è di natura prettamente epistemologica. La
prospettiva con cui le diverse scuole linguistiche hanno definito i loro principi e marcato i
confini della loro disciplina ha avuto ripercussioni sullo spazio occupato dai fatti intonativi
nel dominio linguistico.
L’impatto dello strutturalismo ha indubbiamente frenato lo sviluppo di una discussione sui
metodi di indagine e di riflessione sull’intonazione che invece aveva avuto ampio spazio
nella scuola britannica. Molte delle questioni oggi riprese e approfondite ad esempio in
ambito pragmatico, psicolinguistico, e più in generale dagli studi sul parlato avevano avuto
un ruolo centrale negli studi fonetici inglesi. I motivi, come si è visto, sono stati molteplici.
Tra questi, il tentativo di separare l’oggetto lingua dalle pratiche comunicative dei parlanti
e al contempo di fondare la specificità dell’oggetto lingua sul modello segmentale che ha
trovato non poche resistenze rispetto alla complessità dei fenomeni prosodici.
Un altro ordine di problemi è invece di natura empirica. Diverse sono ad esempio le
difficoltà riguardanti la costituzione del piano dell’espressione proprio della prosodia.
L’individuazione delle unità e con essa la descrizione della sua organizzazione non è
un’operazione semplice. La natura continua dei correlati acustici e al tempo stesso dei sensi
a cui essi si associano, chiaramente distinguibili dai parlanti e funzionalmente determinanti
186
nelle dinamiche della comunicazione ordinaria, rende difficoltosa e poco efficace una loro
generalizzazione e formalizzazione. Lo stesso metodo delle coppie minime, utilizzato in
fonologia per l’individuazione delle distinzioni di significato, non trova facile applicazione
con i fenomeni intonativi.
Va aggiunto inoltre che questi ultimi si presentano spesso interrelati con le altre
caratteristiche non segmentali e con altri elementi fonici co-occorrenti. Tono, intensità e
tempo, ad esempio, partecipano contemporaneamente alla costituzione dei contrasti
significanti. Al tempo stesso altri tratti come quelli emotivi o relativi alle qualità della voce
partecipano alla composizione degli andamenti tonali, creando non poche difficoltà
nell’estrazione di indici acustici che si trovano a condensare contemporaneamente più
livelli di informazione. La complessità delle questioni trova ancora oggi risposte divergenti.
Marotta (2010) ad esempio sostiene l’esistenza di una doppia prospettiva, una
linguisticamente ‘interna’ ed una linguisticamente ‘esterna’. Rispetto ai fatti linguistici
interni la prosodia e l’intonazione si troverebbero ad avere un ruolo marginale. In senso
opposto Albano Leoni ha in più occasioni avanzato l’ipotesi di una prospettiva unitaria in
grado di mettere al centro le complesse attività semiotiche delle interazioni tra i parlanti.
Posizione questa che renderebbe obsoleta una suddivisione tra fatti interni e fatti esterni alla
lingua.
Tali problemi trovano inevitabilmente riflesso nelle pratiche di rappresentazione. Il modello
alfabetico che, come abbiamo visto, ha rappresentato per la fonologia un primo e
determinante impulso alla riflessione metalinguistica, non presentava che limitate
informazioni sul ruolo che la prosodia, e in particolare l’intonazione, potevano avere nel
meccanismo linguistico. Tale impulso è senza dubbio legato alla capacità del supporto
grafico di mostrare e rendere osservabile, sotto un certo rispetto, il proprio oggetto,
rendendolo al tempo stesso manipolabile. Una simile condizione è infatti riscontrabile nel
rapporto tra gli studi dell’intonazione e la notazione musicale. Allo stesso modo
dell’alfabeto, la partitura ha reso ‘evidenti’ forme e relazioni tra elementi della lingua come
187
tono, intensità e durata, fornendo un valido sostegno alla elaborazione di concetti e
costruzioni teoriche.
E’ indubbio che negli ultimi decenni, soprattutto con lo sviluppo di nuove e più accurate
tecnologie, lo studio dell’intonazione abbia registrato un incremento notevole di interessi.
L’estrema specializzazione dei saperi, e con essa la vicinanza di prospettive plurime sul
medesimo oggetto di analisi, ha allargato di molto la richiesta di nuovi modelli
interpretativi. Pur nella grande variabilità dei sistemi di trascrizione adottati dall‘800 alla
metà del XX secolo, la gran parte degli studi sui fatti intonativi fu influenzata da finalità
soprattutto didattiche. A partire dagli anni ’80 l’interesse comincia ad essere focalizzato
anche sulla base di nuove esigenze di ricerca. Ingegneri, informatici, psicologi, oltre ai
linguisti e scienziati della voce iniziano a interessarsi all’elaborazione di sistemi di analisi
progressivamente più accurati. Dal punto di vista notazionale, l’esigenza sempre più
pressante è quella di rendere tali analisi fruibili e confrontabili a un pubblico sempre più
vasto e variegato. E’ in questo contesto che viene a collocarsi ad esempio il sistema ToBI.
Ispirato soprattutto dall’ambito di studi relativo alla teoria fonologica autosegmentalemetrica, esso ha accolto, come si è visto, il contributo di altre branche di ricerca. Ma è vero
anche il contrario. La pluralità degli interessi e delle prospettive ha spinto verso
l’elaborazione di nuovi sistemi di codifica, ognuno dei quali finalizzato a metodi specifici
di analisi intonativa, che di conseguenza hanno contribuito a costruire nuove e differenti
immagini dello stesso oggetto.
Problematizzare il ruolo della trascrizione e con essa della rappresentazione scientifica
della lingua significa dunque aprire uno spazio di riflessione sui modi in cui queste
influenzano e indirizzano il nostro sguardo. Il passaggio dal suono al segno visivo non è
infatti un’operazione ‘ingenua’, ma implica, come abbiamo visto, delle scelte. Occorre
operare selezioni, individuare delle linee di resistenza dell’oggetto che non sono sempre
visibili, e che dipendono il più delle volte dalla costruzione di complessi schemi di codifica,
ossia di quei processi di classificazione che sono necessari per la messa in evidenza dei
188
fenomeni, e che il più delle volte sono storicamente costituiti. Guardare alla
rappresentazione significa inoltre cercare di non confondere ‘la mappa con il territorio’, e di
guardare così ai mezzi rappresentativi come ausili per una descrizione e non come ‘calco’ o
‘sostituto’ dell’oggetto che si cerca di descrivere. Come si è argomentato nelle pagine
iniziali del lavoro, la distanza che separa gli oggetti dalle configurazioni segniche, e che di
conseguenza non può farli coincidere, è presente anche tra le teorie scientifiche che
dovrebbero far luce sui rapporti tra la lingua e le sue diverse funzioni. Se da un lato tutto
ciò può apparire un limite, dall’altro è interpretabile come condizione a priori di ogni
ricerca scientifica, condizione questa che diviene garanzia dell’inesauribilità della ricerca
stessa.
L'indagine sul problema della notazione intonativa mostra infine come in essa si riflettano
problemi e questioni controverse, che sono ancora oggi lontane dall'essere risolte in
maniera condivisa. L'importanza di questa tematica nella riflessione linguistica diviene
sempre più pertinente, grazie allo sviluppo di nuove tecnologie di raccolta, elaborazione e
analisi dei dati. Su di esse passa oggi la possibilità di rappresentare, misurare, analizzare,
confrontare e condividere le conoscenze in numerosi campi della scienza linguistica.
189
Bibliografia
Abercrombie D. (1967), Elements of general phonetics, Edinburgh: Edinburgh University
Press.
Albano Leoni, F. (1998), ‘L'indeterminatezza del significante. Premessa’, in F. Albano
Leoni, D. Gambarara, S. Gensini, F. Lo Piparo e R. Simone (A cura di), Ai limiti del
linguaggio. Vaghezza, significato e storia, Roma-Bari: Laterza, pp. 9-14.
Albano Leoni, F. (2001), ‘Il ruolo dell'udito nella comunicazione linguistica. Il caso della
prosodia’, in Rivista di linguistica, 13, pp. 45-68.
Albano Leoni, F. (2003), ‘I correlati acustici di una 'voce leggermente rauca, con un tono di
sarcasmo quasi amaro'. Fonetica e linguistica della parole’, in Cosi P., Magno Caldognetto
E., Zamboni A. (a cura di), Voce canto parlato. Studi in onore di Franco Ferrero, Padova,
Unipress.
Albano Leoni, F. (2005), ‘Lo statuto del fonema’, in S. Gensini e A. Martone (a cura di), Il
linguaggio. Teorie e storia delle teorie. In onore di Lia Formigari, Napoli: Liguori, pp.
281-303.
Albano Leoni, F. (2007), ‘Saussure, la sillaba e il fonema, in Elia e M. De Palo (a cura di),
La lezione di Saussure. Saggi di epistemologia saussuriana, Roma, Carocci, pp. 56-85.
Albano Leoni, F. (2009), Dei suoni e dei sensi. Il volto fonico delle parole, Bologna: Il
Mulino.
Alkon, P. K. (1952), ‘Joshua Steele and the Melody of Speech’, in Language and Speech 2,
154-174.
190
Arend Z.M. (1934), ‘Badouin de Courtenay and the Phoneme Idea’, in Le Maitre
Phonetique january.
Armstrong L. E. e Ward, I. C. (1926), A Handbook of English Intonation, Cambridge:
Helfer.
Avesani C. e Vayra M. (1992), 'Discorso, segmenti di discorso e un’ipotesi
sull’intonazione'. In Cresti E., Maraschio N. e Toschi (a cura di) Storia e teoria
dell’interpunzione. Atti del Convegno Internazionale di Studi Firenze 19 – 21 maggio 1988,
Roma, Bulzoni.
Azzaroni, L. (1997), Canone Infinito, Bologna: Cooperativa Libraria Universitaria Editrice.
Bachtin, M. (1981), ‘The dialogic Imagination’, In Holquist M. (a cura di), Austin:
University of Texas Press.
Barker, M. L. (1924), ‘Joshua Steele on Speech-Melody (1779)’, in Modern Language
Review, 169- 174.
Barrett L. F. (2006), ‘Are Emotions Natural Kinds?’, in Association for Psychological
Science, vol.1, no. 1, 2006, 28-58.
Beckman M.E. e G. Ayers Elam (1997), Guidelines for ToBI Labelling, The Ohio State
University Research Foundation.
Beckman, M. (1996), ‘The parsing of prosody’, in Language and Cognitive Processes,
11,1-2, 17:67.
Beckman, M. e Pierrehumbert, J. (1986), 'Intonational structure in Japanese and English', in
Phonology Yearbook, 3: 255-309.
Beckman, M. E. e Ayers, G. M. (1994), Guidelines for ToBI Labelling. Online MS and
accompanying files available at http://www.ling.ohio-state.edu/~tobi/ame_tobi.
191
Beckman, M. E. e Hirschberg, J. (1994), The ToBI Annotation Conventions. Online MS.
Available at http://www.ling.ohio-state.edu/~-tobi/anie_tobi/annotation_ conventions.html.
Beckman, M. E., Hirschberg, J. B., Shattuck-Hufnagel, S. (2004), ‘The Original ToBI
System and the Evolution of the ToBI Framework’, in Jun, Sun-Ah (a cura di), Prosodic
Models and Transcription: Towards Prosodic Typology, Oxford University Press.
Belardi W. (1959), Elementi di fonologia generale, Roma, Edizioni dell'Ateneo.
Bell, A. M. (1867), Visible Speech: The Science of Universal Alphabetics, London: Simkin,
Marshall & CO.
Berio, L. (1981), Invervista sulla musica, a cura di Rossana Dalmonte, Roma-Bari: Laterza.
Bertinetto P. M. e Magno Caldognetto E. (1993), ‘Ritmo e intonazione’, in Alberto M.
Sobrero (a cura di), Introduzione all’italiano contemporaneo, vol. I: Le strutture, RomaBari: Laterza, pp. 141-192.
Bien-Ming C. (1930), ‘The tone behaviour in Hagu: an experimental study’, in Archives
Néerlandaises de Phonétique Expérimentale 6, 6-45.
Bloomfield (1933), Language, Holt, Rinehart and Winston, Inc; trad. it. 1974, Il
linguaggio. Milano: Il Saggiatore; rist. EST (1996),
Bolinger D. (1947), ‘American English Intonation, (review of K. L. Pike, The Intonation of
American English 1945)’, in American Speech, 22, 134-136.
Bolinger D. (1951), 'Intonation: Levels Versus Configurations', in Word, 7, 199-210.
Bolinger D. (1958), 'A Theory of Pitch Accent in English', in Word, 14 (1958), 109-149.
Bolinger D. (1961), Generality, Gradience, and the All-or-None, Mouton: The Hague.
192
Bolinger D. L. (1949), ‘Intonation and analysis’, in Word, 248-254
Bolinger, D. (1948), ‘The intonation of accosting question’, in English Studies, 29, pp. 109114
Bolinger, D. (1972), 'Accent Is Predictable (If You're a Mind-Reader)', in Language, Vol.
48, No. 3, pp. 633-644
Bolinger, D. (1978), ‘Intonation Across Languages’, in Greenberg J. H. (a cura di),
Universals of Human Language, Vol. 2, Phonology, Stanford, Stanford University Press,
pp. 471-524.
Botinis, A., et al. (2001), ‘Developments and paradigms in intonation research’, in Speech
Communication, 33 (2001) 263-296.
Boulakia, G. (2002), ‘Linguistica e fonetica: senza voce o mezza voce?’, in De Dominicis
(a cura di), La voce come bene culturale, Roma: Carocci, pp. 63-85.
Bühler, K. (1934), Sprachtheorie. Die Darstellungsfunktion der Sprache, Jena: Fischer;
trad. it. Teoria del linguaggio. La funzione rappresentativa del linguaggio, Roma:
Armando, 1983.
Burke, K. (1962), A Grammar of Motives and a Rethoric of Motives, Cleveland: The Worls
Publishing Co.
Butler C. (1663), The english grammar, London. Cfr Chaerles Butler's Englisch grammar,
ed. A. Eichler, Halle: Neymeyer, 1910.
Butler, C. (1633), The English grammar, Oxford: the Author.
Cage J. (1976), Per gli uccelli. Conversazioni con Daniel Charles, Milano: Multhipla.
193
Campbell, W. (1992), ‘Prosodic encoding of English speech’, in In Proceedings of the 1992
International Conference on Spoken Language Processing, 663–666. Banff, Canada.
Cardona, G. R., (1981), Antropologia della scrittura, prima ed. Torino: Loescher, rist.,
Torino: Utet, 2009.
Carnochan, J. (1962), ‘Pitch, Tone and intonation in Igbo’ in 4th International Congress of
Phonetic Sciences, Mouton: the Hague, pp. 547 – 554.
Chapman, J. (1818), The Music, or Melody and Rhytmus of Language. Edimburgh.
Clements, G. N. (1979), ‘The Description of Terraced-Level Tone Languages’, in
Language , Vol. 55, No. 3, 536-558
Clemoes, P (1952), Liturgical Influence on Punctuation in Late Old English and Early
Middle English Manuscripts. Dept. of Anglo-Saxon Occasional Papers no. 1, Cambridge:
Dept. of Anglo-Saxon.
Clemoes, P (1952), Liturgical influence on punctuation in late Old English and early
Middle English manuscript, Dept. of Anglo-Saxon Occasional Paper no. 1, Cambridge:
Dept. of anglo-Saxon.
Coleman, H.O. (1914), ‘Intonation and emphasis’, in Miscellanea Phonetica, I,
International Phonetic Association, pp. 6-26.
Cook-Gumperz, J. & Gumperz, J. (a cura di) (1976), Papers on language and context.
Berkeley, University of California, Language Behavior Research Laboratory.
Couper-Kuhlen, E. (1986), An introduction to english prosody, London: Edward Arnold.
Cruttenden (1986), Intonation, Cambridge: Cambridge University Press.
194
Cruttenden, A. (1981), ‘Falls and rises: Meanings and universals’, in Journal of Linguistics
17, pp. 77-92.
Crystal, D. (1969) Prosodic System and Intonation in English, Cambridge: Cambridge
University Press.
Daine, Simon (1640), Simon Daine’s Orthoepedia Anglicana, Rösler M. e Brotanek R. (a
cura di), Halle: M. Niemeyer, 1908.
Dalmonte, R. (1993), ‘Parole di musica e poesia’, in Id. (a cura di), in Phoné semantiké, Il
Verri, 1-2 .
Dalmonte, R. (2005), ‘Musica e parole’, in J.-J. Nattiez (a cura di), Enciclopedia della
musica, vol IX, Einaudi: Torino, pp. 185 - 205.
Danielsson, B. (a cura di), (1955) Works on English orthography and pronunciation; 1551,
1569, 1570, Stockholm: Almqvist & Wiksell.
De Dominicis (2010), Intonazione. Una teoria della costituenza delle unità intonative,
Roma: Carocci.
De Dominicis (a cura di) (2002), La voce come bene culturale, Carocci, Roma.
De Mauro T. (1965), Introduzione alla semantica, Roma, Bari: Laterza
Deleuze, G. (1973), ‘À quoi reconnaît-on le structuralisme?’, in Histoire de la philosophie,
Idées, Doctrines, vol. 8 - Le XXe siècle, Hachette, Parigi , pp. 299-335. tr. it. Lo
strutturalismo, Milano: SE, 2004.
Deutsch, D., Henthorn, T., and Lapidis, R. (2011), ‘Illusory transformation from speech to
song’, in Journal of the Acoustical Society of America, 129, 2245-2252
195
Deutsch, D., Lapidis, R., and Henthorn, T. (2008), ‘The Speech-to-Song Illusion’, in
Journal of the Acoustical Society of America, November, 124, 2471.
Di Cristo, A. (1975), Soixante et dix ans de recherche en prosodie, Aix: éd. de l’Université
de Provence.
Eco, U. (1968), La struttura assente, Milano : Bompiani.
Eco, U. (1975), Trattato di semiotica generale, Milano: Bompiani.
Eco, U. (1997), Kant e l'ornitorinco, Milano: Bompiani.
Eco, U. (2007), Dall'albero al labirinto, Milano: Bompiani.
Elia, A. (1974), ‘«Filologia viva». Henry Sweet e la priorità del parlato’, in Elia A.,
D'Agostino E. (1974), Teorie linguistiche e glottodidattica, Bologna: Il Mulino.
Ellis A. J. (1848), The ethnical alphabet, or Alphabet of nations. Being an extension of
Messrs. Pitman and Ellis's English phonetic alphabet, London: F. Pitman.
Ellis A. J., (1878), Speech in Song. Being the Singer's Pronouncing Primer of the Principal
European Languages for Which Vocal Music Is Usually Composed. London, Novello,
Ewer Publication.
Fabbrichesi Leo, R. (1983), La polemica sull’iconismo, Napoli: Edizioni Scientifiche
Italiane.
Faure, G. (1962), ‘L’intonation et l’identification des mots dans la chaîne parlée’, in 4th
International Congress of Phonetic Sciences, Mouton: the Hague, pp. 598 - 609.
Fónagy I. e Bérard E. (2006), ‘Functions of Intonation’, in Yuji Kawaguchi, Ivan Fonágy,
Tsunekazu Moriguchi (a cura di), Prosody and Syntax. Cross-linguistic Perspectives,
Amsterdam/Philadelphia: John Benjamins Publishing Company.
196
Fónagy, I. & Magdics, K. (1960), ‘Speed of utterance in phrases of different lengths’, in
Language and Speech, 3, 179-92.
Fonagy, I. e Magdics, K., (1963) ‘Emotional patterns in intonation and music’, in
Zeitschrift für Phonetik, 16, pp. 293–326.
Fontana G. (2003), La voce in movimento, Monza: Harta Performing & Momo, [con CD].
Gensini, S. (a cura di) (1998), La varietà delle lingue, Scandicci, La Nuova Italia.
Giannattasio, F. (2005), ‘Dal parlato al cantato’, in J.-J. Nattiez (a cura di), Enciclopedia
della musica, vol. V, Einaudi: Torino, pp. 1003-1036
Giannini, A. Pettorino, M. (1992), La fonetica Spetimentale, Napoli: Edizioni Scientifiche
Italiane.
Giordano, R. (2005), ‘Analisi prosodica e trascrizione intonativa’ in InTSInt, in Albano
Leoni F., Giordano R. (a cura di), Italiano Parlato. Analisi di un dialogo, Liguori, Napoli,
pp. 231-256.
Giordano, R. (2008), ‘Cambiamenti di prospettiva nello studio della prosodia: funzionalità
e proprietà linguistiche dell’intonazione’, in Testi e linguaggi, 2 (2008): 149-162. [Studi
monografici. Grammatiche a confronto, a cura di M. Voghera].
Giorgio Pasquali, ‘Prosodia’, in Enciclopedia Italiana, vol. 33, Roma: Ist. Enciclop.
Italiana, p. 348.
Goldman-Eisler, F. (1961), ‘The distribution of pause duration in speech’, in Language and
Speech, 4, 232-7.
Goldsmith, J. A. (1976a), Autosegmental Phonology, Ph. D. dissertation, Cambridge MA,
MIT Press
197
Goldsmith, J. A. (1976b), 'An Overview od Autosegmental Phonology', in Linguistic
Analysis, 2, 1, pp. 23-68.
Goldsmith, J. A. (1990), Autosegmental and Metrical Phonology, Oxford: Blackwell.
Gombrich, E. H. (1960), Art and illusion, London: Phaidon Press; trad. it Arte e Illusione.
Studio sulla psicologia della rappresentazione pittorica, New York: Phaidon Press, 2002.
Goodman, N. (1968), Languages of art: an approach to a theory of symbols, IndianapolisNew York: The Bobbs-Merril Inc., trad. it. I linguaggi dell'arte, ed. tascabili, Milano: Il
Saggiatore SPA, 2008.
Goodman, N. (1978), Ways of Worldmaking, Indianapolis: Hackett Publishing Company;
trad. it Vedere e costruire il mondo, Roma-Bari: Laterza, 2008.
Goodwin C. (1994), ‘Professional Vision’, American Anthropologist, 96 (3), pp. 606-633;
trad. it Visioni professionali, in Goodwin C., Il senso del vedere, Roma: Meltemi, 2003, pp.
17-67.
Greimas, A. J., (1983), Du sens II. Essais sémiotiques, Paris, Seuil; trad. it. Magli P. e
Pozzato M. P. (a cura di), Del senso 2. Narrativa, modalità, passioni, Milano: Bompiani,
1984.
Greimas, A. J., Fontanille, J., (1991), Sémiotique des passions. Des états de choses aux
états d’âme, Paris, Seuil; trad. it. 1996, Semiotica delle passioni. Dagli stati di cose agli
stati d’animo, a cura di F. Marsciani, I. Pezzini, Milano, Bompiani.
Grice, M., Reyelt, M., Benzmuller, R., Mayer, J., E Batliner, A. (1996), 'Consistency in
Transcription and Labelling of German Intonation with GToBI', in Proceedings of the 1996
International Conference on Spoken LanguageProcessing (New Castle, DE: Citation
Delaware), 1716-19.
198
Grosz, B., e Hirschberg J. (1992), ‘Some intonational characteristics of discourse structure’,
in Proceedings of the 1992 International Conference on Spoken Language Processing,
429–432. Banff, Canada.
Gussenhoven, C. (1984), On the Grammar and Semantics of Sentence Accents (Dordrecht:
Foris),
Gussenhoven, C. (2004), The Phonology of Tone and Intonation, Cambridge: Cambridge
University Press.
Gussenhoven, Carlos (2004), The phonology of tone and intonation, Cambridge:
Cambridge University Press.
Halliday M. A. K. (1967), ‘Notes on Transitivity and Theme in English: Part 2’, in Journal
of Linguistics, Vol. 3. No. 2, 199-244.
Halliday, M. A. K. (1963), 'the tone of English', in Archivum Linguisticum, 15.1: 1-28.
Halliday, M. A. K. (1979), Learning How to Mean, London: Edward Arnold.
Harris, R. (1986), The Origin of Writing, London: Duckworth; trad it. L’origine della
Scrittura, Viterbo: Liguori, 1998.
Hart J. (1569), An Orthographie: conteyning the due order and reason, howe to write or
paint thimage of mannes voice, most like to the life or nature. London: William Seres.
Helmholtz, H. L. F. Von (1863), Die Lehre von den Tonempfindungen als physiologische
Grundlage für die Theorie der Musik trad. en A.J.Ellis 1875, The sensation of tone as
physiological basis for theory of music. New York & London: Longmans.
Hirst, D. J, Di Cristo, A., Espesser, R., (2000), ‘Level of Representation and Levels of
Analysis for Intonation’, in M. Horne (a cura di), Prosody: Theory and Experiment,
Dordrecht: Kluwer Academic Publisher, pp. 51-87.
199
Hirst, D. J. , Espesser, R., (1993) ‘Automatic modelling of fundamental frequency using a
quadratic spline function’ in Travaux de l’Institut de Phonétique d’Aix 15, 71-85.
Hirst, D. J., Di Cristo, A. (1998), Intonation System: A Survey of Twenty Languages,
Cambridge: Cambridge University Press.
Hirst, D., J. (2005a), 'Form and function in the representation of speech prosody', in Speech
Communication, Vol. 46, 3-4, pp. 334-347.
Hirst, D., J. (2005b), ‘Phonetic and Phonological Annotation of Speech Prosody’, in R.
Savy, C. Crocco (a cura di), Analisi prosodica. Teorie, modelli e sistemi di annotazione.
Atti del secondo convegno AISV-Associazione Italiana di Scienze della Voce, Torriana:
EDK, pp. 33-42.
Hjelmelsv, L. (1988), Saggi linguistici, vol. 1, a cura di Romeo Galassi, Milano: Unicopli.
Hjelmslev (1938) ‘Über die Beziehungen der Phonetik zur Sprachwissenschaft’, in Archiv
für vergleichende Phonetik, II, pp. 97-109 e 212-22; tr. it ‘I rapporti della fonetica con la
linguistica’ in Hjelmslev, 1991, pp. 217-32.
Hjelmslev L. (1936), ‘On the Principles of Phonematics’, in Proceedings of the Second
International Congress of Phonetics Sciences, University College, London, 22-26 July
1935, Jones D. Fry D. B. (a cura di) Cambridge: University press, pp. 49-54; trad. it, ‘Sui
Principi della fonematica’, in Hjelmslev, 1991, Saggi linguistici, vol. 2, pp. 211-6.
Hjelmslev, L. (1943), Omkring sprogteoriens grundlæggelse, København: Munksgaard,
trad.it, I fondamenti della teoria del linguaggio, Torino: Einaudi, 1968.
Hjelmslev, L. (1947), ‘The Basic Structure of Language’, in Travaux du Cercle
Linguistique de Copenhague, XIV, 1973, pp. 119-53; trad it. ‘La struttura fondamentale del
linguaggio, in Hjelmslev 1988, pp. 154-96.
200
Hjelmslev, L. (1963), Sproget. En introduktion, Charlottenlund: The Nature Method
Center; trad. it Il linguaggio, Torino: Einaudi, 1970.
Hjelmslev, L. (1991), Saggi linguistici, vol. 2, a cura di Romeo Galassi, Milano: Unicopli.
Hockett, C. F. (1955), A manual of phonology. Indiana University Pubs. In Anthropology
and Linguistic Memoir 11 of International Journal of American Linguistics (Baltimore:
Waverley Press).
Hockett, Charles F. (1942), ‘A system of descriptive phonology’, in Language, vol. 18(1),
pp. 3-21.
Howatt, A.P.R. (1994), ‘Palmer, Harold Edward (1877—1949)’, in Asher, R.E. (ed.),
Encyclopedia of Language and Linguistics, Vol. 6, Oxford, Pergamon, 2915.
Hultzén, L. S (1939), ‘Seventeenth-century intonation’, in American Speech, 14, pp. 39-43.
Hultzén, L. S. (1962), ‘Significant and Nonsignificant in Intonation’, in 4th International
Congress of Phonetic Sciences, Mouton: the Hague, pp. 658 – 661.
Isačenko, A. V. e Scädlich H. J. (1970), A Model of Standard German Intonation, Den
Haag: Moutib.
Jakobson R. (1963), Essais de linguistique générale, Vol. I: Les fondations du langage,
Paris, Editions de Minuit; trad. it. Saggi di linguistica generale, Milano: Feltrinelli, 1966.
Jakobson, R. (1959), ‘Linguistic Aspect on Transaltion’, in Brower R. A. (a cura di) On
translation, Harvard University Press, pp. 232-39; trad. it., ‘Aspetti linguistici della
traduzione’, in Saggi di linguistica generale, prima ed. 1966, Milano: Feltrinelli, 2002, pp.
56-64.
201
Jakobson, R. (1960), ‘Closing statement: linguistics and poetics’, in Sebeok T. A. (a cura
di) Style in language, atti della Conference on Style, Indiana University 1958, Cambridge:
MIT Press., pp. 350-377, rist. Linguistique et poétique, in Essais de linguistique générale,
Paris: Édition de Minuit, 1963, pp. 209-248, trad. it., ‘Linguistica e poetica’, in Saggi di
linguistica generale, prima ed. 1966, Milano: Feltrinelli, 2002, pp. 181-218.
Jakobson, R. (1966), ‘Henry Sweet's Paths Toward Phonemics’, in Jakobson (1971)
Selected Writings, vol. 2. Paris: The Hague.
Jakobson, R. (1976), Six leçons sur le son et le sens, Paris: Minuit; Trad.it 1978, La
linguistica e le scienze dell'uomo, Milano: Saggiatore.
Jespersen O. (1904), Lehrbuch der Phonetik, Leipzig, Berlin: B.G. Teubner.
Jespersen, O (1933), ‘Notes in metre’, in Linguistica, Copenaghen, Levin & Munksgaard.
Jones, D (1909b), The pronunciation of English, Cambridge: Cambridge University Press
Jones, D (1922), An Outline of English Phonetics, New York: G. E. Stechert & Co.
Jones, D (1938), ‘Concrete and Abstract Sounds’, in Proceedings of the Third International
Congress of Phonetic Sciences, Ghent.
Jones, D. (1909a), Intonational Curves, Teubner: Leipzig.
Jones, D. (1944), ‘Some Thoughts on the Phoneme’, in Transactions of the Philological
Society, 43, vol.1, 119-135.
Jones, D. (1950), The phoneme. Its Nature and Use, Cambridge, Heffer & Son. (3nd edition
Cambridge: Cambridge University Press, 1967)
Jones, D.(1931), ‘On phoneme’, in Travaux du Cercle Linguistique de Prague, 4, 74-79.
202
Joos, Martin (1950), ‘Description of language design’, in Journal of the Acoustical Society
of America, vol. 22(6), pp. 701-707.
Karcevskyi, S. (1931), ‘Sur la phonologie de la phrase’, in Travaux du Cercle Linguistique
de Prague, 4, pp 188-227.
Károlyi, O. (1969), La grammatica della musica. La teoria, le forme e gli strumenti
musicali, Torino: Giulio Einaudi Editore.
Kassler, J. C. (2005), ‘Representing speech through musical notation’, in Journal of
Musicological Research (24), 227-239.
Klatt, D. (1987), 'Review of text-to-speech conversion for English', in Journal of the
Acoustical Society of America, 82:737-793.
Klinghardt, H. e De Fourmestraux, M. (1923), French intonation exercises, translated and
adapted for English Readers by Barker M. L., Cambridge: Heffer.
Klinghardt, H., Klemm, G. (1920), Übungen im englischen Tonfall, für Lehrer und
Studierende, Cöthen: Schulze.
Ladd R. (1996), Intonational phonology, Cambridge, Cambridge University Press.
Ladd, D. R. (1980), The Structure of Intonational Meaning: Evidence from English,
Bloomington, IN: Indiana University Press.
Ladd, D.R. e Silverman K.E.A. (1984), ‘Vowel intrinsic pitch in connected speech’, in
Phonetica, 41,31-40.
Latour, B. (1987), Science in Action. How to Follow Scientists and Engineers Through
Society, Cambridge Mass.: Harvard University Press; trad. it La scienza in azione.
Introduzione alla sociologia della scienza, Torino: Edizioni di Comunità, 1998.
203
Lehiste, I. (1970), Suprasegmentals, Cambridge: MIT Press.
Léon, P., Martin, Ph (1970), Prolègomènes a l’étude des structures intonatives, Studia
Phonetica, Ottawa: Marcel Didier.
Lepschy, G. (1966), La linguistica strutturale, Torino, Einaudi.
Levis J. e Pickering L. (2004), ‘Teaching intonation in discourse using speech visualization
technology’, in System, vol. 32, (4), pp. 505-524.
Liberman, M. e Prince A. (1977), ‘On Stress and Linguistic Rhythm’, in Linguistic Inquiry,
8, 249-336.
Lieberman P., Sawashima M., Harris K. S. e Gay T. (1970), ‘The Articulatory
Implementation of the Breath-Group and Prominence: Crico-Thyroid Muscular Activity’,
Language, Vol. 46, No. 2, pp. 312-327.
Lieberman, P. (1967), Intonation, perception, and language, M.I.T. Research Monograph.
Lombardi Vallauri E. (2002), La struttura informativa dell'enunciato, La Nuova Italia.
Lombardi Vallauri, E. (2009), La struttura informativa, Forma e funzione negli enunciati
linguistici, Roma, Carocci.
Lucidi M. (1966) Saggi linguistici, Roma, Scuola grafica Don Bosco
Lucidi, M. (1950), ‘L’equivoco de «L’arbitraire du signe». L’iposema’, in Cultura
neolatina, 10, pp. 185-208; ora in Lucidi, M., Saggi linguistici, Napoli: Istituto
Universitario Orientale di Napoli, 1966.
MacMahon M. K. C. (2007), ‘Using Phonetics in a New Musical Notation: Henry Sweet’ s
manuscript notes of 1904 and 1908’, in Henry Sweet Society Bulletin, Issue No. 48.
204
Magno Caldognetto E. e Poggi I. (2004), ‘Il parlato emotivo. Aspetti cognitivi, linguistici e
fonetici’, in Albano Leoni F., Cutugno F., Pettorino M. e Savy R.(a cura di), Atti del
convegno “Italiano parlato”, Napoli 14-15 febbraio 2003, Cd-rom, Napoli, D’Auria
Editore.
Magno Caldognetto, E. (2002), ‘I correlati fonetici delle emozioni, in Bazzanella C. e
Kobau P. (a cura di) Passioni, emozioni, affetti, pp. 197-213. Milano: McGraw-Hill.
Magno Caldognetto, E. e Poggi, I. (2001), ‘Dall’analisi della multimodalità quotidiana alla
costruzione di Agenti Animati con Facce Parlanti ed Espressive’ in Magno Caldognetto E.
e Cosi P. (a cura di) Multimodalità e Multimedialità nella comunicazione. Atti delle XI
Giornate di Studio del GFS, pp.47-55, Padova: Unipress.
Magno Caldognetto, E., Cavicchio F. e Cosi P. (a cura di) (2008) Comunicazione parlata e
manifestazione delle emozioni. Atti del I convegno del Gruppo di Studio sulla
Comunicazione Parlata (Padova, 29 novembre-1° dicembre 2004), Napoli: Liguori (ebook).
Malberg, B. (1983), Analyse du langage au XX siècle. Théories et méthodes, Paris, Presses
Universitaires de France; trad. it L’analisi del linguaggio nel XX secolo, Bologna: il Mulino
1985.
Maldonado, T. (1974), Avanguardia e razionalità: articoli, saggi pamphlets, 1946-1974.
Torino: Einaudi.
Mancini, G. (1777), Pensieri e riflessioni pratiche sul canto figurato, terza edizione:
Milano, Giuseppe Galeazzi. Ristampa anastatica, Bologna: Arnaldo Forni Editore, 1996.
Mari N. e Schindler O., (1974) Colloquio fra canto e foniatria, Padova, Zanibon.
Marotta G. (2003), ‘L’illusione prosodica’, in Id. (a cura di), Studi e saggi linguistici,
supplemento a “L’Italia dialettale”, XLI, pp. 237-58.
205
Marotta G. (2010), ‘Sulla (presunta) morte del fonema’, in Studi e Saggi Linguistici,
XLVIII, pp. 283-304.
Martin, Ph. (2009), Inronation du français, Paris: Armond Colin.
Martinet, A. (1960), Eléments de linguistique générale, Paris: Colin; trad. it. Elementi di
linguistica generale, Bari: Laterza, 1971.
Mayo, C., Aylett, M., Ladd, D. R. (1997), ‘Prosodic transcription of glasgow English: an
evaluation study of glatobi’, in INT-1997, 231-234.
Monboddo, J. Burnett (1774), Origin and progress of language, vol. II, Edimburgh: printed
for J. Balfour.
Nespor M. (1993), Fonologia, Bologna: il Mulino
Nespor M. e Vogel I. (2007), Prosodic Phonology, Berlin: Mouton De Gruyter.
Nyqvist, A. (1962), ‘Stress, Intonation, Accent, Prominence in Disyllabic Double-stress
Compounds in Educated Southern English’ in 4th International Congress of Phonetic
Sciences, Mouton: the Hague, pp. 710 – 713.
O’ Connor, J. D. e Arnold, G.F. (1961), Intonation of colloquial English, London:
Longman.
Ochs E.e Schieffelin B. B. (1989), ‘Language Has a Heart’, Text, 9(1), pp. 7-25.
Odell, J. M. (1806), An Essay on the Elements, Accents, and Prosody, Cambridge.
Ohala, J. J., Hirano, M. (1967), ‘An experimental investigation of pitch change in speech
(abstract)’, Journal of the Acoustical Society of America, 42, pp. 1208-1209.
206
Omond, T. S. (1921), English Metrists. London, New York e Toronto: Oxford University
Press.
Pagliaro A. (1957), La parola e l'immagine, Napoli, Edizioni Scientifiche Italiane.
Pagliaro, A. e De Mauro, T. (1973), La forma linguistica, Milano: Rizzoli.
Palmer, H. (1922), English intonation with systematic exercise, Cambridge: W. Effer &
Sons LTD.
Palmer, H.E. (1917), The Scientific Study and Teaching of Languages. A review of the
factors and problems connected with the learning and teaching of modern languages with
an analysis of the various methods which may be adopted in order to attain satisfactory
results, Yonkers on Hudson, New York: World Book Company.
Passy P. (1887), Les sons du français: leur formation, leur combinaison, leur
représentation. Paris: Firmin-Didot; trad. eng D. L. Savory e D. Jones The sounds of the
French language, their formation, combination and representation, Oxford, Clarendon,
1907.
Pettorino, M., Giannini, A. (1997), ‘Il discorso politico: una questione di stile’, in Atti delle
VI Giornate di Studio del GFS, Napoli.
Pierrehumbert J. (1980), The phonetics and phonology of English intonation, PhD Thesis,
MIT.
Pierrehumbert J. e Beckman M. (1988), Japanese tone structure, Cambridge MA, MIT
Press.
Pierrehumbert, J. (2000), ‘Tonal elements and their alignment’, in M. Horne (a cura di)
Prosody: Theory and Experiment. Studies Presented to Gosta Bruce. Kluwer, Dordrecht,
11-26
207
Pierson (1884), La métrique naturelle du langage, Paris: Vieveg.
Pike, K. L. (1945), The Intonation of American English. Ann Arbor: The University of
Michigan Press.
Piston, W. (1941), Harmony, New York: Norton & Company.
Poggi I., Magno Caldognetto E. (2004), ‘Il parlato emotivo. Aspetti cognitivi, linguistici e
fonetici’ in F. Albano Leoni, F. Cutugno, M. Pettorino, R. Savy. (a cura di), Atti del
Convegno “Italiano parlato” (Napoli 14-15 febbraio 2003), Napoli: D’Auria Editore, CDRom.
Poggi, I. e Magno Caldognetto, E. (1997), Mani che parlano. Gesti e psicologia della
comunicazione, Padova: Unipress.
Poggi, I. e Pelachaud, C. (2000), ‘Performative Facial Expressions in Animated Faces’, in
J. Cassell, J. Sullivan, S. Prevost, e E. Churchill (a cura di), Embodied Conversational
Agents, pp 155-188. Cambridge, Mass.: The MIT Press.
Price, P., Ostendorf, M., Shattuck-Hufnagel, S., e Fong, C. (1991), 'The Use of Prosody in
Syntactic Disambiguation', in Journal of the Acoustic Society of America, 90: 2956-70.
Prieto L. J. (1975), Pertinence et pratique. Essai de sémiologie, Paris: Édition de Minuit;
trad it. Pertinenza e pratica, Milano: Feltrinelli, 1976.
Pulgram E. (1951), ‘Phoneme and Grapheme: A Parallel’, in Word, 7, pp. 15-20.
Puttenham, George (1589) The Arte of English Poesie, in Edward A. (a cura di),
Westminster A: Constable and Company, 1895,
Rastier F. (2007), ‘Semantica interpretativa. Dalle forme semantiche alla testualità’, in
Paolucci C. (a cura di), Studi di semiotica interpretativa, Milano, Bompiani.
208
Reinhold Petersen, N. (1986), ‘Perceptual compensation for segmentally conditioned
fundamental frequency perturbation’, in Phonetica, 43, 31-42.
Richard Roe, A. B. (1823), The principles of Rhythm both in speech and music; especially
as exhibited in the mechanism of English verse. Dublin: Graisberry.
Ripman W. (1922), Good Speech. An introduction to english phonetic, New York: E. P.
Dutton & Co.
Roe, R. (1823), The Principles of Rhythm, both in Speech and Music; Especially as
exhibited in the Mechanism of English Verse, Dublin, R. Gainsberry.
Romportl, M. (1962), ‘Zum Wesen der intonation’ in 4th International Congress of
Phonetic Sciences, Mouton: the Hague, pp. 749 – 752
Rossi, Mario (1997), ‘Intonation: past, present, future’, In INT-1997, 1-10.
Rush, James (1827), The Philosophy of the Human Voice: Embracing Its Physiological
History; Together with a System of Principles by Which Criticism in the Art of Elocution
May Be Rendered Intelligible, and Instruction, Definite and Comprehensive. To Which Is
Added A Brief Analysis of Song and Recitative. Philadelphia: Printed by J. Maxwell, 1827.
Print.
Russell J. A. e Barrett L. F. (1999), ‘Core Affect, Prototypical Emotional Episodes, and
Other Things Called Emotions: Dissecting the Elephant’, in Journal of Personality and
Social Psychology, 1999, Vol. 76, no. 5, 805-819.
Sapir E. (1922), ‘The Takelma language of Southwestern Oregon’, in Boas, F. Handbook of
American Indian Languages, Pt. 2, Smithsonian Institute, Bureau of American Ethnology
Bulletin 40, 1-296.
209
Saussure, F. de
(1916) Cours de linguistique générale, seconda ed. 1922, Paris: Payot,
trad. e cura di Tullio De Mauro, Corso di linguistica generale, prima ed. 1967, Roma-Bari:
Laterza, 2005.
Saussure, F. de (1916), Cours de linguistiche générale, Paris, Payot; trad. it. Corso di
Linguistica generale, 2° ed., introduzione, traduzione e commento di T. De Mauro, Bari:
Laterza, 1968.
Savastano E., Giannini A., Pettorino M. (1995), ‘Aspetti prosodici del parlato dei politici’,
in AIA Atti del XXIII Convegno Nazionale, 171-176, Bologna.
Scherer, K. R., Johnstone, T. & Klasmeyer, G. (2003), ‘Vocal expression of emotion’ in R.
J. Davidson, K. R. Scherer , H. Goldsmith (a cura di), Handbook of the Affective Sciences'
( 433–456). New York and Oxford: Oxford University Press.
Selkirk E. (1984), Phonology and sintax. The relation between sound and structure,
Cambridge, Mass., M.I.T. Press.
Selkirk, E. (1978), On prosodic structre and its relation to syntactic structure.
Bloomington, Indiana University Press.
Selkirk, E. (1986), ‘On derived domains in sentence phonology’, in Phonology Yearbook 3,
371-405.
Sherer K. R. (2003), ‘Vocal communication of emotion: a review of research paradigms’,
in Speech communication, 40 (1-2), pp. 227-256.
Sheridan, T. (1796), A course of lectures on elocution, London.
Sievers (1901), Grundzüge der phonetik zur einführung in das studium der lautlehre der
indogermanischen sprachen, Leipzig, Breitkopf & Härtel.
210
Sievers, E. (1876), Grundzüge der Lautphysiologie zur Einführung in das Studium der
Lautlehre der indogermanischen Sprachen, Lipsia, Breitkopf & Härtel.
Silverman K. (1993), ‘Assessing the contribution of prosody to speech synthesis in the
context of an application’, Proceedings of the ESCA Workshop on Prosody, Lund
University.
Silverman, K. E. A., M. Beckman, J. F. Pitrelli, M. Ostendorf, C. Wightman, P. Price, J.
Pierrehumbert, e J. Hirschberg. (1992), ‘TOBI: A standard for Labeling English Prosody’
in Proceedings of the 1992 International Conference on Spoken Language Processing, Vol.
2, 867-870. Banff, Canada.
Smith, R. (2011), ‘Harold E. Palmer’s alternative ‘applied linguistics’’, in Histoire
Épistémologie Langage, Vol. 33, 1, pp. 53-67.
Sorianello, P. (2006), Prosodia. Modelli e ricerca empirica, Roma, Carocci.
Sornicola R. (2013), ‘Abbiamo bisogno di una linguistica delle emozioni?’, in Tempesta, I.,
Vedovelli, M. (a cura di), Di linguistica e sociolinguistica. Studi offerti a Norbert Dittmar,
Roma, Bulzoni, pp. 49-76.
Sproat R., Ostendorf M. e Hunt A. (1999), ‘The need for increased speech synthesis
research’, Report of the 1998 NSF Workshop for discussing research priorities and
evaluation strategies in speech synthesis.
Steele J. (1775), En essay toward establishing the Melody and Measure of speech, to be
expressed and perpetuated by peculiar symbol, printed by W. Bowyer and J. Nichols.
Steele, J. (1779), Prosodia rationalis.
Stern, H.H. (1983), Fundamental Concepts of Language Teaching, Oxford: Oxford
University Press.
211
Stockwell Robert P., Bowen J. Donald and Silva-Fuenzalida I. (1956), ‘Spanish Juncture
and Intonation’, in Language, vol. 32, no. 4, pp. 641-665. Linguistic Society of America.
Sweet H. (1878), ‘English and Germanic Philology’, in Transactions of the Philological
Society 1877-9; poi in Sweet H., Collected Papers, 95-140 Oxford: The Clarendon press,
1913.
Sweet H. (1890b), A primer of Spoken English, Oxford: The Clarendon press.
Sweet H. (1892), A manual of current shorthand, orthographic and phonetic, Oxford: The
Clarendon press.
Sweet H. (1893), A primer of historical english grammar. Oxford: The Clarendon press.
Sweet H. (1913), Collected Papers, Oxford, The Clarendon press.
Sweet, H. (1874), History of English sound from the Earliest Period, Including an
Investigation of the General Law of Sound Change, and Full Word Lists, London,Trübner
& Co. (2nd ed. Oxford: The Clarendon press, 1888).
Sweet, H. (1876), 'Word, logic, and grammar', in Transactions of the Philological Society,
1875-6, pp. 470-503; in Sweet H., Collected Papers, 80-94 Oxford: The Clarendon press,
1913.
Sweet, H. (1877a), Handbook of phonetics, Oxford, Clarendon Press.
Sweet, H. (1877b), ‘Presidential address on English Philology and Phonology’ in
Transactions of the Philological Society 1877-9, 1-16; poi in Sweet H. (1913) Collected
Papers, 80-94 Oxford: The Clarendon press.
Sweet, H. (1877c), 'Language and Thought', The Journal of the Anthropological Institute of
Great Britain and Ireland, Vol. 6, pp. 457-482.
212
Sweet, H. (1880), ‘Sound Notation’, in Transactions of philological Society, 1880-1, 177235; poi in Sweet H. Collected Papers, 285-243 Oxford: The Clarendon press, 1913.
Sweet, H. (1890a), A primer of phonetics, Oxford: The Clarendon press.
Sweet, H. (1900), The pratical study of languages, New York: Henry Hold and company.
't Hart J., Collier R., Cohen A. (1990), A perceptual study of intonation: an experimentalphonetic approach to speech melody, Cambridge: Cambridge University Press.
't Hart, J. e Collier R. (1975), ‘Integrating different levels of intonation analysis’ in Journal
of Phonetics, 3, p. 235-255.
Trager, G. L. & Smith, H. L. Jr. (1951), An outline of English structure, Studies in
Linguistics, Occasional Papers, 3. (Washington, American Council of Learned Society;
Norman, Okla, Battemburg Press).
Trubeckoj, N. (1939), Grundzüge der Phonologie, Prague, Travaux du Cercle Linguistique
De Prague, VII; trad. it. Fondamenti di fonologia, Torino: Einaudi, 1971.
Twaddel, W. F. (1935), ‘On defining the phoneme’, in Language Monograph, XVI,
Baltimore: Waverly Press.
Uhmann, S. (1992), ‘Contextualizing relevance: On some forms and functions of speech
rate changes in everyday conversation’, in Auer, P., Di Luzio, A. (a cura di) The
Contextualization of Language, Amsterdam: Benjamins, 297-336.
van Fraassen, B. C (1980), The Scientific Image, Oxford: Oxford University Press; trad. it.
l’immagine scientifica, Bologna: Editrice Clueb, 1985.
Vasco, V. (2012), “Tu chiamale se vuoi emozioni”. Espressione e riconoscimento degli
stati d’animo nel parlato, Tesi di dottorato, Roma «La Sapienza».
213
Venditti, J. J. (1997), 'Japanese ToBI Labelling Guidelines', in Ohio State University
Working Papers in Linguistics, 50: 62-72.
Vladimir, A. (1962), ‘Tone and intonation’, in 4th International Congress of Phonetic
Sciences, Mouton: the Hague, pp. 403 – 406.
Volli, U. (1974), ‘Some possible developments of the concept of iconism’, in Versus , 2,
pp. 14–30.
Volli, U. (1975), ‘Analisi Semiotica della comunicazione iconica’, in Ikon , 95, p.p 159186
Wells, R. S. (1945), ‘The Pitch Phonemes of English, in Language, Vol. 21, n° 1, pp. 2739.
Wells, R. S. (1947), ‘The Intonation of American English by Kenneth L. Pike’, in
Language, Vol. 23, n°3, pp. 255-273.
Wightman, C. W., Shattuck-Hufnagel, S., Ostendorf, M., e Price, P. J. (1992), 'Segmental
Durations in the Vicinity of Prosodic Phrase Boundaries', in Journal of the Acoustical
Society of America, 91: 1707-17.
Wodarz, H. W. (1962), ‘Über syntaktische und expressive Relevanz der Intonation’, in 4th
International Congress of Phonetic Sciences, Mouton: the Hague, pp. 800 – 804.
214
Scarica

La#trascrizione#dell`intonazione.# La#notazione - Padis