F ENOMENI DI ESITAZIONE E DINTORNI: UNA RASSEGNA BIBLIOGRAFICA
(Progetto API - Istituto Universitario Orientale)
a cura di
Claudia Crocco, Renata Savy
0.INTRODUZIONE
Nella lingua parlata occorrono con grande frequenza fenomeni che interrompono il
flusso del parlato rendendolo discontinuo. Tali fenomeni vengono solitamente raggruppati
sotto la dicitura di ‘fenomeni di esitazione’ oppure ‘disfluenze’. Si tratta di vocalizzazioni
solitamente registrate con grafie varie (‘uhm’ eh’ ‘ehm’ ecc.), pause silenti che interrompono
il continuum fonico, oppure anche false partenze e correzioni operate dai parlanti.
Anche nei dialoghi contenuti nel corpus AVIP/API sono presenti fenomeni di
esitazione. Di seguito sono riportati alcuni esempi, tratti dai dialoghi A01 e C02 della varietà
napoletana 1
A01_nG001: <inspirazione> Sara allora c'hai sulla tua sinistra <pb> una figura che
s+/viene definita colibrì.
A01_nG005: #<F004> hai# fatto ? <inspirazione> ora #<F006> prosegui diritto# <pl>
vai diritto <pb> <inspirazione> <pb> e arriva praticamente <pb> al <eeh> all'inizio della figura
fiume <pb> e inizi a risalire verso 'sta figura.
C02_nG003: <inspirazione> <ehm> <pl> <ehm> sc+ <eeh> scendi<ii> <pb> <eeh>
<pb> da <eeh> dal punto di partenza <pl> <eeh> fino <pb> a<aa> <ehm> ce l'hai il punto di
partenza ?
C02_nG015: poi<ii> <ehm> <pb> una linea <pb> orizzontale sotto<oo> <pb> <eeh>
la scri+ <eeh> sotto la<aa> la seconda<aa> <ehm> figura <pl> quella giù
C02_nF028: <inspirazione> allora <pb> <f.vocale> direttamente so+ <pb> allora <pl>
direttamente sotto <pb> al+ <eeh> l+ / la <eeh> linea di partenza c'è il bar diol+ <pb> di Liolà
Come si vede anche solo da questi pochi esempi, le esitazioni o disfluenze sono una
classe di fenomeni eterogenei largamente presenti, che caratterizzano specificamente la lingua
parlata.
In una visione della lingua che dia priorità alla scrittura sulla produzione orale, le
disfluenze possono essere considerate ‘deviazioni’, ‘errori’ commessi dai parlanti, che
testimonierebbero il carattere incerto e instabile del parlato rispetto alla lingua scritta: i
fenomeni di esitazione, infatti, non sono noti alla lingua scritta, nella quale sono presenti
(raramente ed occasionalmente) nella letteratura, per specifiche finalità espressive e creative.
L’assenza dei fenomeni di esitazione nella lingua scritta (a parte le finalità espressive cui
1
Gli esempi riportati sono trascritti secondo le specifiche di trascrizione ortografica stabilite per il progetto
AVIP/API. All’interno di ciascun turno, inoltre, le porzioni di testo contenenti esitazioni di vario genere sono
state trascritte in grassetto.
1
abbiamo accennato) è ovviamente dovuta al fatto che effettivamente questi fenomeni sono
legati alle specifiche modalità di produzione del parlato.
Un approccio allo studio della lingua che non accordi alcuna priorità o eccellenza alla
lingua scritta, ma che riconosca l’importanza e l’indipendenza della lingua parlata, è invece
alla base dell’idea che le disfluenze siano fenomeni importanti e degni di interesse e studio:
essi possono fornire informazioni su cosa effettivamente il parlante fa quando parla. In
quest’ottica, le disfluenze non sono ‘errori’, quanto piuttosto fenomeni normali all’interno
dell’economia del parlato. L’alta frequenza di occorrenza di tali fenomeni, inoltre, ha
suggerito a molti studiosi del parlato la necessità di un’indagine accurata sulla loro natura e le
loro caratteristiche.
I fenomeni di esitazione sono stati oggetto di studi molto diversi. La letteratura
specifica sull’argomento, infatti, investe campi di indagine vari, spaziando dalla fonetica, alla
psicolinguistica, agli studi con finalità teconologico-applicative. Il motivo della poliedricità di
questi studi è legato proprio alla natura del fenomeno indagato. Come abbiamo visto, infatti,
con la dicitura ‘disfluenze’, o ‘esitazioni’ si intendono fenomeni con qualità e caratteristiche
molto diverse, come pause silenti, pause piene, false partenze, riparazioni e altro ancora. Tutti
questi fenomeni, inoltre, possono essere osservati dal punto di vista strettamente foneticoacustico, con attenzione, cioè, alla sostanza fonica attraverso la quale sono realizzati, oppure
possono essere studiati con attenzione al contesto sintattico o prosodico in cui occorrono, o
ancora, come fenomeni legati alla tensione emotiva del parlante in una data situazione. Un
altro campo di interesse scientifico legato al problema dei fenomeni di esitazione è quello
teconologico: ad esempio, gli algoritmi utilizzati per il riconoscimento automatico del parlato,
devono misurarsi con la difficoltà rappresentata dalla presenza nel parlato spontaneo di
disfluenze ed esitazioni.
In una visione ‘purista’ legata ad esigenze di efficienza e ottimizzazione, il compito
principale di questi algoritmi è quello di individuare, isolare ed espungere tali fenomeni da
una rappresentazione formale del parlato, come si evince dai numerosi lavori presenti in
letteratura (ad es.: Heeman e Allen, 1994, Stolcke e Shriberg, 1996) dei quali riportiamo un
breve elenco nella bibliografia generale.
Lo studio dei fenomeni di esitazione si è concentrato spesso sui contesti di occorrenza
delle disfluenze, al fine di utilizzare queste informazioni per ricostruire a posteriori le
condizioni di produzione del parlato. Le rotture nel flusso del parlato, infatti, possono
costituire un valido indice per studiare la struttura del parlato e per testare la validità di ipotesi
e modelli sintattici, prosodici ecc.
Di seguito presenteremo una rassegna bibliografica che, pur non avendo pretese di
esaustività, vuole proporsi come una strumento utile che getti uno sguardo sull’attuale stato
dell’arte nella ricerca sulle disfluenze. La rassegna è articolata per campi di indagine: sono
stati, cioè, trattati insieme studi di argomento simile. Come abbiamo già avuto modo di dire,
infatti, la poliedricità dell’argomento in esame è all’origine di una bibliografia vasta ed
eterogenea, che abbiamo raggruppato per praticità secondo il soggetto di ciascuno studio
citato. Come il lettore avrà modo di notare, alcuni studi investono più aspetti del problema e
pertanto la loro classificazione non è sempre risultata agevole. Nella rassegna essi sono stati
posti nella sezione ritenuta più opportuna, con rimandi alle altre sezioni cui lo studio avrebbe
potuto essere attribuito.
2
1.ESITAZIONI E PIANIFICAZIONE DEL PARLATO : L’APPROCCIO LINGUISTICO.
Il dibattito sulle esitazioni in linguistica va avanti ormai da diversi decenni.
In un lavoro del 1959 Maclay e Osgood 2 hanno fornito (tra l’altro) una classificazione
che individua quattro categorie di fenomeni di disfluenza:
a)
Ripetizioni (repeats) che coprono tutte le ripetizioni semanticamente
non significative;
b)
False partenze (false starts) che comprendono stringhe incomplete o
interrotte che possono essere ricostruite o corrette;
c)
Pause piene (filled pauses) che comprendono tutte le occorrenze dei
dispositivi di esitazione (tipo E, @ 3, ecc)
d)
Pause vuote (unfilled pauses) che sono caratterizzate da un silenzio di
“inusuale lunghezza” e “dall’allungamento non fonetico di fonemi” 4.
Questa classificazione è stata comunemente utilizzata in molti lavori successivi ed è
stata adottata da altri studiosi anche molti anni dopo la pubblicazione di questo studio.
In un articolo del 1965 Donald S. Boomer5 affronta il problema della posizione delle
pause vuote e piene nel discorso legato inglese. Attraverso un’indagine sulla posizione di
occorrenza delle pause, è stata indagata, quindi, la pianificazione del parlato. L’ipotesi
centrale è che le esitazioni, nel discorso spontaneo, cadano nei punti in cui il parlante prende
delle decisioni e opera delle scelte 6: per questo motivo, l’esitazione dovrebbe fornire
informazioni sulla grandezza e sulla natura dell’unità di codificazione del parlato: in
particolare, l’unità di codificazione in questione non sarebbe la parola, ma la frase fonemica.
Se, infatti, l’unità di codificazione fosse la singola parola, le esitazioni dovrebbero cadere più
frequentemente prima delle parole che comportano una decisione difficile, ad esempio nel
caso in cui si ponga al parlante una scelta tra molte alternative. Ipotizzando, invece, che
l’unità di codificazione sia una sequenza di più parole, le esitazioni dovrebbero cadere
prevalentemente nella parte iniziale di tali sequenze.
Si pone quindi un problema circa la definizione della frase fonemica. Questa unità,
infatti, deve essere definita sulla base di un criterio esterno ed autonomo, per le sue
caratteristiche fonologiche e in modo non dipendente dalla presenza vs. assenza delle
esitazioni stesse. La frase fonemica è quindi, nell’opinione dell’autore e in accordo con
Trager e Smith (1951)7, un macrosegmento marcato fonologicamente, che contiene uno ed un
solo accento primario e finisce con una giuntura terminale.
Lo studio, condotto su alcune registrazioni di parlato, valuta l’occorrenza di fenomeni
di pausazione nelle frasi fonemiche, a partire dall’ipotesi che le pause cadano prevalentemente
all’inizio di queste unità. I dati sperimentali hanno fornito un buon sostegno all’ipotesi
dell’autore: le esitazioni, infatti, ricorrono con maggiore frequenza non al principio della frase
fonemica, ma dopo la prima parola della frase. Questo risultato è in contraddizione con
2
Maclay H. Osgood C. E., ‘Hesitation Phenomena in Spontaneous English Speech’, Word, vol.15, 19, 1959.
La trascrizione fonetica è qui resa con l’alfabeto SAMPA.
4
Le pause caratterizzate da silenzio sono a volte anche definite come silent pauses (pause silenti).
5
Donald S. Boomer, ‘Hesitation and grammatical encoding’, Language and Speech 8:148-158, 1965.
6
In lavori precedenti sul problema, come Lounsbury (‘Transitional Probability, Linguistic Structure and Systems
of habit-Family hierarchies’, in C.E. Osgood e T.Sebeok, “Psycholinguistics: a Survey of Theory and Research
Problems” , Beltimora, 1954) si ipotizza che: “Le pause esitative corrispondono ai punti di più alta incertezza
statistica nel succedersi di unità di un dato ordine”. E ancora (ibidem) , che :“le pause di esitazione e i punti di
alta incertezza statistica corrispondano all’inizio delle unità di codificazione”.
7
Trager G. L., Smith H. L., ‚An Outline of English Structure’, University of Oklahoma Press, Norman, 1951.
3
3
l’ipotesi che l’unità di pianificazione sia la parola: poiché le parole ad alta informazione
lessicale tendono a trovarsi verso al fine della frase fonemica, le esitazioni, in un modello
basato sulla parola, dovrebbero cadere piuttosto verso la fine che non all’inizio della frase
fonemica.
Boomer sostiene, quindi, che esista un processo di pianificazione che anticipa pezzi
strutturati di sintassi e significato. Quando si arriva alla giuntura terminale di una frase, la
successiva può essere pronta, e quindi pronunciata senza intoppi, oppure può non essere
ancora definita, e quindi il discorso sarà interrotto fino al completamento dell’unità
successiva. L’interruzione si realizza con una pausa o con un’esitazione. Questo chiaramente
non spiega il fatto che le esitazioni si trovino in ogni parte delle frasi, ma solo che
tendenzialmente esse occorrano dopo il primo confine di parola all’interno della frase
fonemica.
Quanto al significato più propriamente pragmatico delle esitazioni, i dati di Boomer
sembrano offrire sostegno all’ipotesi di Maclay e Osgood (1959), che avevano ricondotto
l’uso di esitazioni tipo “ah” alla necessità del parlante di mantenere il controllo della
conversazione finchè non sia stato raggiunto un certo senso di completezza nell’espressione8.
Tre anni dopo la pubblicazione dell’articolo di Boomer, Henri C. Barik9 pubblicò
alcune riflessioni suscitate dal lavoro di cui abbiamo appena riportato i contenuti principali.
Barik propose alcune riflessioni sul problema sollevato dalle pause di giuntura: un
importante punto del lavoro di Boomer riguardava, infatti, una possibile distinzione di
lunghezza tra le pause di giuntura e quelle di esitazione. Nei dati di Boomer, le pause di
giuntura risultavano essere più lunghe della media, in contrasto con quanto sostenuto da
Lounsbury (1959), secondo il quale le pause poste in giuntura avrebbero dovuto essere più
brevi di quelle di esitazione poiché non corrispondenti a incertezze nella produzione.
Analogamente, Barik ipotizza che, se la pausa di giuntura è priva di funzioni extralinguistica e
serve a delimitare un’unità di parlato già codificata, non sembra giusto sostenere che essa
debba essere più lunga di una pausa che segnala un’operazione di ricerca e di codifica. Le
pause occorrono in una giuntura terminale e funzionano solo come pause di giuntura
dovrebbero essere, pertanto, più brevi delle pause poste all’interno di una frase fonetica. Così,
per spiegare il dato di Boomer, secondo cui le pause di giuntura erano più lunghe di quelle di
esitazione, Barik ipotizza che, in base alla durata, una pausa possa essere distinta in elementi
che indicano esitazione ed elementi che indicano la giuntura. Il componente indicante la
giuntura sarebbe associato alla prima frase, mentre il componente indicante esitazione sarebbe
associato alla seconda. Un problema successivo ma non secondario, riguarda tuttavia, la
possibilità materiale di distinguere, nelle pause che occorrono tra due frasi, tra componenti
che indicano esitazione e componenti di giuntura.
In vari studi Goldman-Eisler (195810,196811) affrontò il problema della grammaticalità
delle pause, distinguendo tra pause grammaticali e pause non grammaticali. Secondo l’ipotesi
8
Il senso di esitazioni tipo “ah” è quindi: “Ho ancora il controllo del discorso, non mi interrompere”. Lallgee et
al., in uno studio del 1969 intitolato ‘An experimental investigation of the function of filled pauses in speech’
(Language and speech 12:24-29), affermano, sulla base dei propri dati, che la teoria di Maclay e Osgood non è
corretta, o che perlomeno essa sia valida solo per il parlato monologico e non per quello dialogico, nel quale
sono utilizzate altre strategie (per esempio alzare la voce) per conservare il controllo del discorso.
9
Henri C. Barik, ‘On defining juncture pauses: a note on Boomer’s “Hesitation and grammatical encoding”’.
Language and Speech 11:156-159, 1968.
10
Goldman-Eisler, F. ‘The predictability of words in context and lenght of pauses in speech’, Language and
Speech, 1:226-231, 1958.
4
avanzata dall’autore le pause grammaticali cadono ai confini di frase, mentre le pause non
grammaticali sono distribuite in modo non prevedibile nel flusso del discorso. Inoltre, nei testi
letti, al contrario di quanto avviene nel parlato spontaneo, quasi tutte le pause cadrebbero in
posizioni grammaticali.
Nel 1971 Eric Brown e Murray S. Miron12 hanno affrontato il problema, connesso ai
risultati di Goldman-Eisler (1968), relativo alla predicibilità dell’organizzazione temporale
delle pause in un testo in inglese americano, di 1537 parole, letto da un professionista. Dai
dati emerse che le pause in testi letti fossero in qualche modo predicibili sulla base di analisi
linguistiche (in particolare sintattiche) oppure stocastiche.
Questo studio ha dimostrato che fino al 64% delle pause in un testo letto può essere
predetto dall’analisi sintattica del messaggio. Le predizioni sintattiche sulla durata e
l’occorrenza delle pause sono consistenti con un’ipotesi relativa al fatto che lettori fluenti
tendono a porre le pause in posizioni grammaticali. Questo è inoltre il primo studio che
investiga sistematicamente l’ipotesi “durazionale” secondo la quale la complessità sintattica
influenza direttamente le manifestazioni concrete della performance.
In un lavoro del 1971 Mark Cook13 ha riconsiderato alcune ipotesi avanzate in
letteratura a proposito dell’inglese. In particolare, l’autore riconsidera in modo critico le
ipotesi di Maclay e Osgood (1959) e quelle di Boomer (1965).
Maclay e Osgood (1959) avevano sostenuto che le pause piene sono segnali del
parlante per indicare che non ha finito di parlare anche se è momentaneamente in silenzio e
che esse occorrono più spesso davanti alle parole lessicali che davanti alle parole funzionali.
Diversamente da quanto sostenuto da Maclay e Osgood (1959), i risultati di Cook
hanno mostrato, tuttavia, che le pause piene tendono ad occorrere in ugual misura davanti alle
parole lessicali e davanti alle parole funzionali. In generale, i dati mostrano che le pause piene
occorrono meno spesso di quanto atteso davanti a nomi, avverbi e verbi, e più spesso davanti
ai pronomi. Infine esse occorrono all’incirca quanto ci si aspettava davanti agli aggettivi.
Inoltre, le pause piene, occorrono più spesso di quanto possa essere attribuito al caso davanti
alle congiunzioni e a parole come well, yes, e no. In altre parole, le pause piene tendono ad
occorrere ad inizio di frase, davanti alla prima, alla seconda o anche alla terza parola.
Comunque non sembrano occorrere particolarmente spesso davanti al verbo della frase.
Tutto ciò concorda con i risultati di Boomer (1965) secondo cui le pause piene
tendono ad occorrere più spesso davanti alla prima o alla seconda parola della frase, piuttosto
che nella seconda parte della frase.
Come abbiamo visto, il lavoro di Cook si pone in netto contrasto con quello di Maclay
e Osgood. Questi autori avevano ipotizzato che le pause piene fossero più frequenti prima di
parole lessicali poiché queste richiedono un maggiore sforzo al parlante. In realtà il lavoro di
Cook punta soprattutto a sottolineare il fatto che parlare è un’attività più complessa del
semplice selezionare parole. Pertanto, il parlante deve compiere più scelte all’inizio della
frase e ciò spiega la più alta incidenza delle pause piene all’inizio della frase. Nonostante ciò,
i dati concordano con Maclay e Osgood nel sostenere una relazione tra le pause piene e
l’attività cognitiva dei parlanti.
11
Goldman-Eisler, F. 1968. Psycholinguistics, Experiments in Spontaneous Speech. Academic Press.
Eric Brown e Murray S. Miron, ‘Lexical and Syntactic Predictors of the Distribution of Pauses Time in
Reading’ Journal of Verbal Learning and Verbal Behaviour 10: 658-667, 1971.
13
Mark Cook, ‘The incidence of filled pauses in relation to part of speech’, Language and Speech, 14/2:135-139,
1971.
12
5
Più recentemente, E. E. Shriberg14 ha condotto uno studio che raccoglie informazioni
generali sulle disfluenze (riempitivi, parole ripetute, forme varie di auto-riparazione) nel
parlato spontaneo di adulti normali parlanti di inglese americano, a partire all’ipotesi che esse
non siano eventi irregolari. La tesi fornisce, quindi, dati che mostrino che, al contrario di
quanto molti hanno ritenuto, le disfluenze hanno tendenze fortemente regolari su varie
dimensioni.
Il metodo include l’analisi di oltre 5000 disfluenze annotate a mano da un database di
250.000 parole che comprende: dialoghi orientati ad un compito di interazione uomomacchina; dialoghi orientati ad un compito di interazione uomo-uomo; conversazione uomouomo su un argomento prescritto.
L’approccio è neutro dal punto di vista teorico ed è fortemente guidato dai dati. Le
annotazioni corrispondono a caratteristiche osservabili (tratti, features) nei dati, includendo:
1)
il dominio di parlato;
2)
il parlante;
3)
la frase in cui occorre la disfluenza;
4)
caratteristiche della disfluenza collegate alla parola;
5)
semplici caratteristiche acustiche della disfluenza.
Sono stati sviluppati, inoltre, una metodologia per rappresentare questi tratti in un
formato database, e un algoritmo per la classificazione automatica del tipo di disfluenza sulla
base di questa rappresentazione.
I risultati mostrano tendenze regolari nelle proporzioni delle disfluenze, per quel che
riguarda la lunghezza, la posizione della disfluenza, la presenza di un’altra disfluenza nella
stessa frase, il tipo di disfluenza e la combinazione di questi tratti sia all’interno di un
parlante, sia tra i parlanti.
Sono state trovate anche regolarità per i tratti della disfluenza connessi alla parola,
incluso il numero di parole troncate, la frequenza delle parole interrotte e l’andamento della
produzione delle frasi.
Ulteriori analisi descrivono le caratteristiche di sovrapposizione delle disfluenze e
delle caratteristiche prosodiche dei tipi più semplici di disfluenza.
Un’analisi comparativa è stata condotta confrontando dati provenienti dai tre tipi di
parlato; dove i risultati fossero rilevanti, sono stati allestiti semplici modelli parametrici.
In conclusione, le disfluenze mostrano regolarità su varie dimensioni. Queste
regolarità possono essere d’aiuto nella costruzione di modelli della produzione del linguaggio
parlato fornendo indicazioni e vincoli. Inoltre, essi possono implementare modelli per
migliorare il processing del parlato spontaneo.
2.L’INTERPRETAZIONE PRAGMATICA DEL RUOLO DELLE ESITAZIONI.
Lo studio dei fenomeni di esitazione ha trovato spazio anche nella letteratura di
argomento linguistico-pragmatico. Vari studiosi si sono interessati della funzione delle
esitazioni nell’economia del discorso, sviluppando a volte modelli della conversazione che
comprendessero le presenza di fenomeni di disfluenza, ma anche indagando il diverso uso
14
Elizabeth E. Shriberg, ‘Preliminaries to a theory of speech disfluencies’, Unpublished PhD Thesis, University
of California, Berkeley, 1994.
6
delle interruzioni in cultura diverse. Di seguito sono riassunti i contenuti di alcuni studi di
questo tipo.
Nel 1981 Adolf E. Hieke 15 ha indagato le esitazioni riscontrabili nel parlato inglese e
tedesco, in uno dei pochi lavori che integrano effettivamente il ruolo delle esitazioni in un
quadro più ampio di tipo pragmatico-funzionalista, che gatta luce sulla ragion d’essere dei
fenomeni di esitazione nel parlato spontaneo.
L’autore ha indagato i fenomeni di esitazione categorizzandoli come errori previsti ed
errori commessi. Gli errori previsti danno luogo, nell’output, al parlato senza errori, mentre
gli errori commessi al parlato con errori.
In corrispondenza della tipologia di parlato con errori commessi, l’autore individua
due categorie maggiori di errore, cioè ritardi e riparazioni. Questa tassonomia, supportata
dall’osservazione di un corpus di lingua inglese e tedesca, rende ragione del ruolo
grammaticale delle riparazioni e dei cambiamenti strutturali che essi causano.
L’obbiettivo primario del parlante è generare un parlato che sia il più possibile
accettabile sia dal punto di vista del contenuto che della forma e, allo stesso tempo,
minimizzare gli errori mentre viene prodotta una frase. Nel caso in cui siano commessi errori,
i parlanti possono fermarsi e correggerli oppure ignorarli e continuare. Le esitazioni, quindi,
fanno parte integrante del processo di produzione del parlato in senso positivo (un punto di
abbastanza diverso da quello che vede opposte da una parte il parlato fluente e dall’altra le
esitazioni). Nell’ottica dell’autore, inoltre, le esitazioni fanno non soltanto parte integrante
della normale fluenza, quando occorrono moderatamente, ma pause ed altre esitazioni
andrebbero considerate fenomeni legati alla buona formazione e non disfluenze, almeno
quando servono come dispositivi utilizzati dal parlante per produrre un parlato più corretto e
senza errori, cioè di alta qualità.
All’inventario delle regole della grammatica, a giudizio dell’autore, andrebbe
aggiunto, quindi, un set di postulati conversazionali. I seguenti tre postulati possono essere
aggiunti alla grammatica che opera in un parlante. Ciascuno di essi ha effetti sul componente
della grammatica indicato tra parentesi:
a)
Produrre stringhe prive di errori (fonologia e sintassi);
b)
Produrre stringhe intelligibili (semantica, lessico, logica,
stilistica, retorica);
c)
Avere il controllo del canale della comunicazione (fluenza, e,
nel parlato dialogico, anche della presa di parola).
Il primo postulato assicura che la grammatica sia applicata per generare un parlato
quanto più è possibile accettabile, mentre il secondo postulato risponde del fatto che le
stringhe siano quanto più è possibile dotate di un significato in un contesto ristretto ma anche
più ampio. Il terzo postulato assicura, oltre al conseguimento degli altri obbiettivi, che il
canale della comunicazione sia impiegato nella maniera più spedita.
Nella tassonomia proposta sia le riparazioni che le false partenze interrompono la
programmazione e richiedono una riprogrammazione. Occorre quindi dividere le ripetizioni in
prospettive e retrospettive. Le prime che hanno funzione anticipatoria, servono come
dispositivo per “guadagnare tempo”, ad es. per una migliore scelta lessicale. Le ripetizioni
retrospettive, a differenza di quelle prospettive, hanno in primo luogo una funzione di ponte
15
Adolf E. Hieke ‘A content processing view of hesitation phenomena’ Language and Speech, 24/2: 147-160,
1981.
7
con i segmenti di parlato che sono stati separati dal resto da intervalli di tempo (pause o
esitazioni).
La tassonomia proposta mantiene i vantaggi di altre, precedentemente elaborate, ma è
più esplicativa. Alcuni aspetti (come le nozioni di prospettivo e retrospettivo), aspettano
comunque ulteriori indagini.
In un lavoro del 1993, Airenti et al.16 hanno delineato le linee generali di uno scambio
dialogico elementare; concentrando l’analisi sugli errori (cioè le disfluenze) nello scambio
dialogico, gli usi ingannevoli della comunicazione e gli usi non espressivi del linguaggio.
Dal punto di vista teorico, il modello presuppone che la teoria dell’uso del linguaggio
sia parte di una teoria riguardante l’interazione umana, che a sua volta dovrebbe conformarsi
ad una teoria generale dell’azione. Le riflessioni contenute nel lavoro di Airenti et alii, quindi,
riguardano la comunicazione (anche non verbale).
L’idea centrale del modello che viene presentato è che la competenza comunicativa
possa essere considerata un metalivello, preposto al controllo delle inferenze basilari veicolate
da rappresentazioni condivise di pattern predefiniti di interazione. La comunicazione, inoltre,
poggerebbe su alcune condizioni mentali che costituiscono i primitivi alla base delle
interazioni.
Il modello è basato su regole, riguardanti le interazioni sociali, che danno accesso alle
struttura della conoscenza. Secondo gli autori, queste regole catturano il componente della
competenza comunicativa. Inoltre, esse non variano con gli individui e (almeno teoricamente)
non possono sbagliare. Le strutture della conoscenza sono invece idiosincratiche e
rappresentano le interazioni sociali dal punto di vista del singolo agente.
La conseguenza di questi assunti è che le strutture della conoscenza sono responsabili
per ogni deviazione dalla comunicazione standard. Le differenze tra individui possono quindi
portare ad errori nella comunicazione.
L’approccio presentato in questo lavoro pone l’accento sulle forti connessioni che
esistono a giudizio degli autori tra le specifiche conoscenze pragmatiche legate ad un dato
compito e la conoscenza generale del mondo. Assumendo che la comunicazione sia
controllata da una struttura cognitiva specifica, chiamata “gioco della conversazione” è chiaro
che bisogna chiamare in causa anche i “giochi comportamentali”, ad es. la conoscenza di
pattern stereotipati di interazione e la conoscenza del mondo. Tutto ciò è coerente con l’idea
che la competenza pragmatica possa essere identificata e descritta da un numero limitato di
regole, idea condivisa in vari modelli dell’interazione umana. Anche se il modello non è del
tutto formalizzato, la classificazione di forme non-standard della comunicazione (errori,
espedienti, inganni) introdotti nel modello, costituiscono un primo passo per integrare in un
modello unitario aspetti della comunicazione normalmente considerati indipendenti.
In uno studio non propriamente relativo al problema delle disfluenze, ma riguardante
più in generale fenomeni di discontinuità nella conversazione, Muraka 17 (1994) affronta il
problema della funzione delle interruzioni all’interno di uno scambio dialogico. Le
interruzioni sono classificate dall’autore e divise in due tipi principali:
a)
cooperative (con cui si suggerisce una parola o un’espressione
all’interlocutore);
16
Gabriella Airenti, Bruno G. Bara, Marco Colombetti, ‘Failures, explotations and deceits in communication’,
Journal of Pragmatics 20:303-326, North Holland, 1993.
17
Kumiko Muraka, ‘Intrusive or co-operative? A cross-cultural study of interruption’. Journal of Pragmatics 21:
385-400, 1994.
8
b)
intrusive (reali interruzioni dovute a vari motivi).
Le interruzioni intrusive sono state ulteriormente divise in tre subcategorie in base al motivo
dell’interruzione:
a)
cambi di topic;
b)
presa di parola;
c)
disaccordo.
Il punto centrale dello studio riguarda la relazione tra frequenza e tipo di interruzioni e
la sua variazione in funzione della cultura di provenienza dei parlanti.
Confrontando lo stile conversazionale inglese e giapponese, l’autore nota differenze
relative al valore sociale attribuito all’interruzione nelle due culture. Nelle interazioni tra
madrelingua inglesi o giapponesi viene adottato lo stile conversazionale proprio della lingua e
della cultura dei parlanti. Tuttavia, nel caso in cui un parlante giapponese (lingua nella quale
le interruzioni intrusive sono meno frequenti che in inglese) parli in inglese, questi può
produrre più interruzioni intrusive, ad esempio per adattarsi allo stile conversazionale della
lingua target.
L’autore sottolinea, quindi, l’importanza della conoscenza delle strategie
conversazionali proprie di una data lingua,poiché l’ignoranza di tali stili conversazionali può
comportare malintesi ed errate valutazioni sulle abilità e sulla personalità dell’interlocutore.
In uno studio di Clark (1994)18, il problema delle disfluenze è incluso in un modello di
descrizione della conversazione come cooperazione volta alla risoluzione di eventuali
problemi attraverso apposite strategie. I problemi che possono sorgere nel corso di una
conversazione sono in primo luogo dei problemi “collettivi”, che riguardano, cioè tutti i
partecipanti, i quali sono tenuti a gestirli insieme. Gli interlocutori hanno tre tipi di strategie
per gestire tali problemi:
1)
possono prevenire i problemi prevedibili ed evitabili;
2)
possono avvertire gli interlocutori dei problemi prevedibili ma
inevitabili;
3)
possono riparare i danni che si sono già verificati.
In quest’ottica, i parlanti possono coordinare:
1)
l’articolazione da parte di un interlocutore e l’attenzione dei destinatari;
2)
la presentazione di un’espressione da parte di un interlocutore e
l’identificazione di questa espressione da parte dei destinatari;
3)
il significato trasmesso dall’interlocutore e la comprensione di tale
significato da parte dei destinatari.
In ultimo, il parlante propone al suo interlocutore un progetto da realizzare insieme, e
ciò richiede un’ulteriore coordinazione. La conversazione è quindi frutto di una coordinazione
tra parlanti che cooperano a più livelli per far procedere la conversazione senza errori, ovvero
riparando quelli che si sono già verificati.
A proposito delle pause piene, l’autore riporta un dato (da Smith e Clark, studio allora
in preparazione) dal quale si evince che i parlanti producono pause del tipo “uh” e “um”
piuttosto spesso dopo pause vuote. “Um” viene usata più frequentemente di “uh” quando i
parlanti prevengono pause successive. Comunque, i parlanti usano “um” e “uh” per avvertire
l’interlocutore della grandezza dell’interruzione che stanno prevenendo.
Normalmente si ritiene che una conversazione comporti la capacità da parte dei
parlanti di trattare i problemi che possono sorgere, tenendoli sotto controllo e risolvendoli nel
18
Herbert H. Clark, ‘Managing problems in speaking’, Speech Communication 15:243-250, 1994.
9
caso in cui si verifichino. L’autore ritiene una definizione di questo eccessivamente generica,
poiché, in primo luogo, essa trascura la dimensione collettiva nella conversazione, in virtù
della quale i parlanti affrontano insieme i problemi che possono sorgere. In secondo luogo, i
parlanti non si limitano a riparare gli errori, ma tentano di prevenirli oppure avvertono
l’interlocutore nel caso in cui i problemi siano inevitabili. La riparazione, quindi, è l’ultima
strategia a disposizione dei parlanti, che preferiscono utilizzare altre risorse, per prevenire i
problemi o avvertire della loro inevitabilità l’interlocutore.
Di particolare interesse, a causa del materiale su cui è stato condotto, è uno studio di
Branigan et al.19 relativo all’influenza di fattori non linguistici sulla frequenza di occorrenza
della disfluenze. Analogamente al materiale di cui è costituito il corpus AVIP/API,
nell’ambito del quale è stata compiuta la presente ricerca bibliografica, il corpus utilizzato
studio di Braningam et al. è, infatti, composto da dialoghi in inglese elicitati con la tecnica del
Map Task (corpus HCRC).
Nella conduzione dello studio, gli autori hanno valutato le seguenti variabili:
a)
sesso del parlante e dell’interlocutore;
b)
ruolo conversazionale;
c)
abilità nel guidare l’interlocutore;
d)
familiarità con l’interlocutore;
e)
pratica nello svolgimento del compito;
f)
contatto visivo.
Le disfluenze sono state classificate nel modo seguente:
a)
basic types: ripetizioni, cancellazioni, inserzioni, sostituzioni;
b)
non basic types: combinazioni di questi tipi e tipi complessi;
c)
reparandum: parole che devono essere rimosse per rendere fluente il
parlato.
L’analisi verte sulla valutazione della frequenza di disfluenza (numero di disfluenze
per 100 parole) e gli scarti (numero di parole da sostituire per 100 parole che il locutore
intende realizzare) in una serie di confronti intra e inter-parlante. La frequenza delle
disfluenze è stata calcolata come numero di disfluenze per 100 parole che il locutore intende
realizzare. La frequenza degli scarti è calcolata come numero di reparandum per 100 parole
che il locutore intende realizzare.
I risultati suggeriscono che questi fattori non linguistici influenzino effettivamente la
fluenza del parlante, anche se la loro influenza può manifestarsi attraverso complesse
interazioni con altri fattori, e in alcuni casi può essere soltanto apparente.
Dai risultati emerge anche una notevole variabilità inter-parlante. Inoltre la fluenza del
parlato sembra essere influenzata da molti fattori non linguistici:
a)
Le donne presentano meno disfluenze degli uomini quando possono
vedere l’interlocutore, anche se, in generale, il sesso dell’interlocutore non ha effetti
sulla fluenza.
b)
I Giver presentano più disfluenze dei Follower. Questa differenza non
sembra attribuibile semplicemente alla lunghezza delle frasi prodotte.
c)
Il ruolo nella conversazione ha effetti sul tipo di disfluenze prodotte: la
frequenza delle ripetizioni non differisce tra Giver e Follower, ma il Giver produce in
proporzione più inserzioni e sostituzioni e meno cancellazioni del Follower.
19
Braningan, Lickely, Mc Kelvie ‘Non linguistic influences on rates of disfluency in spontaneous speech’,
ICPhS’99, 1999.
10
d)
I parlanti hanno esibito una frequenza di scarti più alta (in proporzione,
un maggior numero di parole che fanno parte di una reparandum) parlando ad un
interlocutore familiare. La familiarità, tuttavia, non ha effetti sulla frequenza delle
disfluenze.
e)
I parlanti hanno prodotto più ripetizioni quando non potevano vedere
l’interlocutore. La condizione di contatto visivo, tuttavia, non ha mostrato effetti
stabili sulla frequenza di disfluenza e scarto in generale.
f)
I Giver hanno prodotto meno ripetizioni la seconda volta che hanno
eseguito il compito. La pratica nel compito, tuttavia, non ha mostrato effetti stabili
sulla frequenza di disfluenza e scarto in generale.
Come si vede, i risultati mostrano che i fattori non linguistici non sortiscono un effetto
uniforme sulla fluenza. Molti effetti, inoltre, non hanno reale rilevanza statistica. Ancora, i
risultati mostrano che i fattori non linguistici esibiscono interazioni complesse. Non si
devono, dunque, attendere effetti semplici e immediati sulla fluenza legati all’azione di fattori
non linguistici.
Uno studio sull’inglese, in parte di carattere pragmatico, ma concentrato specialmente
sulle possibilità applicative di tipo didattico della ricerca sulle pause piene è quello condotto
da R. L. Rose20. Secondo l’autore21 i fenomeni di esitazione possono essere descritti secondo
una tassonomia che individua quattro macrocategorie di esitazione, e cioè:
-false partenze;
-ri-partenze;
-pause;
-allungamento di parole.
Le pause a loro volta possono essere suddivise in vuote (silenti) e piene. Le pause
piene possono essere lessicalizzate o non lessicalizzate.
Rose analizza sistematicamente un piccolo corpus di parlato spontaneo. Il risultato
principale della ricerca è la distinzione tra pause piene chiuse e aperte, cioè pause piene che
terminano o meno con una nasalizzazione. Dai dati emerge, infatti, che il comportamento di
queste due categorie di pause piene è indipendente.
Le pause piene, inoltre, avrebbero anche la funzione pragmatica di attenuare le
asserzioni, in conformità con la ben documentata utilità che esse hanno nel ridurre l’impatto
di una risposta sfavorevole o non preferita in una coppia adiacente.
La principale applicazione dello studio di Rose è di tipo didattico: i risultati del
presente studio, integrati con quelli di precedenti ricerche, hanno prodotto specifiche
raccomandazioni teoriche e pratiche per l’uso delle pause piene in contesti di ELT (English
Language Teaching). Nel corso delle lezioni, infatti, gli insegnanti possono suggerire
implicitamente agli studenti (parlanti non nativi di inglese) di avvantaggiarsi dal tempo di
pausa dell’interlocutore per processare l’input precedente, oppure di utilizzare le pause piene
come strumento per aumentare l’impressione di fluenza, evitando i silenzi nel tempo
impiegato per pensare. In questo modo gli studenti potrebbero apparire più fluenti, suonando
più simili ai parlanti nativi.
20
Ralph Leon Rose, ‘The communicative value of filled pauses in spontaneous speech’, Unpublished Master’s
Thesis, University of Birmingham, 1998.
21
Si veda il sito del FPRC – Filled Pauses Research Center, curato da Rose stesso.
11
3.LE ESITAZIONE NEL PARLATO SPONTANEO E NEL PARLATO LETTO .
Altri studi si sono concentrati sul problema delle esitazioni (in particolare delle pause)
nei testi letti.
Nel 1989 Gunnar Fant e Anita Kruckenberg22 hanno pubblicato un studio, che pur
riguardando in modo marginale il problema delle pause in testi di parlato letto e parlato
ritmico, contiene alcuni punti importanti, relativi ai dati raccolti dagli autori sul timing delle
pause.
In particolare, gli autori affermano che la proporzione globale pause/parlato è un
parametro che varia da parlante a parlante in un range compreso tra il 15% e 30%.
Il problema della percezione e della produzione delle pause in testi letti ad alta voce in
svedese è invece centrale in un lavoro del 199123 di Eva Strangert, che analizza poi, con
particolare attenzione, i correlati acustici delle disfluenze e la loro distribuzione.
Lo studio, che utilizza come materiali testi letti lentamente, a velocità normale e
velocemente, ha mostrato che l’uso di testi letti ad alta voce limita il numero delle esitazioni,
e che la distribuzione delle esitazioni stesse nei testi letti a voce alta è legata alla presenza di
confini sintattici.
Dal punto di vista acustico, i correlati più stabili delle esitazioni includono, oltre al
silenzio, nei casi in cui è presente, l’allungamento prepausale, reset di f0 e irregolarità nella
qualità della voce.
Inoltre, l’autrice ha riscontrato alcune correlazioni tra la presenza di confini sintattici,
e la tipologia di pause. Infatti, maggiore è il rango del confine sintattico, maggiore è la
probabilità che la pausa occorra. Le correlazioni sussistono non solo tra distribuzione e
sintassi, ma anche sul piano acustico: i dati mostrano che quanto più è alto il rango del
confine sintattico, tanto più marcati e vari sono i correlati acustici della pausa.
Un dato ulteriore riguarda la relazione tra incidenza di pause e velocità di lettura:
quanto più è lenta la lettura, tanto più sono risultate frequenti le pause. I dati mostrano anche
che il legame con la sintassi è presente tanto nella produzione quanto nella percezione delle
pause. Per quel che concerne le produzione, l’intervallo di silenzio presente nella pausa
riflette il rango del confine sintattico. Dal punto di vista della percezione, invece, le pause
silenti vengono chiaramente percepite, e il silenzio sembra essere il correlato acustico più
forte.
In un altro studio di argomento simile, Strangert (1993) 24 conduce un’indagine sulla
distribuzione e la posizione di occorrenza delle pause in tre stili diversi di parlato svedese:
monologhi spontanei, lettura non professionale, lettura professionale.
Le pause occorrono in tutti e tre gli stili nelle seguenti posizioni:
1)
nei monologhi spontanei: ai confini sintattici, prima di parole piene, in
altre posizioni;
2)
nella lettura non professionale: ai confini sintattici;
3)
nella lettura professionale: ai confini sintattici, prima di parole piene.
22
Gunnar Fant e Anita Kruckenberg, ‘Preliminaries to the study of Swedish prose reading and reading style’
STL-QPSR 2/1989, Dept. of Communication and Music Acoustics, KTH.
23
Eva Stangert, ‘Pausing in texts read aloud’, ICPhS’91, 4:238-241, 1991.
24
Eva Strangert, ‘Speaking style and pausing’ PHONUM (Reports from the Dept. Of Phonetics, University of
Umeå): 121-137; 1993.
12
Nel parlato spontaneo, che differisce molto dagli altri due tipi per modalità di
pianificazione e produzione, la libertà e la frequenza di occorrenza delle pause riflette
difficoltà nella pianificazione. Nel parlato spontaneo e in quello non professionale, il maggior
numero di pause occorre in corrispondenza dei paragrafi. Nel caso del parlato letto da
professionisti (notiziari), la necessità di dare l’informazione rapidamente fa sì che le pause
siano estremamente ridotte.
Oltre alle pause silenti, l’autrice individua anche altri tipi di pausa/esitazione, quali:
-pause costituite da inserzione di vocali;
-rallentamento della velocità d’eloquio;
-calo di f0 (caratteristica delle pause esterne ad una frase in tutti e tre gli stili di
parlato).
-glottalizzazioni e altre irregolarità del voicing.
In conclusione, in generale nei tre stili di parlato analizzati le pause sembrano essere
largamente dipendenti dalla sintassi, e le loro manifestazioni riflettono il rango del confine
sintattico i corrispondenza del quale occorrono.
Come si vede i risultati di questo secondo studio coincidono in parte con quelli del
primo, avvalorando l’ipotesi secondo la quale i fenomeni di esitazione sono ampiamente
correlati alla sintassi.
Un ulteriore studio che contiene dati interessanti sulla posizione delle pause è quello,
pubblicato nel 1998 da Petra Hansson25. Si tratta di uno studio che, a partire dai dati
disponibili in letteratura, affronta il problema della distribuzione delle pause e dei principali
correlati acustici ad esse associati, nello svedese parlato spontaneo.
Le pause nel parlato spontaneo hanno una distribuzione più libera rispetto a quella che
si trova nel parlato letto. Tale distribuzione non è tuttavia casuale. Le pause nel parlato
spontaneo, infatti, occorrono per la maggior parte:
a) tra frasi;
b) dopo marche discorsive e congiunzioni;
c) prima di parole piene accentate.
Una delle funzioni attribuibili alla prosodia è quella di strutturare il linguaggio parlato
(Bruce G., 1998 26) ed infatti, un modo di marcare i confini tra unità coerenti di parlato è
inserire delle pause. La segmentazione del flusso di parlato a mezzo di pause non è, però,
importante soltanto per la percezione, ma è importante anche dal punto di vista della
produzione, e.g., perché le pause consentono a chi parla di respirare, pianificare la frase e
scegliere le parole (Goldman-Eisler, 197227). Così, se le pause nel parlato letto sembrano
coincidere per lo più con i confini sintattici (Strangert E., 1991), le pause nel parlato
spontaneo hanno una distribuzione meno soggetta a restrizioni (Gårding, 1967 28; Strangert E.,
1993).
Dai dati di Hansson, ricavati dall’analisi di un monologo in lingua svedese, si evince
che un confine di frase non sembra essere, nel parlato spontaneo, una posizione obbligatoria
per le pause. Sebbene si tratti del confine sintattico in cui le pause occorrono con maggiore
25
Petra Hansson, ‘Pausing in spontaneous speech’ , Proceedings FONETIK 98 Dept. Of Linguistics, Stockholm
University, pgg. 158-161,1998.
26
Bruce G., ‘Allmän och svensk prosodi’, Praktisk lingvistik, 16, Department of Linguistics and Phonetics, Lund
University, 1998.
27
Goldman-Eisler, F. 1972 Pauses, clauses, sentences. In Language and Speech 15: 103-13.
28
Gårding E., ‘Prosodiska drag i spontant och uppläst tal’, in Holm G. (ed.) Svenskt talspråk, 40-85. Stockholm:
Almqwist & Wiksell.
13
frequenza nel materiale analizzato, infatti, solo il 57% del numero totale delle frasi analizzate
sono precedute da pause. D’altro canto, il fatto che le pause occorrano frequentemente dopo
marche discorsive potrebbe anche costituire un riflesso della pianificazione delle frasi.
Spesso le pause non sono vuote ma si accompagnano a correlati acustici, quali:
a)
allungamento prepausale;
b)
inserzione di vocoidi;
c)
cambi nella qualità della voce;
d)
pattern specifici di f0;
e)
abbassamento graduale dei valori dell’intensità
f)
glottalizzazioni (normalmente combinate con un calo in f0 e
nell’intensità).
I fenomeni di esitazione, che spesso occorrono congiunti ad intervalli di silenzio e
all’inserzione di vocoidi, sono percepiti anch’essi come pause. In parecchi casi, inoltre, la
ripetizione di una parola dà all’ascoltatore l’impressione della presenza di una pausa, a
dispetto dell’assenza di correlati acustici.
Le misure condotte sulle pause vuote mostrano che le pause poste prima di confini di
frase e dopo marche di discorso, che presumibilmente riflettono la pianificazione della frase
sono più lunghe delle pause poste prima delle parole accentate, che riflettono il processo di
ricerca di una parola importante operato dl parlante. Non c’è, inoltre, una differenza
significativa tra durata delle pause sintatticamente motivate e durata della pause non
sintatticamente motivate.
Sulla base delle differenze nei profili di f0 associati alle pause, infine, si può fare una
distinzione tra pause che segnalano confini prosodici e pause che occorrono senza spezzare la
coerenza prosodica della frase.
4.STUDI SULLA QUALITÀ ACUSTICA DELLA DISFLUENZE.
In questo paragrafo sono riportati i risultati principali di alcuni studi che hanno avuto
come oggetto la qualità acustica delle esitazioni. Altri dati interessanti in proposito sono stati
riportati nel paragrafo relativo agli studi sulle esitazioni in diversi stili di parlato (Strangert
1991, 1993; Hansson 1998).
In uno studio di Duez29 viene investigata acusticamente la frequenza durata e
distribuzione delle pause in francese, in 3 stili di parlato: interviste politiche (PI), interviste
spontanee (CI) (classificate come appartenenti al parlato spontaneo) e discorsi politici (PS).
Lo scopo di questo lavoro è l'analisi dettagliata in ciascun tipo di testo ed il confronto
tra i diversi stili per arrivare a stabilire la possibile funzione stilistica delle pause, a partire da
uno sfondo teorico costituito dai lavori pionieristici di Goldman-Eisler 1968, Grosjean e
Deschamps 1973 30, Boomer 1965, Ruder and Jensen 1972 31, Barik, 1968.
L'assunto di partenza è che non è possibile attribuire un'unica funzione ad una pausa:
una pausa può avere diverse funzioni e al contempo una stessa funzione può essere realizzata
29
Danielle Duez, ‘Silent and non-silent pauses in three speech styles’, Language and Speech, 25/ 1: 11-28, 1982.
Grosjean F., Deschamps A. ‘Analyse des variables temporelles du français spontané’, Phonetica, N° 28:191226,1973.
31
Ruder, K. F., Jensen, P. J., ‘Fluent and Hesitation pauses as a function of sintactyc complexity’, Journal of
Speech and Hearing Research, 15:49-60, 1972.
30
14
attraverso diversi tipi di fenomeni di esitazione (pausa silente, pausa piena, falsa partenza,
ripetizione, allungamento sillabico, o qualunque combinazione delle precedenti).
Sono stati calcolati i seguenti parametri:
Total Speech Times
(TST);
Total Articulation Times
(TAT);
Total Pause Times
(TPT);
Total Time of Silent Pause
(TTSP);
Total Time of Non-silent Pause
(TTNP);
Il TAT corrisponde alla somma delle durate dei segmenti fonici che contengono
informazioni semantiche;
il TTSP corrisponde alla somma delle durate delle pause silenti;
il TTNP corrisponde alla somma di tutti gli altri segmenti fonici non classificabili
come sopra.
Il TPT è dato dalla somma di TTSP+TTNP. Le pause silenti e non-silenti sono definite
e classificate secondo il seguente criterio:
Silent pause: ogni intervallo nella traccia oscillografica in cui l'energia totale è
indistinguibile da quella del rumore di fondo.
Filled pause: ogni occorrenza delle interiezioni di esitazione francesi come “eu”,
“oe”, “n”, ecc.
False start: ogni sequenza di segmenti intesi come inizio del successivo enunciato
ma interrotta e rimpiazzata da un'altra che viene portata a compimento.
Repeat:
ogni ripetizione non intenzionale di una sequenza fonica
riprodotta successivamente nella sua forma completa (si tratta di ripetizioni
anticipatorie).
Lengthened syllable: ogni sillaba nella quale la vocale e/o la
consonante sono prolungate in maniera abnorme.
Articulated sequence:ogni sequenza di segmenti fonici (escluse pause
piene, false partenze e ripetizioni) delimitata da due pause silenti.
E’ stata studiata anche la distribuzione sintattica delle pause silenti, in accordo alla
loro durata e alla loro tipologia. Le pause sono state suddivise come segue, in base alla
posizione di occorrenza:
- interna al sintagma;
- tra sintagmi;
- tra clausole.
Il primo dato importante che emerge da quest'analisi è la grande variabilità
interindividuale sia nella frequenza delle pause che nella loro durata.
Questa variazione interindividuale è di norma maggiore di quella rilevabile nel
passaggio da uno stile di parlato ad un altro. Tuttavia alcune differenze significative tra i tre
stili in esame emergono chiaramente.
Innanzitutto si osserva la totale assenza di pause non-silenti nel PS, mentre nel PI e nel
CI esse sono presenti e dovute al carattere di 'improvvisazione' del parlato. Al contrario, nel
PS sono assai più frequenti e lunghe, rispetto agli altri due stili, le pause silenti che hanno il
compito proprio di escludere i tempi di esitazione e di enfatizzare le idee e gli argomenti.
In generale, il numero e durata maggiore di pause silenti si ha dunque nel PS, mentre il
numero e durata maggiore di pause piene si ha nel CI e la velocità di articolazione maggiore si
ha nel PI.
15
Per quanto riguarda la distribuzione sintattica dei tipi di pause si confermano
sostanzialmente i risultati precedenti di Grosjean e Deschamps (1975) e di Goldman-Eisler
(1972).
Le pause silenti che occorrono a confine di clausola sono più frequenti e più lunghe di
quelle che occorrono al confine di sintagma ed entrambe di quelle che occorrono all'interno di
un sintagma.
Le prime due, tuttavia, sono più frequenti nel PI che nel mentre nel PS più formale il
43% circa dei confini tra costituenti minori (sintagmi) coincide con una pausa ed il 79% dei
confini di costituenti maggiori (clausole) è segnalato dalla presenza di pausa.
Anche la durata delle pause tra costituenti (maggiori o minori) mostra distribuzione
simile in PI e CI, mentre in PS queste pause tendono ad essere significativamente lunghe. La
differenza è difficile da spiegare soprattutto perché si tratta di situazioni di parlato diverse; ad
ogni modo sembra che si possa dire che alcune delle pause lunghe, soprattutto quelle tra
sintagmi, del PS hanno una funzione stilistica.
La durata e la frequenza delle pause interne a sintagma sono simili per i due tipi di
parlato da intervista (PI e CI); l'interpretazione che se ne dà è che queste pause silenti
costituiscono un tipo di esitazione nel CI, mentre hanno una funzione stilistica nel PI, quella
di costituire un evento inatteso e quindi attirare l'attenzione dell'interlocutore o enfatizzare la
parola o l'argomento che segue.
Negli stili di parlato più informali (PI e CI), quindi, sono più frequenti i fenomeni di
esitazione (pause non-silenti), e frequenza e durata delle pause silenti mostrano distribuzioni
più o meno simili. La maggior parte di queste pause silenti sono brevi o medie e tendono ad
occorrere alle giunture tra costituenti sintattici, ma la loro presenza non è, presumibilmente
legata a fattori grammaticali: esse, cioè, non hanno lo scopo di facilitare la comprensione,
bensì servono per pianificare on-line, mentre si parla. Sono anche abbastanza frequenti le
pause all'interno di sintagma che per il CI hanno carattere di esitazione, mentre per il PI hanno
funzione stilistica di straniamento, espressiva di rafforzamento dell'argomentazione e
prosodica di messa in rilievo di certe parti della stringa.
Nello stile di parlato più formale e controllato (PS) sono praticamente assenti i
fenomeni di esitazione. Inoltre, le pause silenti hanno frequenza e durata piuttosto alte e
costituiscono una caratteristica saliente di questo stile di parlato, tanto che, nonostante
l'assenza di fenomeni di esitazione il tempo di pausa totale è il 50% in più rispetto agli altri
stili. Queste pause occorrono essenzialmente al confine tra costituenti sintattici e tendono ad
essere in accordo con la struttura grammaticale, rendendo più facile e spedita la decodifica,
mentre poco frequenti sono le pause interne ai costituenti che hanno, eventualmente, una
funzione stilistica.
Le ipotesi avanzate in questo lavoro necessitano, secondo l’autrice, di una verifica
percettiva, ovvero di un'indagine sul giudizio soggettivo in merito a lunghezza, frequenza ed
effetto delle pause silenti, nonché della loro funzione prosodica (si vedano gli altri lavori di
Duez analizzati in questa rassegna).
O'Shaughnessy32 ha condotto uno studio sui restart (ripartenze o false partenze) in
inglese, definiti come interruzioni del flusso del parlato in cui il parlante reitera una porzione
della stringa immediatamente precedente con o senza cambiamenti lessicali.
Il fenomeno può andare dalla ripetizione di una sillaba a quella di più parole. Nel caso
di cambiamenti lessicali (cambi di progetto), questi possono riguardare tanto la sostituzione di
32
Douglas O'Shaughnessy, ‘Analysis of false start in spontaneous speech’, Proceedings of ICSLP-92: 931-934,
1992a.
16
una nuova parola al posto di una parola intera o interrotta precedente, quanto l'inserzione di
una parola in una sequenza che conterrà quindi la nuova parola in una seconda occorrenza.
Lo scopo del lavoro è fondamentalmente quello di evidenziare dal punto di vista
acustico aspetti dell'intonazione dei restart che possono fungere da indici di identificazione
per un sistema di riconoscimento automatico del parlato: tale sistema dovrà individuare,
isolare ed espungere una versione di ciascuna parola o porzione di parola ripetuta e, nel caso
di sostituzione lessicale, ogni parola o porzione presente, ma rifiutata e sostituita dal parlante.
Prima di presentare i dati dell'analisi, l'autore offre una panoramica dei precedenti
studi sulle false partenze, esigui soprattutto dal punto di vista dell'analisi acustica (Heike,
1981; Levelt, 1989 33; Grosjean e Deschamp 1973; Shriberg et al. 1992 34).
Risulta importante, in particolare, il sunto dei dati di Shriberg et al. 1992 con i quali
l’autore opera continui confronti: si tratta di un lavoro volto all’individuazione e correzione
automatica delle false partenze, nel quale risulta che il 10% delle sequenze di un testo parlato
ha fenomeni di ripartenza: il 59% di essi è costituito da ripetizioni di una sola parola, il 24%
da ripetizioni di due parole, il resto a decrescere. Nell’uso di un algoritmo che lavora sul solo
testo, la percentuale di errore nell’individuazione dei restart si mantiene alta (intorno al 23%)
e si producono falsi allarmi nel 38% dei casi; l’inclusione di un modello linguistico porta
invece all’85% di individuazioni.
Lo studio è condotto su un corpus di interazioni uomo-macchina, prodotto da parlanti
adulti maschi e femmine.
I risultati delle analisi svolte sul materiale mostrano che, nella semplice ripetizione di
parola quest’ultima dovrebbe avere ipoteticamente gli stessi parametri di durata e pitch in
entrambe le occorrenze, tuttavia vi sono diversi casi in cui risulta deaccentata (ha cioè pitch
più basso e durata minore). Sono emersi da questo studio anche alcuni altri dati importanti,
che riporteremo analiticamente di seguito.
Innanzitutto, se una parola viene interrotta in un qualche suo punto, è presente una
pausa nell’85% circa dei casi; circa ¾ delle parole interrotte, inoltre, non arriva a completare
la prima sillaba (la parola viene interrotta grosso modo dopo la prima consonante) ma si
attesta grosso modo sempre intorno ad una durata di circa 100ms. Quando, invece, si verifica
una pausa al confine di parola, la parola ripetuta dopo la pausa è caratterizzata da due tipi di
condizioni: o una ripetizione con pochi cambi prosodici o una ripetizione con accorciamento
di durata della parola di circa il 50%.
Nel caso di sostituzione o inserzione di nuova parola nella sequenza, la parola
sostituita o inserita ha durata notevole e f0 molto pronunciata solo se apporta nuova
informazione semantica, altrimenti, se ridondante, questo non accade.
Le parole funzionali che precedono la ripetizione hanno spesso un calo di f0 ma non di
durata; le parole piene che precedono la ripetizione subiscono invece un notevole
accorciamento insieme al calo di f0, a meno che non siano seguite da pausa, nel qual caso
subiscono l’allungamento prepausale.
In questo studio è stato, inoltre, testato un algoritmo di individuazione automatica che
lavora sul parametro durata (individuando come restart tutti i casi con presenza di una pausa
breve, inferiore di 400ms) che ha dato risultati di corretta individuazione nel 75% dei casi e
35% di falsi allarmi.
33
Levelt, W. J. M., Speaking: from intention to articulation. Cambridge, MA: MIT Press, 1989.
Shriberg, E., Bear J, Dowling J., ‘Automatic Detection and Correction of Repairs in Human-Computer
Dialogue’. DARPA Speech and Natural language Workshop. Arden House, N. Y., 6 pages, Feb. 1992.
34
17
Si ipotizza un miglioramento di questo algoritmo con l’inclusione di due modalità di
analisi:
1) l’analisi di f0 nelle adiacenze della pausa breve (sempre primo indice del restart)
2) l’analisi delle caratteristiche spettrali delle sequenze adiacenti la pausa, alla ricerca
della ripetizione totale o parziale. Questa seconda ipotesi diventa però difficilmente
perseguibile nel caso di sostituzione o inserzione di nuovo elemento lessicale, cioè nel caso di
cambio di progetto.
Un altro studio dello stesso autore 35, che verte principalmente sul problema del
riconoscimento automatico delle pause, pur rimandando al precedente in molte sue parti,
inserisce, tuttavia, degli interessanti ampliamenti delle analisi relative alla pause piene e
vuote. Di seguito sono riportati solo i dati relativi a questa parte di ampliamento delle analisi.
Nel riconoscimento automatico delle pause vuote, il problema principale consiste
nell’evitare la confusione con le fasi di silenzio di foni ostruenti: la distinzione è tutta nella
durata: le fasi di silenzio delle consonanti occlusive, infatti, non durano più di 40ms, mentre
le pause silenti a confine di unità sintattica si attestano su una media di 490/500ms, quelle
interne ad unità sintattica, intorno ai 270ms.
Le pause piene somigliano, invece, a parole molto brevi del parlato fluente. La
distinzione in questo caso coinvolge durata, timbro e pattern di f0. In particolare,
- le pause piene al confine di costituenti sintattici maggiori hanno durate
variabili tra 200 e 500ms; quelle interne a tali costituenti variano tra 170 e 350ms;
- le pause piene non grammaticali possono essere precedute da una pausa vuota
breve (intorno ai 350ms); quelle grammaticali sono precedute da un silenzio ampio,
sempre maggiore di 275ms che tende a crescere (fino a 700ms) se la pausa piena che
segue è breve, e ad accorciarsi se la pausa piena che segue è lunga;
- il pattern spettrale della pausa piena è di norma uniforme per tutta la sua
durata, simile a quello di uno schwa, a volte seguito da un segmento nasale o nasalizzato;
- tutte le pause piene hanno, infine, un pattern discendendente (se si trovano al
confine sintattico) o piatto su valori assoluti molto bassi (se si trovano dentro costituente
sintattico) di f0; tutte terminano con una f0 al di sotto del 15% del range del parlante.
Uno altro studio di carattere propriamente fonetico-acustico è stato pubblicato nel
1993 da Schriberg e Lickely36.
Gli autori hanno analizzato due corpora piuttosto difformi di inglese di Inghilterra e
d’America: il corpus di inglese di Edimburgo, infatti, è più spontaneo di quello di inglese
americano.
Lo studio mostra che la f0 delle pause piene interne ad una clausola non è casuale, ma
dipende dal contesto prosodico precedente: i picchi di f0 più alti, infatti, sono
sistematicamente connessi ai valori più alti all’interno delle pause piene. Tale relazione tra
contesto prosodico precedente e comportamento della f0 nelle pause piene può essere
descritta, sia nell’inglese d’America che in quello d’Inghilterra, attraverso un modello lineare
35
Douglas O'Shaughnessy, ‘Locating disfluencies in spontaneous speech: an acoustical analisys’, Proceedings of
European Conference On Acoustics on Speech Communication and Technology, 3:2187-2190, 1992b.
36
Elizabeth E. Schriberg, Robin J. Lickely ‘Intonation of clause-internal filled pauses’, Phonetica, 50:172-179,
1993.
18
nel quale la caduta del pitch è proporzionale alla distanza tra il valore del precedente picco di
f0 e la baseline stimata per il parlante.
Questo modello, che utilizza un solo parametro (valore della f0 del picco), è, per
accuratezza delle previsioni, non molto distante da modelli che utilizzano un numero
superiore di variabili indipendenti. Tuttavia, il modello è risultato meno efficiente per le pause
piene che seguono picchi iniziali di frase.
I risultati suggeriscono inoltre che l’intonazione nelle pause piene sia indipendente da
variabili temporali.
Anche altri studi successivi di Robin Lickely37 hanno illustrato diversi importanti
risultati sulla percezione delle pause e la loro qualità acustica.
Lickely (1994) analizza, attraverso cinque esperimenti, la percezione da parte di
parlanti normali delle disfluenze nel parlato spontaneo. Il principale risultato dei primi tre
esperimenti riguarda il fatto che le disfluenze (le riparazioni) vengono riconosciute molto
presto, in genere entro la prima parola successiva al punto di interruzione. Inoltre, il
riconoscimento della disfluenza avviene anche prima che la prima parola successiva alla
disfluenza venga essa stessa riconosciuta, e ciò indica che non vengono utilizzate da parte del
parlante informazioni di carattere sintattico. Gli ultimi due esperimenti confermano l’ipotesi
che l’informazione prosodica possa essere usata per distinguere le disfluenze dalle produzioni
fluenti.
In un capitolo apposito l’autore presenta poi i risultati di un’analisi acustica dettagliata
condotta sul materiale utilizzato per gli esperimenti.
L’indagine acustica interessa le pause, il pitch, il ritmo, le glottalizzazioni e i fenomeni
di giuntura, in prossimità delle disfluenze presenti negli stimoli utilizzati per gli esperimenti.
Pur avendo rilevato alcuni indici che potrebbero guidare l’ascoltatore al
riconoscimento precoce delle disfluenze, Lickely suggerisce che questi indici non debbano
essere sopravvalutati, poiché la loro importanza può essere legata all’alta qualità del segnale,
che li rende chiaramente udibili: in condizioni di interazione naturali questi stessi indici non
sarebbero chiaramente udibili. E’ tuttavia chiaramente udibile un arresto tra le parole nel
punto di interruzione in cui gli indici sono stati rilevati. La presenza di una pausa in un posto
dove essa non sia prevedibile su base sintattica o prosodica è essa stessa un segno di
disfluenza, anche se non è necessariamente un segnale di una successiva riparazione.
L’autore ha ipotizzato che il reset di f0 potesse fungere da indice affidabile, per gli
ascoltatori, della presenza di disfluenze. I risultati, tuttavia, non mostrano evidenze
incontrovertibili in tal senso.
L’indice più stabile delle discontinuità sembra, in conclusione, essere nelle pause e
nell’assenza di collegamenti fonologici, nei casi in cui la struttura sintattica e quella prosodica
prevedrebbero dei collegamenti. Questi indici, comunque, sono definibili solo in termini di
distinzione tra ciò che i parlanti si aspettano nel parlato fluente e ciò che occorre nelle
riparazioni, ma non possono essere definiti in termini di proprietà assolute e isolabili. Dove
una riparazione consiste in una partenza completamente nuova di una frase, la prosodia
iniziale di forse è identificata come il più ovvio tra gli indici intonativi di una riparazione.
Altri indici intonativi possono essere utili, in combinazione con le informazioni ritmiche, ma
sono necessari, per rilievi di questo tipo, ulteriori studi su un campione più ampio.
Altri lavori dello stesso autore sono trattati nella sezione relativa agli studi sulla
percezione (§5).
37
Robin J. Lickely, ‘Detecting Disfluencies in Spontaneous Speech’, Unpublished PhD Thesis, University of
Edinburgh, 1994.
19
In uno studio sul tedesco del 1995, A. Batliner et al. 38 presentano un'analisi statistica e
i risultati di una classificazione automatica delle pause piene presenti nel corpus Verbmobil
.Viene inoltre discussa la rilevanza di differenti parametri prosodici nel marcare i diversi tipi
di pause piene.
Innanzitutto è stata operata una distinzione e classificazione preliminare delle pause
piene in due tipologie:
Hesitations (FPHs):
dovute ad esigenze di pianificazione, presa di turno e
tratti idiosincratici del parlante. Queste hanno la stessa funzione delle pause vuote e
degli allungamenti vocalici o consonantici in fine parola.
Cue phrases (FPRs):
ripetizioni o riparazioni di parole e sintagmi, ripartenze
di costruzioni sintattiche. Queste hanno funzione equivalente a parole come “no”,
“cioè”, ecc.
Gli autori sottolineano come le FP possano essere indicatori di diversi tipi e gradi di confine
tra costituenti. Pertanto devono essere collegate a diversi parametri prosodici.
Il corpus è costituito da dialoghi Map Task raccolti nelle località di Munchen e
Karlsruhe, divisi in un totale di 2422 turni (339 minuti di parlato) e prodotti da 56 parlanti
femmine e 81 parlanti maschi.
Nella trascrizione di questi dialoghi le FP hanno avuto le seguenti 4 notazioni: <äh>,
<ähm>, <hm>, <häs>.
Non sono state notate differenze nella presenza e distribuzione delle FP tra maschi e
femmine.
Le FPH sono state divise in:
FPHstrong: quelle che si presentano ad inizio turno o al confine tra
costituenti sintattici principali
FPHweak:
quelle che occorrono ai confini di parole, di sintagmi o di
costituenti prosodici intermedi deboli.
Le FPH forti si distinguono da tutte le altre (FPH deboli e FPR) perchè hanno pause
silenti adiacenti piuttosto lunghe e sillabe adiacenti meno intense, proprio perché si trovano ai
confini di costituenti sintattici maggiori.
Le FPR si distinguono dalle altre (FPH deboli e forti) in base ai parametri di energia e
f0. Normalmente l'energia sulle sillabe adiacenti è minore che nelle FPH e f0 tende ad avere
un movimento di tipo falling sulla sillaba che precede e di tipo rising su quella che segue;
quindi, mediamente, esse si trovano in una sorta di valle melodica.
In generale, al confronto con sillabe di controllo, il parametro significativo che aiuta a
distinguere (automaticamente) le FP è la durata. Inoltre f0 è bassa e tende ad avere un pattern
discendente. Ciò rende le FP prosodicamente simili alle frasi parentetiche.
M. Pätzold, A. Simpson39 hanno condotto un’indagine sul tedesco, allo scopo di
verificare se le esitazioni (definite come sillabe comprendenti una vocale, eventualmente
seguita da una nasale bilabiale (tipo “uh”, “uhm”), prodotta da un parlante in punti critici e
problematici della stringa), dal punto di vista della loro realizzazione, appartengano o meno
allo stesso sistema fonologico sul quale si costruiscono gli items lessicali. A questo scopo è
38
A. Batliner, A Kießling, S. Burger, E Nöth, ‘Filled pauses in spontaneous speech’, ICPhS'95, .3: 472-475,
Stockholm, 1995.
39
M. Pätzold, A. Simpson, ‘An acoustic analysis of hesitation particles in German’, ICPhS'95, 3: 512-515,
Stockholm, 1995.
20
stata pertanto effettuata un'analisi spettrale delle porzioni vocaliche di particelle di esitazione
e una comparazione con le porzioni vocaliche di items lessicali.
Le analisi sono state condotte su 3 parlanti, utilizzando materiale del Kiel corpus
(interno al progetto Verbmobil).
Sono state analizzate F1 ed F2 intorno al punto centrale della porzione analizzata.
Le vocali 'lessicali' scelte per il campione di controllo sono: [E], [A], [«], ed [Œ]; la
vocale delle esitazioni è stata trascritta come [Î] convenzionalmente, anche se questo simbolo
non rappresenta direttamente la qualità fonetica. Poiché le vocali delle esitazioni sono di
norma molto più lunghe di quelle degli items lessicali sono state scelte solo vocali lessicali
con durata maggiore di 80ms.
Dalle analisi è risultato in primo luogo che c'è una forte variabilità interindividuale
nella qualità vocalica delle esitazioni: la vocale è una vocale sempre centrale, ma con diversi
gradi di altezza.
Il confronto con le vocali di controllo, tuttavia, mostra che per tutti e tre i parlanti i
valori di F1 ed F2 delle vocali delle esitazioni sono molto diversi da quelli delle vocali
lessicali.
Dai dati emersi dalle analisi, gli autori concludono che, poiché la porzione vocalica
delle esitazioni differisce fortemente da quella delle vocali lessicali, si può supporre che esse
siano foneticamente correlate ad un sistema fonologico diverso da quello degli items lessicali.
Gli autori, inoltre, sottolineano un problema metodologico: dal momento che le
esitazioni sono prosodicamente prominenti, esse avrebbero dovuto essere paragonate a vocali
in sillabe prominenti, cioè a vocali toniche. Questo è stato però possibile solo per [E], [A],
dato che [«] ed [Œ] compaiono solo in posizione atona. Inoltre, per trovare una [«] con durate
paragonabili alle altre, sono stati selezionati solo foni in fine di stringa.
Le proprietà acustiche delle ripetizioni sono state studiate da Shriberg in un lavoro
sull’inglese del 199540.Le ripetizioni vengono suddivise in due categorie a seconda della loro
funzione (cfr. Heike, 1981, discusso a pg. 12):
Ripetizioni prospettive: caratterizzate dalla presenza di una pausa dopo entrambe le
occorrenze della parola (R1 e R2) o almeno dopo la seconda occorrenza (R2); esse servono a
'mantenere il campo' durante l'esitazione.
Ripetizioni retrospettive: caratterizzate dalla presenza della pausa solo dopo la prima
occorrenza (R1) della parola; esse servono da ponte per connettere la continuazione con ciò
che c'è prima dopo una rottura della fluenza.
La questione centrale riguarda la possibilità di rintracciare delle caratteristiche
acustiche di queste ripetizioni che le differenzino dalle altre pause piene. Allo scopo di
rispondere a questo quesito sono stati analizzati items estratti dal corpus Switchboard,
costituito da conversazioni telefoniche di 6 parlanti maschi.
Sono stati valutati i seguenti parametri:
- durata di R1 ed R2;
- valori di f0 all'onset e offset di R1 ed R2.
Nel corpus sono presenti entrambi i tipi di R, cioè tanto quella retrospettiva, quanto
quella prospettiva, ma con frequenze di occorrenza molto diverse. Le prospettive
rappresentano il 10% delle ripetizioni, mentre le retrospettive ben il 90%.
Per quanto riguarda le durate, dal rapporto R1/R2 si evince che:
40
E.E. Shriberg, ‘Acoustic Properties of disfluent repetitions’, ICPhS'95, 4: 384-387, Stockholm,1995.
21
- per le R prospettive si può avere tanto R1>R2, quanto R2>R1, con una leggera
prevalenza del secondo caso.
- per le R retrospettive, invece, si ha sempre R1>R2, con differenze di durata
notevoli.
Il nodo centrale dell’indagine, alla luce di questi dati, riguarda la possibilità di
considerare questi casi vadano considerati come allungamenti di R1 o di accorciamenti di R2.
Ad un'indagine con parole di controllo presenti nel discorso fluente, risulta che si tratta di
durate particolarmente fuori norma per R1, che subisce quindi degli allungamenti. Questo
quadro ben si adatta alla funzione di 'ponte', di collegamento che questo tipo di ripetizioni
svolge.
L'allungamento di R2 sembra invece collegato alla funzione di 'stallo' della R
prospettiva.
Per quanto riguarda la frequenza fondamentale:
- nelle R retrospettive f0 mostra un pattern discendente tra onset e offset sia in R1
che in R2. L'onset di R2 tende a riprendere valori pari a quelli dell'onset di R1, mentre
l'offset di R2 non raggiunge gli stessi valori in basso dell'offset di R1, forse a causa della
ridotta durata di R2. (Questo corrisponde bene all'ipotesi di Levelt e Cutler (1983)41, che R2
ha gli stessi parametri del materiale che rimpiazza)
- nelle R prospettive (per le quali, tuttavia, si hanno solo pochi dati preliminari)
sembra che il pattern di f0 sia discendente nel passaggio da R1 a R2: l'onset di R2 è più
basso dell'offset di R1. Questo pattern accomuna del tutto le R prospettive alle pause piene,
di cui condividono già la funzione di 'stallo'.
5.I FENOMENI DI DISFLUENZA NELLA PERCEZIONE DEL PARLATO
Esitazione e disfluenze sono state oggetto di indagine anche da parte degli
psicolinguisti: esse possono, infatti, dare informazioni molto utili sui meccanismi di
produzione e percezione del parlato.
In uno studio del 1979, Bernd Voss 42 ha condotto un’indagine sui problemi percettivi
di parlanti non nativi dell’inglese. La percezione sembra essere il risultato di un confronto tra
le proiezioni dell’ascoltatore e l’informazione acustica in entrata. Da questo lavoro non
emergono sostanziali differenze tra i meccanismi di percezione dei parlanti nativi e non nativi,
mentre i fenomeni di esitazione sono fonte di problemi di percezione per i parlanti non nativi.
Lo studio di Voss vuole fornire una risposta (pur provvisoria) alla domanda se ci siano
differenze nei meccanismi di percezione di parlanti nativi e non nativi. Voss prende le mosse
da un studio di Laver (1970, pg.73)43 in cui si sostiene che “la percezione […] regolarizza e
idealizza, in qualche modo, il parlato”. L’ipotesi usata per spiegare quest’osservazione è che
la percezione del parlato non è solo un processo di identificazione dei segmenti della catena
parlata, ma è piuttosto un processo di confronto tra la ricostruzione operata dall’ascoltatore e
l’informazione acustica in entrata. Non è necessario, quindi, per il processo di percezione
dell’ascoltatore, ricostruire le difficoltà di performance (come esitazioni e errori) del parlante.
41
Levelt, W. J. M., Cutler, A., ‘Prosodic marking in speech repair’, Journal of Semantics, 2/2:205-217, 1983.
Bernd Voss Hesitation phenomena as sources of perceptual errors for non-native speakers Language and
Speech, vol.22, Part 2, 1979.
43
Laver, J., The production of Speech, in Lyons, 1970: 53-75.
42
22
L’implicazione insita in tale affermazione è che la percezione dipende dalla capacità
dell’ascoltatore di compiere il processo di ricostruzione descritto. Questo compito, se non crea
problemi ai parlanti nativi, può dare difficoltà ai parlanti non nativi, che, ad esempio per
imperfezioni del proprio ‘sistema generativo’, dipendono più strettamente dall’informazione
acustica. E’ stata quindi verificata l’ipotesi secondo cui le esitazioni possono essere fonte di
errori di comprensione per i parlanti non nativi.
Il compito sperimentale affidato ai soggetti parlanti non nativi di inglese era di
trascrivere il più correttamente possibile un brano di parlato spontaneo.
In fase di trattamento dei dati i fenomeni di esitazione sono stati classificati (secondo
Maclay e Osgood, 1959) in ripetizioni, false partenze, pause piene e pause vuote.
Dagli errori di interpretazione delle disfluenze emerge che il pattern ritmico delle frasi
è un elemento stabile: in particolare è stabile il numero degli accenti percepiti,
indipendentemente dal numero di sillabe realizzate.
Di particolare interesse, inoltre, sono alcuni errori caratterizzati dal fatto che gli
ascoltatori cercano di ricostruire alcuni aspetti della forma fonologica anche a spese del senso.
La strategia di percezione, in questi casi mostra di preferire in casi di dubbio un criterio
fonologico piuttosto che semantico. Ciò avviene tanto per i parlanti non nativi quanto per i
parlanti nativi.
Infine, un terzo degli errori rilevati sono errate interpretazioni di esitazioni. In
particolare:
a)
una pausa può essere interpretata come una parola (o parte di una parola);
b)
una parola (o una sua parte) può essere interpretata come una pausa piena. In
questo caso la presunta pausa è stata filtrata e non considerata nell’interpretazione
della stringa.
In senso generale, Voss nota il fatto che gli ascoltatori talora sentono più di quanto non
sia stato effettivamente detto. Questo supporta l’idea che la percezione sia un processo di
confronto tra le attese dell’ascoltatore e l’informazione acustica in entrata.
Per quel che concerne l’uso di diverse strategie percettive da parte di parlanti nativi vs.
non nativi, i dati mostrano che gli errori di percezione nei parlanti non nativi hanno una
andamento simile a quello dei parlanti nativi, anche se l’alto numero di errori connessi alle
esitazioni suggerisce che esse presentino una maggiore difficoltà percettiva per i parlanti non
nativi che ascoltano parlato spontaneo.
L’importanza delle pause nella percezione è sottolineata anche in uno studio di Reich
(1980)44. Già Goldman-Eisler (1968) aveva messo a fuoco il fatto che le pause possono essere
usate per facilitare la produzione, analogamente a quanto Aaronson (1968)45 rilevava per la
percezione del parlato.
Lo studio di Reich prende le mosse dalla distinzione operata da Goldman-Eisler (1958,
1968) tra pause grammaticali e pause non grammaticali (cfr. §1), dove per pause grammaticali
si intendono quelle che occorrono tra le clausole e che sono usate per la pianificazione
strutturale e semantica a lungo termine nella produzione del parlato, mentre le pause non
grammaticali sono quelle che occorrono all’interno delle clausole e hanno a che fare con la
selezione a brevissimo termine di una parola. Questa distinzione trova sostegno nel fatto che
le pause grammaticali sembrano essere associate ad un processing di tipo diverso rispetto alle
44
Schuli S. Reich, ‘Significance of Pauses for Speech Perception’, Journal of Psycholinguistic Research,
9/4:379-389, 1980.
45
Aaronson D. ‘Temporal course of perception in an immediate recall task’, J.Exp. Psycol. 76:129-140,1968.
(citato in Reich, 1980).
23
pause non grammaticali. Partendo da questa posizione, si attende che le pause tendano ad
interferire col processamento del parlato: lo scopo del lavoro di Reich, infatti, è di esaminare
gli effetti della disposizione delle pause sulla percezione delle frasi. Nel primo esperimento è
stato utilizzato un compito di categorizzazione semantica, mentre nel secondo esperimento è
stato utilizzato un compito di richiamo alla memoria di frasi precedentemente ascoltate dai
soggetti.
Sebbene le pause non sembrino avere effetti sulla velocità con cui le parole nelle frasi
sono individuate (esperimento I), hanno tuttavia un considerevole effetto sulla velocità e
l’accuratezza con cui le frasi sono ricordate (esperimento II). Questi risultati sono simili a
quelli ottenuti da Aaronson (1968) e sono anche inscrivibili all’interno del modello della
percezione del parlato proposto dalla Aaronson stessa, anche a dispetto di alcune differenze
nelle strategie di percezione che i parlanti sembrano adottare. Tali differenze sono
probabilmente riconducibili al tipo di esperimento dal quale provengono i dati dei due autori.
Sebbene il compito di classificazione semantica (esperimento I) non è stato
influenzato in modo significativo dalla posizione delle pause, la complessità strutturale della
frase ha notevoli effetti sul compito stesso.
In conclusione sembra possibile dire che in condizioni di sovraccarico cognitivo nel
processamento uditivo, le pause possono giocare un ruolo di vitale importanza nella scelta
della strategia e di conseguenza nel livello della performance. Come le pause sono cruciali
per facilitare il parlato fluente e complesso, così lo sono altrettanto nel mettere l’ascoltatore in
grado di comprendere la complessità di una frase.
Alcuni studi sia sull’aspetto percettivo sia sull’aspetto acustico delle pause sono stati
condotti da Duez (1985, 1990; per uno studio di carattere propriamente acustico vedi §4).
Lo studio del 198546 indaga la percezione delle pause silenti in tre stili di parlato in
lingua francese (discorsi politici, interviste di argomento politico ed interviste casuali). Ai
soggetti è stato richiesto di identificare le pause silenti (definite come “interruzioni del flusso
di parlato”) in campioni di parlato naturale, di parlato con spettro invertito e di parlato
sintetico, concentrandosi esclusivamente sulla percezione delle pause, senza prestare
attenzione al significato delle stringhe che erano state loro sottoposte. Queste condizioni non
naturali di percezione, costituiscono in qualche modo un limite nella procedura sperimentale.
In fase di analisi dei dati, le pause sono state suddivise, in base alla posizione sintattica
in cui sono state individuate dagli ascoltatori, in:
a) Pause poste al confine di frase.
b) Pause poste al confine di clausola.
c) Pause poste al confine di costituenti.
Per ciascuna pausa sono state condotte misure acustiche relative alla durata, alla
frequenza fondamentale e all’intensità. Per quel che concerne la durata sono stati misurati gli
allungamenti vocalici, mentre le misure di intensità e frequenza sono state normalizzate.
Sono stati identificati, infine, anche fenomeni di esitazione quali pause piene, false
partenze, ripetizioni e strascinamenti della voce.
Infine, i dati provenienti dalle analisi dei vari tipi di parlato sono stati posti a
confronto.
La percezione delle pause è risultata simile nel parlato normale e nel parlato che ha
subito un’inversione spettrale. Questo dato pone l’accento sull’importanza della struttura
46
Danielle Duez, ‘Perception of silent pauses in continuous speech’, Language and Speech, 28/4:377-389,1985b.
24
prosodica, poichè dai dati risulta che, nel 70% dei casi, essa ha la stessa influenza sulla
percezione delle pause di una struttura linguistica completa.
Le differenze tra i dati provenienti dai due tipi di parlato possono, quindi, essere
attribuite al contesto. I parlanti tendono a non percepire le pause inattese, come quelle poste
all’interno dei costituenti o quelle che si accompagnano ad un’esitazione. Tuttavia queste
pause sono identificate più facilmente nel parlato con spettro invertito, dove non ci sono
interferenze di carattere sintattico-semantico. Nel parlato sintetico tutte le pause sono
identificate con maggiore faciltà, indipendentemente dalla loro reale durata. In questo caso,
infatti, l’individuazione delle pause è un compito psicoacustico che non coinvolge nessuna
abilità di carattere linguistico.
La durata sembra essere un parametro essenziale nella percezione delle pause, poiché
l’identificazione di una pausa sembra correlata alla sua durata. La durata di una pausa
interagisce con i parametri acustici che caratterizzano la vocale precedente, e l’influenza di
questi parametri sembra crescere al decrescere della durata della pausa.
L’autrice prospetta, infine, un più ampio studio sulle strutture ritmiche, in cui si
investighi con particolare attenzione l’interazione della durata di una pausa con il contesto
acustico in cui essa si trova.
Nello studio del 199347, sempre sul francese, sono state analizzate quelle pause che,
pur essendo percepite negli esperimenti, non corrispondono a pause vuote, e che sono state
chiamate dall’autrice pause soggettive.
Con procedura analoga a quella adottata per gli esperimenti del 1985, nel primo
esperimento sono stati utilizzati stimoli provenienti da parlato spontaneo, presentati in due
versioni, una non modificata ed un’altra in cui è stato invertito lo spettro. Gli stimoli, presi da
discorsi ed interviste (casuali e di argomento politico) ad uomini politici francesi sono stati
sottoposti a 10 soggetti (5 uomini e 5 donne) di madrelingua francese. Ai soggetti è stato
richiesto di premere un bottone ogni volta che avessero percepito una pausa (definita come
interruzione nella frase).
In fase di analisi dei dati, una pausa è stata definita come tale nel caso in cui fosse
percepita da due soggetti (o da uno solo, ma in ambedue le modalità di presentazione del
materiale) e non fosse associata ad un confine sintattico immediatamente precedente o seguita
da una consonante occlusiva.
Le posizioni sintattiche delle pause, rilevate dai dati, sono le seguenti:
1)
tra frasi;
2)
tra clausole;
3)
tra sintagmi;
4)
all’interno di un sintagma.
Sono state, inoltre, misurate la durata, la frequenza e l’intensità di ogni pausa. Le pause non
silenti sono state classificate come segue:
1)
Pause piene: occorrenze di “interiezioni” come: eu, euh, n.
2)
False partenze: ogni sequenza di segmenti, con cui il parlante
intende cominciare una frase, interrotta e rimpiazzata da un’altra sequenza poi
completata.
3)
Ripetizioni: ogni sequenza ripetuta e completata.
4)
Sillabe allungate: ogni sillaba con una vocale o una consonante
lunga in modo abnorme.
47
Danielle Duez ,’ Acustic Correlates of Subjective Pauses’, Journal of Psycholinguistic Research, 22/1:21-39,
1993.
25
I dati provenienti dai due tipi di materiale non sono stati analizzati separatamente poiché non
sono state rilevate differenze significative.
I risultati ottenuti concordano con quelli provenienti dallo studio condotto dalla stessa
Duez nel 1985, dal quale era emerso che la percezione delle pause silenti interagisce
principalmente con le vocali ed in particolare con la loro durata.
Nel secondo esperimento ai 10 soggetti sono state sottoposte 5 repliche di due frasi
prodotte da un parlante francese di sesso maschile, addestrato a non produrre pause silenti. La
procedura è analoga a quella dell’esp.1. Anche in questo caso sono state prese misure
acustiche di durata, frequenza ed intensità. Dai risultati emerge che, al crescere della durata
della vocale target, cresce la frequenza di percezione della pausa. Non sono stati rilevati
effetti sistematici legati alle variazioni di f0 e intensità. Questo dato mostra che la struttura
temporale ha un ruolo predominante rispetto al pattern di f0 e di intensità nella percezione
delle pause.
I risultati degli esperimenti sottolineano l’importanza dell’allungamento segmentale
(ed in particolare vocalico) sul numero delle pause soggettive. Questo allungamento può
corrispondere alla presenza di una pausa non silente. Il legame esistente tra le pause non
silenti e le pause soggettive è stato poco indagato. Nella maggior parte dei casi le pause
soggettive sono provocate dall’allungamento di una vocale che è dovuto, a sua volta, alla
realizzazione di un confine sintattico. Questo dato conferma la presenza di un legame tra la
struttura temporale di una frase e la sua struttura sintattica.
L’allungamento finale è un fenomeno fondamentale nella percezione e nella
produzione del parlato e può essere fisiologicamente determinato. Inoltre, la vocale allungata
funge da marca di confine e il grado di allungamento indica l’importanza del confine. Un
fenomeno simile è stato studiato relativamente alla declination e al reset di f0.
Dal punto di vista percettivo, una durata lunga può svolgere la funzione di una pausa.
La quantità di allungamento necessaria perché sia percepita una pausa dovrebbe essere
approssimativamente pari alla durata di un suono.
Da questo studio, l’allungamento finale sembra essere l’indice più stabile nella
percezione di una pausa soggettiva.
D’Urso e Zammuner (1990)48 hanno invece affrontato, in uno studio sull’italiano, il
problema della la predicibilità della durata delle pause poste tra due turni (domanda e
risposta): si tratta di uno studio in cui l’analisi percettiva è congiunta e posta in relazione con
l’analisi pragmatica. Sono stati condotti a riguardo due esperimenti:
1) Alcuni soggetti hanno valutato la lunghezza di pause aventi una durata
compresa tra i 3 e i 7 secondi e poste tra domande e risposte, nella loro lingua
madre ed in una lingua non nota. Gli stessi soggetti hanno anche valutato la
lunghezza di pause poste in sequenze di rumore bianco.
2) Alcuni soggetti hanno condotto un’intervista telefonica con una persona
addestrata a ritardare artatamente la risposta ad alcune delle domande poste. La
variabile dipendente era l’ammontare di tempo che l’intervistatore aspettava la
risposta prima di prendere nuovamente spontaneamente la parola.
In ambedue gli studi la lunghezza della pausa percepita o ritenuta accettabile tra una domanda
e una risposta varia in funzione di fattori linguistici e in funzione della conoscenza
48
Valentina D’Urso e Vanda Zammuner, ‘The perception of pause in question-answer pairs’, Bulletin of the
Psychnomic Society, 28/1: 41-43, 1990.
26
enciclopedica. I risultati sembrano riflettere una regola del linguaggio che collega il ritmo
della presa di turno e l’ammontare del lavoro mentale che, plausibilmente, è necessario per
rispondere ad una domanda.
Gli autori ritengono necessario lo sviluppo di un modello che tenga in conto i processi
mentali coinvolti nella presa di turno e che possa spiegare i pattern temporali.
In questo studio si tratta principalmente di come il contenuto di due turni adiacenti
influenzi la lunghezza di una transizione accettata prima del secondo turno. In particolare, le
misure riguardano la durata reale e quella soggettiva degli intervalli intercorrenti tra domanda
e risposta. L’ipotesi principale è che tale lunghezza vari con la complessità del contenuto del
discorso. In generale, la complessità del contenuto dovrebbe aiutare a determinare la durata
della pausa, poiché è proporzionale all’ammontare del lavoro mentale richiesto per processare
l’informazione portata da una frase.
Gli autori ipotizzano che le parti “vuote” siano a tutti gli effetti parti costituenti del
dialogo, e che, ceteris paribus, una pausa abbia valore e significato in funzione della sua
durata e della sua posizione nel flusso del discorso.
I risultati mettono l’accento sull’esistenza di un regola temporale implicita nella
conversazione, alla quale i soggetti aderiscono, che impone che una pausa di dimensioni
eccessive sia percepita come deviante e venga pertanto corretta. Lo stesso fenomeno
evidenzia la necessità di una descrizione del meccanismo di presa di turno anche in termini di
processo di inferenza. Questo meccanismo ha a che fare con l’ammontare di conoscenze
necessarie attivate prima dell’inizio di un turno e con i processi mentali interni attribuiti al
parlante successivo. Così, la durata della pausa ritenuta accettabile e tollerata
dall’interlocutore, dipende dal tipo di domanda posta, cioè dalle caratteristiche del contenuto
della domanda. Inoltre, la regola stabilisce che, se una domanda non ottiene risposta entro il
tempo massimo ritenuto appropriato in funzione del suo contenuto, sia necessario un segnale
per evitare un danneggiamento nell’interazione.
In un lavoro del 1995, derivato da quello precedente del 1994 (vedi§ 4), Lickely49
presenta alcuni risultati ottenuti da un esperimento svolto su un corpus di parlato spontaneo
olandese. Ai soggetti è stato chiesto di individuare delle disfluenze confrontando una
trascrizione con il nastro che stavano ascoltando. I risultati mostrano che molte disfluenze
sfuggono all’ascoltatore anche quando quest’ultimo stia cercando di individuarle. Sembra,
infatti, che gli ascoltatori umani siano dotati della capacità di filtrare molte disfluenze prima
di dare inizio al processamento lessicale o sintattico, evitando i problemi che incontrano i
modelli computazionali di comprensione del parlato.
Un dato rilevante emerso da questo studio è che l’individuazione delle pause è
risultata più facile tra le frasi che non nelle frasi. L’autore ipotizza che le pause piene tra le
frasi possano essere più prominenti dal punto di vista acustico, oppure che il processamento
cognitivo affidato all’ascoltatore potrebbe essere più facile tra le frasi e consentirebbe di
accordare una maggiore attenzione al compito di individuazione delle pause.
Nel 1996, Lickely50 ha pubblicato un lavoro, che rappresenta uno sviluppo e un
completamento ei precedenti, incentrato principalmente sull’analisi di fenomeni di giuntura
nei casi in cui non c’è una chiara pausa silente nel punto di interruzione. In questo studio
viene avanzata un’ipotesi di tipo fonologico per rendere conto della impossibilità di
individuare un tratto acustico sulla base del quale distinguere continuazioni fluenti vs.
disfluenti.
49
50
Robin J. Lickely, ‘Missing Disfluences’, ICPhS‘95, 4: 192-195, Stockholm, 1995.
Robin J. Lickely, ‘Juncture cues to disfluency’ (Proceedings of the ICSLP, Philadelphia, 1996.
27
In questo studio, pertanto, viene avanzata un’ipotesi relativa ad un altro tratto
fonologico del parlato che possa fungere da indicatore affidabile per le disfluenze, in special
modo per quelle situate nel mezzo di una clausola in assenza di pausa.
Secondo Lickely nel parlato fluente, le parole sono separate l’una dall’altra da pause,
oscurate da processi di assimilazione, elisione, ecc. L’ipotesi è che questi fenomeni di
giuntura siano bloccati dalla disfluenza. Alcuni esperimenti di percezione mostrano poi che
questo fenomeno può essere usato dagli ascoltatori per un’individuazione precoce delle
disfluenze: di centrale importanza è, quindi, il modo in cui i parlanti/ascoltatori riescono a
individuare le disfluenze, e il momento in cui ciò avviene.
In un precedente esperimento di gating era stato dimostrato che le disfluenze possono
essere riconosciute molto presto, subito dopo l’inizio della riparazione, anche prima che la
prima parola della riparazione possa essere riconosciuta. Questo vuol dire che non le
indicazione sintattiche o semantiche, ma altre indicazioni guidano l’ascoltatore nel
riconoscere un utterance disfluente.
La maggior parte degli stimoli del corpus utilizzato non hanno pause all’interno. Gli
stimoli sperimentali, infatti, erano stati studiati per valutare se le disfluenze (senza pausa)
blocchino il processo fonologico di connessione delle parole nella frase. Analisi acustiche sui
vari indici possibili per il riconoscimento precoce delle disfluenze non hanno dato indicazioni
nette. Le glottalizzazioni, il pitch, le pause, non sono indici che forniscono indicazioni
univoche.
I dati sperimentali avvalorano, quindi, l’ipotesi secondo cui i fenomeni di giuntura che
normalmente sono presenti nel parlato fluente sono, invece, assenti nel caso di parlato
disfluente. Gli esperimenti suggeriscono l’assenza di connessione tra le parole serve agli
ascoltatori come indice per individuare precocemente le disfluenze. Questo sembra essere
l’indice più stabile per individuare le disfluenze, anche se sicuramente esso interagisce con
altri indici a livelli linguistici diversi.
Per quel che concerne altre lingue oltre l’inglese, analizzato negli studi
precedentemente illustrati, Van Donzel e Koopmans-van Beinum (1996) 51 hanno indagato le
strategie di pausazione in olandese, tenendo conto, nell’impostazione della ricerca, del livello
pragmatico. Sono state raccolte registrazioni di parlato spontaneo prodotto da 4 parlanti di
sesso maschile e da 4 parlanti di sesso femminile tutti di madrelingua olandese.
Successivamente sono state individuate le pause e gli allungamenti, messi poi in relazione alla
struttura del discorso, precedentemente individuata in modo indipendente. Lo studio mostra
così l’esistenza di pause silenti, pause piene e allungamenti di parole. Esistono diversi tipi di
pause che possono essere combinati ed utilizzati in modo vario: l’uso delle pause è
largamente dipendente dal parlante. Anche se è stato possibile individuare in modo sommario
due tipi di strategie di pausazione che caratterizzano due distinti gruppi di soggetti, all’interno
dello stesso parlante la strategia di pausazione è risultata costante.
Gli autori notano inoltre che molto spesso le produzioni dei parlanti iniziano con
parole che non fanno realmente parte della struttura del discorso, come congiunzioni ecc.,
parti cioè che non esprimono alcun significato lessicale proprio. Si tratta di parole la cui
funzione è semplicemente quella di collegare la clausola alla precedente, senza tuttavia
esprimere una coordinazione vera e propria.
Lo studio comprende anche una parte che riguarda la percezione. I risultati indicano
che la presenza di una pausa acustica probabilmente ha una forte influenza sulla percezione
51
Monique van Donzel, Florien J. Koopmans-van Beinum, ‘Pausing strategies in discourse in Dutch’ , Proc.
ICSLP’96, http://fonsg3.let.uva.nl/IFA-publications/ICSLP96/Monique_van_Donzel/a505.htm, 1996.
28
dei confini del discorso da parte degli ascoltatori e ciò avviene almeno per i confini di
clausola e per i connettivi, poiché spesso le pause occorrono in questi contesti.
Di argomento più specificamente psicolinguistico sono alcuni lavori, come quello di
Lallgee e Cook52 (1969), che indaga la relazione tra esitazioni e ansietà del parlante. Gli autori
non riscontrano una correlazione positiva tra la crescita del livello di stress nel parlante e la
crescita di produzioni contenenti esitazioni.
Un altro studio, sempre del 1969, di Ragsdale53 verte sull’analisi di tre categorie di
fenomeni di esitazione (“ah” e le sue varianti; “non-ah” (ad es. ripetizioni); pause piene, in un
normale contesto di conversazione) in relazione all’ansia. Dai risultati emerge che la categorie
“non-ah” avrebbero una correlazione positiva con l’ansia, anche se non emergono altre
correlazioni significative tra le variabili. La produzione di esitazioni è stata anche studiata in
relazione agli indici AI (indice dell’ansia; interessa i motivi per cui il paziente si lamenta, e
cioè suoi sentimenti soggettivi di tensione, nervosismo ecc.) e IR (indice di interiorizzazione;
valuta la tendenza ad interiorizzare le difficoltà e a manifestarle verbalmente o
somaticamente). Nei soggetti utilizzati per lo studio, al crescere di AI e IR, crescono anche
balbettamenti, ripetizioni, cambi di frase ecc. (pause della categoria “non-ah”)
Una dettagliata rassegna bibliografica (ovviamente aggiornata all’anno di
pubblicazione del lavoro) è contenuta in Rochester54 (1973). La rassegna tratta principalmente
sul problema delle pause nella letteratura psicolinguistica e in parte anche linguistica.
L’autore non fornisce dati nuovi ma l’articolo è utile per le informazioni che vi sono
contenute circa il lavoro e le differenti prospettive teoriche presenti in letteratura.
6.CONCLUSIONI
Nell’ampia messe di dati, teorie, modelli presentati in queste pagine, occorre
individuare temi, percorsi e linee comuni per tirare le fila del discorso e delineare un quadro
complessivo della ricerca scientifica sui fenomeni di esitazione, disfluenza e pausazione.
Prima di affrontare il nucleo vero e proprio di queste conclusioni, tuttavia, vorremmo
proporre alcune riflessioni di carattere generale sulle motivazioni alla base della complessità e
della varietà della produzione scientifica sull’argomento.
In primo luogo, l’interesse per questi fenomeni è piuttosto recente: per quanto siano
presenti in letteratura alcuni lavori pionieristici (come quelli di Goldman-Eisler 1958, 196155,
1968, 197256), l’attenzione di un numero ampio di studiosi non risale a più di una ventina di
anni fa.
La crescita dell’interesse da parte della comunità scientifica è dovuto al fatto che
questi fenomeni sono ora visti non più come irregolarità occasionali e idiosincratiche del
52
G. M. Lallgee, Mark Cook, ‘An experimental investigation of the function of filled pauses in speech’,
Language and speech 12:24-29, 1969.
53
J. Donald Ragsdale, ‘Relationships between hesitation phenomena, anxiety and self-control in a normal
communication situation’, Language and speech, 12: 257-265, 1969.
54
S. R. Rochester, ‘The significance of pauses in spontaneous speech’, Journal of psycholinguistic research,
2/1:51-81, 1973.
55
Goldman-Eisler, F. 1961 ‘A Comparative Study of Two Hesitation.Phenomena’ Language and Speech 4: 1826.
56
Goldman-Eisler, F. 1972 ‘Pauses, clauses, sentences’, Language and Speech 15: 103-13.
29
parlato, ma come parti integranti del sistema linguistico, ingranaggi che, in modi non ancora
del tutto noti, cooperano al funzionamento della lingua.
La varietà di prospettive di studio dei fenomeni di esitazione, disfluenza e pausazione
è, inoltre, all’origine di un’inaspettata congiunzione di approcci teorici diversi. Si tratta di una
particolarità, che se rende, da un parte difficilmente catalogabili questi lavori, che spesso
potrebbero trovarsi in sezioni diverse da quelle in cui sono effettivamente, dall’altra parte
rappresenta una felice eccezione nel campo degli studi linguistici, intesi in senso lato. Così, in
questi lavori, avviene che linguistica teorica strutturale, pragmalinguistica e psicolinguistica si
affianchino, e che in studi di carattere psicolinguistico e pragmatico si tenga conto del fattore
fonetico acustico. In effetti, proprio la natura varia ed eterogenea dei fenomeni indagati,
difficili da comprendere e di classificazione controversa in mancanza di punti di riferimento
in una teoria tradizionale della lingua, sembrerebbe essere all’origine della necessità di un
approccio interdisciplinare, che punti a valutare e a tenere in conto il maggior numero
possibile di aspetti pertinenti.
La coesistenza di prospettive teoriche differenti, tuttavia, comporta anche alcuni
problemi, legati all’uso sia di nomenclature diverse, che generano un certo caos terminologico
che può disorientare il lettore, sia di classificazioni eterogenee. Questi lavori mancano a volte
di classificare e differenziare i fenomeni trattati, oppure si servono di tassonomie diverse,
talora costruite ad hoc per le esigenze di lavoro, e comunque difficilmente confrontabili tra
loro. A nostro parere ciò si deve sia alla difficoltà di trattamento di questi fenomeni, sia alla
relativa recenziorità delle indagini, che non possono avvalersi di un quadro teorico preciso e
definito e di categorie riconosciute nelle quali operare.
Tra gli studi che offrono una tassonomia chiara, quella che probabilmente trova da
molti anni ampio consenso, è quella di Maclay e Osgood (1959).
La complessità di questo quadro generale si riflette nella varietà dei contributi presenti
nella rassegna.
Per quel che concerne le pause, variamente classificate negli studi passati in rivista in
questa rassegna, molti studiosi hanno cercato regolarità nella disposizione che riflettessero
vincoli e strategie tipo ad es. sintattico. La classificazione di Goldman-Eisler (1958, 1968),
che differenzia pause grammaticali e non grammaticali sulla base delle loro occorrenza in
corrispondenza di confini sintattici, costituisce in tal senso un punto di partenza dal quale
molti studiosi successivamente hanno preso le mosse (Reich, 1980). La mancata coincidenza
tra confini sintattici e occorrenza delle pause nelle pause non grammaticali rappresenta poi
una risorsa per lo studioso: lì dove non è prevedibile la presenza di una pausa, infatti, è
possibile osservare fenomeni che richiedono nuove spiegazioni.
Un altro campo di indagine, in parte correlato al precedente, riguarda le diverse
strategie di pausazione nel parlato spontaneo e in quello letto (Strangert, 1991, 1993;
Hansson, 1998): gli studi di questo genere hanno offerto dati a sostegno dell’ipotesi secondo
la quale la disposizione delle pause dipende largamente dalla sintassi nel parlato più
controllato, mentre risponde a un’organizzazione non solo sintattica nel parlato spontaneo. Di
grande importanza sono, a questo punto, gli studi di tipo pragmatico, che hanno dato alle
strategie di pausazione (e più in generale all’uso di esitazioni varie) importanza nell’ambito di
modelli della conversazione. L’uso di pause piene, ad esempio, è stato collegato al
mantenimento della parola presa in un’interazione dialogica (Maclay e Osgood, 1959), ma
anche allo stress del parlante rispetto all’interazione. Studiosi di ambito psicolinguistico, ad
esempio, si sono interessati di questo aspetto del problema, mettendo in relazione la fluenza
del parlante e il suo livello di stress in un determinata situazione. Anche il concetto di fluenza
30
è stato discusso e problematizzato in alcuni casi. Hieke (1980) ha, per esempio, sostenuto che
la presenza di disfluenza nel parlato sia in certa misura fisiologica, e faccia parte di un
dispositivo per mantenere l’alta qualità del parlato, che si ottiene in primo luogo attraverso la
cooperazione tra i locatori. Ciò rivede in buona misura il concetto stesso di ‘dis-fluenza’.
Questo termine, infatti, contiene in sé un giudizio relativo alla ‘non-funzione’ delle esitazioni
nel parlato.Se le esitazioni svolgono il ruolo di ultima risorsa nel mantenimento della qualità
delle produzioni, esse trovano un posto legittimo e importante nell’economia del parlato.
L’indagine fonetico-acustica e percettiva, infine, oltre ad avere risvolti applicativi
nell’elaborazione di algoritmi per il riconoscimento del parlato spontaneo (Stolcke e Shriberg,
1996) ha portato all’individuazione di correlati specifici di ciascun tipo di esitazione e anche
all’elaborazione di modelli fonologici che contemplino la presenza delle pause piene. In
particolare, Lickely (1994, 1996), non avendo rilevato correlati acustici specifici che guidino
l’ascoltatore nell’individuazione delle disfluenze, ha ipotizzato che la mancanza di
collegamenti fonologici che si ha nel caso del parlato disfluente costituisca l’indice più
affidabile e utilizzato dall’ascoltatore. Anche Päzold e Simpson (1995) hanno tentato di
interpretare fonologicamente la sostanza fonica delle esitazioni, ipotizzando per esse un
sistema fonologico diverso rispetto alla lingua di riferimento.
Inoltre, le indagini percettive, condotte talora anche ad integrazione di studi di altro
tipo, hanno svolto un’importante ruolo di verifica delle ipotesi di lavoro.
Come si vede, il quadro che questi lavori delineano è molto complesso e ancora in
parte frastagliato: il nostro auspicio è che questa rassegna, consentendo uno sguardo sinottico
sui risultati conseguiti dalle discipline interessate al problema delle ‘esitazione e dintorni’,
costituisca uno strumento utile ed uno stimolo al proseguimento ed all’ampliamento della
ricerca interdisciplinare su questo tema, verso modelli che rendano conto delle funzioni,
dell’uso e delle caratteristiche delle dei fenomeni indagati nei lavori presentati in queste
pagine.
31
Scarica

full text