F ENOMENI DI ESITAZIONE E DINTORNI: UNA RASSEGNA BIBLIOGRAFICA (Progetto API - Istituto Universitario Orientale) a cura di Claudia Crocco, Renata Savy 0.INTRODUZIONE Nella lingua parlata occorrono con grande frequenza fenomeni che interrompono il flusso del parlato rendendolo discontinuo. Tali fenomeni vengono solitamente raggruppati sotto la dicitura di ‘fenomeni di esitazione’ oppure ‘disfluenze’. Si tratta di vocalizzazioni solitamente registrate con grafie varie (‘uhm’ eh’ ‘ehm’ ecc.), pause silenti che interrompono il continuum fonico, oppure anche false partenze e correzioni operate dai parlanti. Anche nei dialoghi contenuti nel corpus AVIP/API sono presenti fenomeni di esitazione. Di seguito sono riportati alcuni esempi, tratti dai dialoghi A01 e C02 della varietà napoletana 1 A01_nG001: <inspirazione> Sara allora c'hai sulla tua sinistra <pb> una figura che s+/viene definita colibrì. A01_nG005: #<F004> hai# fatto ? <inspirazione> ora #<F006> prosegui diritto# <pl> vai diritto <pb> <inspirazione> <pb> e arriva praticamente <pb> al <eeh> all'inizio della figura fiume <pb> e inizi a risalire verso 'sta figura. C02_nG003: <inspirazione> <ehm> <pl> <ehm> sc+ <eeh> scendi<ii> <pb> <eeh> <pb> da <eeh> dal punto di partenza <pl> <eeh> fino <pb> a<aa> <ehm> ce l'hai il punto di partenza ? C02_nG015: poi<ii> <ehm> <pb> una linea <pb> orizzontale sotto<oo> <pb> <eeh> la scri+ <eeh> sotto la<aa> la seconda<aa> <ehm> figura <pl> quella giù C02_nF028: <inspirazione> allora <pb> <f.vocale> direttamente so+ <pb> allora <pl> direttamente sotto <pb> al+ <eeh> l+ / la <eeh> linea di partenza c'è il bar diol+ <pb> di Liolà Come si vede anche solo da questi pochi esempi, le esitazioni o disfluenze sono una classe di fenomeni eterogenei largamente presenti, che caratterizzano specificamente la lingua parlata. In una visione della lingua che dia priorità alla scrittura sulla produzione orale, le disfluenze possono essere considerate ‘deviazioni’, ‘errori’ commessi dai parlanti, che testimonierebbero il carattere incerto e instabile del parlato rispetto alla lingua scritta: i fenomeni di esitazione, infatti, non sono noti alla lingua scritta, nella quale sono presenti (raramente ed occasionalmente) nella letteratura, per specifiche finalità espressive e creative. L’assenza dei fenomeni di esitazione nella lingua scritta (a parte le finalità espressive cui 1 Gli esempi riportati sono trascritti secondo le specifiche di trascrizione ortografica stabilite per il progetto AVIP/API. All’interno di ciascun turno, inoltre, le porzioni di testo contenenti esitazioni di vario genere sono state trascritte in grassetto. 1 abbiamo accennato) è ovviamente dovuta al fatto che effettivamente questi fenomeni sono legati alle specifiche modalità di produzione del parlato. Un approccio allo studio della lingua che non accordi alcuna priorità o eccellenza alla lingua scritta, ma che riconosca l’importanza e l’indipendenza della lingua parlata, è invece alla base dell’idea che le disfluenze siano fenomeni importanti e degni di interesse e studio: essi possono fornire informazioni su cosa effettivamente il parlante fa quando parla. In quest’ottica, le disfluenze non sono ‘errori’, quanto piuttosto fenomeni normali all’interno dell’economia del parlato. L’alta frequenza di occorrenza di tali fenomeni, inoltre, ha suggerito a molti studiosi del parlato la necessità di un’indagine accurata sulla loro natura e le loro caratteristiche. I fenomeni di esitazione sono stati oggetto di studi molto diversi. La letteratura specifica sull’argomento, infatti, investe campi di indagine vari, spaziando dalla fonetica, alla psicolinguistica, agli studi con finalità teconologico-applicative. Il motivo della poliedricità di questi studi è legato proprio alla natura del fenomeno indagato. Come abbiamo visto, infatti, con la dicitura ‘disfluenze’, o ‘esitazioni’ si intendono fenomeni con qualità e caratteristiche molto diverse, come pause silenti, pause piene, false partenze, riparazioni e altro ancora. Tutti questi fenomeni, inoltre, possono essere osservati dal punto di vista strettamente foneticoacustico, con attenzione, cioè, alla sostanza fonica attraverso la quale sono realizzati, oppure possono essere studiati con attenzione al contesto sintattico o prosodico in cui occorrono, o ancora, come fenomeni legati alla tensione emotiva del parlante in una data situazione. Un altro campo di interesse scientifico legato al problema dei fenomeni di esitazione è quello teconologico: ad esempio, gli algoritmi utilizzati per il riconoscimento automatico del parlato, devono misurarsi con la difficoltà rappresentata dalla presenza nel parlato spontaneo di disfluenze ed esitazioni. In una visione ‘purista’ legata ad esigenze di efficienza e ottimizzazione, il compito principale di questi algoritmi è quello di individuare, isolare ed espungere tali fenomeni da una rappresentazione formale del parlato, come si evince dai numerosi lavori presenti in letteratura (ad es.: Heeman e Allen, 1994, Stolcke e Shriberg, 1996) dei quali riportiamo un breve elenco nella bibliografia generale. Lo studio dei fenomeni di esitazione si è concentrato spesso sui contesti di occorrenza delle disfluenze, al fine di utilizzare queste informazioni per ricostruire a posteriori le condizioni di produzione del parlato. Le rotture nel flusso del parlato, infatti, possono costituire un valido indice per studiare la struttura del parlato e per testare la validità di ipotesi e modelli sintattici, prosodici ecc. Di seguito presenteremo una rassegna bibliografica che, pur non avendo pretese di esaustività, vuole proporsi come una strumento utile che getti uno sguardo sull’attuale stato dell’arte nella ricerca sulle disfluenze. La rassegna è articolata per campi di indagine: sono stati, cioè, trattati insieme studi di argomento simile. Come abbiamo già avuto modo di dire, infatti, la poliedricità dell’argomento in esame è all’origine di una bibliografia vasta ed eterogenea, che abbiamo raggruppato per praticità secondo il soggetto di ciascuno studio citato. Come il lettore avrà modo di notare, alcuni studi investono più aspetti del problema e pertanto la loro classificazione non è sempre risultata agevole. Nella rassegna essi sono stati posti nella sezione ritenuta più opportuna, con rimandi alle altre sezioni cui lo studio avrebbe potuto essere attribuito. 2 1.ESITAZIONI E PIANIFICAZIONE DEL PARLATO : L’APPROCCIO LINGUISTICO. Il dibattito sulle esitazioni in linguistica va avanti ormai da diversi decenni. In un lavoro del 1959 Maclay e Osgood 2 hanno fornito (tra l’altro) una classificazione che individua quattro categorie di fenomeni di disfluenza: a) Ripetizioni (repeats) che coprono tutte le ripetizioni semanticamente non significative; b) False partenze (false starts) che comprendono stringhe incomplete o interrotte che possono essere ricostruite o corrette; c) Pause piene (filled pauses) che comprendono tutte le occorrenze dei dispositivi di esitazione (tipo E, @ 3, ecc) d) Pause vuote (unfilled pauses) che sono caratterizzate da un silenzio di “inusuale lunghezza” e “dall’allungamento non fonetico di fonemi” 4. Questa classificazione è stata comunemente utilizzata in molti lavori successivi ed è stata adottata da altri studiosi anche molti anni dopo la pubblicazione di questo studio. In un articolo del 1965 Donald S. Boomer5 affronta il problema della posizione delle pause vuote e piene nel discorso legato inglese. Attraverso un’indagine sulla posizione di occorrenza delle pause, è stata indagata, quindi, la pianificazione del parlato. L’ipotesi centrale è che le esitazioni, nel discorso spontaneo, cadano nei punti in cui il parlante prende delle decisioni e opera delle scelte 6: per questo motivo, l’esitazione dovrebbe fornire informazioni sulla grandezza e sulla natura dell’unità di codificazione del parlato: in particolare, l’unità di codificazione in questione non sarebbe la parola, ma la frase fonemica. Se, infatti, l’unità di codificazione fosse la singola parola, le esitazioni dovrebbero cadere più frequentemente prima delle parole che comportano una decisione difficile, ad esempio nel caso in cui si ponga al parlante una scelta tra molte alternative. Ipotizzando, invece, che l’unità di codificazione sia una sequenza di più parole, le esitazioni dovrebbero cadere prevalentemente nella parte iniziale di tali sequenze. Si pone quindi un problema circa la definizione della frase fonemica. Questa unità, infatti, deve essere definita sulla base di un criterio esterno ed autonomo, per le sue caratteristiche fonologiche e in modo non dipendente dalla presenza vs. assenza delle esitazioni stesse. La frase fonemica è quindi, nell’opinione dell’autore e in accordo con Trager e Smith (1951)7, un macrosegmento marcato fonologicamente, che contiene uno ed un solo accento primario e finisce con una giuntura terminale. Lo studio, condotto su alcune registrazioni di parlato, valuta l’occorrenza di fenomeni di pausazione nelle frasi fonemiche, a partire dall’ipotesi che le pause cadano prevalentemente all’inizio di queste unità. I dati sperimentali hanno fornito un buon sostegno all’ipotesi dell’autore: le esitazioni, infatti, ricorrono con maggiore frequenza non al principio della frase fonemica, ma dopo la prima parola della frase. Questo risultato è in contraddizione con 2 Maclay H. Osgood C. E., ‘Hesitation Phenomena in Spontaneous English Speech’, Word, vol.15, 19, 1959. La trascrizione fonetica è qui resa con l’alfabeto SAMPA. 4 Le pause caratterizzate da silenzio sono a volte anche definite come silent pauses (pause silenti). 5 Donald S. Boomer, ‘Hesitation and grammatical encoding’, Language and Speech 8:148-158, 1965. 6 In lavori precedenti sul problema, come Lounsbury (‘Transitional Probability, Linguistic Structure and Systems of habit-Family hierarchies’, in C.E. Osgood e T.Sebeok, “Psycholinguistics: a Survey of Theory and Research Problems” , Beltimora, 1954) si ipotizza che: “Le pause esitative corrispondono ai punti di più alta incertezza statistica nel succedersi di unità di un dato ordine”. E ancora (ibidem) , che :“le pause di esitazione e i punti di alta incertezza statistica corrispondano all’inizio delle unità di codificazione”. 7 Trager G. L., Smith H. L., ‚An Outline of English Structure’, University of Oklahoma Press, Norman, 1951. 3 3 l’ipotesi che l’unità di pianificazione sia la parola: poiché le parole ad alta informazione lessicale tendono a trovarsi verso al fine della frase fonemica, le esitazioni, in un modello basato sulla parola, dovrebbero cadere piuttosto verso la fine che non all’inizio della frase fonemica. Boomer sostiene, quindi, che esista un processo di pianificazione che anticipa pezzi strutturati di sintassi e significato. Quando si arriva alla giuntura terminale di una frase, la successiva può essere pronta, e quindi pronunciata senza intoppi, oppure può non essere ancora definita, e quindi il discorso sarà interrotto fino al completamento dell’unità successiva. L’interruzione si realizza con una pausa o con un’esitazione. Questo chiaramente non spiega il fatto che le esitazioni si trovino in ogni parte delle frasi, ma solo che tendenzialmente esse occorrano dopo il primo confine di parola all’interno della frase fonemica. Quanto al significato più propriamente pragmatico delle esitazioni, i dati di Boomer sembrano offrire sostegno all’ipotesi di Maclay e Osgood (1959), che avevano ricondotto l’uso di esitazioni tipo “ah” alla necessità del parlante di mantenere il controllo della conversazione finchè non sia stato raggiunto un certo senso di completezza nell’espressione8. Tre anni dopo la pubblicazione dell’articolo di Boomer, Henri C. Barik9 pubblicò alcune riflessioni suscitate dal lavoro di cui abbiamo appena riportato i contenuti principali. Barik propose alcune riflessioni sul problema sollevato dalle pause di giuntura: un importante punto del lavoro di Boomer riguardava, infatti, una possibile distinzione di lunghezza tra le pause di giuntura e quelle di esitazione. Nei dati di Boomer, le pause di giuntura risultavano essere più lunghe della media, in contrasto con quanto sostenuto da Lounsbury (1959), secondo il quale le pause poste in giuntura avrebbero dovuto essere più brevi di quelle di esitazione poiché non corrispondenti a incertezze nella produzione. Analogamente, Barik ipotizza che, se la pausa di giuntura è priva di funzioni extralinguistica e serve a delimitare un’unità di parlato già codificata, non sembra giusto sostenere che essa debba essere più lunga di una pausa che segnala un’operazione di ricerca e di codifica. Le pause occorrono in una giuntura terminale e funzionano solo come pause di giuntura dovrebbero essere, pertanto, più brevi delle pause poste all’interno di una frase fonetica. Così, per spiegare il dato di Boomer, secondo cui le pause di giuntura erano più lunghe di quelle di esitazione, Barik ipotizza che, in base alla durata, una pausa possa essere distinta in elementi che indicano esitazione ed elementi che indicano la giuntura. Il componente indicante la giuntura sarebbe associato alla prima frase, mentre il componente indicante esitazione sarebbe associato alla seconda. Un problema successivo ma non secondario, riguarda tuttavia, la possibilità materiale di distinguere, nelle pause che occorrono tra due frasi, tra componenti che indicano esitazione e componenti di giuntura. In vari studi Goldman-Eisler (195810,196811) affrontò il problema della grammaticalità delle pause, distinguendo tra pause grammaticali e pause non grammaticali. Secondo l’ipotesi 8 Il senso di esitazioni tipo “ah” è quindi: “Ho ancora il controllo del discorso, non mi interrompere”. Lallgee et al., in uno studio del 1969 intitolato ‘An experimental investigation of the function of filled pauses in speech’ (Language and speech 12:24-29), affermano, sulla base dei propri dati, che la teoria di Maclay e Osgood non è corretta, o che perlomeno essa sia valida solo per il parlato monologico e non per quello dialogico, nel quale sono utilizzate altre strategie (per esempio alzare la voce) per conservare il controllo del discorso. 9 Henri C. Barik, ‘On defining juncture pauses: a note on Boomer’s “Hesitation and grammatical encoding”’. Language and Speech 11:156-159, 1968. 10 Goldman-Eisler, F. ‘The predictability of words in context and lenght of pauses in speech’, Language and Speech, 1:226-231, 1958. 4 avanzata dall’autore le pause grammaticali cadono ai confini di frase, mentre le pause non grammaticali sono distribuite in modo non prevedibile nel flusso del discorso. Inoltre, nei testi letti, al contrario di quanto avviene nel parlato spontaneo, quasi tutte le pause cadrebbero in posizioni grammaticali. Nel 1971 Eric Brown e Murray S. Miron12 hanno affrontato il problema, connesso ai risultati di Goldman-Eisler (1968), relativo alla predicibilità dell’organizzazione temporale delle pause in un testo in inglese americano, di 1537 parole, letto da un professionista. Dai dati emerse che le pause in testi letti fossero in qualche modo predicibili sulla base di analisi linguistiche (in particolare sintattiche) oppure stocastiche. Questo studio ha dimostrato che fino al 64% delle pause in un testo letto può essere predetto dall’analisi sintattica del messaggio. Le predizioni sintattiche sulla durata e l’occorrenza delle pause sono consistenti con un’ipotesi relativa al fatto che lettori fluenti tendono a porre le pause in posizioni grammaticali. Questo è inoltre il primo studio che investiga sistematicamente l’ipotesi “durazionale” secondo la quale la complessità sintattica influenza direttamente le manifestazioni concrete della performance. In un lavoro del 1971 Mark Cook13 ha riconsiderato alcune ipotesi avanzate in letteratura a proposito dell’inglese. In particolare, l’autore riconsidera in modo critico le ipotesi di Maclay e Osgood (1959) e quelle di Boomer (1965). Maclay e Osgood (1959) avevano sostenuto che le pause piene sono segnali del parlante per indicare che non ha finito di parlare anche se è momentaneamente in silenzio e che esse occorrono più spesso davanti alle parole lessicali che davanti alle parole funzionali. Diversamente da quanto sostenuto da Maclay e Osgood (1959), i risultati di Cook hanno mostrato, tuttavia, che le pause piene tendono ad occorrere in ugual misura davanti alle parole lessicali e davanti alle parole funzionali. In generale, i dati mostrano che le pause piene occorrono meno spesso di quanto atteso davanti a nomi, avverbi e verbi, e più spesso davanti ai pronomi. Infine esse occorrono all’incirca quanto ci si aspettava davanti agli aggettivi. Inoltre, le pause piene, occorrono più spesso di quanto possa essere attribuito al caso davanti alle congiunzioni e a parole come well, yes, e no. In altre parole, le pause piene tendono ad occorrere ad inizio di frase, davanti alla prima, alla seconda o anche alla terza parola. Comunque non sembrano occorrere particolarmente spesso davanti al verbo della frase. Tutto ciò concorda con i risultati di Boomer (1965) secondo cui le pause piene tendono ad occorrere più spesso davanti alla prima o alla seconda parola della frase, piuttosto che nella seconda parte della frase. Come abbiamo visto, il lavoro di Cook si pone in netto contrasto con quello di Maclay e Osgood. Questi autori avevano ipotizzato che le pause piene fossero più frequenti prima di parole lessicali poiché queste richiedono un maggiore sforzo al parlante. In realtà il lavoro di Cook punta soprattutto a sottolineare il fatto che parlare è un’attività più complessa del semplice selezionare parole. Pertanto, il parlante deve compiere più scelte all’inizio della frase e ciò spiega la più alta incidenza delle pause piene all’inizio della frase. Nonostante ciò, i dati concordano con Maclay e Osgood nel sostenere una relazione tra le pause piene e l’attività cognitiva dei parlanti. 11 Goldman-Eisler, F. 1968. Psycholinguistics, Experiments in Spontaneous Speech. Academic Press. Eric Brown e Murray S. Miron, ‘Lexical and Syntactic Predictors of the Distribution of Pauses Time in Reading’ Journal of Verbal Learning and Verbal Behaviour 10: 658-667, 1971. 13 Mark Cook, ‘The incidence of filled pauses in relation to part of speech’, Language and Speech, 14/2:135-139, 1971. 12 5 Più recentemente, E. E. Shriberg14 ha condotto uno studio che raccoglie informazioni generali sulle disfluenze (riempitivi, parole ripetute, forme varie di auto-riparazione) nel parlato spontaneo di adulti normali parlanti di inglese americano, a partire all’ipotesi che esse non siano eventi irregolari. La tesi fornisce, quindi, dati che mostrino che, al contrario di quanto molti hanno ritenuto, le disfluenze hanno tendenze fortemente regolari su varie dimensioni. Il metodo include l’analisi di oltre 5000 disfluenze annotate a mano da un database di 250.000 parole che comprende: dialoghi orientati ad un compito di interazione uomomacchina; dialoghi orientati ad un compito di interazione uomo-uomo; conversazione uomouomo su un argomento prescritto. L’approccio è neutro dal punto di vista teorico ed è fortemente guidato dai dati. Le annotazioni corrispondono a caratteristiche osservabili (tratti, features) nei dati, includendo: 1) il dominio di parlato; 2) il parlante; 3) la frase in cui occorre la disfluenza; 4) caratteristiche della disfluenza collegate alla parola; 5) semplici caratteristiche acustiche della disfluenza. Sono stati sviluppati, inoltre, una metodologia per rappresentare questi tratti in un formato database, e un algoritmo per la classificazione automatica del tipo di disfluenza sulla base di questa rappresentazione. I risultati mostrano tendenze regolari nelle proporzioni delle disfluenze, per quel che riguarda la lunghezza, la posizione della disfluenza, la presenza di un’altra disfluenza nella stessa frase, il tipo di disfluenza e la combinazione di questi tratti sia all’interno di un parlante, sia tra i parlanti. Sono state trovate anche regolarità per i tratti della disfluenza connessi alla parola, incluso il numero di parole troncate, la frequenza delle parole interrotte e l’andamento della produzione delle frasi. Ulteriori analisi descrivono le caratteristiche di sovrapposizione delle disfluenze e delle caratteristiche prosodiche dei tipi più semplici di disfluenza. Un’analisi comparativa è stata condotta confrontando dati provenienti dai tre tipi di parlato; dove i risultati fossero rilevanti, sono stati allestiti semplici modelli parametrici. In conclusione, le disfluenze mostrano regolarità su varie dimensioni. Queste regolarità possono essere d’aiuto nella costruzione di modelli della produzione del linguaggio parlato fornendo indicazioni e vincoli. Inoltre, essi possono implementare modelli per migliorare il processing del parlato spontaneo. 2.L’INTERPRETAZIONE PRAGMATICA DEL RUOLO DELLE ESITAZIONI. Lo studio dei fenomeni di esitazione ha trovato spazio anche nella letteratura di argomento linguistico-pragmatico. Vari studiosi si sono interessati della funzione delle esitazioni nell’economia del discorso, sviluppando a volte modelli della conversazione che comprendessero le presenza di fenomeni di disfluenza, ma anche indagando il diverso uso 14 Elizabeth E. Shriberg, ‘Preliminaries to a theory of speech disfluencies’, Unpublished PhD Thesis, University of California, Berkeley, 1994. 6 delle interruzioni in cultura diverse. Di seguito sono riassunti i contenuti di alcuni studi di questo tipo. Nel 1981 Adolf E. Hieke 15 ha indagato le esitazioni riscontrabili nel parlato inglese e tedesco, in uno dei pochi lavori che integrano effettivamente il ruolo delle esitazioni in un quadro più ampio di tipo pragmatico-funzionalista, che gatta luce sulla ragion d’essere dei fenomeni di esitazione nel parlato spontaneo. L’autore ha indagato i fenomeni di esitazione categorizzandoli come errori previsti ed errori commessi. Gli errori previsti danno luogo, nell’output, al parlato senza errori, mentre gli errori commessi al parlato con errori. In corrispondenza della tipologia di parlato con errori commessi, l’autore individua due categorie maggiori di errore, cioè ritardi e riparazioni. Questa tassonomia, supportata dall’osservazione di un corpus di lingua inglese e tedesca, rende ragione del ruolo grammaticale delle riparazioni e dei cambiamenti strutturali che essi causano. L’obbiettivo primario del parlante è generare un parlato che sia il più possibile accettabile sia dal punto di vista del contenuto che della forma e, allo stesso tempo, minimizzare gli errori mentre viene prodotta una frase. Nel caso in cui siano commessi errori, i parlanti possono fermarsi e correggerli oppure ignorarli e continuare. Le esitazioni, quindi, fanno parte integrante del processo di produzione del parlato in senso positivo (un punto di abbastanza diverso da quello che vede opposte da una parte il parlato fluente e dall’altra le esitazioni). Nell’ottica dell’autore, inoltre, le esitazioni fanno non soltanto parte integrante della normale fluenza, quando occorrono moderatamente, ma pause ed altre esitazioni andrebbero considerate fenomeni legati alla buona formazione e non disfluenze, almeno quando servono come dispositivi utilizzati dal parlante per produrre un parlato più corretto e senza errori, cioè di alta qualità. All’inventario delle regole della grammatica, a giudizio dell’autore, andrebbe aggiunto, quindi, un set di postulati conversazionali. I seguenti tre postulati possono essere aggiunti alla grammatica che opera in un parlante. Ciascuno di essi ha effetti sul componente della grammatica indicato tra parentesi: a) Produrre stringhe prive di errori (fonologia e sintassi); b) Produrre stringhe intelligibili (semantica, lessico, logica, stilistica, retorica); c) Avere il controllo del canale della comunicazione (fluenza, e, nel parlato dialogico, anche della presa di parola). Il primo postulato assicura che la grammatica sia applicata per generare un parlato quanto più è possibile accettabile, mentre il secondo postulato risponde del fatto che le stringhe siano quanto più è possibile dotate di un significato in un contesto ristretto ma anche più ampio. Il terzo postulato assicura, oltre al conseguimento degli altri obbiettivi, che il canale della comunicazione sia impiegato nella maniera più spedita. Nella tassonomia proposta sia le riparazioni che le false partenze interrompono la programmazione e richiedono una riprogrammazione. Occorre quindi dividere le ripetizioni in prospettive e retrospettive. Le prime che hanno funzione anticipatoria, servono come dispositivo per “guadagnare tempo”, ad es. per una migliore scelta lessicale. Le ripetizioni retrospettive, a differenza di quelle prospettive, hanno in primo luogo una funzione di ponte 15 Adolf E. Hieke ‘A content processing view of hesitation phenomena’ Language and Speech, 24/2: 147-160, 1981. 7 con i segmenti di parlato che sono stati separati dal resto da intervalli di tempo (pause o esitazioni). La tassonomia proposta mantiene i vantaggi di altre, precedentemente elaborate, ma è più esplicativa. Alcuni aspetti (come le nozioni di prospettivo e retrospettivo), aspettano comunque ulteriori indagini. In un lavoro del 1993, Airenti et al.16 hanno delineato le linee generali di uno scambio dialogico elementare; concentrando l’analisi sugli errori (cioè le disfluenze) nello scambio dialogico, gli usi ingannevoli della comunicazione e gli usi non espressivi del linguaggio. Dal punto di vista teorico, il modello presuppone che la teoria dell’uso del linguaggio sia parte di una teoria riguardante l’interazione umana, che a sua volta dovrebbe conformarsi ad una teoria generale dell’azione. Le riflessioni contenute nel lavoro di Airenti et alii, quindi, riguardano la comunicazione (anche non verbale). L’idea centrale del modello che viene presentato è che la competenza comunicativa possa essere considerata un metalivello, preposto al controllo delle inferenze basilari veicolate da rappresentazioni condivise di pattern predefiniti di interazione. La comunicazione, inoltre, poggerebbe su alcune condizioni mentali che costituiscono i primitivi alla base delle interazioni. Il modello è basato su regole, riguardanti le interazioni sociali, che danno accesso alle struttura della conoscenza. Secondo gli autori, queste regole catturano il componente della competenza comunicativa. Inoltre, esse non variano con gli individui e (almeno teoricamente) non possono sbagliare. Le strutture della conoscenza sono invece idiosincratiche e rappresentano le interazioni sociali dal punto di vista del singolo agente. La conseguenza di questi assunti è che le strutture della conoscenza sono responsabili per ogni deviazione dalla comunicazione standard. Le differenze tra individui possono quindi portare ad errori nella comunicazione. L’approccio presentato in questo lavoro pone l’accento sulle forti connessioni che esistono a giudizio degli autori tra le specifiche conoscenze pragmatiche legate ad un dato compito e la conoscenza generale del mondo. Assumendo che la comunicazione sia controllata da una struttura cognitiva specifica, chiamata “gioco della conversazione” è chiaro che bisogna chiamare in causa anche i “giochi comportamentali”, ad es. la conoscenza di pattern stereotipati di interazione e la conoscenza del mondo. Tutto ciò è coerente con l’idea che la competenza pragmatica possa essere identificata e descritta da un numero limitato di regole, idea condivisa in vari modelli dell’interazione umana. Anche se il modello non è del tutto formalizzato, la classificazione di forme non-standard della comunicazione (errori, espedienti, inganni) introdotti nel modello, costituiscono un primo passo per integrare in un modello unitario aspetti della comunicazione normalmente considerati indipendenti. In uno studio non propriamente relativo al problema delle disfluenze, ma riguardante più in generale fenomeni di discontinuità nella conversazione, Muraka 17 (1994) affronta il problema della funzione delle interruzioni all’interno di uno scambio dialogico. Le interruzioni sono classificate dall’autore e divise in due tipi principali: a) cooperative (con cui si suggerisce una parola o un’espressione all’interlocutore); 16 Gabriella Airenti, Bruno G. Bara, Marco Colombetti, ‘Failures, explotations and deceits in communication’, Journal of Pragmatics 20:303-326, North Holland, 1993. 17 Kumiko Muraka, ‘Intrusive or co-operative? A cross-cultural study of interruption’. Journal of Pragmatics 21: 385-400, 1994. 8 b) intrusive (reali interruzioni dovute a vari motivi). Le interruzioni intrusive sono state ulteriormente divise in tre subcategorie in base al motivo dell’interruzione: a) cambi di topic; b) presa di parola; c) disaccordo. Il punto centrale dello studio riguarda la relazione tra frequenza e tipo di interruzioni e la sua variazione in funzione della cultura di provenienza dei parlanti. Confrontando lo stile conversazionale inglese e giapponese, l’autore nota differenze relative al valore sociale attribuito all’interruzione nelle due culture. Nelle interazioni tra madrelingua inglesi o giapponesi viene adottato lo stile conversazionale proprio della lingua e della cultura dei parlanti. Tuttavia, nel caso in cui un parlante giapponese (lingua nella quale le interruzioni intrusive sono meno frequenti che in inglese) parli in inglese, questi può produrre più interruzioni intrusive, ad esempio per adattarsi allo stile conversazionale della lingua target. L’autore sottolinea, quindi, l’importanza della conoscenza delle strategie conversazionali proprie di una data lingua,poiché l’ignoranza di tali stili conversazionali può comportare malintesi ed errate valutazioni sulle abilità e sulla personalità dell’interlocutore. In uno studio di Clark (1994)18, il problema delle disfluenze è incluso in un modello di descrizione della conversazione come cooperazione volta alla risoluzione di eventuali problemi attraverso apposite strategie. I problemi che possono sorgere nel corso di una conversazione sono in primo luogo dei problemi “collettivi”, che riguardano, cioè tutti i partecipanti, i quali sono tenuti a gestirli insieme. Gli interlocutori hanno tre tipi di strategie per gestire tali problemi: 1) possono prevenire i problemi prevedibili ed evitabili; 2) possono avvertire gli interlocutori dei problemi prevedibili ma inevitabili; 3) possono riparare i danni che si sono già verificati. In quest’ottica, i parlanti possono coordinare: 1) l’articolazione da parte di un interlocutore e l’attenzione dei destinatari; 2) la presentazione di un’espressione da parte di un interlocutore e l’identificazione di questa espressione da parte dei destinatari; 3) il significato trasmesso dall’interlocutore e la comprensione di tale significato da parte dei destinatari. In ultimo, il parlante propone al suo interlocutore un progetto da realizzare insieme, e ciò richiede un’ulteriore coordinazione. La conversazione è quindi frutto di una coordinazione tra parlanti che cooperano a più livelli per far procedere la conversazione senza errori, ovvero riparando quelli che si sono già verificati. A proposito delle pause piene, l’autore riporta un dato (da Smith e Clark, studio allora in preparazione) dal quale si evince che i parlanti producono pause del tipo “uh” e “um” piuttosto spesso dopo pause vuote. “Um” viene usata più frequentemente di “uh” quando i parlanti prevengono pause successive. Comunque, i parlanti usano “um” e “uh” per avvertire l’interlocutore della grandezza dell’interruzione che stanno prevenendo. Normalmente si ritiene che una conversazione comporti la capacità da parte dei parlanti di trattare i problemi che possono sorgere, tenendoli sotto controllo e risolvendoli nel 18 Herbert H. Clark, ‘Managing problems in speaking’, Speech Communication 15:243-250, 1994. 9 caso in cui si verifichino. L’autore ritiene una definizione di questo eccessivamente generica, poiché, in primo luogo, essa trascura la dimensione collettiva nella conversazione, in virtù della quale i parlanti affrontano insieme i problemi che possono sorgere. In secondo luogo, i parlanti non si limitano a riparare gli errori, ma tentano di prevenirli oppure avvertono l’interlocutore nel caso in cui i problemi siano inevitabili. La riparazione, quindi, è l’ultima strategia a disposizione dei parlanti, che preferiscono utilizzare altre risorse, per prevenire i problemi o avvertire della loro inevitabilità l’interlocutore. Di particolare interesse, a causa del materiale su cui è stato condotto, è uno studio di Branigan et al.19 relativo all’influenza di fattori non linguistici sulla frequenza di occorrenza della disfluenze. Analogamente al materiale di cui è costituito il corpus AVIP/API, nell’ambito del quale è stata compiuta la presente ricerca bibliografica, il corpus utilizzato studio di Braningam et al. è, infatti, composto da dialoghi in inglese elicitati con la tecnica del Map Task (corpus HCRC). Nella conduzione dello studio, gli autori hanno valutato le seguenti variabili: a) sesso del parlante e dell’interlocutore; b) ruolo conversazionale; c) abilità nel guidare l’interlocutore; d) familiarità con l’interlocutore; e) pratica nello svolgimento del compito; f) contatto visivo. Le disfluenze sono state classificate nel modo seguente: a) basic types: ripetizioni, cancellazioni, inserzioni, sostituzioni; b) non basic types: combinazioni di questi tipi e tipi complessi; c) reparandum: parole che devono essere rimosse per rendere fluente il parlato. L’analisi verte sulla valutazione della frequenza di disfluenza (numero di disfluenze per 100 parole) e gli scarti (numero di parole da sostituire per 100 parole che il locutore intende realizzare) in una serie di confronti intra e inter-parlante. La frequenza delle disfluenze è stata calcolata come numero di disfluenze per 100 parole che il locutore intende realizzare. La frequenza degli scarti è calcolata come numero di reparandum per 100 parole che il locutore intende realizzare. I risultati suggeriscono che questi fattori non linguistici influenzino effettivamente la fluenza del parlante, anche se la loro influenza può manifestarsi attraverso complesse interazioni con altri fattori, e in alcuni casi può essere soltanto apparente. Dai risultati emerge anche una notevole variabilità inter-parlante. Inoltre la fluenza del parlato sembra essere influenzata da molti fattori non linguistici: a) Le donne presentano meno disfluenze degli uomini quando possono vedere l’interlocutore, anche se, in generale, il sesso dell’interlocutore non ha effetti sulla fluenza. b) I Giver presentano più disfluenze dei Follower. Questa differenza non sembra attribuibile semplicemente alla lunghezza delle frasi prodotte. c) Il ruolo nella conversazione ha effetti sul tipo di disfluenze prodotte: la frequenza delle ripetizioni non differisce tra Giver e Follower, ma il Giver produce in proporzione più inserzioni e sostituzioni e meno cancellazioni del Follower. 19 Braningan, Lickely, Mc Kelvie ‘Non linguistic influences on rates of disfluency in spontaneous speech’, ICPhS’99, 1999. 10 d) I parlanti hanno esibito una frequenza di scarti più alta (in proporzione, un maggior numero di parole che fanno parte di una reparandum) parlando ad un interlocutore familiare. La familiarità, tuttavia, non ha effetti sulla frequenza delle disfluenze. e) I parlanti hanno prodotto più ripetizioni quando non potevano vedere l’interlocutore. La condizione di contatto visivo, tuttavia, non ha mostrato effetti stabili sulla frequenza di disfluenza e scarto in generale. f) I Giver hanno prodotto meno ripetizioni la seconda volta che hanno eseguito il compito. La pratica nel compito, tuttavia, non ha mostrato effetti stabili sulla frequenza di disfluenza e scarto in generale. Come si vede, i risultati mostrano che i fattori non linguistici non sortiscono un effetto uniforme sulla fluenza. Molti effetti, inoltre, non hanno reale rilevanza statistica. Ancora, i risultati mostrano che i fattori non linguistici esibiscono interazioni complesse. Non si devono, dunque, attendere effetti semplici e immediati sulla fluenza legati all’azione di fattori non linguistici. Uno studio sull’inglese, in parte di carattere pragmatico, ma concentrato specialmente sulle possibilità applicative di tipo didattico della ricerca sulle pause piene è quello condotto da R. L. Rose20. Secondo l’autore21 i fenomeni di esitazione possono essere descritti secondo una tassonomia che individua quattro macrocategorie di esitazione, e cioè: -false partenze; -ri-partenze; -pause; -allungamento di parole. Le pause a loro volta possono essere suddivise in vuote (silenti) e piene. Le pause piene possono essere lessicalizzate o non lessicalizzate. Rose analizza sistematicamente un piccolo corpus di parlato spontaneo. Il risultato principale della ricerca è la distinzione tra pause piene chiuse e aperte, cioè pause piene che terminano o meno con una nasalizzazione. Dai dati emerge, infatti, che il comportamento di queste due categorie di pause piene è indipendente. Le pause piene, inoltre, avrebbero anche la funzione pragmatica di attenuare le asserzioni, in conformità con la ben documentata utilità che esse hanno nel ridurre l’impatto di una risposta sfavorevole o non preferita in una coppia adiacente. La principale applicazione dello studio di Rose è di tipo didattico: i risultati del presente studio, integrati con quelli di precedenti ricerche, hanno prodotto specifiche raccomandazioni teoriche e pratiche per l’uso delle pause piene in contesti di ELT (English Language Teaching). Nel corso delle lezioni, infatti, gli insegnanti possono suggerire implicitamente agli studenti (parlanti non nativi di inglese) di avvantaggiarsi dal tempo di pausa dell’interlocutore per processare l’input precedente, oppure di utilizzare le pause piene come strumento per aumentare l’impressione di fluenza, evitando i silenzi nel tempo impiegato per pensare. In questo modo gli studenti potrebbero apparire più fluenti, suonando più simili ai parlanti nativi. 20 Ralph Leon Rose, ‘The communicative value of filled pauses in spontaneous speech’, Unpublished Master’s Thesis, University of Birmingham, 1998. 21 Si veda il sito del FPRC – Filled Pauses Research Center, curato da Rose stesso. 11 3.LE ESITAZIONE NEL PARLATO SPONTANEO E NEL PARLATO LETTO . Altri studi si sono concentrati sul problema delle esitazioni (in particolare delle pause) nei testi letti. Nel 1989 Gunnar Fant e Anita Kruckenberg22 hanno pubblicato un studio, che pur riguardando in modo marginale il problema delle pause in testi di parlato letto e parlato ritmico, contiene alcuni punti importanti, relativi ai dati raccolti dagli autori sul timing delle pause. In particolare, gli autori affermano che la proporzione globale pause/parlato è un parametro che varia da parlante a parlante in un range compreso tra il 15% e 30%. Il problema della percezione e della produzione delle pause in testi letti ad alta voce in svedese è invece centrale in un lavoro del 199123 di Eva Strangert, che analizza poi, con particolare attenzione, i correlati acustici delle disfluenze e la loro distribuzione. Lo studio, che utilizza come materiali testi letti lentamente, a velocità normale e velocemente, ha mostrato che l’uso di testi letti ad alta voce limita il numero delle esitazioni, e che la distribuzione delle esitazioni stesse nei testi letti a voce alta è legata alla presenza di confini sintattici. Dal punto di vista acustico, i correlati più stabili delle esitazioni includono, oltre al silenzio, nei casi in cui è presente, l’allungamento prepausale, reset di f0 e irregolarità nella qualità della voce. Inoltre, l’autrice ha riscontrato alcune correlazioni tra la presenza di confini sintattici, e la tipologia di pause. Infatti, maggiore è il rango del confine sintattico, maggiore è la probabilità che la pausa occorra. Le correlazioni sussistono non solo tra distribuzione e sintassi, ma anche sul piano acustico: i dati mostrano che quanto più è alto il rango del confine sintattico, tanto più marcati e vari sono i correlati acustici della pausa. Un dato ulteriore riguarda la relazione tra incidenza di pause e velocità di lettura: quanto più è lenta la lettura, tanto più sono risultate frequenti le pause. I dati mostrano anche che il legame con la sintassi è presente tanto nella produzione quanto nella percezione delle pause. Per quel che concerne le produzione, l’intervallo di silenzio presente nella pausa riflette il rango del confine sintattico. Dal punto di vista della percezione, invece, le pause silenti vengono chiaramente percepite, e il silenzio sembra essere il correlato acustico più forte. In un altro studio di argomento simile, Strangert (1993) 24 conduce un’indagine sulla distribuzione e la posizione di occorrenza delle pause in tre stili diversi di parlato svedese: monologhi spontanei, lettura non professionale, lettura professionale. Le pause occorrono in tutti e tre gli stili nelle seguenti posizioni: 1) nei monologhi spontanei: ai confini sintattici, prima di parole piene, in altre posizioni; 2) nella lettura non professionale: ai confini sintattici; 3) nella lettura professionale: ai confini sintattici, prima di parole piene. 22 Gunnar Fant e Anita Kruckenberg, ‘Preliminaries to the study of Swedish prose reading and reading style’ STL-QPSR 2/1989, Dept. of Communication and Music Acoustics, KTH. 23 Eva Stangert, ‘Pausing in texts read aloud’, ICPhS’91, 4:238-241, 1991. 24 Eva Strangert, ‘Speaking style and pausing’ PHONUM (Reports from the Dept. Of Phonetics, University of Umeå): 121-137; 1993. 12 Nel parlato spontaneo, che differisce molto dagli altri due tipi per modalità di pianificazione e produzione, la libertà e la frequenza di occorrenza delle pause riflette difficoltà nella pianificazione. Nel parlato spontaneo e in quello non professionale, il maggior numero di pause occorre in corrispondenza dei paragrafi. Nel caso del parlato letto da professionisti (notiziari), la necessità di dare l’informazione rapidamente fa sì che le pause siano estremamente ridotte. Oltre alle pause silenti, l’autrice individua anche altri tipi di pausa/esitazione, quali: -pause costituite da inserzione di vocali; -rallentamento della velocità d’eloquio; -calo di f0 (caratteristica delle pause esterne ad una frase in tutti e tre gli stili di parlato). -glottalizzazioni e altre irregolarità del voicing. In conclusione, in generale nei tre stili di parlato analizzati le pause sembrano essere largamente dipendenti dalla sintassi, e le loro manifestazioni riflettono il rango del confine sintattico i corrispondenza del quale occorrono. Come si vede i risultati di questo secondo studio coincidono in parte con quelli del primo, avvalorando l’ipotesi secondo la quale i fenomeni di esitazione sono ampiamente correlati alla sintassi. Un ulteriore studio che contiene dati interessanti sulla posizione delle pause è quello, pubblicato nel 1998 da Petra Hansson25. Si tratta di uno studio che, a partire dai dati disponibili in letteratura, affronta il problema della distribuzione delle pause e dei principali correlati acustici ad esse associati, nello svedese parlato spontaneo. Le pause nel parlato spontaneo hanno una distribuzione più libera rispetto a quella che si trova nel parlato letto. Tale distribuzione non è tuttavia casuale. Le pause nel parlato spontaneo, infatti, occorrono per la maggior parte: a) tra frasi; b) dopo marche discorsive e congiunzioni; c) prima di parole piene accentate. Una delle funzioni attribuibili alla prosodia è quella di strutturare il linguaggio parlato (Bruce G., 1998 26) ed infatti, un modo di marcare i confini tra unità coerenti di parlato è inserire delle pause. La segmentazione del flusso di parlato a mezzo di pause non è, però, importante soltanto per la percezione, ma è importante anche dal punto di vista della produzione, e.g., perché le pause consentono a chi parla di respirare, pianificare la frase e scegliere le parole (Goldman-Eisler, 197227). Così, se le pause nel parlato letto sembrano coincidere per lo più con i confini sintattici (Strangert E., 1991), le pause nel parlato spontaneo hanno una distribuzione meno soggetta a restrizioni (Gårding, 1967 28; Strangert E., 1993). Dai dati di Hansson, ricavati dall’analisi di un monologo in lingua svedese, si evince che un confine di frase non sembra essere, nel parlato spontaneo, una posizione obbligatoria per le pause. Sebbene si tratti del confine sintattico in cui le pause occorrono con maggiore 25 Petra Hansson, ‘Pausing in spontaneous speech’ , Proceedings FONETIK 98 Dept. Of Linguistics, Stockholm University, pgg. 158-161,1998. 26 Bruce G., ‘Allmän och svensk prosodi’, Praktisk lingvistik, 16, Department of Linguistics and Phonetics, Lund University, 1998. 27 Goldman-Eisler, F. 1972 Pauses, clauses, sentences. In Language and Speech 15: 103-13. 28 Gårding E., ‘Prosodiska drag i spontant och uppläst tal’, in Holm G. (ed.) Svenskt talspråk, 40-85. Stockholm: Almqwist & Wiksell. 13 frequenza nel materiale analizzato, infatti, solo il 57% del numero totale delle frasi analizzate sono precedute da pause. D’altro canto, il fatto che le pause occorrano frequentemente dopo marche discorsive potrebbe anche costituire un riflesso della pianificazione delle frasi. Spesso le pause non sono vuote ma si accompagnano a correlati acustici, quali: a) allungamento prepausale; b) inserzione di vocoidi; c) cambi nella qualità della voce; d) pattern specifici di f0; e) abbassamento graduale dei valori dell’intensità f) glottalizzazioni (normalmente combinate con un calo in f0 e nell’intensità). I fenomeni di esitazione, che spesso occorrono congiunti ad intervalli di silenzio e all’inserzione di vocoidi, sono percepiti anch’essi come pause. In parecchi casi, inoltre, la ripetizione di una parola dà all’ascoltatore l’impressione della presenza di una pausa, a dispetto dell’assenza di correlati acustici. Le misure condotte sulle pause vuote mostrano che le pause poste prima di confini di frase e dopo marche di discorso, che presumibilmente riflettono la pianificazione della frase sono più lunghe delle pause poste prima delle parole accentate, che riflettono il processo di ricerca di una parola importante operato dl parlante. Non c’è, inoltre, una differenza significativa tra durata delle pause sintatticamente motivate e durata della pause non sintatticamente motivate. Sulla base delle differenze nei profili di f0 associati alle pause, infine, si può fare una distinzione tra pause che segnalano confini prosodici e pause che occorrono senza spezzare la coerenza prosodica della frase. 4.STUDI SULLA QUALITÀ ACUSTICA DELLA DISFLUENZE. In questo paragrafo sono riportati i risultati principali di alcuni studi che hanno avuto come oggetto la qualità acustica delle esitazioni. Altri dati interessanti in proposito sono stati riportati nel paragrafo relativo agli studi sulle esitazioni in diversi stili di parlato (Strangert 1991, 1993; Hansson 1998). In uno studio di Duez29 viene investigata acusticamente la frequenza durata e distribuzione delle pause in francese, in 3 stili di parlato: interviste politiche (PI), interviste spontanee (CI) (classificate come appartenenti al parlato spontaneo) e discorsi politici (PS). Lo scopo di questo lavoro è l'analisi dettagliata in ciascun tipo di testo ed il confronto tra i diversi stili per arrivare a stabilire la possibile funzione stilistica delle pause, a partire da uno sfondo teorico costituito dai lavori pionieristici di Goldman-Eisler 1968, Grosjean e Deschamps 1973 30, Boomer 1965, Ruder and Jensen 1972 31, Barik, 1968. L'assunto di partenza è che non è possibile attribuire un'unica funzione ad una pausa: una pausa può avere diverse funzioni e al contempo una stessa funzione può essere realizzata 29 Danielle Duez, ‘Silent and non-silent pauses in three speech styles’, Language and Speech, 25/ 1: 11-28, 1982. Grosjean F., Deschamps A. ‘Analyse des variables temporelles du français spontané’, Phonetica, N° 28:191226,1973. 31 Ruder, K. F., Jensen, P. J., ‘Fluent and Hesitation pauses as a function of sintactyc complexity’, Journal of Speech and Hearing Research, 15:49-60, 1972. 30 14 attraverso diversi tipi di fenomeni di esitazione (pausa silente, pausa piena, falsa partenza, ripetizione, allungamento sillabico, o qualunque combinazione delle precedenti). Sono stati calcolati i seguenti parametri: Total Speech Times (TST); Total Articulation Times (TAT); Total Pause Times (TPT); Total Time of Silent Pause (TTSP); Total Time of Non-silent Pause (TTNP); Il TAT corrisponde alla somma delle durate dei segmenti fonici che contengono informazioni semantiche; il TTSP corrisponde alla somma delle durate delle pause silenti; il TTNP corrisponde alla somma di tutti gli altri segmenti fonici non classificabili come sopra. Il TPT è dato dalla somma di TTSP+TTNP. Le pause silenti e non-silenti sono definite e classificate secondo il seguente criterio: Silent pause: ogni intervallo nella traccia oscillografica in cui l'energia totale è indistinguibile da quella del rumore di fondo. Filled pause: ogni occorrenza delle interiezioni di esitazione francesi come “eu”, “oe”, “n”, ecc. False start: ogni sequenza di segmenti intesi come inizio del successivo enunciato ma interrotta e rimpiazzata da un'altra che viene portata a compimento. Repeat: ogni ripetizione non intenzionale di una sequenza fonica riprodotta successivamente nella sua forma completa (si tratta di ripetizioni anticipatorie). Lengthened syllable: ogni sillaba nella quale la vocale e/o la consonante sono prolungate in maniera abnorme. Articulated sequence:ogni sequenza di segmenti fonici (escluse pause piene, false partenze e ripetizioni) delimitata da due pause silenti. E’ stata studiata anche la distribuzione sintattica delle pause silenti, in accordo alla loro durata e alla loro tipologia. Le pause sono state suddivise come segue, in base alla posizione di occorrenza: - interna al sintagma; - tra sintagmi; - tra clausole. Il primo dato importante che emerge da quest'analisi è la grande variabilità interindividuale sia nella frequenza delle pause che nella loro durata. Questa variazione interindividuale è di norma maggiore di quella rilevabile nel passaggio da uno stile di parlato ad un altro. Tuttavia alcune differenze significative tra i tre stili in esame emergono chiaramente. Innanzitutto si osserva la totale assenza di pause non-silenti nel PS, mentre nel PI e nel CI esse sono presenti e dovute al carattere di 'improvvisazione' del parlato. Al contrario, nel PS sono assai più frequenti e lunghe, rispetto agli altri due stili, le pause silenti che hanno il compito proprio di escludere i tempi di esitazione e di enfatizzare le idee e gli argomenti. In generale, il numero e durata maggiore di pause silenti si ha dunque nel PS, mentre il numero e durata maggiore di pause piene si ha nel CI e la velocità di articolazione maggiore si ha nel PI. 15 Per quanto riguarda la distribuzione sintattica dei tipi di pause si confermano sostanzialmente i risultati precedenti di Grosjean e Deschamps (1975) e di Goldman-Eisler (1972). Le pause silenti che occorrono a confine di clausola sono più frequenti e più lunghe di quelle che occorrono al confine di sintagma ed entrambe di quelle che occorrono all'interno di un sintagma. Le prime due, tuttavia, sono più frequenti nel PI che nel mentre nel PS più formale il 43% circa dei confini tra costituenti minori (sintagmi) coincide con una pausa ed il 79% dei confini di costituenti maggiori (clausole) è segnalato dalla presenza di pausa. Anche la durata delle pause tra costituenti (maggiori o minori) mostra distribuzione simile in PI e CI, mentre in PS queste pause tendono ad essere significativamente lunghe. La differenza è difficile da spiegare soprattutto perché si tratta di situazioni di parlato diverse; ad ogni modo sembra che si possa dire che alcune delle pause lunghe, soprattutto quelle tra sintagmi, del PS hanno una funzione stilistica. La durata e la frequenza delle pause interne a sintagma sono simili per i due tipi di parlato da intervista (PI e CI); l'interpretazione che se ne dà è che queste pause silenti costituiscono un tipo di esitazione nel CI, mentre hanno una funzione stilistica nel PI, quella di costituire un evento inatteso e quindi attirare l'attenzione dell'interlocutore o enfatizzare la parola o l'argomento che segue. Negli stili di parlato più informali (PI e CI), quindi, sono più frequenti i fenomeni di esitazione (pause non-silenti), e frequenza e durata delle pause silenti mostrano distribuzioni più o meno simili. La maggior parte di queste pause silenti sono brevi o medie e tendono ad occorrere alle giunture tra costituenti sintattici, ma la loro presenza non è, presumibilmente legata a fattori grammaticali: esse, cioè, non hanno lo scopo di facilitare la comprensione, bensì servono per pianificare on-line, mentre si parla. Sono anche abbastanza frequenti le pause all'interno di sintagma che per il CI hanno carattere di esitazione, mentre per il PI hanno funzione stilistica di straniamento, espressiva di rafforzamento dell'argomentazione e prosodica di messa in rilievo di certe parti della stringa. Nello stile di parlato più formale e controllato (PS) sono praticamente assenti i fenomeni di esitazione. Inoltre, le pause silenti hanno frequenza e durata piuttosto alte e costituiscono una caratteristica saliente di questo stile di parlato, tanto che, nonostante l'assenza di fenomeni di esitazione il tempo di pausa totale è il 50% in più rispetto agli altri stili. Queste pause occorrono essenzialmente al confine tra costituenti sintattici e tendono ad essere in accordo con la struttura grammaticale, rendendo più facile e spedita la decodifica, mentre poco frequenti sono le pause interne ai costituenti che hanno, eventualmente, una funzione stilistica. Le ipotesi avanzate in questo lavoro necessitano, secondo l’autrice, di una verifica percettiva, ovvero di un'indagine sul giudizio soggettivo in merito a lunghezza, frequenza ed effetto delle pause silenti, nonché della loro funzione prosodica (si vedano gli altri lavori di Duez analizzati in questa rassegna). O'Shaughnessy32 ha condotto uno studio sui restart (ripartenze o false partenze) in inglese, definiti come interruzioni del flusso del parlato in cui il parlante reitera una porzione della stringa immediatamente precedente con o senza cambiamenti lessicali. Il fenomeno può andare dalla ripetizione di una sillaba a quella di più parole. Nel caso di cambiamenti lessicali (cambi di progetto), questi possono riguardare tanto la sostituzione di 32 Douglas O'Shaughnessy, ‘Analysis of false start in spontaneous speech’, Proceedings of ICSLP-92: 931-934, 1992a. 16 una nuova parola al posto di una parola intera o interrotta precedente, quanto l'inserzione di una parola in una sequenza che conterrà quindi la nuova parola in una seconda occorrenza. Lo scopo del lavoro è fondamentalmente quello di evidenziare dal punto di vista acustico aspetti dell'intonazione dei restart che possono fungere da indici di identificazione per un sistema di riconoscimento automatico del parlato: tale sistema dovrà individuare, isolare ed espungere una versione di ciascuna parola o porzione di parola ripetuta e, nel caso di sostituzione lessicale, ogni parola o porzione presente, ma rifiutata e sostituita dal parlante. Prima di presentare i dati dell'analisi, l'autore offre una panoramica dei precedenti studi sulle false partenze, esigui soprattutto dal punto di vista dell'analisi acustica (Heike, 1981; Levelt, 1989 33; Grosjean e Deschamp 1973; Shriberg et al. 1992 34). Risulta importante, in particolare, il sunto dei dati di Shriberg et al. 1992 con i quali l’autore opera continui confronti: si tratta di un lavoro volto all’individuazione e correzione automatica delle false partenze, nel quale risulta che il 10% delle sequenze di un testo parlato ha fenomeni di ripartenza: il 59% di essi è costituito da ripetizioni di una sola parola, il 24% da ripetizioni di due parole, il resto a decrescere. Nell’uso di un algoritmo che lavora sul solo testo, la percentuale di errore nell’individuazione dei restart si mantiene alta (intorno al 23%) e si producono falsi allarmi nel 38% dei casi; l’inclusione di un modello linguistico porta invece all’85% di individuazioni. Lo studio è condotto su un corpus di interazioni uomo-macchina, prodotto da parlanti adulti maschi e femmine. I risultati delle analisi svolte sul materiale mostrano che, nella semplice ripetizione di parola quest’ultima dovrebbe avere ipoteticamente gli stessi parametri di durata e pitch in entrambe le occorrenze, tuttavia vi sono diversi casi in cui risulta deaccentata (ha cioè pitch più basso e durata minore). Sono emersi da questo studio anche alcuni altri dati importanti, che riporteremo analiticamente di seguito. Innanzitutto, se una parola viene interrotta in un qualche suo punto, è presente una pausa nell’85% circa dei casi; circa ¾ delle parole interrotte, inoltre, non arriva a completare la prima sillaba (la parola viene interrotta grosso modo dopo la prima consonante) ma si attesta grosso modo sempre intorno ad una durata di circa 100ms. Quando, invece, si verifica una pausa al confine di parola, la parola ripetuta dopo la pausa è caratterizzata da due tipi di condizioni: o una ripetizione con pochi cambi prosodici o una ripetizione con accorciamento di durata della parola di circa il 50%. Nel caso di sostituzione o inserzione di nuova parola nella sequenza, la parola sostituita o inserita ha durata notevole e f0 molto pronunciata solo se apporta nuova informazione semantica, altrimenti, se ridondante, questo non accade. Le parole funzionali che precedono la ripetizione hanno spesso un calo di f0 ma non di durata; le parole piene che precedono la ripetizione subiscono invece un notevole accorciamento insieme al calo di f0, a meno che non siano seguite da pausa, nel qual caso subiscono l’allungamento prepausale. In questo studio è stato, inoltre, testato un algoritmo di individuazione automatica che lavora sul parametro durata (individuando come restart tutti i casi con presenza di una pausa breve, inferiore di 400ms) che ha dato risultati di corretta individuazione nel 75% dei casi e 35% di falsi allarmi. 33 Levelt, W. J. M., Speaking: from intention to articulation. Cambridge, MA: MIT Press, 1989. Shriberg, E., Bear J, Dowling J., ‘Automatic Detection and Correction of Repairs in Human-Computer Dialogue’. DARPA Speech and Natural language Workshop. Arden House, N. Y., 6 pages, Feb. 1992. 34 17 Si ipotizza un miglioramento di questo algoritmo con l’inclusione di due modalità di analisi: 1) l’analisi di f0 nelle adiacenze della pausa breve (sempre primo indice del restart) 2) l’analisi delle caratteristiche spettrali delle sequenze adiacenti la pausa, alla ricerca della ripetizione totale o parziale. Questa seconda ipotesi diventa però difficilmente perseguibile nel caso di sostituzione o inserzione di nuovo elemento lessicale, cioè nel caso di cambio di progetto. Un altro studio dello stesso autore 35, che verte principalmente sul problema del riconoscimento automatico delle pause, pur rimandando al precedente in molte sue parti, inserisce, tuttavia, degli interessanti ampliamenti delle analisi relative alla pause piene e vuote. Di seguito sono riportati solo i dati relativi a questa parte di ampliamento delle analisi. Nel riconoscimento automatico delle pause vuote, il problema principale consiste nell’evitare la confusione con le fasi di silenzio di foni ostruenti: la distinzione è tutta nella durata: le fasi di silenzio delle consonanti occlusive, infatti, non durano più di 40ms, mentre le pause silenti a confine di unità sintattica si attestano su una media di 490/500ms, quelle interne ad unità sintattica, intorno ai 270ms. Le pause piene somigliano, invece, a parole molto brevi del parlato fluente. La distinzione in questo caso coinvolge durata, timbro e pattern di f0. In particolare, - le pause piene al confine di costituenti sintattici maggiori hanno durate variabili tra 200 e 500ms; quelle interne a tali costituenti variano tra 170 e 350ms; - le pause piene non grammaticali possono essere precedute da una pausa vuota breve (intorno ai 350ms); quelle grammaticali sono precedute da un silenzio ampio, sempre maggiore di 275ms che tende a crescere (fino a 700ms) se la pausa piena che segue è breve, e ad accorciarsi se la pausa piena che segue è lunga; - il pattern spettrale della pausa piena è di norma uniforme per tutta la sua durata, simile a quello di uno schwa, a volte seguito da un segmento nasale o nasalizzato; - tutte le pause piene hanno, infine, un pattern discendendente (se si trovano al confine sintattico) o piatto su valori assoluti molto bassi (se si trovano dentro costituente sintattico) di f0; tutte terminano con una f0 al di sotto del 15% del range del parlante. Uno altro studio di carattere propriamente fonetico-acustico è stato pubblicato nel 1993 da Schriberg e Lickely36. Gli autori hanno analizzato due corpora piuttosto difformi di inglese di Inghilterra e d’America: il corpus di inglese di Edimburgo, infatti, è più spontaneo di quello di inglese americano. Lo studio mostra che la f0 delle pause piene interne ad una clausola non è casuale, ma dipende dal contesto prosodico precedente: i picchi di f0 più alti, infatti, sono sistematicamente connessi ai valori più alti all’interno delle pause piene. Tale relazione tra contesto prosodico precedente e comportamento della f0 nelle pause piene può essere descritta, sia nell’inglese d’America che in quello d’Inghilterra, attraverso un modello lineare 35 Douglas O'Shaughnessy, ‘Locating disfluencies in spontaneous speech: an acoustical analisys’, Proceedings of European Conference On Acoustics on Speech Communication and Technology, 3:2187-2190, 1992b. 36 Elizabeth E. Schriberg, Robin J. Lickely ‘Intonation of clause-internal filled pauses’, Phonetica, 50:172-179, 1993. 18 nel quale la caduta del pitch è proporzionale alla distanza tra il valore del precedente picco di f0 e la baseline stimata per il parlante. Questo modello, che utilizza un solo parametro (valore della f0 del picco), è, per accuratezza delle previsioni, non molto distante da modelli che utilizzano un numero superiore di variabili indipendenti. Tuttavia, il modello è risultato meno efficiente per le pause piene che seguono picchi iniziali di frase. I risultati suggeriscono inoltre che l’intonazione nelle pause piene sia indipendente da variabili temporali. Anche altri studi successivi di Robin Lickely37 hanno illustrato diversi importanti risultati sulla percezione delle pause e la loro qualità acustica. Lickely (1994) analizza, attraverso cinque esperimenti, la percezione da parte di parlanti normali delle disfluenze nel parlato spontaneo. Il principale risultato dei primi tre esperimenti riguarda il fatto che le disfluenze (le riparazioni) vengono riconosciute molto presto, in genere entro la prima parola successiva al punto di interruzione. Inoltre, il riconoscimento della disfluenza avviene anche prima che la prima parola successiva alla disfluenza venga essa stessa riconosciuta, e ciò indica che non vengono utilizzate da parte del parlante informazioni di carattere sintattico. Gli ultimi due esperimenti confermano l’ipotesi che l’informazione prosodica possa essere usata per distinguere le disfluenze dalle produzioni fluenti. In un capitolo apposito l’autore presenta poi i risultati di un’analisi acustica dettagliata condotta sul materiale utilizzato per gli esperimenti. L’indagine acustica interessa le pause, il pitch, il ritmo, le glottalizzazioni e i fenomeni di giuntura, in prossimità delle disfluenze presenti negli stimoli utilizzati per gli esperimenti. Pur avendo rilevato alcuni indici che potrebbero guidare l’ascoltatore al riconoscimento precoce delle disfluenze, Lickely suggerisce che questi indici non debbano essere sopravvalutati, poiché la loro importanza può essere legata all’alta qualità del segnale, che li rende chiaramente udibili: in condizioni di interazione naturali questi stessi indici non sarebbero chiaramente udibili. E’ tuttavia chiaramente udibile un arresto tra le parole nel punto di interruzione in cui gli indici sono stati rilevati. La presenza di una pausa in un posto dove essa non sia prevedibile su base sintattica o prosodica è essa stessa un segno di disfluenza, anche se non è necessariamente un segnale di una successiva riparazione. L’autore ha ipotizzato che il reset di f0 potesse fungere da indice affidabile, per gli ascoltatori, della presenza di disfluenze. I risultati, tuttavia, non mostrano evidenze incontrovertibili in tal senso. L’indice più stabile delle discontinuità sembra, in conclusione, essere nelle pause e nell’assenza di collegamenti fonologici, nei casi in cui la struttura sintattica e quella prosodica prevedrebbero dei collegamenti. Questi indici, comunque, sono definibili solo in termini di distinzione tra ciò che i parlanti si aspettano nel parlato fluente e ciò che occorre nelle riparazioni, ma non possono essere definiti in termini di proprietà assolute e isolabili. Dove una riparazione consiste in una partenza completamente nuova di una frase, la prosodia iniziale di forse è identificata come il più ovvio tra gli indici intonativi di una riparazione. Altri indici intonativi possono essere utili, in combinazione con le informazioni ritmiche, ma sono necessari, per rilievi di questo tipo, ulteriori studi su un campione più ampio. Altri lavori dello stesso autore sono trattati nella sezione relativa agli studi sulla percezione (§5). 37 Robin J. Lickely, ‘Detecting Disfluencies in Spontaneous Speech’, Unpublished PhD Thesis, University of Edinburgh, 1994. 19 In uno studio sul tedesco del 1995, A. Batliner et al. 38 presentano un'analisi statistica e i risultati di una classificazione automatica delle pause piene presenti nel corpus Verbmobil .Viene inoltre discussa la rilevanza di differenti parametri prosodici nel marcare i diversi tipi di pause piene. Innanzitutto è stata operata una distinzione e classificazione preliminare delle pause piene in due tipologie: Hesitations (FPHs): dovute ad esigenze di pianificazione, presa di turno e tratti idiosincratici del parlante. Queste hanno la stessa funzione delle pause vuote e degli allungamenti vocalici o consonantici in fine parola. Cue phrases (FPRs): ripetizioni o riparazioni di parole e sintagmi, ripartenze di costruzioni sintattiche. Queste hanno funzione equivalente a parole come “no”, “cioè”, ecc. Gli autori sottolineano come le FP possano essere indicatori di diversi tipi e gradi di confine tra costituenti. Pertanto devono essere collegate a diversi parametri prosodici. Il corpus è costituito da dialoghi Map Task raccolti nelle località di Munchen e Karlsruhe, divisi in un totale di 2422 turni (339 minuti di parlato) e prodotti da 56 parlanti femmine e 81 parlanti maschi. Nella trascrizione di questi dialoghi le FP hanno avuto le seguenti 4 notazioni: <äh>, <ähm>, <hm>, <häs>. Non sono state notate differenze nella presenza e distribuzione delle FP tra maschi e femmine. Le FPH sono state divise in: FPHstrong: quelle che si presentano ad inizio turno o al confine tra costituenti sintattici principali FPHweak: quelle che occorrono ai confini di parole, di sintagmi o di costituenti prosodici intermedi deboli. Le FPH forti si distinguono da tutte le altre (FPH deboli e FPR) perchè hanno pause silenti adiacenti piuttosto lunghe e sillabe adiacenti meno intense, proprio perché si trovano ai confini di costituenti sintattici maggiori. Le FPR si distinguono dalle altre (FPH deboli e forti) in base ai parametri di energia e f0. Normalmente l'energia sulle sillabe adiacenti è minore che nelle FPH e f0 tende ad avere un movimento di tipo falling sulla sillaba che precede e di tipo rising su quella che segue; quindi, mediamente, esse si trovano in una sorta di valle melodica. In generale, al confronto con sillabe di controllo, il parametro significativo che aiuta a distinguere (automaticamente) le FP è la durata. Inoltre f0 è bassa e tende ad avere un pattern discendente. Ciò rende le FP prosodicamente simili alle frasi parentetiche. M. Pätzold, A. Simpson39 hanno condotto un’indagine sul tedesco, allo scopo di verificare se le esitazioni (definite come sillabe comprendenti una vocale, eventualmente seguita da una nasale bilabiale (tipo “uh”, “uhm”), prodotta da un parlante in punti critici e problematici della stringa), dal punto di vista della loro realizzazione, appartengano o meno allo stesso sistema fonologico sul quale si costruiscono gli items lessicali. A questo scopo è 38 A. Batliner, A Kießling, S. Burger, E Nöth, ‘Filled pauses in spontaneous speech’, ICPhS'95, .3: 472-475, Stockholm, 1995. 39 M. Pätzold, A. Simpson, ‘An acoustic analysis of hesitation particles in German’, ICPhS'95, 3: 512-515, Stockholm, 1995. 20 stata pertanto effettuata un'analisi spettrale delle porzioni vocaliche di particelle di esitazione e una comparazione con le porzioni vocaliche di items lessicali. Le analisi sono state condotte su 3 parlanti, utilizzando materiale del Kiel corpus (interno al progetto Verbmobil). Sono state analizzate F1 ed F2 intorno al punto centrale della porzione analizzata. Le vocali 'lessicali' scelte per il campione di controllo sono: [E], [A], [«], ed [Œ]; la vocale delle esitazioni è stata trascritta come [Î] convenzionalmente, anche se questo simbolo non rappresenta direttamente la qualità fonetica. Poiché le vocali delle esitazioni sono di norma molto più lunghe di quelle degli items lessicali sono state scelte solo vocali lessicali con durata maggiore di 80ms. Dalle analisi è risultato in primo luogo che c'è una forte variabilità interindividuale nella qualità vocalica delle esitazioni: la vocale è una vocale sempre centrale, ma con diversi gradi di altezza. Il confronto con le vocali di controllo, tuttavia, mostra che per tutti e tre i parlanti i valori di F1 ed F2 delle vocali delle esitazioni sono molto diversi da quelli delle vocali lessicali. Dai dati emersi dalle analisi, gli autori concludono che, poiché la porzione vocalica delle esitazioni differisce fortemente da quella delle vocali lessicali, si può supporre che esse siano foneticamente correlate ad un sistema fonologico diverso da quello degli items lessicali. Gli autori, inoltre, sottolineano un problema metodologico: dal momento che le esitazioni sono prosodicamente prominenti, esse avrebbero dovuto essere paragonate a vocali in sillabe prominenti, cioè a vocali toniche. Questo è stato però possibile solo per [E], [A], dato che [«] ed [Œ] compaiono solo in posizione atona. Inoltre, per trovare una [«] con durate paragonabili alle altre, sono stati selezionati solo foni in fine di stringa. Le proprietà acustiche delle ripetizioni sono state studiate da Shriberg in un lavoro sull’inglese del 199540.Le ripetizioni vengono suddivise in due categorie a seconda della loro funzione (cfr. Heike, 1981, discusso a pg. 12): Ripetizioni prospettive: caratterizzate dalla presenza di una pausa dopo entrambe le occorrenze della parola (R1 e R2) o almeno dopo la seconda occorrenza (R2); esse servono a 'mantenere il campo' durante l'esitazione. Ripetizioni retrospettive: caratterizzate dalla presenza della pausa solo dopo la prima occorrenza (R1) della parola; esse servono da ponte per connettere la continuazione con ciò che c'è prima dopo una rottura della fluenza. La questione centrale riguarda la possibilità di rintracciare delle caratteristiche acustiche di queste ripetizioni che le differenzino dalle altre pause piene. Allo scopo di rispondere a questo quesito sono stati analizzati items estratti dal corpus Switchboard, costituito da conversazioni telefoniche di 6 parlanti maschi. Sono stati valutati i seguenti parametri: - durata di R1 ed R2; - valori di f0 all'onset e offset di R1 ed R2. Nel corpus sono presenti entrambi i tipi di R, cioè tanto quella retrospettiva, quanto quella prospettiva, ma con frequenze di occorrenza molto diverse. Le prospettive rappresentano il 10% delle ripetizioni, mentre le retrospettive ben il 90%. Per quanto riguarda le durate, dal rapporto R1/R2 si evince che: 40 E.E. Shriberg, ‘Acoustic Properties of disfluent repetitions’, ICPhS'95, 4: 384-387, Stockholm,1995. 21 - per le R prospettive si può avere tanto R1>R2, quanto R2>R1, con una leggera prevalenza del secondo caso. - per le R retrospettive, invece, si ha sempre R1>R2, con differenze di durata notevoli. Il nodo centrale dell’indagine, alla luce di questi dati, riguarda la possibilità di considerare questi casi vadano considerati come allungamenti di R1 o di accorciamenti di R2. Ad un'indagine con parole di controllo presenti nel discorso fluente, risulta che si tratta di durate particolarmente fuori norma per R1, che subisce quindi degli allungamenti. Questo quadro ben si adatta alla funzione di 'ponte', di collegamento che questo tipo di ripetizioni svolge. L'allungamento di R2 sembra invece collegato alla funzione di 'stallo' della R prospettiva. Per quanto riguarda la frequenza fondamentale: - nelle R retrospettive f0 mostra un pattern discendente tra onset e offset sia in R1 che in R2. L'onset di R2 tende a riprendere valori pari a quelli dell'onset di R1, mentre l'offset di R2 non raggiunge gli stessi valori in basso dell'offset di R1, forse a causa della ridotta durata di R2. (Questo corrisponde bene all'ipotesi di Levelt e Cutler (1983)41, che R2 ha gli stessi parametri del materiale che rimpiazza) - nelle R prospettive (per le quali, tuttavia, si hanno solo pochi dati preliminari) sembra che il pattern di f0 sia discendente nel passaggio da R1 a R2: l'onset di R2 è più basso dell'offset di R1. Questo pattern accomuna del tutto le R prospettive alle pause piene, di cui condividono già la funzione di 'stallo'. 5.I FENOMENI DI DISFLUENZA NELLA PERCEZIONE DEL PARLATO Esitazione e disfluenze sono state oggetto di indagine anche da parte degli psicolinguisti: esse possono, infatti, dare informazioni molto utili sui meccanismi di produzione e percezione del parlato. In uno studio del 1979, Bernd Voss 42 ha condotto un’indagine sui problemi percettivi di parlanti non nativi dell’inglese. La percezione sembra essere il risultato di un confronto tra le proiezioni dell’ascoltatore e l’informazione acustica in entrata. Da questo lavoro non emergono sostanziali differenze tra i meccanismi di percezione dei parlanti nativi e non nativi, mentre i fenomeni di esitazione sono fonte di problemi di percezione per i parlanti non nativi. Lo studio di Voss vuole fornire una risposta (pur provvisoria) alla domanda se ci siano differenze nei meccanismi di percezione di parlanti nativi e non nativi. Voss prende le mosse da un studio di Laver (1970, pg.73)43 in cui si sostiene che “la percezione […] regolarizza e idealizza, in qualche modo, il parlato”. L’ipotesi usata per spiegare quest’osservazione è che la percezione del parlato non è solo un processo di identificazione dei segmenti della catena parlata, ma è piuttosto un processo di confronto tra la ricostruzione operata dall’ascoltatore e l’informazione acustica in entrata. Non è necessario, quindi, per il processo di percezione dell’ascoltatore, ricostruire le difficoltà di performance (come esitazioni e errori) del parlante. 41 Levelt, W. J. M., Cutler, A., ‘Prosodic marking in speech repair’, Journal of Semantics, 2/2:205-217, 1983. Bernd Voss Hesitation phenomena as sources of perceptual errors for non-native speakers Language and Speech, vol.22, Part 2, 1979. 43 Laver, J., The production of Speech, in Lyons, 1970: 53-75. 42 22 L’implicazione insita in tale affermazione è che la percezione dipende dalla capacità dell’ascoltatore di compiere il processo di ricostruzione descritto. Questo compito, se non crea problemi ai parlanti nativi, può dare difficoltà ai parlanti non nativi, che, ad esempio per imperfezioni del proprio ‘sistema generativo’, dipendono più strettamente dall’informazione acustica. E’ stata quindi verificata l’ipotesi secondo cui le esitazioni possono essere fonte di errori di comprensione per i parlanti non nativi. Il compito sperimentale affidato ai soggetti parlanti non nativi di inglese era di trascrivere il più correttamente possibile un brano di parlato spontaneo. In fase di trattamento dei dati i fenomeni di esitazione sono stati classificati (secondo Maclay e Osgood, 1959) in ripetizioni, false partenze, pause piene e pause vuote. Dagli errori di interpretazione delle disfluenze emerge che il pattern ritmico delle frasi è un elemento stabile: in particolare è stabile il numero degli accenti percepiti, indipendentemente dal numero di sillabe realizzate. Di particolare interesse, inoltre, sono alcuni errori caratterizzati dal fatto che gli ascoltatori cercano di ricostruire alcuni aspetti della forma fonologica anche a spese del senso. La strategia di percezione, in questi casi mostra di preferire in casi di dubbio un criterio fonologico piuttosto che semantico. Ciò avviene tanto per i parlanti non nativi quanto per i parlanti nativi. Infine, un terzo degli errori rilevati sono errate interpretazioni di esitazioni. In particolare: a) una pausa può essere interpretata come una parola (o parte di una parola); b) una parola (o una sua parte) può essere interpretata come una pausa piena. In questo caso la presunta pausa è stata filtrata e non considerata nell’interpretazione della stringa. In senso generale, Voss nota il fatto che gli ascoltatori talora sentono più di quanto non sia stato effettivamente detto. Questo supporta l’idea che la percezione sia un processo di confronto tra le attese dell’ascoltatore e l’informazione acustica in entrata. Per quel che concerne l’uso di diverse strategie percettive da parte di parlanti nativi vs. non nativi, i dati mostrano che gli errori di percezione nei parlanti non nativi hanno una andamento simile a quello dei parlanti nativi, anche se l’alto numero di errori connessi alle esitazioni suggerisce che esse presentino una maggiore difficoltà percettiva per i parlanti non nativi che ascoltano parlato spontaneo. L’importanza delle pause nella percezione è sottolineata anche in uno studio di Reich (1980)44. Già Goldman-Eisler (1968) aveva messo a fuoco il fatto che le pause possono essere usate per facilitare la produzione, analogamente a quanto Aaronson (1968)45 rilevava per la percezione del parlato. Lo studio di Reich prende le mosse dalla distinzione operata da Goldman-Eisler (1958, 1968) tra pause grammaticali e pause non grammaticali (cfr. §1), dove per pause grammaticali si intendono quelle che occorrono tra le clausole e che sono usate per la pianificazione strutturale e semantica a lungo termine nella produzione del parlato, mentre le pause non grammaticali sono quelle che occorrono all’interno delle clausole e hanno a che fare con la selezione a brevissimo termine di una parola. Questa distinzione trova sostegno nel fatto che le pause grammaticali sembrano essere associate ad un processing di tipo diverso rispetto alle 44 Schuli S. Reich, ‘Significance of Pauses for Speech Perception’, Journal of Psycholinguistic Research, 9/4:379-389, 1980. 45 Aaronson D. ‘Temporal course of perception in an immediate recall task’, J.Exp. Psycol. 76:129-140,1968. (citato in Reich, 1980). 23 pause non grammaticali. Partendo da questa posizione, si attende che le pause tendano ad interferire col processamento del parlato: lo scopo del lavoro di Reich, infatti, è di esaminare gli effetti della disposizione delle pause sulla percezione delle frasi. Nel primo esperimento è stato utilizzato un compito di categorizzazione semantica, mentre nel secondo esperimento è stato utilizzato un compito di richiamo alla memoria di frasi precedentemente ascoltate dai soggetti. Sebbene le pause non sembrino avere effetti sulla velocità con cui le parole nelle frasi sono individuate (esperimento I), hanno tuttavia un considerevole effetto sulla velocità e l’accuratezza con cui le frasi sono ricordate (esperimento II). Questi risultati sono simili a quelli ottenuti da Aaronson (1968) e sono anche inscrivibili all’interno del modello della percezione del parlato proposto dalla Aaronson stessa, anche a dispetto di alcune differenze nelle strategie di percezione che i parlanti sembrano adottare. Tali differenze sono probabilmente riconducibili al tipo di esperimento dal quale provengono i dati dei due autori. Sebbene il compito di classificazione semantica (esperimento I) non è stato influenzato in modo significativo dalla posizione delle pause, la complessità strutturale della frase ha notevoli effetti sul compito stesso. In conclusione sembra possibile dire che in condizioni di sovraccarico cognitivo nel processamento uditivo, le pause possono giocare un ruolo di vitale importanza nella scelta della strategia e di conseguenza nel livello della performance. Come le pause sono cruciali per facilitare il parlato fluente e complesso, così lo sono altrettanto nel mettere l’ascoltatore in grado di comprendere la complessità di una frase. Alcuni studi sia sull’aspetto percettivo sia sull’aspetto acustico delle pause sono stati condotti da Duez (1985, 1990; per uno studio di carattere propriamente acustico vedi §4). Lo studio del 198546 indaga la percezione delle pause silenti in tre stili di parlato in lingua francese (discorsi politici, interviste di argomento politico ed interviste casuali). Ai soggetti è stato richiesto di identificare le pause silenti (definite come “interruzioni del flusso di parlato”) in campioni di parlato naturale, di parlato con spettro invertito e di parlato sintetico, concentrandosi esclusivamente sulla percezione delle pause, senza prestare attenzione al significato delle stringhe che erano state loro sottoposte. Queste condizioni non naturali di percezione, costituiscono in qualche modo un limite nella procedura sperimentale. In fase di analisi dei dati, le pause sono state suddivise, in base alla posizione sintattica in cui sono state individuate dagli ascoltatori, in: a) Pause poste al confine di frase. b) Pause poste al confine di clausola. c) Pause poste al confine di costituenti. Per ciascuna pausa sono state condotte misure acustiche relative alla durata, alla frequenza fondamentale e all’intensità. Per quel che concerne la durata sono stati misurati gli allungamenti vocalici, mentre le misure di intensità e frequenza sono state normalizzate. Sono stati identificati, infine, anche fenomeni di esitazione quali pause piene, false partenze, ripetizioni e strascinamenti della voce. Infine, i dati provenienti dalle analisi dei vari tipi di parlato sono stati posti a confronto. La percezione delle pause è risultata simile nel parlato normale e nel parlato che ha subito un’inversione spettrale. Questo dato pone l’accento sull’importanza della struttura 46 Danielle Duez, ‘Perception of silent pauses in continuous speech’, Language and Speech, 28/4:377-389,1985b. 24 prosodica, poichè dai dati risulta che, nel 70% dei casi, essa ha la stessa influenza sulla percezione delle pause di una struttura linguistica completa. Le differenze tra i dati provenienti dai due tipi di parlato possono, quindi, essere attribuite al contesto. I parlanti tendono a non percepire le pause inattese, come quelle poste all’interno dei costituenti o quelle che si accompagnano ad un’esitazione. Tuttavia queste pause sono identificate più facilmente nel parlato con spettro invertito, dove non ci sono interferenze di carattere sintattico-semantico. Nel parlato sintetico tutte le pause sono identificate con maggiore faciltà, indipendentemente dalla loro reale durata. In questo caso, infatti, l’individuazione delle pause è un compito psicoacustico che non coinvolge nessuna abilità di carattere linguistico. La durata sembra essere un parametro essenziale nella percezione delle pause, poiché l’identificazione di una pausa sembra correlata alla sua durata. La durata di una pausa interagisce con i parametri acustici che caratterizzano la vocale precedente, e l’influenza di questi parametri sembra crescere al decrescere della durata della pausa. L’autrice prospetta, infine, un più ampio studio sulle strutture ritmiche, in cui si investighi con particolare attenzione l’interazione della durata di una pausa con il contesto acustico in cui essa si trova. Nello studio del 199347, sempre sul francese, sono state analizzate quelle pause che, pur essendo percepite negli esperimenti, non corrispondono a pause vuote, e che sono state chiamate dall’autrice pause soggettive. Con procedura analoga a quella adottata per gli esperimenti del 1985, nel primo esperimento sono stati utilizzati stimoli provenienti da parlato spontaneo, presentati in due versioni, una non modificata ed un’altra in cui è stato invertito lo spettro. Gli stimoli, presi da discorsi ed interviste (casuali e di argomento politico) ad uomini politici francesi sono stati sottoposti a 10 soggetti (5 uomini e 5 donne) di madrelingua francese. Ai soggetti è stato richiesto di premere un bottone ogni volta che avessero percepito una pausa (definita come interruzione nella frase). In fase di analisi dei dati, una pausa è stata definita come tale nel caso in cui fosse percepita da due soggetti (o da uno solo, ma in ambedue le modalità di presentazione del materiale) e non fosse associata ad un confine sintattico immediatamente precedente o seguita da una consonante occlusiva. Le posizioni sintattiche delle pause, rilevate dai dati, sono le seguenti: 1) tra frasi; 2) tra clausole; 3) tra sintagmi; 4) all’interno di un sintagma. Sono state, inoltre, misurate la durata, la frequenza e l’intensità di ogni pausa. Le pause non silenti sono state classificate come segue: 1) Pause piene: occorrenze di “interiezioni” come: eu, euh, n. 2) False partenze: ogni sequenza di segmenti, con cui il parlante intende cominciare una frase, interrotta e rimpiazzata da un’altra sequenza poi completata. 3) Ripetizioni: ogni sequenza ripetuta e completata. 4) Sillabe allungate: ogni sillaba con una vocale o una consonante lunga in modo abnorme. 47 Danielle Duez ,’ Acustic Correlates of Subjective Pauses’, Journal of Psycholinguistic Research, 22/1:21-39, 1993. 25 I dati provenienti dai due tipi di materiale non sono stati analizzati separatamente poiché non sono state rilevate differenze significative. I risultati ottenuti concordano con quelli provenienti dallo studio condotto dalla stessa Duez nel 1985, dal quale era emerso che la percezione delle pause silenti interagisce principalmente con le vocali ed in particolare con la loro durata. Nel secondo esperimento ai 10 soggetti sono state sottoposte 5 repliche di due frasi prodotte da un parlante francese di sesso maschile, addestrato a non produrre pause silenti. La procedura è analoga a quella dell’esp.1. Anche in questo caso sono state prese misure acustiche di durata, frequenza ed intensità. Dai risultati emerge che, al crescere della durata della vocale target, cresce la frequenza di percezione della pausa. Non sono stati rilevati effetti sistematici legati alle variazioni di f0 e intensità. Questo dato mostra che la struttura temporale ha un ruolo predominante rispetto al pattern di f0 e di intensità nella percezione delle pause. I risultati degli esperimenti sottolineano l’importanza dell’allungamento segmentale (ed in particolare vocalico) sul numero delle pause soggettive. Questo allungamento può corrispondere alla presenza di una pausa non silente. Il legame esistente tra le pause non silenti e le pause soggettive è stato poco indagato. Nella maggior parte dei casi le pause soggettive sono provocate dall’allungamento di una vocale che è dovuto, a sua volta, alla realizzazione di un confine sintattico. Questo dato conferma la presenza di un legame tra la struttura temporale di una frase e la sua struttura sintattica. L’allungamento finale è un fenomeno fondamentale nella percezione e nella produzione del parlato e può essere fisiologicamente determinato. Inoltre, la vocale allungata funge da marca di confine e il grado di allungamento indica l’importanza del confine. Un fenomeno simile è stato studiato relativamente alla declination e al reset di f0. Dal punto di vista percettivo, una durata lunga può svolgere la funzione di una pausa. La quantità di allungamento necessaria perché sia percepita una pausa dovrebbe essere approssimativamente pari alla durata di un suono. Da questo studio, l’allungamento finale sembra essere l’indice più stabile nella percezione di una pausa soggettiva. D’Urso e Zammuner (1990)48 hanno invece affrontato, in uno studio sull’italiano, il problema della la predicibilità della durata delle pause poste tra due turni (domanda e risposta): si tratta di uno studio in cui l’analisi percettiva è congiunta e posta in relazione con l’analisi pragmatica. Sono stati condotti a riguardo due esperimenti: 1) Alcuni soggetti hanno valutato la lunghezza di pause aventi una durata compresa tra i 3 e i 7 secondi e poste tra domande e risposte, nella loro lingua madre ed in una lingua non nota. Gli stessi soggetti hanno anche valutato la lunghezza di pause poste in sequenze di rumore bianco. 2) Alcuni soggetti hanno condotto un’intervista telefonica con una persona addestrata a ritardare artatamente la risposta ad alcune delle domande poste. La variabile dipendente era l’ammontare di tempo che l’intervistatore aspettava la risposta prima di prendere nuovamente spontaneamente la parola. In ambedue gli studi la lunghezza della pausa percepita o ritenuta accettabile tra una domanda e una risposta varia in funzione di fattori linguistici e in funzione della conoscenza 48 Valentina D’Urso e Vanda Zammuner, ‘The perception of pause in question-answer pairs’, Bulletin of the Psychnomic Society, 28/1: 41-43, 1990. 26 enciclopedica. I risultati sembrano riflettere una regola del linguaggio che collega il ritmo della presa di turno e l’ammontare del lavoro mentale che, plausibilmente, è necessario per rispondere ad una domanda. Gli autori ritengono necessario lo sviluppo di un modello che tenga in conto i processi mentali coinvolti nella presa di turno e che possa spiegare i pattern temporali. In questo studio si tratta principalmente di come il contenuto di due turni adiacenti influenzi la lunghezza di una transizione accettata prima del secondo turno. In particolare, le misure riguardano la durata reale e quella soggettiva degli intervalli intercorrenti tra domanda e risposta. L’ipotesi principale è che tale lunghezza vari con la complessità del contenuto del discorso. In generale, la complessità del contenuto dovrebbe aiutare a determinare la durata della pausa, poiché è proporzionale all’ammontare del lavoro mentale richiesto per processare l’informazione portata da una frase. Gli autori ipotizzano che le parti “vuote” siano a tutti gli effetti parti costituenti del dialogo, e che, ceteris paribus, una pausa abbia valore e significato in funzione della sua durata e della sua posizione nel flusso del discorso. I risultati mettono l’accento sull’esistenza di un regola temporale implicita nella conversazione, alla quale i soggetti aderiscono, che impone che una pausa di dimensioni eccessive sia percepita come deviante e venga pertanto corretta. Lo stesso fenomeno evidenzia la necessità di una descrizione del meccanismo di presa di turno anche in termini di processo di inferenza. Questo meccanismo ha a che fare con l’ammontare di conoscenze necessarie attivate prima dell’inizio di un turno e con i processi mentali interni attribuiti al parlante successivo. Così, la durata della pausa ritenuta accettabile e tollerata dall’interlocutore, dipende dal tipo di domanda posta, cioè dalle caratteristiche del contenuto della domanda. Inoltre, la regola stabilisce che, se una domanda non ottiene risposta entro il tempo massimo ritenuto appropriato in funzione del suo contenuto, sia necessario un segnale per evitare un danneggiamento nell’interazione. In un lavoro del 1995, derivato da quello precedente del 1994 (vedi§ 4), Lickely49 presenta alcuni risultati ottenuti da un esperimento svolto su un corpus di parlato spontaneo olandese. Ai soggetti è stato chiesto di individuare delle disfluenze confrontando una trascrizione con il nastro che stavano ascoltando. I risultati mostrano che molte disfluenze sfuggono all’ascoltatore anche quando quest’ultimo stia cercando di individuarle. Sembra, infatti, che gli ascoltatori umani siano dotati della capacità di filtrare molte disfluenze prima di dare inizio al processamento lessicale o sintattico, evitando i problemi che incontrano i modelli computazionali di comprensione del parlato. Un dato rilevante emerso da questo studio è che l’individuazione delle pause è risultata più facile tra le frasi che non nelle frasi. L’autore ipotizza che le pause piene tra le frasi possano essere più prominenti dal punto di vista acustico, oppure che il processamento cognitivo affidato all’ascoltatore potrebbe essere più facile tra le frasi e consentirebbe di accordare una maggiore attenzione al compito di individuazione delle pause. Nel 1996, Lickely50 ha pubblicato un lavoro, che rappresenta uno sviluppo e un completamento ei precedenti, incentrato principalmente sull’analisi di fenomeni di giuntura nei casi in cui non c’è una chiara pausa silente nel punto di interruzione. In questo studio viene avanzata un’ipotesi di tipo fonologico per rendere conto della impossibilità di individuare un tratto acustico sulla base del quale distinguere continuazioni fluenti vs. disfluenti. 49 50 Robin J. Lickely, ‘Missing Disfluences’, ICPhS‘95, 4: 192-195, Stockholm, 1995. Robin J. Lickely, ‘Juncture cues to disfluency’ (Proceedings of the ICSLP, Philadelphia, 1996. 27 In questo studio, pertanto, viene avanzata un’ipotesi relativa ad un altro tratto fonologico del parlato che possa fungere da indicatore affidabile per le disfluenze, in special modo per quelle situate nel mezzo di una clausola in assenza di pausa. Secondo Lickely nel parlato fluente, le parole sono separate l’una dall’altra da pause, oscurate da processi di assimilazione, elisione, ecc. L’ipotesi è che questi fenomeni di giuntura siano bloccati dalla disfluenza. Alcuni esperimenti di percezione mostrano poi che questo fenomeno può essere usato dagli ascoltatori per un’individuazione precoce delle disfluenze: di centrale importanza è, quindi, il modo in cui i parlanti/ascoltatori riescono a individuare le disfluenze, e il momento in cui ciò avviene. In un precedente esperimento di gating era stato dimostrato che le disfluenze possono essere riconosciute molto presto, subito dopo l’inizio della riparazione, anche prima che la prima parola della riparazione possa essere riconosciuta. Questo vuol dire che non le indicazione sintattiche o semantiche, ma altre indicazioni guidano l’ascoltatore nel riconoscere un utterance disfluente. La maggior parte degli stimoli del corpus utilizzato non hanno pause all’interno. Gli stimoli sperimentali, infatti, erano stati studiati per valutare se le disfluenze (senza pausa) blocchino il processo fonologico di connessione delle parole nella frase. Analisi acustiche sui vari indici possibili per il riconoscimento precoce delle disfluenze non hanno dato indicazioni nette. Le glottalizzazioni, il pitch, le pause, non sono indici che forniscono indicazioni univoche. I dati sperimentali avvalorano, quindi, l’ipotesi secondo cui i fenomeni di giuntura che normalmente sono presenti nel parlato fluente sono, invece, assenti nel caso di parlato disfluente. Gli esperimenti suggeriscono l’assenza di connessione tra le parole serve agli ascoltatori come indice per individuare precocemente le disfluenze. Questo sembra essere l’indice più stabile per individuare le disfluenze, anche se sicuramente esso interagisce con altri indici a livelli linguistici diversi. Per quel che concerne altre lingue oltre l’inglese, analizzato negli studi precedentemente illustrati, Van Donzel e Koopmans-van Beinum (1996) 51 hanno indagato le strategie di pausazione in olandese, tenendo conto, nell’impostazione della ricerca, del livello pragmatico. Sono state raccolte registrazioni di parlato spontaneo prodotto da 4 parlanti di sesso maschile e da 4 parlanti di sesso femminile tutti di madrelingua olandese. Successivamente sono state individuate le pause e gli allungamenti, messi poi in relazione alla struttura del discorso, precedentemente individuata in modo indipendente. Lo studio mostra così l’esistenza di pause silenti, pause piene e allungamenti di parole. Esistono diversi tipi di pause che possono essere combinati ed utilizzati in modo vario: l’uso delle pause è largamente dipendente dal parlante. Anche se è stato possibile individuare in modo sommario due tipi di strategie di pausazione che caratterizzano due distinti gruppi di soggetti, all’interno dello stesso parlante la strategia di pausazione è risultata costante. Gli autori notano inoltre che molto spesso le produzioni dei parlanti iniziano con parole che non fanno realmente parte della struttura del discorso, come congiunzioni ecc., parti cioè che non esprimono alcun significato lessicale proprio. Si tratta di parole la cui funzione è semplicemente quella di collegare la clausola alla precedente, senza tuttavia esprimere una coordinazione vera e propria. Lo studio comprende anche una parte che riguarda la percezione. I risultati indicano che la presenza di una pausa acustica probabilmente ha una forte influenza sulla percezione 51 Monique van Donzel, Florien J. Koopmans-van Beinum, ‘Pausing strategies in discourse in Dutch’ , Proc. ICSLP’96, http://fonsg3.let.uva.nl/IFA-publications/ICSLP96/Monique_van_Donzel/a505.htm, 1996. 28 dei confini del discorso da parte degli ascoltatori e ciò avviene almeno per i confini di clausola e per i connettivi, poiché spesso le pause occorrono in questi contesti. Di argomento più specificamente psicolinguistico sono alcuni lavori, come quello di Lallgee e Cook52 (1969), che indaga la relazione tra esitazioni e ansietà del parlante. Gli autori non riscontrano una correlazione positiva tra la crescita del livello di stress nel parlante e la crescita di produzioni contenenti esitazioni. Un altro studio, sempre del 1969, di Ragsdale53 verte sull’analisi di tre categorie di fenomeni di esitazione (“ah” e le sue varianti; “non-ah” (ad es. ripetizioni); pause piene, in un normale contesto di conversazione) in relazione all’ansia. Dai risultati emerge che la categorie “non-ah” avrebbero una correlazione positiva con l’ansia, anche se non emergono altre correlazioni significative tra le variabili. La produzione di esitazioni è stata anche studiata in relazione agli indici AI (indice dell’ansia; interessa i motivi per cui il paziente si lamenta, e cioè suoi sentimenti soggettivi di tensione, nervosismo ecc.) e IR (indice di interiorizzazione; valuta la tendenza ad interiorizzare le difficoltà e a manifestarle verbalmente o somaticamente). Nei soggetti utilizzati per lo studio, al crescere di AI e IR, crescono anche balbettamenti, ripetizioni, cambi di frase ecc. (pause della categoria “non-ah”) Una dettagliata rassegna bibliografica (ovviamente aggiornata all’anno di pubblicazione del lavoro) è contenuta in Rochester54 (1973). La rassegna tratta principalmente sul problema delle pause nella letteratura psicolinguistica e in parte anche linguistica. L’autore non fornisce dati nuovi ma l’articolo è utile per le informazioni che vi sono contenute circa il lavoro e le differenti prospettive teoriche presenti in letteratura. 6.CONCLUSIONI Nell’ampia messe di dati, teorie, modelli presentati in queste pagine, occorre individuare temi, percorsi e linee comuni per tirare le fila del discorso e delineare un quadro complessivo della ricerca scientifica sui fenomeni di esitazione, disfluenza e pausazione. Prima di affrontare il nucleo vero e proprio di queste conclusioni, tuttavia, vorremmo proporre alcune riflessioni di carattere generale sulle motivazioni alla base della complessità e della varietà della produzione scientifica sull’argomento. In primo luogo, l’interesse per questi fenomeni è piuttosto recente: per quanto siano presenti in letteratura alcuni lavori pionieristici (come quelli di Goldman-Eisler 1958, 196155, 1968, 197256), l’attenzione di un numero ampio di studiosi non risale a più di una ventina di anni fa. La crescita dell’interesse da parte della comunità scientifica è dovuto al fatto che questi fenomeni sono ora visti non più come irregolarità occasionali e idiosincratiche del 52 G. M. Lallgee, Mark Cook, ‘An experimental investigation of the function of filled pauses in speech’, Language and speech 12:24-29, 1969. 53 J. Donald Ragsdale, ‘Relationships between hesitation phenomena, anxiety and self-control in a normal communication situation’, Language and speech, 12: 257-265, 1969. 54 S. R. Rochester, ‘The significance of pauses in spontaneous speech’, Journal of psycholinguistic research, 2/1:51-81, 1973. 55 Goldman-Eisler, F. 1961 ‘A Comparative Study of Two Hesitation.Phenomena’ Language and Speech 4: 1826. 56 Goldman-Eisler, F. 1972 ‘Pauses, clauses, sentences’, Language and Speech 15: 103-13. 29 parlato, ma come parti integranti del sistema linguistico, ingranaggi che, in modi non ancora del tutto noti, cooperano al funzionamento della lingua. La varietà di prospettive di studio dei fenomeni di esitazione, disfluenza e pausazione è, inoltre, all’origine di un’inaspettata congiunzione di approcci teorici diversi. Si tratta di una particolarità, che se rende, da un parte difficilmente catalogabili questi lavori, che spesso potrebbero trovarsi in sezioni diverse da quelle in cui sono effettivamente, dall’altra parte rappresenta una felice eccezione nel campo degli studi linguistici, intesi in senso lato. Così, in questi lavori, avviene che linguistica teorica strutturale, pragmalinguistica e psicolinguistica si affianchino, e che in studi di carattere psicolinguistico e pragmatico si tenga conto del fattore fonetico acustico. In effetti, proprio la natura varia ed eterogenea dei fenomeni indagati, difficili da comprendere e di classificazione controversa in mancanza di punti di riferimento in una teoria tradizionale della lingua, sembrerebbe essere all’origine della necessità di un approccio interdisciplinare, che punti a valutare e a tenere in conto il maggior numero possibile di aspetti pertinenti. La coesistenza di prospettive teoriche differenti, tuttavia, comporta anche alcuni problemi, legati all’uso sia di nomenclature diverse, che generano un certo caos terminologico che può disorientare il lettore, sia di classificazioni eterogenee. Questi lavori mancano a volte di classificare e differenziare i fenomeni trattati, oppure si servono di tassonomie diverse, talora costruite ad hoc per le esigenze di lavoro, e comunque difficilmente confrontabili tra loro. A nostro parere ciò si deve sia alla difficoltà di trattamento di questi fenomeni, sia alla relativa recenziorità delle indagini, che non possono avvalersi di un quadro teorico preciso e definito e di categorie riconosciute nelle quali operare. Tra gli studi che offrono una tassonomia chiara, quella che probabilmente trova da molti anni ampio consenso, è quella di Maclay e Osgood (1959). La complessità di questo quadro generale si riflette nella varietà dei contributi presenti nella rassegna. Per quel che concerne le pause, variamente classificate negli studi passati in rivista in questa rassegna, molti studiosi hanno cercato regolarità nella disposizione che riflettessero vincoli e strategie tipo ad es. sintattico. La classificazione di Goldman-Eisler (1958, 1968), che differenzia pause grammaticali e non grammaticali sulla base delle loro occorrenza in corrispondenza di confini sintattici, costituisce in tal senso un punto di partenza dal quale molti studiosi successivamente hanno preso le mosse (Reich, 1980). La mancata coincidenza tra confini sintattici e occorrenza delle pause nelle pause non grammaticali rappresenta poi una risorsa per lo studioso: lì dove non è prevedibile la presenza di una pausa, infatti, è possibile osservare fenomeni che richiedono nuove spiegazioni. Un altro campo di indagine, in parte correlato al precedente, riguarda le diverse strategie di pausazione nel parlato spontaneo e in quello letto (Strangert, 1991, 1993; Hansson, 1998): gli studi di questo genere hanno offerto dati a sostegno dell’ipotesi secondo la quale la disposizione delle pause dipende largamente dalla sintassi nel parlato più controllato, mentre risponde a un’organizzazione non solo sintattica nel parlato spontaneo. Di grande importanza sono, a questo punto, gli studi di tipo pragmatico, che hanno dato alle strategie di pausazione (e più in generale all’uso di esitazioni varie) importanza nell’ambito di modelli della conversazione. L’uso di pause piene, ad esempio, è stato collegato al mantenimento della parola presa in un’interazione dialogica (Maclay e Osgood, 1959), ma anche allo stress del parlante rispetto all’interazione. Studiosi di ambito psicolinguistico, ad esempio, si sono interessati di questo aspetto del problema, mettendo in relazione la fluenza del parlante e il suo livello di stress in un determinata situazione. Anche il concetto di fluenza 30 è stato discusso e problematizzato in alcuni casi. Hieke (1980) ha, per esempio, sostenuto che la presenza di disfluenza nel parlato sia in certa misura fisiologica, e faccia parte di un dispositivo per mantenere l’alta qualità del parlato, che si ottiene in primo luogo attraverso la cooperazione tra i locatori. Ciò rivede in buona misura il concetto stesso di ‘dis-fluenza’. Questo termine, infatti, contiene in sé un giudizio relativo alla ‘non-funzione’ delle esitazioni nel parlato.Se le esitazioni svolgono il ruolo di ultima risorsa nel mantenimento della qualità delle produzioni, esse trovano un posto legittimo e importante nell’economia del parlato. L’indagine fonetico-acustica e percettiva, infine, oltre ad avere risvolti applicativi nell’elaborazione di algoritmi per il riconoscimento del parlato spontaneo (Stolcke e Shriberg, 1996) ha portato all’individuazione di correlati specifici di ciascun tipo di esitazione e anche all’elaborazione di modelli fonologici che contemplino la presenza delle pause piene. In particolare, Lickely (1994, 1996), non avendo rilevato correlati acustici specifici che guidino l’ascoltatore nell’individuazione delle disfluenze, ha ipotizzato che la mancanza di collegamenti fonologici che si ha nel caso del parlato disfluente costituisca l’indice più affidabile e utilizzato dall’ascoltatore. Anche Päzold e Simpson (1995) hanno tentato di interpretare fonologicamente la sostanza fonica delle esitazioni, ipotizzando per esse un sistema fonologico diverso rispetto alla lingua di riferimento. Inoltre, le indagini percettive, condotte talora anche ad integrazione di studi di altro tipo, hanno svolto un’importante ruolo di verifica delle ipotesi di lavoro. Come si vede, il quadro che questi lavori delineano è molto complesso e ancora in parte frastagliato: il nostro auspicio è che questa rassegna, consentendo uno sguardo sinottico sui risultati conseguiti dalle discipline interessate al problema delle ‘esitazione e dintorni’, costituisca uno strumento utile ed uno stimolo al proseguimento ed all’ampliamento della ricerca interdisciplinare su questo tema, verso modelli che rendano conto delle funzioni, dell’uso e delle caratteristiche delle dei fenomeni indagati nei lavori presentati in queste pagine. 31