Estratto da: Emanuele Arielli, 'Pensiero e progettazione. La psicologia cognitiva applicata al
design e all'architettura', Milano, Bruno Mondadori (2003).
Capitolo Quarto: Immagini mentali e pensiero visivo
1. Immagini mentali
In un problema descritto da Skinner (1953) viene chiesto di immaginare un cubo in cui tutte
le facce sono dipinte di rosso. In seguito bisogna suddividere il cubo in ventisette cubi uguali,
sezionandolo con due tagli paralleli per ogni asse (come nel famoso rompicapo, il “cubo di
Rubik”). Quanti dei cubi ottenuti avranno tre facce dipinte di rosso, quanti invece solo due,
una o nessuna faccia? S’immagini ora quante finestre ha la propria casa. È molto improbabile
che la risposta sia stata appresa sotto forma di informazione numerica o linguistica. Piuttosto,
occorrerà esplorare mentalmente la casa, entrare nelle stanze, contare le finestre.
In questi compiti attiviamo subito una sorprendente capacità della mente umana, quella di
creare, manipolare ed esplorare immagini mentali. Una volta appreso il numero delle finestre
della propria casa, sarà possibile imparare questa informazione memorizzandola in un formato
differente, puramente linguistico, recuperabile senza dover ripercorrere mentalmente
l’esplorazione effettuata la prima volta.
Le immagini mentali, intuitivamente, assomigliano alle immagini percepite, ma solitamente
non vengono confuse con queste. Qual è dunque la natura delle immagini mentali? Sono
come “fotografie” nella mente? Come vengono generate e manipolate? Dare risposte a tali
questioni non è semplice, perché occorre fare ipotesi su fenomeni che avvengono
esclusivamente all’interno della mente. Le immagini mentali sono state infatti per lungo
tempo escluse dalla ricerca psicologica, perché considerate “mentalistiche” e prive di un
riscontro osservabile con obiettività.
1.1 Il dibattito sulla natura delle immagini mentali
Come già notava il filosofo David Hume (1711-1776) ciò che distingue percezione e
immaginazione è prima di tutto la vividezza e il dettaglio posseduta dalla prima. Chi ha
visitato Venezia o ha visto delle immagini in televisione o in fotografia, sarà in grado di
recuperare dalla sua memoria a lungo termine l’immagine mentale di Piazza S. Marco. Le
differenze con la percezione vera e propria sono evidenti. Un’immagine, per quanto possa
essere forte, è più vaga, manca di dettagli ed è instabile. Nella nostra immagine mentale di
Piazza S.Marco possiamo probabilmente vedere le colonne del porticato e le finestre
sovrastanti, ma non possiamo veramente contarle come potremmo fare avendo di fronte la
piazza. Piuttosto abbiamo una rappresentazione vaga di “molte” colonne e di una fila
imprecisata di finestre. Allo stesso modo, la foto di una casa mostra sempre un numero
determinato di finestre, l’aspetto delle sue tende e così via, mentre possiamo invece
immaginare una casa generica senza sapere con esattezza il numero delle finestre o il colore
delle tende.
Questo fatto è stato considerato da alcuni autori come una prova che le immagini non sono
affatto “fotografie” nella mente (Pylyshyn 1973), e che anzi l’idea di immagine mentale è
ambigua e fuorviante. Questa conclusione ha acceso negli anni ’70 e ’80 un vivace dibattito
sulla vera natura di questi fenomeni, diviso tra chi negava alle immagini mentali una funzione
tra i processi cognitivi e chi invece ha cercato di mostrare che non è possibile ignorarle.
La prima posizione è stata sostenuta dalle argomentazioni di molti filosofi che considerano il
concetto di immagine mentale come fuorviante e inutile (Wittgenstein 1953, Ryle 1949,
Dennet 1969). Pylyshyn, in accordo con essi, ha sostenuto che le immagini sono in realtà
codificate nella mente sotto forma di descrizioni astratte, basate su un sistema di
rappresentazione di tipo simbolico simile al linguaggio (Fodor 1975) piuttosto che di tipo
pittorico (posizione “proposizionalista”). Solo in questo modo è possibile rendere conto delle
differenze tra le immagini mentali e la percezione, come quella appena menzionata
1
dell’indeterminatezza delle prime rispetto alle seconde. Una descrizione può essere
indeterminata, in quanto può fare uso di un simbolo come “molte” per indicare le “molte
colonne” di Piazza S. Marco, senza dover essere più specifico. Un’immagine pittorica può
essere indeterminata perché incompleta, come ad esempio una fotografia di Piazza S. Marco
con la parte che mostra il colonnato tagliata via, oppure perché è sfuocata o distorta: nessuna
di queste alternative però sembra un modo plausibile per descrivere l’idea di “molte colonne”
meglio di quanto non faccia una semplice descrizione di tipo linguistico o simbolico.
Inoltre un’immagine percepita è il prodotto di uno stimolo che può essere in certi casi
interpretato in più modi, come nel caso delle figure ambigue. Si è mostrato invece che
un’immagine mentale, come si dirà più avanti, non può essere ambigua, ma è sempre
un’immagine determinata, ovvero già interpretata: nel caso della figura ambigua di Jastrow
(coniglio/anatra, capitolo 3, figura 15), è come se l’immagine venisse prodotta con una
descrizione precisa, del tipo “Questo oggetto è un’anatra” oppure “è un coniglio”. Un tipo di
determinazione che la figura non può dare se non sotto forma di una descrizione di tipo
linguistico/simbolico. In altri termini, le immagini mentali sarebbero già descrizioni di
percetti, non semplici riproduzioni.
La posizione proposizionalista non nega l’esistenza, a chiunque intuitivamente evidente, di
immagini nella mente. Ciò che è dibattuto è il ruolo causale di queste immagini, ovvero se noi
elaboriamo e analizziamo informazioni che si presentano sotto forma di immagini, oppure se
queste, pur esistendo, sono solo un effetto secondario, non fondamentale, di dati elaborati in
un formato più astratto, di tipo simbolico.
1.2 Manipolazione e ispezione
Un numero crescente di risultati sperimentali ha messo in dubbio la posizione
proposizionalista e ha ridato alle immagini mentali un ruolo centrale nei processi cognitivi.
Anche le posizioni filosofiche contrarie non possono ignorare i risultati di studi empirici che
hanno mostrato come i processi cognitivi legati alle immagini mentali manifestano una forte
analogia con la percezione.
Gli esperimenti più noti a sostegno dell’analogia tra immagini mentali e percezione visiva
sono quelli sulla trasformazione e sull'ispezione di immagini mentali. L'idea di fondo di questi
esperimenti è che le immagini mentali vengono esplorate e manipolate allo stesso modo in cui
noi esploriamo e manipoliamo le immagini reali, percepite.
In un celebre esperimento, Shepard e Metzler (1971) hanno presentato a dei soggetti coppie
di immagini in cui erano raffigurate strutture tridimensionali sotto angolature differenti. Il
compito consisteva nel dire se l'oggetto nelle due immagini era lo stesso o una sua versione
speculare. In un compito del genere, questa l’ipotesi, occorre ruotare mentalmente l'oggetto di
una delle due figure fino a farlo coincidere con quello rappresentato nell’altra immagine e
potere così effettuare il confronto. In questo esperimento si mostrò che i tempi di risposta dei
soggetti aumentavano linearmente con l'aumentare della differenza di angolatura con cui
l'oggetto veniva presentato nelle due immagini: una piccola differenza di angolatura
comportava un tempo di risposta minore per decidere se l'oggetto era lo stesso, mentre una
differenza maggiore, fino all'angolatura limite di 180 gradi, richiedeva tempi maggiori. 1
Un esperimento analogo condotto con lettere dell'alfabeto ruotate, in cui occorre stabilire se
sono specularmente riflesse oppure identiche, conduce agli stessi risultati, mostrando come gli
stessi meccanismi siano validi anche per rotazioni di figure bidimensionali (fig. 1).
1
Test di rotazione mentale sono anche usati per valutare le capacità di manipolazione di immagini
visive e spaziali di un soggetto. Negli Stati Uniti vengono talvolta usati nei test di selezioni per facoltà
come architettura o ingenieria.
2
Figura 1: Versioni ruotate e specchiate della lettera “R”.
Altri risultati di queste ricerche mostrano che i soggetti ruotano gli oggetti mentalmente
rappresentati anche dopo molte prove, senza imparare a confrontare le immagini a prescindere
dal loro orientamento, e che la rotazione non è un passaggio discontinuo dalla posizione
originaria a quella finale dell’oggetto, ma è costituita da una serie continua di
rappresentazioni interne: anche il movimento di rotazione viene cioè mentalmente
immaginato. Altri esperimenti (Bundesen e Larsen 1975) hanno mostrato che anche per il
confronto tra immagini simili ma di dimensioni diverse viene impiegato un tempo
proporzionale alla differenza di grandezza delle due immagini.
Kosslyn (1980) ha condotto i più noti studi sull'ispezione ("scanning"), nonché sui processi di
generazione (combinazione, trasformazione) e mantenimento nella memoria delle immagini, e
sui processi neuronali coinvolti in questi fenomeni, mostrando come l' "occhio della mente"
esamini le immagini mentali in modo del tutto simile a come l'occhio reale fa con con le
immagini percepite.
In un esperimento Kosslyn fece apprendere a dei soggetti una mappa di un'isola fittizia su cui
erano contrassegnati i luoghi più significativi, come un villaggio, una palude, una spiaggia e
così via. Una volta imparata la mappa ai soggetti veniva chiesto di "muoversi" mentalmente cioè spostare la loro attenzione - da un punto determinato ad un altro della mappa
memorizzata (ad esempio dalla "palude" alla "spiaggia").2 Anche in questo caso il tempo
necessario per percorrere il tragitto era proporzionale alla distanza effettiva dei luoghi sulla
mappa.
In un'immagine mentale di grandi dimensioni, si è inoltre dimostrato, l’ispezione richiede
tempi maggiori di quelli che si hanno con un’immagine più piccola, in quanto l'occhio
“mentale” deve coprire una distanza più elevata. A questo fatto sembra esserci un’eccezione.
Inducendo infatti le persone ad immaginare un'oca accanto ad un elefente (quindi un oggetto
piccolo affianco ad uno più grande), l'oca viene immaginata secondo proporzioni ridotte. Se
invece si chiede di immaginare l'oca accanto ad una mosca, essa verrà immaginata in modo
ingrandito. A questo punto, chiedendo di analizzare alcune parti dell'oca, si è visto che un
soggetto ci mette più tempo nel caso in cui l’oca è immaginata di piccole dimensioni che in
quello in cui è ingrandita. Questo può essere spiegato con la perdita di risoluzione
dell'immagine: nella percezione normale se un'immagine diventa troppo piccola, la
distinguibilità delle parti può essere compromessa e occorre uno sforzo per vederla nei
particolari. Lo stesso avviene probabilmente anche nel caso delle immagini mentali.
Altri esperimenti di Kosslyn, infine, hanno cercato di stabilire anche le dimensioni del
"campo visivo" delle immagini mentali, chiedendo ai soggetti di ingrandire un'immagine
mentale fino al punto in cui le sue estremità scomparivano, come se uscissero dai bordi del
campo visivo. Attraverso queste prove egli ha valutato un’ampiezza del campo
"immaginativo" di circa 20° (altre stime considerano un'ampiezza maggiore, di 40-60°), che ci
porta a considerare l'area in cui le immagini mentali appaiono come più simile ad uno
2
Un aspetto messo in luce da Kosslyn (1991) è che l’attenzione coinvolge anche la generazione di
immagini e non solo la loro ispezione. Generare un’immagine è paragonabile al tracciare delle linee
per mezzo dello spostamento di un “puntatore” (come nei programmi di disegno su computer),
corrispondente al fuoco della nostra attenzione. Kosslyn parla di vero e proprio “disegno mentale”.
3
schermo piuttosto che al campo visivo vero e proprio (ampio circa 120° in verticale e 180° in
orizzontale).
2. Memoria e immagini mentali
Il problema delle immagini mentali è connesso con quello della memoria visiva. Noi siamo in
grado di rievocare le nostre percezioni anche a distanza di molto tempo: per esempio
rievocando l’aspetto di un appartamento visitato in passato.
Il fatto che noi siamo in grado di rievocare un’immagine visiva anche dopo molti anni (ad
esempio che aspetto aveva l’edificio del liceo dove si è studiato) è prova che esista una
memoria a lungo termine visuale. Nella memoria a lungo termine noi conserviamo tutto il
bagaglio delle nostre conoscenze ed esperienze nell’arco degli anni. Queste informazioni non
sono solo di tipo fattuale (conoscenze generali, come ad esempio la memoria delle tabelline
della moltiplicazione o la conoscenza della forma degli oggetti) o pratico (la nostra capacità di
guidare un’auto), ma possono essere anche esperienze in prima persona, tra cui situazioni
udite o viste in passato.
In genere si individuano altri due tipi di memoria oltre a quella a lungo termine: quella a
breve termine, in grado di conservare le informazioni per pochi secondi, e la cosiddetta
memoria “sensoriale”, di durata brevissima (meno di un secondo), consistente in una sorta di
traccia che le informazioni sensoriali lasciano al loro passare e che scompare rapidamente per
decadimento o perché soppiantata dalle altre informazioni in arrivo.
A differenza della memoria sensoriale, quella a breve termine non solo dura di più (10
secondi per le informazioni visive), ma permette di essere continuamente mantenuta per temi
più lunghi grazie alla ripetizione, che rinfrensca ciclicamente l’informazione. Se
l’informazione non passa nella memoria a lungo termine e se non è sostenuta dalla
ripetizione, anche questo tipo di memoria svanisce per decadimento o perché sostituita da
nuove informazioni.
Un modello teorico più specifico della memoria a breve termine è quello, proposto da
Baddeley (1990), della memoria di lavoro. Essa è chiamata in questo modo perché considera
la memoria a breve termine non solo come un passaggio intermedio tra il registro sensoriale e
la memoria a lungo termine, ma come il luogo dove avvengono i principali processi cognitivi.
È nello spazio della memoria a breve termine che noi “lavoriamo” sulle informazioni. Si tratta
di uno spazio limitato in grado di conservare circa sette unità di informazioni (più o meno
due) in un’unica presentazione (Miller 1956, chiamò questo limite il “magico numero sette”),
cioè senza ripetere le informazioni. 3
Le ricerche di Baddeley hanno dimostrato che la memoria di lavoro è articolata in due
funzioni autonome: il circuito fonologico, in cui viene conservata l’informazione verbale in
forma fonetica, e il taccuino (scratch pad) visivo-spaziale, riservato alle informazioni visive. I
due sistemi sono coordinati da un esecutivo centrale che controlla i processi di elaborazione
delle informazioni.
La presenza di queste due unità distinte, una per l’informazione linguistica, l’altra per quella
visiva, è dimostrabile in esperimenti in cui un soggetto deve tenere a mente informazioni
verbali o visive mentre viene distratto da stimoli di volta in volta verbali o visivi (Logie e
Denis 1991). Gli stimoli di disturbo verbali hanno un’influenza negativa solo sulla
memorizzazione di informazioni linguistiche, ma non su quelle visive; gli stimoli di disturbo
visivo invece hanno l’effetto opposto. Questo non mostra solo la presenza di due unità distinte
della memoria di lavoro, ma anche il fatto che essi possono essere “sovraccaricati”
indipendentemente.
3
Per esempio siamo in grado di ripetere alla prima lettura un numero di telefono di cinque o sei cifre.
Per numeri più lunghi, ciò non è più possibile: la memoria a breve termine viene sovraccaricata,
dobbiamo rileggere il numero ed eventualmente conservarlo nella memoria a lungo termine.
4
Kosslyn ha sviluppato un modello della memoria visiva analogo, chiamando “buffer
(“tampone”) visivo” ciò che Baddeley aveva nominato taccuino visivo-spaziale. In particolare
egli ha evidenziato la relazione della memoria di lavoro visiva con la memoria a lungo
termine:
1) il processo di generazione di immagini è costituito da un recupero di informazioni visive
dalla memoria a lungo termine in quella a breve termine;
2) il processo di trasformazione avviene all’interno della memoria a breve (o, come si è detto,
di “lavoro”): ad esempio nel compito di rotazione visto prima, le due immagini presentate
vengono memorizzate a breve termine ed una di esse viene ruotata fino a verificare la
coincidenza con la seconda. In questo caso non c’è rinvio alla memoria a lungo termine;
3) infine nel processo di ispezione (“scanning”), un’immagine (ad esempio una mappa) viene
analizzata attraverso una sorta di obiettivo focalizzato su un punto dell’immagine, in grado di
spostarsi su di essa. A differenza del semplice recupero di un’immagine dalla memoria e
lungo termine, qui è un “occhio della mente” che, nella memoria di lavoro, ispeziona
l’immagine contenuta nella memoria a lungo termine.
Considerando che anche le percezioni generate da stimoli esterni sono rappresentate nella
memoria di lavoro visuale, queste differenti relazioni possono essere rappresentate nel modo
seguente (fig. 2):
Figura 2: modello di Kosslyn della memoria visiva
Questo schema mette bene in luce un presupposto alla base delle teorie che abbiamo appena
visto, ovvero che le immagini mentali e le percezioni coinvolgono le medesime funzioni
cognitive, con la differenza che le fonti da cui le informazioni provengono sono differenti: la
mente nel primo caso, e la realtà esterna nel secondo. Si potrebbe addirittura dire che la
generazione di immagini mentali conrrisponde al processo di percezione a ritroso (Farah
2000).
Il fatto che percezione e immaginazione visiva facciano uso delle stesse funzioni è mostrato
ad esempio spingendo dei soggetti a crearsi un’immagine visiva oppure uditiva (immaginare
ad esempio una melodia) durante un compito di individuazione percettiva di un oggetto
(Segal e Fusella 1969): nel caso dell’immagine visiva, la prestazione nel compito è ridotta, ma
non nel caso in cui il soggetto si crea un’immagine uditiva, che invece riduce la prestazione di
un compito in cui è coinvolta la percezione di suoni. Ricerche più recenti (Claus et. al. 1998)
hanno mostrato come la costruzione di un’immagine mentale a partire da un testo è meno
efficace quando il testo deve essere letto di quando il testo viene ascoltato. Questo perché la
memoria di lavoro visiva nel primo caso viene in parte impegnata dalla lettura.
Anche a livello neuronale si è mostrato che percezione e immaginazione condividono gli
stessi meccanismi. Studiando pazienti con danni cerebrali (Farah 1988, 2000) si è visto come
5
limitazioni di tipo percettivo si accompagnano anche a limitazioni nella capacità di crearsi
immagini. Pazienti che hanno perso la capacità di riconoscere certe classi di oggetti, molto
spesso hanno difficoltà a generare immagini mentali degli stessi oggetti. Soggetti invece che
hanno subito un danno presso il lobo parietale destro e soffrono di negligenza spaziale
unilaterale, non sono in grado di vedere oggetti nella parte sinistra del loro campo visivo o di
vedere la parte sinistra degli oggetti. Chiedendo loro di ricordare visivamente un ambiente che
è a loro familiare da prima del danno neuronale, si è visto che essi descrivono solo gli oggetti
che si trovano sulla destra (Bisiach e Luttazzi, 1978). Se invece si chiede a loro di immaginare
l’ambiente guardando dal lato opposto, questa volta vengono descritti solo gli oggetti che
prima erano stati esclusi. 4 Anche in questo caso una limitazione neuronale coinvolge sia la
percezione visiva, sia la costruzione di immagini mentali.
Farah (1984) sostiene che la possibilità di riconoscere un oggetto percepito richiede un
normale funzionamento della memoria di lavoro visiva, ma anche della capacità di
ispezionare la memoria a lungo termine per poter riconoscere in quale categoria l’oggetto
appartiene. Un altro caso interessante è quello infine di pazienti che sono in grado di
descrivere e riconoscere un oggetto visivamente, ma non sono capaci di descriverlo
richiamandolo dalla memoria. L’incapacità di descrivere un oggetto recuperato dalla
memoria, consisterebbe quindi in un difetto di ciò che nel modello di Kosslyn (Figura 2,
sopra) viene descritto come il processo di “generazione” di immagini. Analogamente è
possibile descrivere casi di pazienti in cui è la capacità di ispezione, non di generazione, ad
essere danneggiata.
3. Costruire mentalmente immagini
Un’altra importante differenza tra percezione e immagini mentali è la capacità di queste
ultime di manipolare e costruire oggetti. Non si tratta solo della capacità di muovere,
ingrandire o traslare oggetti singoli, come si è visto negli esperimenti di rotazione e ispezione,
ma di costruire rappresentazioni complesse e mai esistite, cioè non provenienti dall’esperienza
passata. Si tratta di una capacità centrale per il pensiero creativo, sia nello sviluppo di idee
scientifiche che di progetti architettonici, opere letterarie e artistiche. Anche immaginare
semplicemente di spostare i mobili nel proprio appartamento fa uso di questa facoltà.
Spesso si è associata la creatività con un’elevata capacità di creare e manipolare immagini
mentali (Shepard 1978). Testimonianze famose di scienziati o artisti attesterebbero che alla
base delle loro scoperte più importanti ci sia sempre stata un’immagine decisiva: Albert
Einstein ci racconta come il nucleo della teoria della relatività fosse nato immaginando di
viaggiare su un raggio di luce, Kekulé, scopritore della struttura ad anello della molecola del
benzene, sognò un serpente che si mordeva la coda. Mozart, per fare un esempio di forte
immaginazione auditiva, sosteneva di poter sentire un’intera opera prima ancora di
trascriverla per la prima volta sullo spartito.
Shepard ipotizza che la funzione creativa delle immagini mentali sia data dalla loro
indipendenza dal linguaggio. Le parole sono categorie fisse e tendono a imporre
interpretazioni del mondo rigide, limitando la possibilità di creare nuove configurazioni,
scoprire analogie tra oggetti e situazioni (capitolo 5, par. 4.3). Il fatto che vi sia una
correlazione tra immaginazione e creatività non spiega tuttavia quale sia il rapporto tra i due,
ovvero se la maggiore capacità di elaborare immagini mentali sia la causa di una elevata
creatività, oppure se una persona dotata di cratività sia per questo motivo in grado di costruire
immagini mentali in modo più ricco.
4
Studi su questo fenomeno hanno mostrato che l’esclusione di parte del campo visivo non ha nulla a
che vedere con un disturbo di parte della retina, ma con la percezione dell’orientamento spaziale del
paziente. Karnath e colleghi (1993) hanno mostrato che, in certi casi, se si fa ruotare il tronco del
paziente verso sinistra mantenendo la testa orientata nella posizione originaria, l’incapacità di
percepire la zona sinistra viene ridotta benchè lo stimolo visivo che giunge sulla retina non sia
cambiato.
6
I meccanismi che stanno alla base della nostra capacità di sintesi e combinazione di immagini
mentali non sono ancora del tutto chiari, ma sufficienti per dimostrare ancora una volta la
somiglianza tra meccanismi immaginativi e percettivi (Kosslyn 1994, Finke, Ward e Smith
1992).
Ad esempio manipolando mentalmente lettere come la “D” e la “J” maiuscole, le persone
sono in grado di operare una trasformazione in cui la “D” viene capovolta di novanta gradi e
posta sopra la “J”. L’immagine mentale ottenuta viene facilmente riconosciuta come un
nuovo oggetto, un ombrello (Finke e Slayton 1988; Finke, Pinker e Farah 1989). Si tenga
presente che ai soggetti viene solo detto di manipolare una “J” e una “D”, senza che loro
abbiamo un supporto visivo di queste lettere. Le istruzioni verbali vengono ritradotte in
immagini mentali, a loro volta queste vengono trasformate per ottenere una nuova
configurazione che infine viene descritta con una nuova etichetta verbale: un’operazione tanto
semplice per il nostro intuito, quanto soprendentemente complessa.
Per quanto concerne la capacità di manipolare e scoprire nuove proprietà nelle immagini, vi è
una vasta discussione non solo sulle somiglianze, ma anche sulle differenze tra
immaginazione e percezione (Roskos-Ewoldsen et al. 1993).
Molte prove sperimentali hanno messo in luce i limiti della capacità di manipolare ed
esplorare immagini mentali. Ad esempio, immaginare un cubo trasparente poggiato su una
faccia e individuare i suoi otto vertici non è un compito difficile. Più complesso è immaginare
il cubo come poggiato su un vertice, con la diagonale perpendicolare al piano; in questo caso
le persone tendono a localizzare i vertici in modo inesatto, costruendo mentalmente qualcosa
di più simile ad un tetraedro (Barolo, Masini e Antonietti 1988).
È stato mostrato che è molto difficile scoprire figure emergenti o nascoste in un’immagine
ambigua rappresentata mentalmente (Reed e Johnsen 1975). In un esperimento di Chambers e
Reisberg (1985), la figura ambigua di Jastrow (cap. 3, figura 15) è stata fatta osservare ai
soggetti, spingendo parte di essi con suggerimenti a vedere la testa di coniglio, altri quella
d’anatra, e infine chiedendo loro di memorizzare la figura. Quello che succede è che i primi
memorizzano l’immagine sottolineando la sua “conigliezza”, i secondi accentuano
l’“anatrezza” dell’immagine, ovvero ognuno codifica la figura percepita sulla base
dell’interpretazione data. Ogni soggetto, rievocando l’immagine, non riesce più a vedere
l’ambiguità con l’ “occhio della mente”: chi ha osservato la figura come anatra non riesce a
vederla mentalmente come coniglio e viceversa.
La costruzione dell’immagine mentale in un senso o nell’altro determina inoltre quali
particolari sono salienti e degni di attenzione. Infatti ponendo i soggetti che hanno
memorizzato la figura come coniglio di fronte a diverse versioni dell’immagine in cui i tratti
peculiari del roditore sono stati distorti (ad esempio cancellando la concavità della bocca),
essi riconoscono immediatamente la modificazione. Per i soggetti che hanno memorizzato
l’anatra, invece, la cancellazione della bocca del coniglio non è un tratto saliente, di
conseguenza essi hanno più difficoltà a distinguere la differenza di questa versione con il
disegno originale. La differenza di focalizzazione nelle immagini mentali comporta una
“perdita di definizione” delle caratteristiche secondarie.
La maggiore difficoltà di cogliere l’ambiguità nelle immagini mentali sembra porre queste in
una posizione di inferiorità rispetto alla percezione. I tre tipi di ambiguità possibili che
abbiamo incontrato nel corso di questo libro (alternanza figura-sfondo, orientamento nel cubo
di Necker, interpretazione delle figure come quella del coniglio e dell’anatra) sembrano
difficili da realizzare a livello puramente immaginativo.
Una spiegazione di questo fatto è che l’ambiguità consiste nella comprensenza di più
interpretazioni possibili di uno stesso stimolo. Il percetto, si è detto, è uno stimolo già
interpretato, e una figura ambigua può essere percepita - cioè reinterpretata - in modi diversi,
anche se lo stimolo sulla retina (stimolo prossimale) resta sempre lo stesso.
Il fatto che questa reinterpretazione sia difficile con le immagini mentali conferma l’ipotesi
che queste siano simili ai percetti, non agli stimoli (Reisberg, Logie 1993). Se nella
7
percezione possiamo reinterpretare lo stimolo che colpisce i nostri occhi, nell’immagine
mentale lo stimolo non c’è. Per questo motivo l’idea dell’immagine mentale come una sorta
di fotografia interiore è semplicistica, in quanto una fotografia è un oggetto da cui si origina
uno stimolo visivo che viene ricostruito nella percezione, mentre l’immagine mentale è già il
prodotto di una ricostruzione e di una interpretazione. 5 Le immagini mentali sono dotate
quindi di una dimensione “concettuale”: non memorizziamo solo la figura di un coniglio, ma
sappiamo che è un coniglio. La nostra immagine mentale non può essere semplicemente
separata dalla sua interpretazione.6
Le immagini mentali, inoltre, vengono talvolta codificate e memorizzate per mezzo di nomi
per poter essere ricordate con più facilità (cfr. Baddeley, Lewis 1981; Pearson, Logie e
Gilhooly 1999). In compiti in cui si chiede di manipolare mentalmente figure come cerchi,
quadrati o triangoli, la mente conserva queste figure codificandole verbalmente (usando cioè
le parole, come “cerchio” e “quadrato”, e non le immagini) e mantenendole nel circuito
fonologico (vedi sopra, par. 2) per non caricare eccessivamente la memoria di lavoro visiva
(il taccuino visivo-spaziale) occupata nella manipolazione. 7 Infatti provando
sperimentalmente a introdurre interferenze di tipo verbale durante questi compiti (ad esempio
ascoltare o ripetere parole a caso), la prestazione diminuisce in quanto le persone tendono a
dimenticare le forme che stavano manipolando.
Se è valida l’ipotesi che le informazioni verbali e visive sono elaborate da due processi
distinti della memoria di lavoro, allora questo significa che le immagini mentali sono
codificate sia visivamente che verbalmente (Pearson, Logie 2000). Nei compiti in cui bisogna
reinterpretare in modo nuovo una figura (come si è detto nel capitolo 3, par. 6) la
verbalizzazione può però costituire un ostacolo: si è mostrato che “distraendo” in questi casi
un soggetto nelle sue funzioni verbali, la sua capacità di fare nuove scoperte su un’immagine
aumenta in quanto, si ipotizza, le immagini vengono liberate dallo schema imposto dalle
etichette verbali (Intons-Peterson 1996).
Tutti questi esempi mostrano che le immagini mentali sono interpretate e generate in un
modo che va ben al di là dello stimolo visivo. Un’altra conferma è data dal fatto che se una
persona immagina una forma con un determinato orientamento, sarà difficile per lei poterla
riorientare. Presentiamo a dei soggetti delle sagome note, come ad esempio il contorno
dell’Africa, ruotate di novanta gradi. Il risultato è che molte persone non sono in grado di
riconoscere a prima vista la sagoma come l’Africa. Ciò mostra l’importanza dall’orientamento
per la comprensione di certe immagini. Ruotando la sagoma nella posizione normale, il
riconoscimento è però immediato.
Se invece di ruotare la figura realmente, si chiede ai soggetti di memorizzarla e di ruotarla
mentalmente, il riconoscimento al contrario non avviene. Pur avendo davanti agli “occhi della
mente” la sagoma dell’Africa nella posizione corretta, non riusciamo a riconoscerla come tale.
Si suppone che questo accada perchè l’asse di orientamento della figura rimane invariato
nonostante la rotazione. Ovvero la nuova parte superiore della figura non viene vista come
“sopra”. Suggerendo esplicitamente di cambiare l’asse di orientamento dell’immagine nel
modo corretto, i soggetti riescono infine a riconoscere la sagoma.
5
Per lo stesso motivo è difficile “vedere” mentalmente le tipiche illusioni ottiche (ad esempio linee
parallele che sembrano convergenti quando poste su una griglia) che consistono in una discrepanza tra
lo stimolo e il percetto.
6
L’esperimento di Finke et al. (1989) sulla manipolazione di lettere come la “D” o la “J” sembrerebbe
smentire questi fatti. In questi casi però non sono le figure a essere reinterpretate, ma la loro
combinazione. Inoltre si può supporre che questo sia un compito meno complesso di quello
riguardante le figure ambigue e dunque più accessibile alla nostra memoria di lavoro visiva.
7
Per lo stesso motivo l’immagine ambigua di Jastrow può essere ricordata con il termine “coniglio”
oppure con il termine “anatra”. Il nome viene sua volta utilizzato per mantenere viva l’immagine nella
memoria di lavoro, soprattutto se questa viene coinvolta in altri compiti.
8
Qualcosa di simile avviene anche nella percezione: se invece di ruotare fisicamente la
sagoma, incliniamo la testa in modo da vederla “dritta”, non cambiamo l’asse di orientamento
della figura e, nell’esempio dell’Africa, non riusciamo a riconoscerla (Reisberg, Logie 1993).
Analogamente, se osserviamo una persona in piedi contro un muro tenendo la testa inclinata
di novanta gradi, essa non ci appare sdraiata orizzontalmente su un pavimento, nonostante lo
stimolo sulla retina ci possa suggerire proprio questo. Ciò avviene perché noi non
modifichiamo la nostra conoscenza dell’orientamento sopra-sotto. L’orientamento non è
qualocosa che appartiene a ciò che vediamo, ma è qualcosa che noi sappiamo e che
aggiungiamo alla comprensione dell’immagine.
La sagoma dell’Africa viene riconosciuta inoltre quando si ci viene chiesto di disegnare
l’immagine mentale (ruotata nel verso corretto, ma non riconosciuta) su un foglio. A questo
punto riusciamo a vedere e risconoscere con facilità la forma. Questo è un fatto rilevante che
mostra come la visualizzazione permette di far emergere proprietà che a livello di pensiero o
immagine mentale erano nascoste. Questo perché “mettere su carta” un’immagine mentale
significa ricreare fisicamente lo stimolo, il quale può essere più facilmente reinterpretato. Un
fenomeno la cui importanza è evidente quando si fa uso di disegni, diagrammi o schizzi come
mezzi di osservazione e trasformazione delle proprie idee (capitolo 5, par. 3).
3.1
Limitazioni e differenze con la percezione
Questi esempi mostrano che l’osservazione e la manipolazione di immagini mentali sono, per
certi compiti, sorprendenti (rotazione, ispezione), per altri piuttosto limitati (riconoscimento
di forme e parti). Alcuni autori (Reinsberg, Logie 1993) ipotizzano che questa differenza
rispecchi la distinzione tra fenomeni visivi e fenomeni spaziali (capitolo 3, par. 2.2). Compiti
di rotazione, traslazione e ispezione mentale sembrerebbero coinvolgere fenomeni spaziali, i
quali, si era detto, sono legati alla dimensionae motoria: le immagini in questi esperimenti
vengono infatti “mossi” nella nostra mente. Lo stesso avviene nei compiti in cui figure
immaginate vengono spostate e combinate per creare nuove configurazioni. Invece compiti di
riconoscimento di parti (il becco dell’anatra visto come le orecchie del coniglio, la percezione
del “sopra” e del “sotto”) e di reinterpretazione di una figura sarebbero più legate alla
dimensione visiva. In quest’ultimo caso la prestazione per mezzo di immagini mentali è di
lunga inferiore di quella che si ha con la percezione visiva.
In conclusione, le immagini mentali non sembrano essere né pure descrizioni o concetti
(secondo la posizione proposizionalista di Pylyshyn), né semplici fotografie mentali.
Pylyshyn aveva osservato che se ricordiamo l’immagine di un amico ad una festa insieme ad
altri particolari, come l’arredamento o l’abbigliamento della altre persone, con lo scorrere del
tempo è improbalbile che ci ricorderemo dell’arredamento scordandoci invece l’identità
dell’amico. L’immagine non è memorizzata in modo uniforme, come una pellicola
impressionata nella mente, ma è già interpretata e organizzata in elementi più o meno salienti
e focalizzati. Le immagini mentali – come ogni rappresentazione – sono il prodotto di
un’esclusione di aspetti e di un’enfatizzazione di altri (capitolo 2, par. 1.3).
Gli esempi e le discussioni viste fin qui favoriscono dunque una posizione intermedia sulla
natura delle immagini mentali. Esse sono analoghe alla percezione, ma allo stesso tempo sono
determinate da concetti e interpretazioni. Come sostiene Fodor (1975, p. 190. trad. mia), c’è
un “gamma infinita di casi tra i paragrafi e le fotografie”, intendendo con “paragrafi” le
descrizioni linguistiche e proposizionali. Le immagini mentali possiedono caratteristiche
percettive che i concetti astratti non hanno, ma sono al tempo stesso più astratti e indefiniti
delle esperienze visive. Essi sono situati tra i pensieri e le sensazioni.
4. Linguaggio, percezione e immagini
9
Nel secondo capitolo la dimensione raffigurativa e quella linguistica sono state volutamente
considerate come due tipi particolari di rappresentazione senza prendere in considerazione le
loro peculiarità e differenze. Si era fatto un riferimento ad una nota affermazione di Ludwig
Wittgenstein secondo cui linguaggio e “mondo”, incluso l’insieme dei fenomeni percettivi,
possono essere uniti in un sistema di correlazioni isomorfe (ad esempio tra note su uno
spartito e le onde sonore di una melodia), in cui è possibile tradurre da una rappresentazione
ad un altra. Si può essere quindi tentati di considerare il rapporto tra il linguaggio e la realtà
percepita come una correlazione simile a quella tra uno spartito e una melodia: noi
percepiamo forme, oggetti ed eventi (o ci facciamo immagini mentali di essi) e siamo in grado
di descriverli con frasi, i cui nomi e verbi corrispondono a cose ed eventi. Ascoltando una
frase come “Il libro è sopra il tavolo” e vedendo un libro sopra il tavolo, riusciamo a
confrontare l’input acustico e l’input visivo e constatare facilmente la corrispondenza
(Kanisza, Legrenzi e Sonino 1983).
4.1 Parole e immagini
Tutto ciò non è così semplice. La percezione di forme ed oggetti, come abbiamo visto, non è
un semplice rispecchiamento nella mente di ciò che c’è nella realtà, ma è un processo
costruttivo complesso, dotato di meccanismi e leggi specifiche. Inoltre il linguaggio stesso
presenta caratteristiche profondamente differenti dal contenuto della nostra percezione e in
particolare dalla visione e dalla rappresentazione di tipo visivo e spaziale.
Il linguaggio, a differenza della delle rappresentazioni raffigurative, è composto da elementi
separabili, le parole (e queste, a loro volta, scomponibili in lettere o fonemi), combinate
secondo regole grammaticali determinate. Esso appartiene a quelli che Goodman (1968)
chiama sistemi rappresentativi “discreti”, come la notazione musicale, distinti dai sistemi
“densi”, come le raffigurazioni pittoriche, in cui non si hanno elementi morfologici
nettamente separabili. 8
Questa è una caratteristica formale che rende il linguaggio molto più schematico di una
raffigurazione. Con un’immagine posso presentare innumerevoli sfumature di colore tra, ad
esempio, il giallo e l’arancione, mentre non ho parole specifiche per indicare tutti i casi
intermedi tra “giallo” e “arancione”, se non con approssimazioni molto rozze (giallo-scuro,
giallo-arancione, arancione-chiaro, ecc.). Una frase può essere scritta su una linea di testo,
oppure spezzata in più linee, o scritta dall’alto in basso, oppure essere letta e quindi ritradotta
in una sequenza temporale di fonemi senza che il suo significato cambi. L’interpretazione di
un disegno o un diagramma invece è legata alla forma che noi diamo ad essi.
La frase “Una mela è sul tavolo” in una determinata lingua è invariabile (a parte
l’intonazione o l’accento nel pronunciarla), ma l’immagine di una mela sul tavolo può
presentarsi in modi innumerevoli, la mela raffigurata può essere verde o rossa, grande o
piccola, il tavolo essere di legno, di metallo e così via. Anche un’immagine estremamente
realistica, ad esempio una fotografia bidimensionale della mela, tralascia molti aspetti, in
quanto noi non vediamo il retro della mela, cosa c’è sotto il tavolo, o se la mela è bacata
all’interno. Ciò però è nulla in confronto all’assenza di dettagli che si ha con una frase
equivalente.
Un’immagine può essere spesso sovradeterminata rispetto al suo scopo e mostrare più
caratteristiche di quante servano. Per comunicare che la mela è sul tavolo, mostro con
un’immagine una miriadi di altri dettagli che non hanno nulla a che vedere con questo fatto.
Anche in un disegno geometrico, ad esempio un angolo retto, mostro più cose (lo spessore
delle due linee, il loro colore, la lunghezza), di quanto servano se il mio obiettivo è
semplicemente comunicare “Angolo di novanta gradi”. D’altro canto il linguaggio è
8
Ci sono anche rappresentazioni che contengono sistemi densi e discreti allo stesso tempo, come ad
esempio le carte geografiche, in parte composte da raffigurazioni iconiche del territorio, in parte
contrassegnate da simboli e didascalie verbali.
10
fortemente sottodeterminato, come si può facilmente comprendere confrontando un romanzo
con la sua versione cinematografica. Per quanto possa descrivere una scena con ricchezza di
dettagli, ne tralascerò un’infinità, dal momento che non posso (né voglio) comunicare ogni
minima sfumatura di colore e di forma.
Un disegno, dunque, tende a raffigurare sempre qualcosa di concreto e specifico, includendo
particolari spesso irrilevanti. Una frase come “poligono con quattro lati perpendicolari”
permette una descrizione astratta di forme che includono quadrati e rettangoli, una
raffigurazione grafica di questo oggetto come un rettangolo (vedi capitolo 2, par. 3 e capitolo
3, par. 6.1) deve essere interpretata come una forma “generica”, che include sia rettangoli che
anche quadrati. Tuttavia l’immagine di un rettangolo è sempre quella di un rettangolo
specifico, con lati di una certa proporzione. Per usare l’immagine di un triangolo come
rappresentazione dei triangoli in generale dobbiamo far capire che non vogliamo
rappresentare solo quel triangolo raffigurato, ma tutti i triangoli. La raffigurazione grafica non
può evitare di essere sempre raffigurazione di qualcosa in concreto, mentre invece il
linguaggio è un sistema che permette un’elevata astrazione.
Si potrebbe obiettare che ci sono raffigurazioni in grado di designare entità astratte, come ad
esempio una sagoma umana che rappresenta una persona generica su un segnale stradale che
indica un passaggio pedonale (fig. 4, sotto), oppure che rappresenta essere umani di genere
maschile (o femminile se disegnati con una gonna stilizzata) sulla porta di una toilette
pubblica (fig. 3). Ma il fatto che nel caso del passaggio pedonale siano rappresentate persone
generiche che attraversano la strada (e non solo uomoni) e nell’altro invece solo persone di
sesso maschile è il prodotto di una convenzione che noi siamo in grado di interpretare, ma
non è una distinzione che viene raffigurata nell’immagine stessa; il significato di queste
sagome è convenzionale come i simboli di un linguaggio.
Il limite principale delle raffigurazioni astratte – come le stilizzazioni – è che esse possono
descrivere bene prototipi di oggetti (capitolo 4, par. 3.1), come pere e mele, sedie e tavoli,
uomini e donne, ma non sono in grado di operare su altri livelli di astrazione. Un’icona
grafica per il concetto di “essere vivente” o “frutta” deve ricorrere inevitabilmente alla
raffigurazione di qualche animale o frutto determinato. Per questo motivo per esprimere un
concetto più comprensivo come “veicoli a due ruote” nella segnaletica stradale talvolta
vengono affiancati biciclette e moto, dal momento che nessuna di queste due raffigurazioni è
in grado da sola di rappresentare tutta la categoria.
Inoltre se è facile astrarre su proprietà come i dettagli o il colore (come nella sagoma umana
al posto dell’immagine di una persona determinata), non è possibile astrarre su proprietà come
le relazioni geometriche: non è possibile disegnare il concetto generale di “triangolo” con un
triangolo stilizzato in cui non siano specificati gli angoli o il rapporto di lunghezza tra i lati.
Con il linguaggio, per fare un altro esempio, possiamo dire che tre oggetti, una colonna, un
albero e una fontata sono allineati tra di loro, senza specificare quale di essi sta nel mezzo,
quale a destra e quale a sinistra. In una raffigurazione, invece, non possiamo evitare di dare
anche questa informazione, ovvero non possiamo disegnare una scena che trasmetta solo
l’informazione “i tre oggetti sono allineati”, senza trasmettere anche l’ordine in cui sono
allineati.
Solamente attraverso una chiarificazione preliminare posso far valere l’immagine di un
triangolo o un rettangolo come raffigurazione di triangoli e rettangoli generici. Va notato
inoltre che per raffigurare un concetto come “figura chiusa con quattro lati perpendicolari”
usiamo un rettangolo e non un quadrato, benchè anche il quadrato soddisfi la definizione.
Perché? Un motivo sta nel fatto che se usassimo un quadrato introdurremmo nella
raffigurazione una proprietà specifica (i quattro lati sono uguali) che un osservatore
interpreterebbe come rilevante, mentre come esemplare di “figura chiusa con quattro lati
perpendicolari” noi vorremmo fosse trascurata. In altri termini, un quadrato è un cattivo
prototipo di questa definizione, che può essere espressa in modo più efficace con un
rettangolo. Per questo motivo non è una buona scelta usare l’immagine di una balena per
11
raffigurare il concetto di “mammifero” in un libro di zoologia, benchè la balena sia un
mammifero. Ci sono altri animali più vicini alla nostra idea prototipica di mammifero e la
balena piuttosto appartiene ad una categoria più specifica (“mammiferi d’acqua”), così come
il quadrato è una cateoria più specifica delle figure chiuse con quattro lati perpendicolari.
Ciò che in una figura è o non è rilevante è spesso frutto di una stipulazione convenzionale o
di una informazione legata al contesto. Da un’immagine presa isolatamente non siamo in
grado di stabilire perché l’immagine di un uomo con il cappello su un segnale di transito
pedonale indica le persone in genere e non gli uomini con i cappelli, mentre invece la figura
di una persona in sedia a rotelle indica un passaggio riservato ai paraplegici e non si riferisce
alle persone generiche. Ciò dipende dalla differente rilevanza che noi attribuiamo a questi
particolari dell’immagine.
Figura 3: la seconda sagoma di essere umano raffigura persone di sesso femminile perché
interpretiamo il particolare (gonna) come rilevante e non come “uomini con gonna”, né il
primo segno come “donna con i pantaloni”.
Figura 4: passaggio pedonale. La figura umana va interpretata ad un livello di astrazione
diverso da quello in fig. 3: i guidatori devono fare attenzione a tutte le persone, non solo a
quelle di sesso maschile.
Il linguaggio, si è visto, permette di esprimere concetti a differenti livelli di astrazione. Se
diciamo che un edficio da progettare deve avere “molte” finestre, stabiliamo un vincolo senza
però dover specificare un numero esatto, cosa che con una raffigurazione grafica non è facile
fare.9
Tuttavia proprio per questo motivo il linguaggio non ci trasmette informazioni in modo
diretto, ma attraverso la codifica indiretta di segni convenzionali e limitati. Sulla limitatezza
abbiamo già fatto l’esempio dei colori (capitolo 3, par. 4): ci sono poche parole per descrivere
differenti tonalità, e una descrizione linguistica non può mai essere così precisa quanto la
semplice e diretta presentazione del colore stesso.
Stenning (2002) ha sostenuto inoltre che c’è una sorta di bilanciamento tra il grado di
astrazione che un sistema rappresentativo può ottenere e la facilità di comprensione delle
informazioni che esso codifica. Più un sistema rappresentativo è astratto, meno immediata
9
C’è tuttavia un modo di introdurre vaghezza nei disegni quando noi disegnamo degli schizzi. Uno
schizzo è una rappresentazione grafica dove gli elementi vengono tratteggiati, delineati, sovrapposti in
più varianti: nel capitolo quinto si esaminerà la loro funzione.
12
sarà l’informazione comunicata. Ad esempio la distanza e le relazioni spaziali tra tre città
possono essere verbalmente espresse in modo molto astratto con:
“Una città è a nord ovest di un’altra che a sua volta è a sud ovest della città che sta più a nord
e più a est delle prime due.” (da Stenning 2002, modificato)
Questa frase non contiene nessun uso diretto e visivo di riferimenti spaziali e ci fornisce una
descrizione astratta della posizione reciproca delle città che solo con fatica siamo in grado di
ricostruire su una mappa. Una descrizione verbale più precisa può ricorrere all’aggiunta di
particolari, ad esempio le distanze effettive tra le città:
“La città A è a 4 chilometri da C e a 2 chilometri da B. La città B è a 2 chilometri da A e a 5
chilometri da C. C è a quattro chilometri da A e a 5 chilometri da B.”
Questa descrizione è più precisa, ma ancora poco intuitiva. A partire da queste informazioni
possiamo ulteriorimente costruire una tabella delle distanze reciproche tra A, B e C che mette
ordine tra questi dati, ma non ci dà ancora una rappresentazione diretta delle relazioni tra le
città.
Invece una rappresentazione diagrammatica di queste relazioni ci mostra subito le distanze e
le posizioni delle tre città:
C
B
A
Le rappresentazioni sono in questi esempi progressivamente più concrete e vincolate. La
descrizione verbale può riferirsi a molteplici disposizioni tra le tre città, non solo ad un’unica
configurazione. La descrizione per mezzo di un diagramma spaziale, invece, ci mostra
un’unica disposizione tra i tre elementi.
Una descrizione verbale può essere indeterminata e astratta ed è in grado di suggerire più
alternative possibili che soddisfano ciò che essa descrive. Interpretando ad esempio una frase
come “L’oggetto A è sotto a D. A è a sinistra di B. C è a destra di A.” possiamo accettare due
soluzioni spaziali differenti, entrame valide:
A B C
D
oppure
A C B
D
Mani e Johnson-Laird (1982, vedi Kanisza, Legrenzi, Sonino 1983) hanno visto che
descrizioni indeterminate di questo tipo vengono ricordate peggio di descrizioni che invece
individuano un’unica disposizione spaziale (come “L’oggetto A è destra di B, C è a sinistra di
B, D è sotto B”, che ha un’unica interpretazione). Questo sosterrebbe l’ipotesi che noi non
memorizziamo le informazioni linguisticamente, ma sotto forma di modelli mentali. Dal
punto di vista verbale una descrizione indeterminata è infatti equivalente (in termini di
numero di informazioni contenute) ad una determinata, ma l’interpretazione spaziale della
prima è più complessa di quella della seconda, dato che deve tenere conto
dell’indeterminatezza e delle possibili varianti.
Il linguaggio, infine, non solo può descrivere più soluzioni possibili, ma è anche in grado di
esprimere qualcosa di impossibile. Ad esempio dicendo che la città A e B stanno ad una
distanza di 2 chilometri, la città A ad una distanza di 4 chilometri da C e questa a 10
chilometri da B, vedremo che non esiste una soluzione possibile che si possa rappresentare
graficamente, dal momento che C può essere distante da B al massimo 6 chilometri. Con
un’immagine invece non possiamo che rappresentare una configurazione spaziale possibile.
4.2 Tradurre dalle immagini al linguaggio e dal linguaggio alle immagini
Il problema della relazione tra linguaggio e percezione, e quello della relazione tra il
linguaggio e altri sistemi di rappresentazione, consiste nello stabilire i meccanismi che
13
permettono la traduzione da una dimensione all’altra. Questo è un problema con importanti
implicazioni pratiche, dal momento che in gran parte delle nostre attività quotidiane siamo
impegnati in un complesso scambio di codifica e decodifica tra ciò che vediamo e le parole.
Anche nell’attività di un architetto, per quanto egli lavori prevalentemente su disegni e
rappresentazioni grafiche, la dimensione linguistica gioca sempre un ruolo importante in
situazioni nei quali egli interagisce con il cliente o con i colleghi, interpreta le sue richieste,
prende appunti, espone e spiega il proprio lavoro e valuta le critiche. Osservando degli
architetti al lavoro in uno studio, si è calcolato come la fase comunicativa e verbale ricopra il
40 per cento di tutte le loro attività (Broadbent 1988).
Linguaggio e percezione sono in stretta relazione anche in contesti più particolari, come ad
esempio in un testo fatto di immagini e parole, o anche in un artefatto, costituito di parti
materiali, percepibili, e di indicazioni verbali presenti sull’oggetto stesso o sotto forma di
manuali di istruzioni. Un designer che si dedica agli aspetti completi di un artefatto dovrebbe
tenere conto anche di come l’oggetto sarà presentato alle altre persone. Un “libretto delle
istruzioni” fatto male è in grado di peggiorare l’utilizzabilità di un artefatto penalizzandone la
funzionalità.
Immagini e parole possono inoltre stare in diverse relazioni tra di loro. Prendendo l’esempio
di un testo e di una immagine al suo interno possiamo ad esempio elencare i seguenti tipi di
relazione:
1) l’immagine rispecchia ciò che viene descritto nel testo (ed è quindi ridondante);
2) l’immagine sintetizza quello di cui parla il testo;
3) l’immagine offre una chiave di lettura per interpretare e comprendere il testo (quindi
focalizza e inquadra il contenuto del testo, cfr. Bransford e Johnson 1972);
4) l’immagine offre un appiglio mnemonico per ricordarsi dell’informazione contenuta nel
testo;
5) non ha nessun ruolo, solo quello di “abbellimento”;
Per ognuna di queste relazioni, vale anche l’inverso. Un testo può permettere o offrire
elementi per comprendere un’immagine (ad esempio una didascalia), può guidare e
influenzare l’analisi di un’immagine, focalizzando su certi suoi aspetti e non su altri, e così
via.
Questo considerazioni generali non spiegano tuttavia la natura della relazione tra immagini e
linguaggio, né come possa avvenire una traduzione dall’uno all’altro.
Su questo punto si è ipotizzato che input differenti come quello linguistico e percettivo
vengano ritradotti nella nostra mente in un “codice” comune, affinchè possano essere
confrontati e trasformati l’uno nell’altro. Questa ipotesi assume che avvenga un duplice
lavoro di codifica e confronto nel caso si debbano confrontare due input a disposizione di un
soggetto, oppure di codifica e “decodifica” nel caso si debba tradurre una rappresentazione in
un’altra. Un codice di questo genere trasformerebbe gli input in informazione astratta,
spogliandoli del loro aspetto fisico (suoni, immagini o segni linguistici). Si è discusso
ampiamente sulla natura di questo codice, se esso sia una sorta di linguaggio mentale o
piuttosto di modelli astratti che non hanno né l’apparenza del linguaggio, né quella delle
immagini, ma che stanno alla base di entrambi.
Fautori delle teorie “proposizionaliste” (si era visto sopra, par. 1.1) prediligono l’ipotesi che
le informazioni visive vengano tradotte in qualcosa di simile all’informazione linguistica.
Clark e Chase (1972; Clark, Carpenter e Just 1973; per un’esposizione e una discussione più
ampia di queste ricerche, vedi Kanisza, Legrenzi e Sonino 1983) hanno compiuto una serie di
esperimenti di comparazione tra immagini e frasi, cercando di estrapolare le modalità di
codifica di queste informazioni e il loro successivo confronto: di fronte ad una figura semplice
come una stella (*) posta sopra un più (+), in assenza di altri suggerimenti si tenderà a
codificare l’immagine come “la stella è sopra il più”, piuttosto che “il più è sotto la stella”,
14
questo perché la relazione sopra è cognitivamente dominante rispetto alla relazione sotto.10 Se
una frase come “il più è sotto la stella” viene presentata dopo l’immagine, il tempo necessario
per giudicare se essa descrive l’immagine in modo veritiero sarà leggermente più lungo di
quello che si ottiene mostrando la frase “la stella è sopra il più”: una possibile del fatto che
l’immagine viene probabilmente codificata con “sopra” piuttosto che “sotto”, quindi in un
codice simile al linguaggio. Tuttavia se presentiamo un’immagine composta da un triangolo
di grandi dimensioni sopra un piccolo cerchio, useremo piuttosto il triangolo come punto di
riferimento e la codifica linguistica “un cerchio è sotto il triangolo” sarà quella prevalente, per
lo stesso motivo per cui diciamo “una mosca è affianco all’elefante”, ma non viceversa. In
questo caso una proprietà percettiva influenza in modo significativo la codifica.
Se una frase che descrive una figura viene presentatra prima di questa, la frase influenzerà
normalmente la codificazione e l’interpretazione di quella figura. Ad esempio se si mostra la
frase “B è più lungo di A” e poi si mostra un segmento A più lungo di B: la figura viene
prevalentemente codificata come “B è più corto di A”, mentre in assenza del suggerimento
verbale si tenderebbe a codificare “A è più lungo di B”. In questo caso è l’informazione
linguistica a focalizzare su un elemento (B) e a influenzare il tipo di codifica.
Gli esempi menzionati mostrano come non è solo attraverso la percezione che possiamo
focalizzarci su aspetti mettendone in secondo piano altri. Anche il linguaggio divide la realtà
in “figura” e “sfondo”, sia attraverso la sua indeterminazione (“La mela è rossa”, ignora le
informazioni sulle dimensioni della mela), sia attraverso diverse accentuazioni: la frase “Il
tavolo è posto dietro il letto” esprime la stessa informazione di “Il letto è posto davanti al
tavolo”, ma le due descrizioni si focalizzano su soggetti diversi. 11
I fenomeni di focalizzazione e influenza tra linguaggio e percezione non riguardano solo
l’interpretazione immediata di un’informazione, ma sembrano agire in maniera ancora più
evidente nei processi di memorizzazione e di recupero. Le ricerche di Elizabeth Loftus, ad
esempio (Loftus e Palmer 1974), sono note per aver mostrato che la memorizzazione di fatti
osservati da testimoni oculari (come un’incidente d’auto o un’aggressione) è fortemente
influenzabile da come vengono formulate le domande poste a loro a proposito di ciò che
hanno visto.
In un altro studio classico di Carmichael, Hogen e Walter del 1932 si presentarono a dei
soggetti figure ambigue analoghe a quelle nella figura 5, insieme ad un’etichetta verbale che
corrispondeva ad una delle possibili interpretazioni di ciascuna immagine. Per esempio la
prima immagine nella figura 5 veniva associata presso un gruppo di persona con la
descrizione “tende in una finestra”, invece ad un altro gruppo veniva descritta con “rombo in
un rettangolo”. Chiedendo dopo diverso tempo ai soggetti dei due gruppi di riprodurre le
immagini viste, essi disegnavano le figure accentuando l’interpretazione data dalle descrizioni
verbali. In altri termini, essi adattavano l’immagine memorizzata avvicinandola al prototipo
fornito dalla descrizione.
10
Un’asimmetria che si riflette nel fatto che tendiamo ad analizzare un’immagine dall’alto in basso (su
quest’ultimo punto, vedi van Sommers 1984).
11
Così la prima frase portebbe essere una risposta legittima alla domanda “Dov’è il tavolo?”, mentre la
seconda, pur descrivendo la stessa configurazione spaziale, suonerebbe anomala.
15
Figura 5
Questa ricerca tuttavia non ci dà una risposta certa sulla questione se l’influsso del linguaggio
avviene nel momento della memorizzazione del percetto, oppure se la trasformazione avviene
durante la conservazione nella memoria a lungo termine o se invece avviene solo quando
l’immagine viene recuperata. Un’ulteriore interpretazione è che la distorsione avvenga
probabilmente nel momento in cui l’informazione viene recuperata per mezzo del termine che
descrive l’immagine e non durante la memorizzazione.12
Quello che sembra essere certo è che le etichette verbali influiscono sul modo in cui noi (ri)produciamo un’immagine. Questo tipo di fenomeno è stati infatti esaminato anche da Van
Sommers (1984) studiando nei dettagli il modo in cui le persone disegnano (sul disegno, vedi
cap. 5, par. 3). Presentando immagini come in figura 5 ed associandole con descrizioni
verbali, si può vedere come queste influenzino radicalmente l’ordine in cui le linee vengono
tracciate: un’immagine descritta come “palo contro l’orizzonte” viene riprodotta disegnando
prima le linee verticali del palo e poi facendo passare dietro la linea dell’orizzonte. Se la
stessa figura viene descritta come “due T ruotate”, una persona tenderà a disegnare le due T.
Riproducendo più volte l’immagine, i disegni tenderanno a essere fedeli alla descrizione
verbale iniziale, distanziandosi invece dalla descrizione alternativa. Un fatto che ricorda
l’esperimento di Carmichel e colleghi, ma che riguarda l’interpretazione diretta
dell’immagine, il modo di strutturarla disegnandola, non la sua memorizzazione.
12
Su questo però non c’è completo accordo (cfr. Daniel 1972).
16
Figura 6: Ordine dei tratti di un disegno con differenti descrizioni verbali (da Van Sommers
1984).
Il rapporto di influenza tra linguaggio e percezione ci riconduce infine ad un tema
brevemente menzionato nel capitolo 3 (par. 4), quello del “relativismo” linguistico (la
cosiddetta ipotesi Sapir-Whorf) secondo cui la realtà che noi percepiamo è del tutto plasmata
e determinata dal nostro linguaggio. Questa è un’interpretazione radicale che non regge alla
prova dei fatti. Il linguaggio non determina ciò che noi percepiamo, tuttavia può influenzare il
modo con cui classifichiamo, riproduciamo e memorizziamo le cose, esso può guidare la
nostra percezione, focalizzando la nostra attenzione su certi aspetti o categorizzandoli in un
modi determinati.
4.3 La codifica delle immagini e del linguaggio nella mente
Un problema prima menzionato riguarda la natura della codificazione delle informazioni
linguistiche rispetto a quelle di tipo visivo. La questione è se ci sono differenti tipi di processi
specifici per ogni tipo di conoscenza, oppure se c’è un sistema unico di elaborazione finale
delle informazioni, cioè un unico “formato” in cui le conoscenze vengono tradotte. Nel
paragrafo 1.1 abbiamo visto che i fautori di una posizione “proposizionalista” negano un
ruolo alle immagini mentali di tipo visivo nei processi cognitivi superiori. Secondo questa
posizione la differenza tra vedere un’immagine e leggere un testo, per quanto innegabile,
riguarderebbe solo i livelli periferici della cognizione umana. Secondo questa la lettura, a
differenza della percezione, è caratterizzata ad esempio dalla scansione da sinistra a destra e
dalla percezione dei simboli grafici da interpretare piuttosto che di oggetti da vedere, ma
questi stimoli verrebbero poi elaborati rapidamente in un formato comune.
Nella comprensione di testi che descrivono scene spaziali, secondo diversi autori (JohnsonLaird 1983, van Dijk e Kintsch 1983, Sanford e Garrod 1981), noi costruiamo modelli mentali
che fungono da ponte di collegamento tra il sapere di tipo linguistico e conoscenze non
linguistiche, come quelle provenienti dalla percezione. Un modello mentale, inteso in questi
termini, non va confuso con un’immagine, perché quest’ultima può mostrare solo relazioni
spaziali, mentre noi costruiamo modelli anche per rappresentarci relazioni astratte.
Altri (Glenberg e Langston 1992), hanno invece posto un maggiore accento sul carratere
visivo dei modelli che costruiamo a partire da una descrizione spaziale contenuta in un testo.
Essa verrebbe raffigurata nel taccuino visuo-spaziale (v. sopra, par. 2) della memoria di
lavoro, similmente a quanto Kosslyn ha sostenuto per le immagini mentali. Immaginare
mentalmente una scena e costruirla leggendola da un testo coinvolgerebbero quindi le stesse
17
funzioni per vie differenti. Che la costruzione di una rappresentazione spaziale di una scena
descritta di un testo avvenga nella memoria visuale sembra dimostrata dal fatto che le
rappresentazioni create quando il testo viene letto sono meno accurate di quelle che si hanno
quando il testo viene fatto ascoltare. Ciò sarebbe dovuto al fatto che l’azione del leggere
impegna in parte la nostra memoria di lavoro di tipo visivo, mentre un testo ascoltato passa
attraverso il canale fonologico. Inoltre nell’accedere alle informazioni visive acquisite dai
testi si hanno fenomeni simili a quelli visti nell’ispezione di immagini mentali quando si
fanno uscire elementi dal “campo visivo” mentale (par. 1.2). Un oggetto descritto da un testo
può essere cioè “fatto uscire” dalle rappresentazioni mentali delle scene successive, ad
esempio descrivendo uno spostamento spaziale sufficientemente grande che ci allontana
dall’oggetto stesso. Il recupero dell’oggetto richiede in questo caso uno sforzo cognitivo
maggiore di quando un oggetto è ancora dentro il “campo visivo” della nostra immagine
mentale.
Per fare un altro esempio, consideriamo la descrizione di una serie di oggetti A B C D E F in
fila. Una prima frase che descrive la relazione spaziale tra gli oggetti A, B ed E (come “A è
subito a sinistra di B, E è invece a destra di B il triplo della distanza”) dovrebbe generare una
rappresentazione che include anche lo spazio “vuoto” tra B ed E, ma non necessariamente lo
spazio alla sinistra di A e alla destra di E. Se questo è vero, la nostra mente dovrebbe essere
preparata in modo diverso ad accogliere le informazioni ulteriori di questa scena: gli oggetti C
e D dovrebbero cioè essere inseriti più facilmente (essendoci lo spazio tra B ed E) di quanto
accada con l’oggetto F. Per quest’ultimo occorre infatti ingrandire mentalmente lo spazio del
modello alla destra di E, mentre per i primi due lo spazio vuoto è già a disposizione. Le
ricerche hanno confermato questa previsione. Se l’informazione fosse solo di tipo linguistico,
questa differenza non dovrebbe esserci.
Una concezione alternativa vede percezione e linguaggio come separati anche nella mente.
Essa ovviamente non esclude che possa esserci una traduzione dall’uno all’altro, ma ipotizza
che vengano trattati separatamente, senza bisogno di un codice più astratto, restando distinti
anche nel modo in cui vengono memorizzati. Un importante sostenitore di questa posizione è
A. Paivio (1971), il quale ha elaborato un modello duale della memoria, che immagazzina
separatamente informazioni astratte e verbali da quelle di tipo immaginativo e percettivo.
Questo modello spiegherebbe perchè le parole più vivide, dotate di alto contenuto
immaginativo (come “casa”, “vacanza” ecc.) vengono ricordate meglio delle parole più
astratte (come “scopo”, “correlazione”). Le prime verrebbero infatti memorizzate sia sotto
forma di informazione verbale che di immagini vivide, le seconde invece no. Il modello di
Paivio non sostiene solo una separazione tra informazione verbale e percettiva, ma spiega
anche le differenze di memorizzazione tra parole.
Anche certe ricerche neuropsicologiche, mettendo in relazione i fenomeni di tipo neuronale
con quelli psicologici, sembrano sostenere una separazione fino a livelli piuttosto elevati della
cognizione tra i due tipi di informazione.
Esistono casi di pazienti affetti da un tipo particolare di afasia che sono in grado di produrre
frasi coerenti (ma prive di senso), leggere o ripetere quanto è stato loro detto, senza però
capirne il significato (Farah 1989). Spesso questi pazienti sono stati erroneamente
diagnosticati come malati di mente sulla base dei loro discorsi insensati e dell’apparente
incapacità di comprendere i discorsi altrui. Tuttavia, dando loro la possibilità di dimostrare le
abilità cognitive attraverso canali non-linguistici, si scopre che il loro disturbo riguarda la
comprensione del linguaggio e non il ragionamento. Essi possono capire immagini,
diagrammi, usare mappe. Possono essere in grado di riordinare una sequenza di immagini di
un fumetto, ricostruendo la storia sottostante.
Ci sono poi casi di persone con un danno nella comprensione percettiva ma non in quella
verbale. Pazienti che soffrono di “agnosia visuale associativa” non riescono a comprendere in
parte o del tutto ciò che vedono, anche se la loro vista non ha problemi. Ci sono casi più
specifici di pazienti che riescono a riconoscere oggetti e situazioni reali, ma non immagini. In
18
questo caso si parla di “agnosia figurativa” e si suppone sia data dal fatto che le immagini
costituiscono un insieme di stimoli più semplici di una scena reale ed offrono per questo
meno indizi per poter essere interpretati e compresi.
Mostrando un oggetto, ad esempio un orologio, ad una persona che soffre di agnosia visuale,
essa non sarà in grado di dire di cosa si tratta. Invece riconoscerà subito l’oggetto se le
facciamo ascoltare il ticchiettio delle lancette, oppure se le diamo in mano l’orologio per
poterlo sentire al tatto. Questo ovviamente dimostra che il concetto di orologio e la sua
descrizione verbale sono intatti. 13
Gli esempi di persone che comprendono testi, ma non oggetti percepiti o viceversa,
sembrano provare l’esistenza di una separazione netta tra la codifica di informazioni verbali e
visive. Questo non significa che ad un qualche livello non ci sia tra i due ambiti una
connessione: Warrington e Shallice (1984) hanno studiato pazienti con specifici deficit nella
comprensione e nel riconoscimento di categorie concettuali come “oggetti animati” (esseri
viventi) e “oggetti inanimati”. I pazienti con un deficit relativo alla categoria degli esseri
viventi non erano in grado né di riconoscere percettivamente né di dare la definizione
linguistica di animali o piante. Similmente paszienti con deficit riguardanti gli oggetti
inanimati non riuscivano comprendere immagini o definire verbalmente oggetti non-viventi.
5. La dimensione mentale dello spazio e dell’orientamento
Il linguaggio è un mezzo molto efficiente per localizzare luoghi dotati di nomi (incrocio,
chiesa, panetteria, ecc.) e comunicare concetti non direttamente visibili (come “cammina fino
a…” o “a quel punto, chiedi ulteriori informazioni”), nonché illustrare relazioni spaziali (a
destra, sinistra, sopra e sotto). Più complesso risulta usare il linguaggio per comunicare i
dettagli di un oggetto.
Il linguaggio è piuttosto efficace nell’esprimere le relazioni spaziali come l’orientamento,
l’essere a destra o a sinistra di qualcosa, l’essere contenuto in esso e così via. Al contrario le
qualità percettive che compongono figure e oggetti sono dotati di una ricchezza e varietà che
non ha paragone nelle categorie linguistiche. Siamo in grado di percepire la differenza tra
migliaia di colori, ma non abbiamo migliaia di nomi per descriverli.
Secondo le ipotesi formulate nell’ambito della semantica cognitiva (cfr. Talmy 1983), il
linguaggio è una fonte importante di schematizzazione dello spazio. Termini come
“attraverso”, “di fronte”, “tra”, “sopra”, “lungo il”, “dietro a” e così via, riflettono categorie
generali delle percezione spaziale. La mente “pensa” le relazioni spaziali secondo queste
categorie generali. Distinzioni più sottili possono essere fatte attraverso termini tecnici di
misurazione.
Un caso interessante sono gli aggettivi spaziali che illustrano il modo con cui l’estensione di
un oggetto viene descritto a seconda delle caratteristiche dell’oggetto stesso, del contesto e
della prospettiva dell’osservatore. Consideriamo il seguente esempio: data una tavola
rettangolare con lati a e b (con a > b), chiedendoci la lunghezza e la larghezza, diremmo che il
rettangolo è „lungo a e largo b“, perché attribuiamo la lunghezza alla dimensione maggiore
(figura 7).
13
La dimostrazione più sorprendente che queste persone non sono cieche o che non hanno nessun tipo
di disturbo visivo periferico (danni agli occhi, alla retina, al nervo ottico, ecc.) è data dal fatto che
questi soggetti sono in grado di copiare un disegno di un oggetto che non riconoscono. Un paziente
studiato da Ratcliff e Newcombe (1982) riusciva a copiare il disegno di un’ancora di nave sul foglio,
tuttavia non riusciva a capire cosa avesse disegnato. Lo stesso paziente sapeva benissimo cosa fosse
un’ancora ed era in grado – verbalmente – di descriverne la funzione e gli usi, a dimostrazione del
fatto che la sua capacità linguistica era intatta.
19
Figura 7: La tavola è „lunga a“ e „larga b“
Inserendo questo oggetto in un contesto specifico, l‘attribuzione delle dimensioni può
mutare: ad esempio possiamo dire che un letto matrimoniale è lungo 2 e largo 3 metri, dato
che questo oggetto è considerato da una prospettiva canonica (cap. 3, par. 3.2) in cui la
lunghezza è sempre quella che va dalla testa ai piedi di una persona sdraiata. La figura sopra
può essere vista invece come il davanzale di una finestra: in questo caso tenderemmo a dire
che il davanzale è „largo a“ e „profondo b“. La variazione d’uso di aggettivi spaziali come
„lungo“ e „largo“ dipende dalla salienza data dal punto di osservazione dell’oggetto. Il
davanzale viene visto in genere con la lunghezza maggiore posta di fronte all’osservatore.
Secondo una proposta di Jackendoff (1996) esistono otto cornici (frames) di riferimento da
tenere in considerazione nella percezione di oggetti fisici che influenzano il modo di
interpretarli e descriverli. Quattro di questi frames sono „intrinseci“, ovvero riguardano le
caratteristiche legate all’oggetto (forma geometrica, movimento, orientamento usuale, modo
di presentazione prevalente), e quattro sono “ambientali” (riferimento gravitazionale,
geografico, contestuale, prospettiva dell’osservatore).
La tavola di figura 7 può essere ad esempio descritta unicamente attraverso aggettivi
intrinseci: „lunga a, larga b e spessa c“. Ma se la osserviamo inserendo il riferimento alla
gravità, potremmo descriverla come „lunga a, larga b e alta c“. Introducendo in seguito la
prospettiva dell’osservatore, potremmo descrivere la tavola come „lunga a, profonda b e alta
c. Infine, se osserviamo l’oggetto anche nel contesto usuale in cui è inserito - ad esempio un
davanzale - potremmo dire: „il davanzale è largo a, profondo b e alto c“.
Questa flessibilità del linguaggio nel descrivere tipi di relazioni spaziali non è presente nel
momento in cui dobbiamo usare le parole per comunicare informazioni relative a qualità
“secondarie” (cap. 3, par. 2.2) e dettagli più specifici di un oggetto. Ad esempio è molto
difficile descrivere verbalmente un volto umano – a meno che non presenti segni caratteristici
molto marcati -, in modo da permetterci di riconoscerlo tra una folla. Questa consiste nel
fatto che noi dobbiamo fare riferimento ad un oggetto unico (il volto dell’attuale Papa) e non
ad una classe di oggetti, come accade quando diciamo semplicemente “Nella stanza ci sono
delle sedie, prendine una”. Nel descrivere una sedia non abbiamo quasi mai bisogno di
distinguerla da sedie simili appartenenti alla stessa classe, a meno che non vogliamo riferirci
ad un oggetto specifico dotato di caratteristiche particolari (“La mia sedia ha un segno blu
sullo schienale”). Il volto di una persona ha tratti unici ma allo stesso tempo è molto simile a
molti altri volti, e il compito di descrivere verbalmente esattamente quel volto è difficile
quanto voler far capire ad una persona la forma esatta di una sedia o di un’automobile, a
differenza di molte altre sedie o auto generiche.
Questo spiegherebbe anche il fatto, decritto da Schooler e Engstler-Schooler (1991), che in
certi casi descrivere verbalmente un volto percepito può portare a peggiorarne il ricordo
rispetto a persone che non si sono sforzate di verbalizzare. La descrizione verbale, imprecisa e
grossolana, influirebbe negativamente sulla codifica o sul recupero dalla memoria di ciò che
si è visto.
Questi esempi mostrano che il grado di difficoltà nel descrivere un oggetto con parole
dipende dal livello di astrazione o generalità con cui ci vogliamo riferire ad esso. Un artefatto
prototipico viene verbalmente comunicato con il termine generale della sua classe: se dico
20
“vedo la mia auto” o “abito in un igloo”, mi sto riferendo ad un artefatto specifico con un
termine relativo all’intera classe, senza bisogno di descriverlo veramente nei particolari. Un
nome è come un’etichetta che rimanda ad una descrizione che l’ascoltatore dovrebbe già
conoscere per esperienza.
Oggetti concepiti ad un livello più specifico richiedono invece un riferimento verbale più
preciso, se non addirittura una descrizione delle caratteristiche percettive dell’oggetto stesso.
Se una persona non sa com’è fatto uno spremiagrumi di Philippe Starck, allora devo
impegnarmi in una descrizione complessa della sua forma: in quel caso il linguaggio diventa
uno strumento meno efficace di un semplice disegno. Perché il linguaggio sia utile in queste
circostanze è necessario che si formi un’“etichetta” che si sostituisca alla descrizione
complessa, come “spremiagrumi di Stark”. Questo però prevede che l’etichetta sia nota
all’interlocutore, anche perché essa non comunica nulla della forma dell’oggetto, ma ha solo
la funzione di riattivare una conoscenza che l’interlocutore deve aver memorizzato in base ad
un’esperienza passata.
5.1 Spazio geografico
Consideriamo la situazione comune in cui qualcuno ci chiede delle indicazioni stradali, come
ad esempio arrivare in stazione dal punto in cui ci troviamo. Per poter rispondere alla
domanda non dobbiamo solo sapere dov’è la stazione (nella nostra mappa mentale della città),
ma anche sapere ricostruire un percorso che porti dal punto in ci troviamo all’obiettivo.
Dobbiamo inoltre fornire una descrizione precisa di questo percorso, che noi potremmo
conoscere intuitivamente, ma che non abbiamo mai analizzato in termini spaziali, come svolte
a destra o sinistra, numero di incroci e così via. Dobbiamo costruire una descrizione o un
“modello” del percorso adeguato all’interlocutore, rispettando i suoi limiti attenzionali e di
memoria. Le persone devono essere in grado di comprendere la descrizione che è stata data,
tenerla in mente, sapere collegare il modello con lo spazio reale. Un percorso troppo
complicato non è più memorizzabile e richiede un modello parziale che avvicini la persona
all’obiettivo (una soluzione “soddisfacente”, v. cap. 5, par. 1), consigliandole di chiedere ad
un certo punto ulteriori informazioni. Oppure, come si fa in Giappone, invece di descrivere a
parole il percorso, si prende carta e penna e si disegna una mappa semplificata del percorso.
Il movimento nello spazio ambientale (ovvero quello spazio in cui il soggetto è collocato e si
sposta, come la sua regione geografica, la sua città o zona) si fonda principalmente su tre tipi
di metodi di orientamento: i punti di riferimento geografici (landmarks), i percorsi e le mappe
vere e proprie (Lynch 1960, Appleyard 1969, Thorndyke 1980, Evans 1980, Golledge 1990).
Una distinzione importante è la rappresentazione e l’orientamento nello spazio a partire da
una prospettiva egocentrica (intrinseca), in cui le relazioni spaziali e gli oggetti sono
raffigurati a partire dal soggetto stesso (se sono davanti al Duomo di Milano, so che il
Castello Sforzesco è più o meno alle mie spalle, sulla sinistra), oppure da una prospettiva
estrinseca che astrae dall’osservatore e crea una mappa oggettiva dotata di punti cardinali (il
Castello è a Nord-ovest rispetto al Duomo). Similmente le distanze possono essere
rappresentate spazialmente (il Castello dista un chilometro dal Duomo), oppure come durata
temporale soggettiva (il Castello è a un quarto d’ora a piedi dal Duomo).
I punti di riferimento sono oggetti significativi che ci permettono di capire dove siamo e in
che direzione ci muoviamo: un edificio famoso, una torre facilmente visibile, una montagna.
L’uso di questi riferimenti appartiene ad una fase ancora primitiva dell’orientamento in un
ambiente. Un soggetto per potersi muovere da un luogo all’altro deve riuscire a vedere il
prossimo punto di riferimento a partire da quello presso cui si trova. È come quando in un
città nuova, sappiamo che il nostro albergo è vicino al duomo e che il duomo è visibile dal
ponte. Se dal punto in cui ci troviamo riusciamo a vedere il ponte, allora siamo in grado di
raggiugnere l’albergo.
Una fase più avanzata di comprensione di un ambiente tiene conto invece di una “mappa
procedurale” in cui a partire da un punto di riferimento si sa quale direzione occorre prendere,
21
anche quando il punto di riferimento successivo non è visibile. La nostra mente è in grado di
stabilire percorsi di complessità crescente a partire dai punti di riferimento: la nostra
dimestichezza con la nuova città ci permette ora di sapere in che direzione si trova l’albergo a
partire dal ponte, senza dover fare uso di passaggi intermedi come il duomo. Questo tipo di
conoscenza dell’ambiente è il prodotto di una dimestichezza acquisita con l’esperienza e non
tramite lo studio di una mappa. Si conoscono infatti i percorsi e le direzioni da prendere a
partire da un punto in cui ci si trova, ma non necessariamente si sanno disegnare in modo
astratto le relazioni spaziali tra tutti i luoghi.
Infine la fase più avanzata di comprensione di un ambiente è quella in cui la nostra mente è
in grado di farsi mappe dei luoghi e dei percorsi in modo da poter mettere in relazione anche
punti distanti del territorio, in una prospettiva astratta, indipendente dalla nostra posizione e
dalla percezione dei punti di riferimento salienti.
La rappresentazione mentale di uno spazio può subire generalizzazioni e semplificazioni
basate sulla nostra consuetudine con questo spazio. Giraudo e Peruch (1992) hanno esaminato
la mappa mentale di Parigi in un gruppo di tassisti, molto familiari con la città, facendo loro
disegnare alcune strade o luoghi su una carta con la sola sagoma della città e della Senna. Il
risultato fu che le relazioni spaziali immaginate dai tassisti divergevano dalle relazioni
spaziali reali. Una ragione è il fatto che essi non conoscono questi luoghi passivamente, come
potrebbe fare qualcuno che ha semplicemene studiato la carta di Parigi, ma si sono costruiti
una rappresentazione sulla base del movimento effettivo tra le strade, in base alla conoscenza
dei tempi di percorrenza, degli ostacoli, delle zone collegate tra loro in modo più diretto o più
indiretto, al di là della distanza effettiva.
Similmente noi tendiamo a semplificare la nostra conoscenza delle relazioni geografiche
sulla base di informazioni generali: sapendo che l’Italia è a sud della Svizzera, potremmo
essere tentati di concludere che quindi Bolzano è più a sud di Lugano, benché ciò sia falso
(cfr. Stevens e Coupe 1978).
Fattori soggettivi e motivazionali, come l’attrattività di un luogo, possono inoltre modificare
la nostra percezione della distanza del luogo stesso. Si è visto che gli Europei, ad esempio,
tendono a sottovalutare la distanza da un punto della città (ad esempio la propria abitazione)
al centro, mentre invece i Nordamericani fanno il contrario, sopravvalutano la distanza dal
centro e diminuiscono quella dalla periferia. Questo, si ipotizza, per il fatto che i primi vedono
il centro città come un luogo privilegiato, piacevole, in cui si passa il tempo libero e si va
spesso, mentre gli Americani lo considerano un luogo da evitare, denso di popolazione più
povera e dove si va solo a lavorare, preferendo le aree esterne.14
Il famoso studio di Kevin Lynch (1960, Lynch e Hack 1984) analizza tre città statunitensi,
Boston, Jersey City e Los Angeles, cercando di ricostruire la percezione degli abitanti del loro
luogo in una sorta di “immagine pubblica” comune che distingue un centro cittandino da un
altro. Egli riconosce cinque elementi fondamentali con cui una città può essere rappresentata:
percorsi (linee di percorrimento per raggiungere un punto da un altro), confini (margini che
delimitano un’area da un’altra), nodi (punti di incontro di percorsi dove è possibile scegliere
dove andare), quartieri e punti di riferimento (monumenti, edifici significativi). Nodi e punti
di riferimento sono, considerandoli in modo astratto, dei punti, mentre confini e percorsi sono
delle linee; infine i quartieri sono superfici. Una delle conclusioni di queste ricerche è che un
buon ambiente urbano si contraddistingue dal fatto che ciascuno di questi elementi si mostra
in modo ben distinto e riconoscibile, ed è in relazione armonica con gli altri. Negativa è la
situazione in cui una persona percepisce delle zone che sono “non-luoghi”, o dove un
elemento prevale in modo eccessivo su tutti gli altri (ad esempio una zona costituita solo da
strade trafficate, che dà l’impressione di vivere in una fitta rete di percorsi e non in un
14
La cosiddetta inner-city è infatti, nel linguaggio nordamericano, il luogo dei ghetti, della povertà e di
condizioni abitative scadenti.
22
quartiere). La struttura di una città deve essere comprensibile, “leggibile” dai suoi abitanti,
come un testo ben equilibrato e privo di ambiguità.
23
Scarica

Emanuele Arielli, `Pensiero e progettazione. La