TEORIA DEI GIOCHI E NEUROECONOMIA
Sommario: Introduzione – 1. Una sotto-periodizzazione e il valore aggiunto della teoria dei giochi – 2.
L’apparato concettuale delle teoria: alcuni aspetti essenziali – 2.1 ... L’equilibrio di Nash – 3. Giochi
strategici celebri – 3.1 Il “Dilemma del Prigioniero” – 3.2 Il “Chicken game” – 3.3 La “Battaglia dei sessi”
– 4. Giochi ripetuti – 4.1 Il meccanismo di soluzione mediante induzione a ritroso – 4.2 Folk Theorem e
Tit –for-Tat – 5. I refinements – 5.1 Equilibrio perfetto nei sottogiochi – 6. Applicazioni alla strategia
militare – 7. Teoria dei giochi e neuroeconomia.
INTRODUZIONE
La Teoria dei Giochi (d’ora in poi TdG)1 è un metodo per l’analisi dei processi decisionali dove
interagiscono più soggetti. Il suo campo di applicazione è sicché vastissimo: potenzialmente, tutti i
contesti decisionali dove ciò che rileva non è solo la propria scelta, ma anche quella altrui.
La teoria ha ricevuto nuovi spunti critici da un filone di ricerca recentissimo, la neuroeconomia l’analisi dei fondamenti neurobiologici delle scelte economiche - che va ad ampliare la metodologia alla
base dell’esame microfondato delle scelte degli agenti. Recent breakthroughs in neuroscience models and
technologies allow us to study in vivo brain activity as individuals solve problems involving tasks such as making choices
between alternative actions, forming expectations about the future, carry out plans, and cooperating, producing, investing
trading and others. Knowledge on how the brain interacts with its environment to produce economic behaviour will allow
social scientist to better understand the variation both within and between individuals’ decision making, and consequently
to better predict economic behavior. (McCabe, 2005, p. 294). In tale prospettiva, la neuroeconomia è stata
individuata come lo spazio “where psychology and economics meet.” (Chorvat – McCabe – Smith, 2004, p. 16).
Si presta di conseguenza all’osservazione delle interazioni strategiche della TdG e all’approfondimento
– che inizia con lo studio della psicologia delle preferenze e con gli sviluppi dell’economia
comportamentale – dei suoi assunti di base e predizioni.
Scopo del lavoro è cogliere le principali interazioni tra TdG e neuroeconomia.
Funzionale all’analisi dei suoi innesti della neuroeconomia nella TdG è una breve panoramica di
quest’ultima, secondo l’articolazione che segue: si richiamano le origini e l’innovatività della TdG
rispetto ad altri approcci più tradizionali della teoria delle decisioni, segnatamente rispetto alla teoria
economica neoclassica (punto 1), e le sue principali caratteristiche metodologiche (par. 2). Si ricordano i
più famosi giochi strategici (parr. 3 – 3.3), i giochi ripetuti e il meccanismo di soluzione attraverso
l’“induzione a ritroso” (punti 4, 4.1, 4.2) per richiamare poi i principali refinements apportati alla teoria
(par. 5). Si illustrano talune applicazioni nel campo della sicurezza della TdG (par. 6). Si analizzeranno
quindi i maggiori contributi fornitele dalla neuroeconomia (par. 7).
1. UNA SOTTO-PERIODIZZAZIONE E IL VALORE AGGIUNTO DELLA TEORIA DEI GIOCHI
L’approccio teorico al gioco, oggi applicato a numerose aree, prende le mosse dai lavori di von
Neumann. Egli credeva nella superiorità della ragione e in un modo puramente razionale - senza
cortocircuiti mentali o particolari attitudini psicologiche - per affrontare le situazioni importanti della
vita. Le sue idee diedero origine ad una branca della matematica efficace per affrontare problemi
decisionali, risoluzione dei conflitti, dilemmi sociali. Tali concetti furono ulteriormente sviluppati, con il
matematico Morgenstern, in Theory of Games and Economic Behaviour (1947), in cui venivano formalizzate
situazioni in campo sociale dove sottostanti all’interazione intersoggettiva agiscono “conflitti di
interesse”. La teoria si sviluppa durante la seconda guerra mondiale, soprattutto in USA e in Gran
Bretagna, dove un numero rilevante di scienziati ed economisti vennero impiegati negli Stati Maggiori.
Si arricchisce negli anni cinquanta, con gli studi di Nash (Nobel dell’economia nel 1994, insignito
Per una ottima panoramica della quale si rinvia a Cellini – Lambertini (1996). Gli esempi riportati nel lavoro sono tratti
anche da Varian (2003) e Méro (2000).
1
1
insieme ad Harsanyi e Selten); di Tucker (matematico americano, autore del Dilemma del Prigioniero DP); di Luce e Raiffa (che in Games and Theory del 1957 estendono la teoria a contesti decisionali incerti
e complessi, popolati da agenti con razionalità limitata); di Schelling, le cui analisi sono pietre miliari nel
campo del coordinamento e deterrenza, autore di Strategy of Conflict (1960), premio Nobel per
l’economia (2005) insieme ad Aumann. La TdG, se nel suo nascere era servita a chiarire alcuni
importanti problemi concettuali ed aveva suscitato non poche aspettative nelle sue applicazioni, in
seguito si andò avviluppando in una spirale di sterili elaborazioni astratte (Spaventa, 1989). A partire
dagli anni ottanta, si è assistito tuttavia a una sua “seconda giovinezza”, attraverso alcuni affinamenti
(refinements) che hanno permesso di ampliarne l’applicazione pratica.
Il valore aggiunto rispetto ad altre impostazioni più tradizionali di analisi delle decisioni (quali la
teoria del controllo ottimo, originariamente sviluppata nel campo della missilistica) sta nei suoi assunti.
L’interazione fra soggetti è sì complessa, ma radicalmente diversa da un congegno che opera in modo
deterministico.
Il primo assunto della TdG è il riconoscimento di tale interazione, che è da intendersi come: 1)
interdipendenza fra soggetti/giocatori; 2) consapevolezza da parte di ognuno di tale interdipendenza
reciproca; 3) consapevolezza che gli altri giocatori sono a conoscenza di tale interdipendenza: essa è
“conoscenza comune” (common knowledge)2. La natura “strategica” di tale interazione sottende: a) il
conflitto di interessi fra giocatori/avversari; b) il tentativo da parte di ognuno di sfruttare tale
interazione con l’obiettivo di massimizzare la propria funzione di utilità/propri guadagni (payoffs); c) la
razionalità (secondo la nozione di razionalità strumentale, che indica appunto l’obiettivo di
ottimizzazione).
Il gioco strategico è perciò una situazione interattiva dove due o più avversari si comportano in
modo interdipendente e cercano di razionalizzare a proprio vantaggio tale interdipendenza. In questa
prospettiva, la tecnica dei giochi è da considerarsi uno strumento conoscitivo e previsivo dei processi
decisionali; una prasseologia, logica dell’azione.
L’ottimizzazione di ciascuno è sottoposta a vincoli (ottimizzazione vincolata). Alcuni postulati
della TdG, sebbene comuni a quelli della teoria economica - razionalità, ottimizzazione, vincoli – sono
da interpretarsi in modo più sofisticato proprio per la presenza di tale (consapevole) interdipendenza
reciproca. Così l’assunto di razionalità comporta che l’agente non solo ottimizza, ma anche che capisce
e prevede la scelta dell’avversario poiché ne ipotizza la razionalità; inoltre, è consapevole che
l’avversario sa che egli è razionale: anche l’ipotesi di razionalità è common knowledge3. I vincoli cui è
sottoposto il processo di ottimizzazione possono essere articolati in tre categorie (Fiocca, 1994): le
prime due comuni alla teoria economica, la terza specifica della TdG in quanto originata dalla
consapevole situazione di interdipendenza fra attori.
Vincoli esogeni, cioè esterni al soggetto: le condizioni di incertezza al cui interno si contestualizza
il processo decisionale; i vincoli informativi (le informazioni sono risorse scarse e costose); i vincoli
istituzionali (le opportunità di reddito, il sistema dei prezzi, la regolamentazione e, più in generale, le
condizioni di ambiente socio-economico e normativo).
Vincoli endogeni, che condizionano le scelte del soggetto dal suo interno: la razionalità limitata à la
Simon, in contrapposizione a quella perfetta “onnipotente” dell’economia neoclassica; il background
culturale/professionale (sebbene anche questo sia parzialmente condizionato dal fattore istituzionale,
cioè dalle opportunità offerte dall’ambiente esterno); una molteplicità di preferenze/sistemi di valori
che motivano le scelte e che non sono strettamente riconducibili al proprio diretto benessere (non-selfish
motivations); le emozioni. Nella categoria di vincoli endogeni possono includersi anche quelli
autoimposti: il soggetto non è un’entità monistica poiché al suo interno giocano una pluralità di
motivazioni, obiettivi, forze contrapposte. Questa “pluralità” di soggetti (selves) all’interno dello stesso
agente sono interpretabili come altrettanti sistemi di preferenze, che possono tra loro confliggere:
2
E’ la catena di ragionamento che comincia con “Io so che tu sai che io so…”.
3
Per questa maggiore articolazione della nozione di razionalità, taluni preferiscono parlare di “intelligenza” dei giocatori; ma, a
prescindere da questioni lessicali, resta il fatto che la TdG richiede una nozione più sofisticata di razionalità rispetto al paradigma
economico neoclassico.
2
autoimporsi dei vincoli (self-control) in tale prospettiva è del tutto razionale se ciò serve a guidare i
comportamenti e le scelte all’interno di questo sistema di spinte e contro-spinte4.
Dopo la teoria della razionalità limitata di Herbert Simon, l’abbandono dell’ipotesi di razionalità
perfetta è stata compiuta assumendo che agenti razionali possano “casualmente” commettere errori:
nella TdG tale assunto ammette soluzioni di equilibrio quali il trembling hand (Selten, 1975). Ancora, è
stata utilizzata una nozione di razionalità evolutiva derivata dalle applicazioni della TdG in biologia:
considerando un orizzonte temporale infinito del gioco, allo scopo di determinare la strategia ottimale,
gli agenti valutano in ogni periodo l’esito del gioco e confrontano le varie strategie disponibili in base
all’utilità che ciascuna di esse fornisce (secondo un processo di trial and error). Se una strategia fornisce
un’utilità superiore alla media, nel periodo successivo un maggior numero di agenti la utilizzerà; e
viceversa. I soggetti cercano di individuare – e quindi di selezionare – la strategia che prevarrà nel lungo
periodo (e che quindi gode di un survival value). L’analisi si concentra dunque sugli aspetti dinamici di
tale processo e sull’equilibrio di lungo periodo.
Riguardo alle preferenze, se nel paradigma neoclassico sono assunte esogene, nella realtà esse
tendono a differire tra soggetti e a riflettere motivazioni diverse: in questa nozione più ampia – oggetto
della vasta letteratura dedicata alla psicologia delle preferenze – alcune motivazioni assumono la forma
di vincoli comportamentali: l’imperativo kantiano, l’esigenza di guadagnare e tutelare una buona
reputazione o di non tradire la fiducia altrui, ecc. E’ un punto ormai consolidato nella teoria economica
che tali comportamenti - altruistici o, quanto meno, cooperativi, o risultanti da “codici d’onore” - non
possono giudicarsi irrazionali solo perché discordanti dallo stretto paradigma della razionalità
strumentale. Max Weber distingueva una razionalità dei valori da quella dei mezzi. I filosofi morali si
occupano soprattutto della prima: l’imperativo categorico vi rientra. La TdG si occupa essenzialmente
della razionalità dei mezzi - cioè dei metodi per produrre decisioni (da qui la rilevanza della recente
nozione di razionalità ecologica di Vernon Smith, premio Nobel per l’economia nel 2002) - sebbene
essa debba entrare inevitabilmente anche nel merito della razionalità degli obiettivi allorquando
l’ampliamento del sistema dei valori degli agenti li conduce a scelte che cambiano radicalmente il
risultato di un gioco.
Non è da trascurare neppure l’importanza nei processi decisionali delle emozioni proprie e di
quelle dell’avversario, e la convenienza a scandagliare le seconde per proteggere le vulnerabilità proprie
e per sfruttare quelle dell’altro. In qualsiasi negoziato, la valutazione di tali aspetti psicologici ed emotivi
è cruciale per il successo.
C’è da notare che, ancor più della teoria economica, la TdG (soprattutto nei suoi sviluppi più
recenti) incorpora questa dimensione del soggettivo - con le sue componenti psicologiche, emotive ed
etiche -, il probabilistico e l’incerto, tenendo conto che, come già aveva affermato Aristotele, il
La coesistenza di diversi sistemi di preferenze/entità (selves) all’interno di uno stesso soggetto trova interpretazione sia in un
contesto statico che dinamico della struttura del soggetto: nel primo, tale pluralità può essere spiegata dalle diverse
componenti che operano e interagiscono all’interno del soggetto, secondo propri bisogni, motivazioni, obiettivi tra loro non
necessariamente compatibili: tipicamente la razionalità, la parte istintuale, la componente emotiva. In una prospettiva
dinamica, la pluralità è vista come l’evoluzione intertemporale delle preferenze soggettive; in tale ipotesi, a ogni sistema
contingente di preferenze corrisponde una diversa entità e quindi, in ultima analisi, un soggetto diverso. Già Strotz (1955)
aveva osservato che, se le preferenze variano nel tempo, un programma che è ottimale al tempo t, non lo sarà
necessariamente al tempo t+1. Per un’analisi più recente, richiamiamo il noto lavoro di Elster (1979), Ulysses and the Sirens.
Nel caso di Ulisse, egli ha utilizzato la propria razionalità per prendere le distanze da sé – e, in particolare, da quel sé che lo
avrebbe attratto verso le Sirene – mediante un severo sistema di auto-costrizione della sua discrezionalità. Anticipando
l’evoluzione delle sue preferenze all’approssimarsi delle Sirene – e quindi il conflitto di obiettivi di breve e lungo periodo
(fermarsi/tornare a casa) – la razionalità di lungo periodo ha prevalso, giustificando il sistema di vincoli auto-imposti.
Pertanto, l’autoregolamentazione e la riduzione volontaria del libero arbitrio possono trovare piena legittimazione anche
sulla base dell’assunto di razionalità di lungo periodo dell’agente economico; in chiave evoluzionistica, con la sua
sopravvivenza; in chiave strategica, con la costruzione della propria reputazione.
Proprio sotto quest’ultimo profilo, grazie alle valenze di lungo periodo dell’auto-imposizione di regole/vincoli, è interesse
della classe politica al governo, il cui obiettivo è ovviamente essere rieletta, investire in politiche aventi ritorni reputazionali, e
quindi in primo luogo credibili. Nel caso concreto, ciò può avvenire attraverso la riduzione della discrezionalità degli
interventi di politica economica, deferita a certi meccanismi (come gli stabilizzatori automatici, la regola monetaria di
Friedman, ecc.) o ad altri organismi, cioè a una terza parte che abbia il potere di punire in caso di violazione dell’impegno a
perseguire la politica temporalmente incoerente.
4
3
comportamento umano è determinato dalla combinazione di fattori razionali (calcolo costi-benefici,
ecc.), a-razionali (cultura, principi, valori, ecc.) e irrazionali (emozioni). L’importanza delle emozioni nei
processi decisionali - e finanche la loro razionalità - vengono rilevate nelle impostazioni più moderne in
tutte le discipline dove al centro c’è l’uomo.
In senso strategico, la razionalità delle emozioni – sottese ad esempio nell’arrossire come metodo di
convogliare informazioni su di sé (sul proprio “tipo”) all’avversario – è stata già suggerita da Frank
(1987): dunque anche le emozioni possono essere incluse nell’ampio armamentario a disposizione
dell’ottimizzazione secondo il paradigma neoclassico della razionalità strumentale. In tutt’altra
prospettiva, Damasio (2004) descrive numerosi esperimenti volti ad analizzare la relazione fra una
particolare categoria di emozioni (che egli chiama marcatori somatici)5 e pensiero razionale: senza le
prime, il secondo non è in grado di condurre il soggetto alla situazione per lui più vantaggiosa. In tale
ottica, gli aspetti emozionali canalizzati nel processo decisionale non sono da considerare
un’interferenza fuorviante nelle scelte, originata dall’intreccio fra razionalità limitata, informazione
imperfetta, avversione al rischio e pervasività dell’incertezza. Piuttosto, la sfera emotiva, nella sua
funzione di linea-guida nelle decisioni, è un indispensabile complemento della razionalità: “una
riduzione dell’emozione può costituire una fonte ugualmente significativa di comportamento
irrazionale”, osserva Damasio.
Vincoli inter-soggettivi: ciascuno, non essendo un’isola/monade – come suppone l’economia
classica, che affida alla mano invisibile il compito di coordinare nel mercato le azioni di agenti atomistici
-, è consapevole di interagire con gli altri nella platea economica, sociale, politica, ecc., e di produrre
quindi un impatto sugli altri (e viceversa), di cui dover tenere conto nelle scelte per l’ottimizzazione.
Il contesto sociale influisce quindi sulla razionalità delle scelte, sulla massimizzazione dei
benefici/minimizzazione di costi e rischi. Più in generale, ai fini del risultato dell’interazione strategica, il
“contesto” – cioè il modo in cui viene percepito l’ambiente esterno - non è “neutrale”6. Come si osserva
in una più ampia prospettiva evoluzionistica, “Human evolution can be viewed in terms of the species increasing
ability to function effectively within a social context.” (Singer et al., 2004, p. 653).
Nei processi decisionali complessi in condizioni di incertezza, la formulazione di un contesto
(frame) – ossia del set all’interno del quale il processo si sviluppa – influisce sul modo di processare le
informazioni, sulle preferenze e, quindi, sulle scelte e sull’esito del gioco (Tversky – Kahneman, 1986).
Quando l’incertezza è pervasiva, un’ampia evidenza empirica mostra che il modo in cui gli individui
rispondono ad un problema può dipendere esclusivamente dal modo in cui esso viene illustrato. In altri
termini, il framing effect tende a determinare suggestioni, apparenti asimmetrie, una sorta d’illusione ottica
che ovviamente non sono neutral1 sul risultato. In laboratorio, ciò dipende da come viene costruito
l’esperimento: un modo con cui verificare l’“effetto contesto” è sottoporre ad un gruppo di persone un
certo problema di scelta e di darne la descrizione (frame) in due modi diversi; ognuno sarà certamente in
grado di comprendere che le due descrizioni sono logicamente equivalenti. Ma se allo stesso gruppo
viene presentata separatamente ciascuna descrizione del problema e si lascia intercorrere un certo
periodo di tempo tra una descrizione e l’altra - in modo che ne sfugga l’equivalenza logica - esso tenderà
a dare risposte differenti in funzione della descrizione7. In laboratorio, il contesto può essere modellato
anche attraverso il modo di dare le istruzioni del gioco ai partecipanti; può variare pure in funzione del
grado di astrazione della interazione poiché, ad esempio, in un ultimatum game8 fa la differenza
Somatici perché riguardano i vissuti corporei, a livello viscerale e non; il termine marcatore deriva dall'idea che il particolare
stato corporeo richiamato costituisce una sorta di “contrassegno” o “etichetta”.
6 Tale aspetto veniva già rilevato da Hayek (1952).
7 Classico è l’esperimento condotto da Tversky e Kahneman (1986) - la cd. Asean desease – in cui i partecipanti si
confrontavano con due versioni – dalla medesima equivalenza logica - di un problema di scelta in condizioni di incertezza.
La versione del problema finalizzata ad elicitare preferenze di avversione al rischio è stata quella scartata dalla maggior parte
degli interpellati.
Analogo risultato è stato ottenuto nell’esperimento condotto da McNeill et al. (1982), in cui la scelta del trattamento
terapeutico (chemioterapia o intervento chirurgico) dipendeva, nelle risposte degli interpellati, dalla descrizione del
programma, e cioè a seconda che essi fossero condotti a pensare in termini di probabilità di morte ovvero di sopravvivenza
dei pazienti.
8 Nella loro versione più semplice valgono le ipotesi di razionalità ed egoismo da parte dei giocatori. Secondo il primo
assunto, ciascun individuo ottimizza - si suppone che massimizzi una funzione di utilità monetaria - consapevole
5
4
confrontarsi come partner con un computer o con un altro individuo. Rileva quindi il meccanismo che
attribuisce un diverso grado di “personalizzazione” all’attuazione degli scambi, così come rileva la
connessione o la distanza sociale percepita dai due avversari (Forsythe et al., 1994), vale a dire la loro
“relazione posizionale”.
Dal laboratorio al mondo reale il passo può esser breve. Spesso le tecniche del soft power sono
finalizzate a “modellare” le percezioni verso direzioni volute. La comunicazione è un candidato
naturale: è un settore in rapidissima espansione, non solo nei tradizionali campi della propaganda e
contropropaganda, dell’informazione e della disinformazione, ma anche in quello più complesso della
manipolazione simbolica, cioè della modifica dei sistemi di lettura e della griglia di valori dell’opinione
pubblica. Per motivi di mercato, le nuove tecnologie audiovisive dei media mirano a soddisfare – più
che la domanda di informazione – la richiesta di effetti. Domanda ed offerta di spettacolarizzazione e di
emozioni “sintetiche” ben si combinano in tempi di guerra: i razionali rapporti scritti dai corrispondenti
di guerra d’un tempo, che collocavano ogni atto nel suo contesto generale, appartengono alle tradizioni
culturali del passato. Oggi il colpo di “zoom” crea un framing effect volto a ricostruzioni ad hoc del teatro
di operazioni, a letture guidate degli avvenimenti, ad interpretazioni mirate di obiettivi e strategie. Altro
esempio emblematico della produzione mediatica di framing effects è dato da al-Qaeda, che attraverso le
tecnologie dell’informazione – e del soft power – persegue le proprie strategie e obiettivi politici: la
leadership del terrorismo transnazionale di matrice islamica le sfrutta per i comunicati alle reti, ai popoli
dell’umma, ai suoi nemici “ebrei, crociati ed apostati”.
Una distinzione implicita nell’analisi degli effetti di contesto è tra: (i) come il mondo viene presentato;
(ii) come esso viene percepito. Infatti, “gli effetti di contesto possono dipendere dall’esperienza
autobiografica” (Vernon L. Smith, 2002, p. 179), cioè da fattori culturali, valoriali ed etici, religiosi,
storici, ecc. Da questa seconda prospettiva, una propria percezione del mondo esterno non dipende
necessariamente da un particolare modo in cui esso viene costruito: la differenza che qui si vuole
cogliere – estremizzandola - è tra manipolazione (appunto il framing effect tradizionale) e
automanipolazione; tra inganno e autoinganno.
dell’interdipendenza strategica che lo lega all’altro (ottimizzazione vincolata); dal secondo assunto discende che gli argomenti
contenuti nelle rispettive funzioni di utilità riguardino il loro stretto benessere e non anche quello dell’altro. In altri termini,
non ci sono esternalità reciproche derivanti da preferenze altruistiche. Ne consegue che ciascun giocatore si interessi solo del
proprio payoff mentre quello dell’altro lo riguarda esclusivamente nella misura in cui influisce sul proprio, data tale
interdipendenza. Pertanto, l’ultimatum game in questa sua versione più semplice è un gioco non cooperativo. Questa
condizione è oggetto di conoscenza comune per i due giocatori.
I due giocatori (che chiamiamo Proponente e Ricevente, indicati rispettivamente con P ed R) devono dividersi una somma
di denaro, la “torta”. Nella versione one-shot game, P ne propone la ripartizione, R deve limitarsi ad accettare l’offerta o a
rifiutarla ponendo in ogni caso fine al gioco; in altri termini, non può lanciare una controproposta. Nel caso rifiuti, entrambi
i giocatori non ricevono nulla; diversamente, la somma risulterà divisa secondo la scelta operata da P.
Una vasta letteratura – si veda, ad esempio, Rubinstein (1982) - dimostra come, in giochi non ripetuti, per agenti razionali
con funzioni di utilità di questo tipo esista un unico equilibrio di Nash, secondo cui R accetta ed ottiene una minima
quantità di denaro (la minima unità di conto), dato che questa è pur sempre preferibile a niente. Il Proponente applica,
infatti, l’induzione a ritroso al problema decisionale affrontato dal Ricevente e, così ragionando, giunge alla conclusione che
qualsiasi guadagno è pur sempre meglio di zero dal punto di vista del Ricevente. Tale risultato sottende un’interazione “priva
di emozioni”, in cui cioè P non prova alcun senso di colpa e/o pudore nel fare un’offerta à la Nash ed R nessun senso di
indignazione e/o invidia di fronte tale sperequata proposta.
L’economia sperimentale, tuttavia, accumula evidenze che la funzione di utilità è più articolata di quella corrispondente al
paradigma neoclassico e che essa contiene anche argomenti non monetari collegati, nella specie, ad un senso di equità
(fairness). Nel mondo reale, gli individui non reagiscano solo in base a criteri di razionalità così strettamente definiti nell’homo
economicus, bensì sulla base di un trade-off tra il proprio consumo e un senso generale di giustizia. In presenza di preferenze
con avversione all’iniquità, essi possono decidere di “punire” la controparte – rinunciando di conseguenza alla propria quota
- qualora questi non faccia delle proposte sufficientemente corrette. Un’analoga esigenza di giustizia tende a motivare le
scelta del Proponente, pur beneficiando di un vantaggio strategico rispetto all’altro: l’evidenza in laboratorio illustra che il
giocatore nel ruolo di Proponente si limita a chiedere per sé solo il 50-60% della “torta”. Pertanto, per formulare
correttamente il comportamento dei due giocatori, occorre considerare una funzione di utilità uniperiodale che non includa
come unica variabile esplicativa il denaro (M), ma anche l’esigenza di equità (F) che nell’allocazione proposta deve trovare
una risposta soddisfacente.
E = E (M, F)
5
I soggetti - soprattutto in condizioni d’incertezza o in contesti decisionali complessi, rischiosi
e/o in evoluzione - commettono errori di valutazione; esprimono tratti comportamentali per loro stessi
fuorvianti, come una “superfiducia”; procedono per tentativi; utilizzano euristiche (rules of thumb ).
Esattamente come in natura l’evoluzione e l’adattamento avvengono non secondo un processo lineare,
ma attraverso la discontinuità di un incessante groping, trial and error. Così, la percezione del rischio non
deriva esclusivamente da fattori oggettivi, ma dalla combinazione fra il dato oggettivo e gli elementi
soggettivi. Essa crea una determinata “relazione posizionale” fra il soggetto e il fattore esterno.
Si configura così un “crocevia” tra le varie classi di vincoli sopra indicate, dove esse si
sovrappongono senza una precisa soluzione di continuità. Un esempio evidente di tale simultaneità
proviene dall’attuale pericolo di terrorismo. La percezione di vulnerabilità da parte dell’opinione
pubblica è infatti molto maggiore di fronte ad un evento altamente improbabile ma catastrofico,
rispetto all’incidente ad elevata frequenza (ogni anno, sulle strade statunitensi, muoiono mediamente
40.000 persone, a fronte delle 3.000 vittime dell’11/9. Cfr. Sandler, 2003; Sandler-Enders, 2004).
Un’indagine di opinioni condotta sulla popolazione italiana documenta che il rischio maggiormente
temuto oggi è l’attacco terroristico. Il terrorismo transnazionale preoccupa in quanto minaccia affatto
inedita che ne rende difficile la comprensione basata sui tradizionali schemi di riferimento già esperiti
dal Paese durante i periodi più oscuri di eversione del terrorismo ideologico.9 Secondo le linee
interpretative degli autori della ricerca, l’idea dell’incombenza di un pericolo viene socialmente costruito
secondo un processo complesso dove – paradossalmente – le stesse misure di contrasto e prevenzione
vengono percepite e utilizzate come indicatori di magnitudo della minaccia. La pervasività
dell’incertezza, in altri termini, tende a distorcere l’assegnazione da parte dei soggetti della distribuzione
di probabilità associata all’evento terroristico, persino in presenza di una riduzione oggettiva del rischio
derivante dalle azioni di contrasto.
Anche la fear economy trova terreno di cultura in questa interazione (sintetizzabile nel clima di
fiducia degli operatori) fra condizioni di incertezza dell’ambiente, meccanismi mentali ed aspettative.
Che il filtro della percezione soggettiva interpreti anche i vincoli che condizionano il soggetto
dall’esterno (prima e terza categoria sopra indicate) riceve un’ampia conferma: da quella più consolidata
– come l’illusione monetaria, l’effetto ricchezza, l’illusione fiscale di Puviani – a quella relativamente più
recente, ma altrettanto nota, fornita dall’economia dell’incertezza - dall’effetto dotazione (Thaler, 1980)
alla contabilizzazione mentale (Tvesky-Kahneman, 1981), distorsione da status quo (SamuelsonZeckauser, 1988), ecc.
2. L’APPARATO CONCETTUALE DELLE TEORIA DEI GIOCHI: ALCUNI ASPETTI ESSENZIALI
Gli elementi costitutivi di un gioco sono sintetizzabili nel set delle regole – generalmente assunte
come common knowledge - con cui vengono specificati l’insieme di partecipanti (giocatori-avversari); la
loro struttura delle preferenze (“tipo” di giocatore); la lista di strategie disponibili a ciascuno; i possibili
payoff (tipicamente espressi in termini di utilità o di valori monetari).
Secondo la natura delle interazioni fra i partecipanti, la classificazione di base è tra giochi non
cooperativi - di cui la TdG prevalentemente si occupa - e giochi cooperativi10. Fra i primi, un’ulteriore
classificazione si fonda sull’ammontare e sulla distribuzione tra gli avversari dei payoffs: a) giochi a
Cfr. Zaretti (2004).
primi sintetizzano dinamiche per cui ciascun soggetto persegue il proprio interesse senza considerare guadagni/perdite
altrui. Nei secondi, i soggetti si coalizzano assumendo reciproci impegni; la questione centrale non è più cercare di anticipare
la mossa dell’altro, bensì come ripartirsi il surplus derivante dalla cooperazione.
9
10I
6
somma variabile (come il DP); b) a somma costante11. Sotto il profilo informativo, si distinguono i
giochi ad informazione (im)perfetta e ad informazione (in)completa12.
Il contesto informativo può essere parzialmente dedotto anche dalla rappresentazione del gioco,
nella forma strategica (o normale) - costituita da una matrice (dei payoffs o delle vincite) - ovvero in
quella estesa. La seconda – tramite l’“albero del gioco” - mette in risalto sia le informazioni di cui i
giocatori dispongono al momento di muovere, sia la sequenza (temporale o logica) delle loro mosse.
L’esito del gioco coincide con l’equilibrio quando ciascuno adotta la strategia migliore, quella
selezionata sulla base della scelta razionale. Ma poiché l’ottimizzazione di ciascuno sottende
l’interdipendenza che si instaura, la scelta migliore per ognuno coincide con la “risposta migliore” (“best
reply”) all’altro. Nel caso di informazione imperfetta - il giocatore non conosce la mossa dell’altro -, la
sua decisione migliore viene formulata sulla base dell’aspettativa che anche l’avversario scelga la
strategia migliore. Ciò conduce ad una nozione fondamentale della TdG…..
2. 1 … L’EQUILIBRIO DI NASH
Due avversari - A e B - che giocano senza conoscere la mossa dell’altro combinano una coppia
di strategie che è un equilibrio di Nash (EN) quando la scelta del giocatore A è ottima, data la scelta di
B, e la scelta di B è ottima, data la scelta di A13. Se i soggetti “giocano al buio” - non comunicano, né
usano altro tipo di coordinamento – e giocano simultaneamente, l’equilibrio si realizza attraverso le
aspettative reciproche: sebbene nessuno dei due – quando decide la propria strategia – sappia quello che
farà l’altro, entrambi formulano una qualche aspettativa a proposito della scelta dell’avversario ovvero,
equivalentemente, riguardo alla sua razionalità. Ciascun giocatore si attende, infatti, che l’avversario
sceglierà la strategia migliore/razionale: anche attraverso il “velo” dell’informazione imperfetta, i
giocatori sono capaci di pensare e vedere le mosse degli avversari. Pertanto, l’EN può essere
interpretato come una coppia di aspettative circa la strategia/razionalità dell’altro: esso è quindi
Nei primi, l’ammontare complessivo del payoff varia in corrispondenza di ciascun esito del gioco; negli altri indipendentemente dal mix di strategie selezionate - la somma algebrica dei payoffs complessivi a disposizione degli agenti
rimane invariata, mentre ne muta l’allocazione fra giocatori in funzione dell’esito del gioco. Tale gioco non soltanto è non
cooperativo, ma è anche fortemente conflittuale poiché ciò che guadagna uno è esattamente pari a ciò che perde l’altro
(secondo la logica “mors tua, vita mea”).
12 In un contesto ad informazione perfetta il giocatore, in ogni istante del gioco, è interamente a conoscenza dell’intera
sequenza di mosse effettuate dagli altri, cioè d ella storia del gioco. I partecipanti, se scelgono simultaneamente, se non
comunicano e se non hanno assunto accordi reciproci ex ante, non conoscono come sta procedendo il gioco, che è quindi ad
informazione imperfetta. Nell’ipotesi di informazione completa, gli agenti conoscono le regole del gioco (la sua struttura),
cioè il numero e l’identità dei giocatori, le strategie a disposizione di ciascuno e i payoff. In tutti i contributi più recenti, il
concetto di informazione (in)completa è stato rivisto, introducendo la “Natura”, un giocatore speciale che può influenzare i
risultati degli altri, ma non viceversa. In tale prospettiva, un gioco è ad informazione completa quando la Natura non gioca
per prima, ovvero la sua mossa è osservata da tutti.
13 Con la strategia dominante ogni giocatore dispone di una scelta ottima, quale che sia la mossa dell’altro. Vale a dire, se
in un gioco vi è una strategia dominante per ciascun giocatore, questa è sempre la strategia migliore, indipendentemente dalla
scelta altrui. L’adozione da parte di ciascuno della propria strategia dominante – con lo scato di quelle strettamente o
debolmente dominate - portano alla soluzione di “equilibrio con strategie dominanti”. Nella matrice riportata, per
qualunque scelta di B, A otterrà sempre il payoff più alto (2) giocando “Basso”, e quindi la sua scelta sarà sempre questa.
E per qualunque scelta di A, B otterrà sempre il payoff più alto (1) giocando “Sinistra”.
11
Sinistra
Giocatore B
Destra
Alto
1, 2
0, 1
Basso
2, 1
1, 0
Giocatore A
Gli equilibri con strategia dominante sono assai graditi - in quanto semplificano la vita - ma non frequenti: è raro
confrontarsi con una scelta che sia la migliore a prescindere da tutto il resto. Essendo un’ipotesi forte, è anche irrealistica.
Proprio per questo la TdG si occupa molto poco – quale caso speciale – di questo tipo di equilibri.
7
predicibile. Un modo alternativo per definirlo è che, una volta conosciuta la decisione dell’avversario,
nessuno dei due giocatori desidera cambiare la propria scelta nella fase post-decisionale: l’equilibrio di
Nash è anche stabile14.
Le principali questioni connesse all’EN sono che : a) esso non è Pareto-efficiente (esempio, il
DP); b) può esserci più di un equilibrio (ad esempio, giochi di tipo “Chicken” e la “Battaglia dei Sessi”);
c) l’equilibrio può non esistere affatto (il gioco dà luogo a preferenze cicliche)15; d) può non essere
verosimile (ad esempio nel gioco del Centipede); e) l’esito cambia a seconda che si tratti di: i) one-shot
games ovvero ii) repeated games (con un numero finito o indefinito/sconosciuto di tornate).
3. GIOCHI STRATEGICI CELEBRI
Ci si limita a richiamarne tre:
3.1 IL “DILEMMA DEL PRIGIONIERO”
14
Nella matrice precedente, si ipotizzi che i due giocatori non comunichino e che giochino simultaneamente.
Giocatore B
Sinistra
Destra
Alto
6, 6
10, 3
Basso
5, 7
4, 8
Giocatore A
Guardando il gioco dalla prospettiva di B, egli si rende conto che se il giocatore A: 1) decide per la strategia “Alto”, a lui
converrà giocare “Sinistra”; 2) decide per la strategia “Basso”, a lui converrà “Destra”. La scelta di ciascuno dipende dunque
da quella dell’altro. Il passo successivo è domandarsi quale sia la scelta ottima per entrambi. “Alto/Sinistra”, corrispondente
al payoff (6, 6), che è infatti un equilibrio di Nash. Infatti, il giocatore B capisce che ad A conviene optare per la strategia
“Alto”: se B giocasse “Sinistra”, ad A converrebbe “Alto”; così pure, se B giocasse “Destra”, all’altro converrebbe “Alto”.
Attesa/data la scelta di A – “Alto” – la mossa migliore per B è “Sinistra” e attesa/data la scelta di B – “Sinistra” – la migliore
strategia per A è giocare “Alto”. L’esito (6, 6) soddisfa pertanto la definizione di equilibrio di Nash.
Per una contro-prova, si consideri l’esito (4, 8). Esso non è un equilibrio di Nash poiché, alla fine del gioco, quando diventa
nota la scelta di entrambi, c’è un rimpianto post-decisionale: A se avesse saputo che B avrebbe giocato “Destra”, avrebbe
scelto “Alto”; ma, in tal caso, anche B non avrebbe confermato la scelta precedente, bensì preferito “Sinistra”. Quindi, c’è la
tendenza da parte di entrambi a muoversi verso un'altra configurazione del gioco. Solo in corrispondenza dell’esito (6, 6),
ognuno confermerebbe la propria scelta anche ex post.
15
Un gioco in cui non esiste o non è verosimile l’equilibrio di Nash può essere risolto utilizzando le strategie miste. Un giocatore utilizza
una strategia pura se le sue azioni sono dettate da un principio unico, tale che, in situazioni identiche, da quel principio segue sempre la
stessa azione. Ciascun giocatore, scelta la propria strategia, vi si attiene rigidamente una volta per tutte. L’imperativo kantiano può essere
considerato una strategia pura. Nella strategia mista, il giocatore assegna una distribuzione di probabilità alle strategie pure. L’equilibrio di
Nash con strategie stocastiche si riferisce alla soluzione in cui ciascun giocatore sceglie la “frequenza ottima” per le proprie strategie, date le
frequenze – ottime - scelte dall’altro. Il giocatore A per esempio potrebbe scegliere di giocare per il 50% Basso, e B potrebbe fare la stessa
cosa per Sinistra e Destra. Considerando la matrice dei payoff che segue:
Sinistra
Giocatore B
Destra
Alto
0, 0
0, -1
Basso
1, 0
-1, 3
Giocatore A
i giocatori avranno una probabilità di ¼ di collocarsi in ciascuna delle quattro caselle della matrice payoff. Quindi il payoff
medio di A sarà 0 e quello di B ½. Nella matrice, l’equilibrio di Nash, benché non esista nelle strategie pure, esiste in quelle
miste (se A gioca Alto con probabilità ¾ e Basso con probabilità ¼, mentre B gioca Sinistra con probabilità ½ e Destra le
altre volte, si ottiene un equilibrio di Nash.
A prima vista, può apparire bizzarro che un soggetto abdichi al proprio potere di scelta per affidarsi al caso. Ma si è già
accennato che può essere perfettamente compatibile con l’assioma di razionalità ottimizzante il fatto che egli operi un’autorestrizione delle proprie scelte.
8
Esso è senz’altro il più noto e ricorrente nella vita di tutti. E’ stato definito l’“osso di gomma”
della TdG; lo si può “masticare” all’infinito: matematici, economisti, politologi, psicologi, filosofi lo
hanno esaminato e tuttavia rimane misterioso ed affascinante (Méro, 1996). Il suo nome è dovuto ad
Albert Tucker, che nel 1951 lo illustrò appunto come detective story. La situazione è nota. La polizia
arresta due complici che hanno effettuato una rapina, ma non vi sono prove sufficienti per incriminarli.
La polizia può solo condannarli per un reato minore (es. detenzione d’armi da fuoco); ovvero, può
ricorrere a un’adeguata strutturazione del sistema di incentivi e punizioni che solleciti una loro
confessione - “incastrandosi” così a vicenda - quando verranno interrogati in celle separate. Secondo
tale struttura – molto simile a quella che si utilizza nei confronti di potenziali “pentiti” - la polizia
propone a ciascun criminale che, denunciando il proprio compagno, lasceranno immediatamente libero
lui e condanneranno l’altro a 10 anni di reclusione. Tale offerta è tuttavia valida solo nel caso che l’altro
non confessi (non collaborando a fare chiarezza sul caso): se anche questi confessasse, ognuno rimarrà
in carcere per 5 anni. Naturalmente – la polizia avverte - se nessuno confessa, non saranno condannati
se non per la pena minore di detenzione d’armi (1 anno di reclusione). La polizia informa pure ciascuno
di loro che la medesima offerta è stata fatta anche all’altro (la struttura dei payoffs è common knowledge)16.
Attraverso tale meccanismo - che mette a nudo il conflitto di interessi fra i due giocatori - la polizia
riesce a ottenere che ciascuno persegua il comportamento razionale: confessare/non cooperare, cioè
tradire l’altro17. Ed ecco quindi la grande contraddizione del Dilemma: la defezione, razionale a livello
individuale, non porta alla migliore delle soluzioni disponibili, mentre la decisione
“solidale”/“cooperativa” diventa irrazionale per chi la compie, perché penalizzante – a meno che non
sia garantita da una risposta reciproca. Il “paradosso della cooperazione” trova spiegazione razionale nel
DP: quanto più gli altri cooperano, tanto più è vantaggioso non cooperare (free-riding). Per inciso, il DP è
concettualmente analogo al “dilemma della sicurezza”, la cui logica illustra le meccaniche interne della
corsa agli armamenti, nelle classiche forme conosciute nei secoli XIX e XX.
In sintesi: a) la scelta cooperativa sarebbe la migliore (Pareto-efficiente); b) la cooperazione
unilaterale è però molto rischiosa; c) poiché maggiore è l’attitudine di un giocatore a cooperare,
maggiore è la convenienza/l’incentivo dell’avversario a non farlo (free-riding).
Situazioni di intrappolamento in un DP si riscontrano in un gran numero di esperienze sociali,
politiche e strategiche. Da qui il conseguente problema di introdurre meccanismi che inducano a
cooperare in modo da ottenere un risultato socialmente migliore.
A livello di intera società, l’esigenza di creare sistemi che inducano alla cooperazione si
concretizza in strutture ad hoc o in istituzioni che garantiscano la reciprocità delle aspettative di fiducia e
il loro adempimento. Situazioni dilemmatiche che mettono in luce l’esigenza di fiducia e affidabilità nei
comportamenti richiedono “costruzioni istituzionali” per indurre ad adottare scelte cooperative.
L’implicazione istituzionalista della TdG è applicata alla realtà socio-politica, alla competizione
economica e al settore militare.
Tale razionalità può essere il frutto di accordi impliciti o espliciti (come quelli che prevalevano
fra il Cremlino e la Casa Bianca nella Guerra Fredda ed esemplificati dalla “linea rossa” costruita fra le
Sotto il profilo informativo, il DP è quindi un gioco a informazione imperfetta e completa.
Nella matrice che segue, i payoffs sono in termini di anni di carcere (preceduti dal segno negativo ad indicare la
disutilità):
16
17
Giocatore B
Giocatore A
Confessare
Non Conf.
Confessare
-5, -5
0, -10
Non Conf.
-10, 0
-1, -1
Poiché tale strategia è adottata da entrambi - ipotizzando entrambi razionali - la soluzione di equilibrio del DP (equilibrio di
Nash) sottende la defezione da parte dei due giocatori. In tal modo, essi ottengono una soluzione congiunta (-5, -5) molto
meno conveniente di quella a cui sarebbero approdati se si fossero aiutati a vicenda (“non confessando”): entrambi, infatti,
sarebbero stati prosciolti dal reato di rapina, rimanendo in carcere solo 1 anno per detenzione d’armi (-1, -1). Tale esito,
Pareto-efficiente, conseguibile esclusivamente attraverso la cooperazione reciproca.
9
due potenze dopo la crisi dei missili di Cuba nel 1963). Essi rendono prevedibile il comportamento
avversario e, mediante la comunicazione diretta, riducono la possibilità di errori di interpretazione e di
“disturbi” che rendono poco trasparenti le decisioni contrapposte. Tale razionalità può essere
ulteriormente garantita dall’esistenza di un terzo che funga da arbitro, oppure dalla presenza di
istituzioni internazionali (ONU, WTO, ecc.) che creino un incentivo a cooperare e definiscano le regole
per la cooperazione.
Come si è osservato, la presenza di valori di natura etico-morali nelle preferenze dei giocatori
può modificare la predizione generale circa l’esito del DP. Al riguardo si richiamano due direzioni di
approfondimento, in parte connesse fra loro. Il primo è l’esistenza di vincoli “morali”: se nella struttura
delle preferenze dell’individuo sono inclusi anche dei (taciti e/o endogeni) vincoli morali/codici
d’onore, secondo cui “confessare”/“tradire” è moralmente riprovevole, il risultato che emerge è di
natura cooperativa, Pareto-efficiente. Ovvero, si può ipotizzare la presenza di accordi ex ante (“pre-play
communication”): l’esito del gioco rispetto alla predizione generale cambia a seconda che vi siano stati fra i
complici degli accordi sul comportamento da assumere nei confronti della polizia in caso di cattura
(naturalmente, “negare” di aver compiuto il reato di rapina). Il passo successivo è considerare il grado di
cogenza di tali accordi: (i) se l’accordo è ritenuto vincolante - in base alla parola data o ad una minaccia
credibile (“Nash threat”) - allora ognuno sceglierà la strategia di non tradire, raggiungendo un esito del
gioco Pareto-efficiente; (ii) se al momento di “salvare la pelle”, i giocatori non mantengono l’impegno
assunto – l’accordo non era che un “cheap talk” -, il gioco conduce al tradizionale EN.
3.2 IL “CHICKEN GAME ”
Il “gioco del pollo” è stato introdotto da P. M. Blackett (autore di uno dei primi studi sulle
conseguenze politiche dell'arma atomica e premio Nobel per la Fisica nel 1948), che lo ha descritto in
occasione della 2^ guerra mondiale e della deterrenza nucleare. Esso si traduce in una prova di forza,
cioè in un braccio di ferro con un’escalation. E’ pertanto particolarmente adatto a spiegare situazioni di
natura militare e di sicurezza. Nel vulgata la descrizione dell’interazione fra i giocatori si ispira al film
“Gioventù bruciata” (1955). Lo scenario è quello di due ragazzi che si sfidano guidando automobili
lanciate una contro l’altra a gran velocità in una strada di periferia, sotto gli occhi di un pubblico di fans.
Colui che per primo sterza dalla traiettoria rettilinea per evitare lo scontro frontale è il “codardo” (il
“pollo”). Vincerà quello che non deflette dalla decisione di andar dritto anche a costo della collisione,
sperando naturalmente che l’avversario sterzi. Per indurre quest’ultimo a farlo tramite l’intimidazione,
egli dovrà mostrarsi irreversibilmente obbligato a non sterzare, ad esempio bloccando lo sterzo:
togliendosi ogni altra scelta, realizza la deterrenza. Ciò è il tradizionale “bruciarsi i ponti alle spalle”18.
L’altro guidatore/giocatore che, spaventato da tale risolutezza, sterzerà per primo per evitare un
frontale, sarà il perdente, additato a disprezzo del gruppo. Se entrambi, impauriti, sterzano, il gioco
finisce pari (1, 1).
Bruno
Andrea
Dritto
Sterza
Dritto
-3, -3
2, 0
Sterza
0, 2
1, 1
La strategia del “bruciarsi i ponti alle spalle”, seguita ad esempio dai kamikaze, è vecchia quanto il Nuovo Mondo. Si narra
infatti che i Conquistadores, appena toccata terra, avessero bruciato le proprie navi con il duplice intento di automotivarsi nel
combattimento per la sopravvivenza contro gli indigeni e, quindi, di effettuare un signalling intimidatorio contro questi ultimi.
18
10
Ma non si può escludere la soluzione più rovinosa, cioè che lo scontro ci sia (-3, -3): esso non
sarebbe necessariamente frutto di irrazionalità, ma probabilmente di un calcolo soggettivo che ha messo
al primo posto la “reputazione” presso il pubblico.
In questo gioco, esistono due equilibri di Nash: (0, 2) e (2, 0), e non si può predire quale dei due
prevarrà. Dipende dal “potere contrattuale” dei due. L’unica possibilità per la cooperazione bilaterale (1,
1) si realizza – mediante un bluff - se ognuna delle parti segnala chiaramente all’altra che la cooperazione
da parte propria è fuori questione. Il giocatore che non sa assumersi il rischio del risultato peggiore è
certamente perdente in giochi di questo tipo.
“Reputazione”, “minaccia”, “deterrenza” sono concetti fondamentali nella TdG, come lo
furono per la deterrenza nucleare reciproca fra i due blocchi nel corso della guerra fredda.
Apparentemente banale, questo gioco è molto frequente nella vita reale - dal campo economico
a quello militare e della sicurezza - per interpretare sia “situazioni complesse” sia giochi con “attori
complessi”. Ad esempio, il chicken game viene spesso utilizzato per descrivere i vantaggi della
cooperazione nei contesti di negoziazione internazionale in campo commerciale: il fallimento della V
Conferenza Ministeriale del WTO a Cancun (settembre 2003) è interpretabile con la circostanza che
nessuna delle due parti – il Nord e il Sud del mondo – abbia “sterzato”, determinando così la rottura
del negoziato. Pure con un chicken game vengono spiegate tanto l’entrata in guerra dell’Inghilterra, in
quanto Churchill lo riconobbe nella strategia di Hitler, che la crisi dei missili di Cuba. In entrambi i casi,
il gioco rappresenta un “braccio di ferro”, fondato sulla credibilità dell’escalation.
Ciò che rende poi istruttiva la storia del “gioco del pollo” è l’effetto tremendamente
semplificante per interpretare l’azione di “attori complessi”. E’ il caso del terrorismo e della criminalità
organizzata transnazionale, in cui i fattori in gioco sono numerosi e le asimmetrie fra i “giocatori”
influenzano le valutazioni. Il terrorismo georeligioso di matrice islamica, ad esempio, sfrutta le
asimmetrie provenienti dal suo stesso bagaglio morale-religioso rispetto al background dell’avversario.
Tali asimmetrie vengono manipolate e trasformate in punti di forza e vantaggi competitivi: “La mia vita
è un’arma” è l’eloquente titolo di un libro di Christoph Reuter. Ciò – ancora una volta – illustra
l’importanza dei fattori psicologici e l’essenzialità della comprensione delle culture spesso molto diverse
dalle proprie. Basti ricordare la diversa capacità di assorbire perdite e distruzioni e le asimmetrie
profonde nell’accettazione dei livelli elevati di rischio per le organizzazioni verticali (“piramidi”) e per
quelle orizzontali (“reti”). Gli aspetti psicologici del confronto fra le “piramidi” e le “reti” assumono
quindi importanza centrale per ogni decisione.
Il potere del chicken game risiede nel fatto che, paradossalmente, esso è in grado di dimostrare che
talvolta l’unico comportamento razionale, cioè quello che porta al risultato migliore, è l’“irrazionalità”, o
meglio l’invio all’avversario di “segnali” in grado di inibire la sua scelta (allo scopo di farlo “sterzare” e,
quindi, da indurlo alla scelta cooperativa).
Come Hermann Kahn scrive in On Escalation:
“…il giocatore “abile” entra in automobile ubriaco, gettando le bottiglie di whisky fuori dal
finestrino per far conoscere a tutti il suo stato di ubriachezza. Indossa occhiali da sole molto scuri in
modo tale che sia evidente che la sua capacità visiva è alquanto limitata, se non addirittura nulla. Non
appena la vettura raggiunge un’alta velocità, prende il volante e lo getta fuori dal finestrino. Se il suo
avversario non sta guardando, allora sorge qualche problema; così pure se entrambi i giocatori
applicano questa stessa strategia”. (Cfr. Méro, 2000, p. 86).
Pertanto, la suddetta strategia serve allo scopo – ed è quindi razionale: più “irrazionalmente” si
gioca, più probabile è la vittoria.
In pratica, in tale gioco, la decisione finale, benché sia una sola (“andare dritto” o “sterzare”),
può essere preceduta da una sorta di “preludio” più o meno lungo, in grado di influire in modo
determinante sull’esito del gioco. Se uno dei due riesce a convincere l’altro – inviandogli messaggi ad hoc
e, quindi, segnalando la sua determinazione - che non si ritirerà in nessun caso, allora quest’ultimo sarà
costretto a farsi da parte per evitare il peggio. Il segnale più efficace durante il preludio è quello che
11
riesce a persuadere l’altro che si è pronti a tutto pur di vincere, “costi quel che costi”. Le armi della
persuasione in tale fase sono molteplici: si possono sintetizzare con l’espressione “bruciarsi i ponti
dietro” - che sta a indicare l’irrevocabilità della propria decisione - ovvero segnalando all’avversario che
“tipo” di giocatore si è (“dimmi che tipo sei e ti dirò che gioco fai”) si potrebbe sintetizzare19.
3.3 LA “BATTAGLIA DEI SESSI ”
O “Gioco delle coppie” serve a rappresentare le molte situazioni in cui i soggetti - pur avendo
preferenze diverse - cercano di coordinare le proprie azioni: il coordinamento dà un valore aggiunto alla
loro azione, sebbene ognuno debba sacrificare qualcosa in termini di preferenze.
Nell’esempio canonico, una coppia – A e B - deve programmare il tempo libero (uno
preferirebbe andare allo stadio, l’altro all’opera). Benché abbiano gusti diversi, entrambi saranno
disposti a sacrificare la propria preferenza piuttosto che trascorrere il pomeriggio separatamente (con
corrispondenti payoffs 0, 0).
Come nel chicken game, anche in questo caso, ci sono due equilibri di Nash: (5, 4) e (4, 5). A
priori non è possibile predire quale dei due verrà selezionato: dipenderà da chi dei due è disposto a
sacrificare le proprie preferenze.
B
A
Calcio
Opera
Calcio
5, 4
0, 0
Opera
0, 0
4, 5
In questo “gioco di coordinamento”, l’equilibrio selezionato dipenderà: 1) dall’esistenza e, 2) dal
tipo di meccanismo di coordinamento. Nell’esempio, un tipo di coordinamento potrebbe basarsi sul
galateo.
Coordinamento e cooperazione sono concetti diversi, dove il primo è sostanzialmente
“ancillare”, strumentale all’altra. L’esigenza di strumenti di coordinamento è correlata positivamente alle
dimensioni e complessità della comunità di giocatori, all’eterogeneità delle loro preferenze – e quindi
alla varietà di “tipologie” di attori -, all’imprevedibilità dei loro comportamenti e decisioni, ecc. Un
coordination failure – che può derivare da una molteplicità di motivi, soggettivi (ad esempio, la razionalità
Se non si hanno segnali nel “preludio” del gioco, come nel caso di un chicken game, né accordi, il giocatore può
utilizzare alcune particolari criteri-guida nella scelta della strategia, che porteranno a esiti diversi dai due possibili equilibri
di Nash: i criteri del Maximin (“massiminimo”) e del Maximax. La loro diversità riflette le attitudini psicologiche degli
avversari – il loro grado di pessimismo/ottimismo – e la loro attitudine al rischio – avversione/attrazione per l’azzardo.
Le soluzioni di equilibrio nel chicken game – ma, anche in termini più generali, le strategie che sottendono all’equilibrio di
Nash - non prendono in considerazione motivazioni di prudenza. Al contrario, gli esperimenti empirici danno conto di tale
attitudine dei giocatori. L’agente, in caso sia pessimista o avverso al rischio, utilizzerà il criterio del Maximin. Egli considera
quale è l’esito peggiore (il payoff minore) in corrispondenza di ogni possibile scelta e opterà per quella che lo condurrà al
“migliore degli esiti peggiori”. Pertanto, il criterio fondamentale che informa il comportamento degli agenti è quello di
garantirsi un risultato non inferiore al proprio livello di sicurezza, definito come il “massimo dei minimi risultati”
(Maximin) che ogni agente può garantirsi indipendentemente dalle scelte effettuate degli avversari. Tale strategia esprime
quindi un trade-off tra ottimizzazione e sicurezza del risultato. Se entrambi si comportano allo stesso modo prudenziale (ad
esempio, “Sterza”/”Sterza”), il risultato è rovesciato rispetto alle aspettative (“Dritto/”Dritto”): invece che nella situazione
“meno peggio”, gli avversari si ritrovano la migliore situazione collettiva (nella precedente matrice che rappresentava il
chicken game, il risultato sarà quindi (1, 1)).
Nel caso sia ottimista/amante dell’azzardo, il giocatore è fiducioso del verificarsi del migliore dei mondi, cioè che l’altro
“sterzi”. Se entrambi hanno la stessa attitudine, emergerà il risultato peggiore, specularmente opposto alle loro aspettative
19
12
limitata) ed oggettivi (carenze nella dotazione istituzionale) – può pregiudicare la scelta cooperativa. In
particolare, l’assenza di coordinamento può derivare dalle medesime situazioni sottostanti al dilemma
del prigioniero ed al free-riding. Il “paradosso del coordinamento” sta ad indicare quella situazione per cui
tutti ritengono utile il coordinamento, ma nessuno vuole farsi coordinare dagli altri20. I market failures
dimostrano la difficoltà di disporre di una “mano invisibile” che riesca a coordinare situazioni non
cooperative, come quelle di mercato. Moltissimi sono i meccanismi di coordinamento nella vita reale:
dalle convenzioni sociali ed il linguaggio al codice della strada. Anche il processo di institutions-building e
una determinata dotazione istituzionale all’interno di una collettività trovano giustificazione
nell’esigenza di tali meccanismi di coordinamento e nelle preferenze da parte della collettività verso
alcuni di essi. La TdG è servita e può servire - in ambito filosofico, ma anche economico – a spiegare la
nascita delle istituzioni sociali. Così un classico della filosofia, Convention: A Philosophical Study (1969) di
David Lewis, prende le mosse dagli argomenti di Thomas Schelling21.
In un gioco ripetuto, si potrà stabilire tra i partecipanti – più o meno implicitamente – un
accordo che prevede l’alternanza (nell’esempio precedente, oltre al galateo, si potrebbe decidere un
avvicendamento settimanale dei programmi).
Il genere di equilibrio che scaturisce dal meccanismo dell’alternanza viene definito in letteratura
focal equilibrium, un equilibrio che nasce spontaneamente – quindi anche quando i soggetti non
comunicano tra loro - poiché riflette il senso comune.
Più in generale, il focal point di Schelling (1960) è un esito del gioco che si impone all’attenzione
dei giocatori per alcune sue peculiarità all’interno della matrice dei payoff, e che spinge i giocatori a
scegliere spontaneamente proprio le strategie che danno luogo a un equilibrio così peculiare. In contesti
decisionali complessi con informazione imperfetta e in cui non esiste possibilità di accordi fra i soggetti
che interagiscono, il punto focale costituisce un elemento attrattivo fra i giocatori, assolvendo così la
funzione di segnalazione e coordinamento. Tutte le opzioni (strategie) alternative vengono scartate a
favore di quella più “attraente”, cioè di quella “saliente”, come è stata denominata da Schelling. Poiché,
verosimilmente, ognuno decide secondo questo stesso criterio-guida, le scelte di tutti convergeranno
verso quel punto, dal quale emergerà un focal equilibrium.
Tutti i fattori che differenziano sono potenziali punti focali proprio in virtù della capacità
d’attrazione esercitata. Se la strategia vincente è quella che trova maggior consenso ed esiste un punto
focale, allora “scommettere” sul punto focale accresce la probabilità di vincere. Il processo si
autoalimenta attraverso le aspettative – sul fatto che anche gli altri facciano la stessa cosa – che si
autorealizzano. E il punto focale – la “scelta saliente” - diventano così centro di aggregazione e common
knowledge.
Riecheggiano le dinamiche sottostanti al famoso “concorso di bellezza” illustrate da Keynes
nella sua Teoria generale dell’occupazione, dell’interesse e della moneta (1936), che racchiude la spiegazione di
molti fenomeni di massa. Egli suggerì che l’operatore di borsa dovrebbe adottare il comportamento di
un lettore che partecipa a un gioco a premi, indetto da un giornale, che consiste nello scegliere la foto
della donna più bella: vince chi sceglierà quella che riceve il maggior numero di preferenze da parte dei
lettori. Se una candidata fosse nettamente più bella, vi sarebbe un punto focale necessario. Ma è raro
che il compito del lettore sia così facile; lo stesso concorso non avrebbe ragione di essere. Di
conseguenza, la scelta razionale di ciascun partecipante deriva - più che dall’espressione delle proprie
preferenze – dalla previsione delle preferenze altrui e dalla tendenza a conformarvisi: la strategia
dell’imitazione, cioè di prevedere la moda statistica delle scelte e di uniformarvisi, aumenta infatti la
probabilità di successo della propria scelta. Nella necessità di scommettere “al buio” su quello che
preferiscono gli altri, una qualche peculiarità nell’oggetto di scelta – capace di attrarre l’attenzione della
massa - può diventare un criterio-guida.
Basti pensare ad esempio alle difficoltà incontrate, anche in tale settore, nei processi di peace-building, dove la
“multinazionalizzazione” degli interventi politico -militari implica una pluralità degli attori coinvolti, la differenza di ruoli,
vocazioni e meccanismi decisionali.
21 Considerando altre applicazioni, in economia industriale la strategia di divisione del mercato fra due imprese rivali ha
come fondamento questo tipo di gioco, così come situazioni in cui i produttori di due beni complementari devono scegliere
quale standard qualitativo adottare in modo da renderli compatibili.
20
13
La “scelta saliente” di Schelling può anche spiegarsi in termini di “accessibilità” di un pensiero,
secondo il significato attribuito da Higgins (1996) e ripreso da Kahneman (2002). Il pensiero intuitivo,
essendo spontaneo, è di facile accesso (al contrario, quelli “inaccessibili” rimangono cristallizzati
nell’inconscio). Pertanto, una scelta saliente è in qualche modo assimilabile ad un pensiero intuitivo. E,
più in generale, maggiore è l’accessibilità di un oggetto, di una motivazione o di un gusto, maggiore è la
vocazione di questi a diventare elementi salienti della scelta. Nella stessa vena, la decisione intuitiva
rappresenta la scelta saliente. Osserva Kahneman, i decisori esperti – costretti costantemente a decidere
sotto pressione – raramente devono scegliere fra opzioni poiché, nella loro mente tende a presentarsi
un’unica opzione; cioè le altre non vengono nemmeno rappresentate, rendendo così più efficiente il
processo decisionale.
4. GIOCHI RIPETUTI
Nela vita reale, i soggetti: a) non si incontrano una volta sola (one-shot game), bensì l’interazione si
ripete nel tempo, in una pluralità di incontri; b) non scelgono simultaneamente (giochi sequenziali).
I giochi ripetuti incorporano elementi di informazione derivanti da due fonti, strettamente
collegate: 1) l’apprendimento e l’esperienza acquisiti nel corso dei rounds; 2) gli aspetti psicologici dei
rivali, cioè le informazioni sulle loro preferenze (“tipo”) che emergeranno con la ripetizione del gioco
(reputazione). Riguardo agli aspetti psicologici, con i giochi ripetuti la teoria è in grado di giustificare
anche la razionalità di comportamenti di cooperazione e di altruismo o quelli punitivi; l’instaurarsi di
rapporti di fiducia e di reciprocità, la credibilità dei giocatori, ecc.
4. 1 IL MECCANISMO DI SOLUZIONE MEDIANTE “INDUZIONE A RITROSO” E IL SUO FALLIMENTO
In un gioco non cooperativo - tipo DP – ripetuto più volte, un giocatore può decidere di
cooperare per costruirsi la “reputazione” di soggetto leale, in modo da sollecitare la cooperazione altrui
e raggiungere un risultato per lui più vantaggioso.
Un meccanismo-chiave per la soluzione del gioco ripetuto è l’“induzione a ritroso” (backward
induction, chiamato anche algoritmo di Kuhn (1953): tale meccanismo conduce a un esito del gioco
diverso – cooperazione/non cooperazione - a seconda che il gioco abbia un orizzonte temporale finito
(e noto), ovvero un orizzonte temporale indefinito (o comunque non noto ai giocatori). Nel primo
caso, l’equilibrio coincide con quello del gioco one-shot22.
4.2 FOLK THEOREM E TIT-FOR-TAT
In un gioco non cooperativo ripetuto un numero indefinito/sconosciuto di volte, il risultato
può essere invece diverso, portando alla soluzione cooperativa23. L’idea che situazioni conflittuali
possano condurre alla cooperazione fra gli individui affonda le radici nella filosofia, in particolare con
Hobbes (1651) e Hume (1740). Poiché la relazione fra individui può sintetizzarsi nel noto “homo homini
lupus”, in termini di TdG il comportamento di ciascun giocatore si fonda sulla strategia non cooperativa,
che si concretizza nel risultato Pareto-inefficiente. Seguendo Hobbes, per evitarlo, occorre la presenza
In un gioco ad esempio con 10 rounds, gli avversari si proiettano alla fine del gioco e ripercorrono a ritroso la sua sequenza.
Poiché nell’ultimo round non c’è alcun vantaggio nel cooperare (non c’è futuro del gioco) e ciascu n giocatore si aspetta che
anche l’altro farà lo stesso tipo di ragionamento, al decimo round entrambi tradiranno (giocare per l’ultima volta è come
giocare una volta sola). Sulla base di tale aspettativa, non ci sarà alcun incentivo a cooperare neppure nel penultimo round; se
ciascun giocatore si aspetta che al nono round non c’è alcun incentivo a cooperare da parte dell’avversario, non c’è ragione c’è
di cooperare all’ottavo round … e cosi via, il gioco si dipana all’indietro e ciascuno sceglierà di non cooperare fin dalla prima
mossa.
Possono presentarsi casi in cui l’applicazione del criterio di backward induction conduce ad equilibri poco credibili sul piano
fattuale. Il gioco del Centipede, che è l’esempio più noto, mostra i limiti di un’applicazione rigida dei criteri di soluzione a
volte predetti dalla TdG.
23 Un one-shot game, quando dà un risultato diverso nella sua versione ripetuta, prende il nome di supergame.
22
14
di un’autorità esterna che punisce chi tradisce/defeziona; si giustifica così la presenza di un meccanismo
esogeno, quale il Leviatano. Per Hume, poiché la vita è un “gioco ripetuto”, la cooperazione di ciascuno
è da considerarsi una sorta di investimento sociale in reputazione, che indurrà gli altri a ricambiare tale
comportamento. In questo caso, la cooperazione – intesa come scambio - insorge
spontaneamente/endogenamente all’interno della collettività.
Il folk theorem mostra che anche i giochi di natura non cooperativa, se ripetuti in un orizzonte
temporale infinito possono dar luogo alla cooperazione implicita tra giocatori.
Esso ipotizza che il first mover (B) adotti una strategia cooperativa. Quest’ultima può assumere
valore segnaletico sul suo “tipo”; è, quindi, interpretabile come un investimento iniziale in reputazione
– analogo al processo di accumulazione in stock di capitale umano -, destinato tuttavia a trasformarsi in
un sunk cost qualora l’altro giocatore (A) scelga comunque di non cooperare.
Quest’ultimo deve di conseguenza decidere se reciprocare la mossa cooperativa di B.
Il teorema sottende un confronto intertemporale, operato dal secondo giocatore A, fra le due
strategie disponibili, cooperare/non cooperare. Ovviamente, non deve trattarsi di preferenze “genuine”
verso una buona reputazione e a favore della cooperazione ma di un calcolo meramente strategico,
poiché A è in grado di anticipare che se non reciproca la cooperazione di B, questo a sua volta
defeziona, portando entrambi ad un equilibrio di Nash.
Pertanto, al tempo t, il giocatore A se defeziona, ottiene un vantaggio incrementale (rispetto
all’adozione di un comportamento cooperativo), determinato dalla cooperazione unilaterale da parte
dell’altro giocatore B. Tuttavia, in ogni periodo successivo, egli subirà una perdita (derivante dal fatto
che l’avversario lo costringerà all’equilibrio di Nash).
Quindi, A dovrà attualizzare le perdite future derivanti dalla defezione utilizzando un tasso di
1
α=
(1 + r ) , è minore
sconto intertemporale r; ipotizzando 0 < r < 1, il fattore di sconto intertemporale,
di 1.
Nell’analisi intertemporale costi-benefici,al giocatore A conviene adottare la strategia non
cooperativa quando privilegia i vantaggi attuali del free-riding senza annettere particolare rilievo alle
perdite future: ciò a dire, quando il tasso di sconto intertemporale, r, è “abbastanza elevato” e il fattore
di sconto α , conseguentemente, piccolo; più elevato r, più basso è l’onere connesso alle perdite future
derivanti dalla mancata cooperazione reciproca. In tal senso, il tasso di sconto intertemporale è un
parametro cruciale per verificare se i meccanismi reputazionali possono portare a esiti efficienti del
gioco nel lungo periodo. Un tasso di sconto temporale iperbolico – che mira a soddisfare i benefici
immediati - sottende, di conseguenza, il disinteresse del soggetto a costruirsi una reputazione nel
tempo24.
Il limite della strategia sottesa dal Folk Theorem è che il soggetto sceglie una volta per tutte, cioè
non ha margini di flessibilità in un suo eventuale ripensamento sulla strategia scelta. Un limite, questo,
superato dal Tit-for-Tat.
In termini formali, ciò è stato dimostrato da Robert Axelrod (1984), politologo dell’Università
del Michigan, con la strategia Tit-for-Tat (“colpo su colpo”), la cui filosofia di base è “Occhio per
occhio, dente per dente”. Tale strategia è molto semplice e si sintetizza nel seguente algoritmo:
“Coopera nella prima tornata; poi copia la mossa che l’avversario ha effettuato nel round precedente”. Si
tratta di una strategia molto efficace – poiché il tradimento viene immediatamente punito; ma è anche
leale – poiché se chi ha defezionato torna a cooperare, la strategia “occhio per occhio” lo ricompenserà
con la cooperazione da parte dell’altro: cioè, il gioco dà la possibilità a chi ha tradito di “rifarsi una
reputazione”. Poiché non è noto - ovvero è indefinito - il numero di tornate, tale meccanismo permette
di conseguire un risultato efficiente nel caso di “Dilemma del Prigioniero”.
5. I REFINEMENTS
La nozione di sconto temporale iperbolico prevede che gli individui si comporteranno impulsivamente ogni qual volta si
confronteranno con una combinazione di incentivi che comporta benefici e costi immediati.
24
15
Per acquisire ulteriori informazioni sugli equilibri di Nash – in particolare quando essi sono più
di uno – ed anche per approfondirne taluni aspetti e superare la scarsa verosimilità di alcune predizioni,
nella storia più recente della TdG sono stati formulati degli affinamenti.
Ci si limita ad elencarne alcuni fra i più noti25: equilibrio perfetto nei sotto-giochi (subgame
perfection); coordinamento tramite focal equilibrium; trembling hand, che mette a fuoco il trade-off fra
ottimizzazione e prudenza; razionalità sequenziale.
6. APPLICAZIONI ALLA STRATEGIA MILITARE
Per quanto sopra detto, un ampio settore della TdG si applica ai problemi di strategia militare,
sia nella fase di preparazione delle forze che nel corso delle operazioni. In particolare, mediante tale
approccio si integrano giochi di strategia, teorie della negoziazione, teoria della comunicazione e
percezione collettiva. Le tecniche dei giochi in situazioni politico-strategiche complesse offrono spunti
interpretativi sui processi decisionali degli avversari e sul tema della dissuasione e coercizione,
direttamente collegato a quello della “minaccia”. La minaccia realizzata sia con la public diplomacy, sia con
la “politica delle cannoniere”, usuale nel periodo della “pax britannica” del XIX secolo (oggi con
l’attacco preventivo codificato nella National Security Strategy, approvata dal Presidente Bush il 20
settembre 2002), è la tecnica o la mossa che in maniera più netta mette in luce la logica
dell’interdipendenza fra giocatori.
Ogni minaccia contiene un implicito invito alla trattativa. Perciò molti esperti strategici
sostengono che la disponibilità di bombe e ad attaccare sono anche messaggi – sicuramente meno
“carini” delle note diplomatiche – che hanno almeno due significati. Il primo è la minaccia di un uso di
bombe o di un attacco successivo; il secondo è l’invito a trattare per accettare le condizioni di pace che
si vogliono imporre. Ma i termini esatti del possibile accordo rimangono incerti: ciascuna delle
controparti conosce – almeno entro dati limiti - le proprie risorse e margini di rischio, mentre è incerta
su quelli dell’avversario. Il gioco della minaccia strategica è l’aggiustamento reciproco a questo rischio
critico, oltre il quale i due avversari (o uno dei due) cedono o entrano effettivamente in guerra
impiegando le armi per tentare reciprocamente di imporre la propria volontà con la prova di forza.
L’esito della trattativa – ovvero, la soluzione del gioco della minaccia – dipende da fattori che
precedono e da fattori che si creano nella situazione stessa. Di importanza cruciale è la “credibilità”
della minaccia. Senza di essa, anche la potenza militare più grande non ha effetto alcuno, cioè viene
neutralizzata.
Ciò dimostra, ancora una volta, l’essenzialità dei fattori psicologici e la necessità di valutare
quelli dell’avversario, oltre che, beninteso, quelli propri. La guerra è il campo non solo del complesso,
ma anche dell’imprevisto e del discontinuo. Non esistono regole; ciascun contendente cerca di imporre
le proprie. Tende sempre a colpire di sorpresa i punti deboli dell’avversario; essi si rendono visibili in
quanto fatti emergere con manovre preparatorie (anche di natura meramente psicologica-comunicativa)
e colpiti prima che l’avversario possa reagire per difenderli.
La logica dei giochi mantiene la sua validità, come strumento euristico per esaminare le
interazioni (o “incroci”) fra le strategie seguite dai due avversari, ma sempre completata da strumenti e
apparati metodologici più complessi e sofisticati che incorporano l’asimmetria, il qualitativo, il
soggettivo, l’incertezza e la probabilità soggettiva attribuita ai vari eventi, primi fra i quali le decisioni
dell’avversario.
7. TEORIA DEI GIOCHI E NEUROECONOMIA
L’analisi microfondata dei processi decisionali, oltre che avvalersi dell’economia
comportamentale – e, nelle sue verifiche empiriche, di quella sperimentale – si sta ulteriormente
sviluppando mediante lo studio dei meccanismi neurali – l’attivazione delle diverse aree del cervello –
coinvolti nei processi decisionali.
25
Per un approfondimento dei quali si rinvia a Cellini-Lambertini (1996).
16
La stessa nozione di razionalità rinvia preminentemente ad una questione metodologica.
Piuttosto che un problema di perseguimento di obiettivi – o di quali obiettivi; più che un problema di
anticipare le mosse altrui (come richiede la nozione più sofisticata di razionalità usata nella TdG), il focus
dell’analisi della razionalità diventa la ricerca delle regole ottime da utilizzare nel processo decisionale –
una prospettiva, questa, che privilegia l’idea della razionalità procedurale.
L’ottimizzazione, sia che guardi agli obiettivi della scelta sia che guardi ai meta-obiettivi degli
strumenti per la scelta, comunque si confronta con dei vincoli. In quest’ultimo caso si tratta di
un’ottimizzazione vincolata delle regole adottate nel processo decisionale.
I nuovi contributi a questo tipo di analisi tornano indietro agli argomenti di Herbert Simon e
procedono inglobando strumenti tecnologicamente avanzati. Uno dei moderni “ritrovati”, che ingloba
argomenti robusti à la Simon e metodiche tecnologicamente avanzate, è la nozione di razionalità
ecologica formulata dal premio Nobel per l’economia, Vernon Smith (2002).
L’ordine razionale, egli osserva, è una sorta di ecosistema. Esso rappresenta una stratificazione
che emerge da processi evoluzionisti culturali e biologici del soggetto. Proprio perché conseguenza di
una stratificazione non pianificata – e neppure coeva – la razionalità ecologica non pretende di
raggiungere l’ottimizzazione di un risultato quanto, esattamente nella stessa vena di Herbert Simon,
un’ottimizzazione vincolata nell’uso delle regole per le decisioni. I vincoli a cui si allude riguardano i
costi dell’attività cognitiva per la formulazione della decisione.
Tali costi, a loro volta, rinviano a fattori oggettivi – come l’acquisizione delle informazioni
rilevanti – e a fattori soggettivi – i meccanismi mentali di cui si serve l’individuo nel processo
decisionale.
La razionalità ecologica e la ricerca neurale (attraverso la tecnologia dell’imaging cerebrale)
sottendono perciò forti connessioni.
Poiché l’adozione di regole per la scelta sconta un’analisi continua di costi-benefici nell’attività
cognitiva (a causa delle risorse limitate oggettive e soggettive); poiché l’output neurale è diverso a
seconda degli stimoli e delle aree cerebrali utilizzate per lo specifico problema decisionale, ne consegue
che: (1) non esiste una ricetta univoca di elaborazione delle decisioni (la modelizzazione artificiale e
stilizzata non è dunque un buon sostituto degli “ambienti naturali” delle scelte (Chorvat-McCabe,
2004); (2) il cervello deve operare selettivamente, un’idea che si riallaccia a quelle dell’“accessibilità”,
dell’intuizione e della scelta saliente (punto 3. 3). Richiamando gli argomenti sviluppati separatamente
da Higgins, Kahneman e Schelling all’analisi neurale, si pongono due questioni: come il cervello opera
tale selezione e, una volta che questa è avvenuta, quali meccanismi neurali vengono utilizzati per la
solizione del problema decisionale (Chorvat-McCabe, 2004).
Sembra – come suggeriscono Chorvat e McCabe – che il cervello non usi modelli generali
(costosi nella gestione e non sempre adattabili agli specifici problemi decisionali), ma abbia aree
dedicate (“tissued structured for solving [specific] problems”, p. 115) o si serva di una sorta di algoritmi per
formulare una decisione (Camerer et al., 2004). Inoltre, la ricerca nel campo della neuroscienza cognitiva
suggerisce che il medesimo problema può essere affrontato con due approcci: non necessariamente
mediante un calcolo volto ad individuare la scelta migliore (come invece prevede la TdG), ma anche
impulsivamente. Questi differenti metodi di soluzione del problema – calcolo vs. impulso – sono
localizzati in regioni distinte del cervello, e la ricerca si sta occupando di come avvenga la scelta di un
meccanismo piuttosto che un altro.
Nella prospettiva della razionalità ecologica e del suo deferire ai meccanismi neurologici, diventa
quindi difficile per ciascuno predire i processi decisionali degli altri soggetti economici/giocatori poiché
non sembrano esistere processi decisionali standard, stilizzabili. Essi sono piuttosto la sintesi di attività
neurali “discontinue” e “confliggenti”, in cui interviene anche l’area affettiva/emotiva. Così come trova
evidenza empirica mediante il monitoraggio dell’attività neurale che il contesto all’interno del quale si
sviluppa il processo decisionale ha un impatto significativo sul modo in cui i meccanismi neurali si
attivano per la soluzione del problema (Chorvat-McCabe, 2004).
Sebbene si sappia ancora poco sul modo in cui l’attività neurale si incanali in una decisione o
formi un precetto categoriale, la neuroscienza ha scoperto che il cervello non “fa una media”, cioè non
integra le varie – o persino discordanti - informazioni provenienti dai diversi gruppi di neuroni.
17
L’individuo, al contrario, seleziona una fonte sopprimendo l’altra, secondo una sorta di algoritmo “chi
vince piglia tutto” (Camerer et al. 2004). Pertanto, l’estrazione neurale del segnale risulta completamente
biased a favore di certi neuroni – e certe informazioni – privilegiando così gli aspetti di efficienza
nell’incipit dell’azione e/o dell’elaborazione di un concetto, piuttosto che indugiare sulla scelta fra le
diversi opzioni; proprio a causa di questa discontinuità nell’aggiornamento dei dati, lo svantaggio è che
il processo di apprendimento - ovvero la formulazione di convinzioni - procede a salti. In tale
prospettiva, possono essere spiegati anche fenomeni quali il framing effect e il fenomeno del preference
reversal , esaminato tra i primi da Lichtenstein e Slovic (1971).
Inoltre, nel processo decisionale subentrano parti confliggenti. Ad esempio, nell’esperimento
neurologico dell’ultimatum game, si è osservato che le motivazioni trovano una localizzazione in diverse
aree cerebrali26 e che nel processo decisionale vengono eventualmente “mediate” da altre aree. Infatti,
nel conflitto tra la parte razionale/cognitiva – la corteccia prefrontale dorsolaterale, che è una regione
coinvolta nelle attività di pianificazione, esecuzione, ecc., e che indurrebbe ad accettare offerte
compatibili con l’equilibrio di Nash – e la parte emotiva – tramite l’insula – interviene a mediare nel
processo decisionale un’altra area – il giro del cingolo anteriore.
Si sta rafforzando l’idea fra neuroscienziati e psicologi che il sistema affettivo convogli al
soggetto una segnalazione-informazione grezza prima ancora che il suo sistema cognitivo abbia
elaborato lo stimolo in modo compiuto. Un’idea molto simile, dunque, a quella dei “marcatori
somatici” formulata da Damasio. Assolvendo – per mezzo dell’amigdala (situata al di sotto in
profondità della corteccia cerebrale) - un ruolo cruciale nella motivazione e quindi nell’azione
dell’individuo (Frijda, 1986), l’affetto/emozione ha una funzione primaria nelle scelte e quindi nei
comportamenti economici e non27. Come suggerito da Damasio, il lato affettivo-emotivo diventa
complemento o succedaneo – è difficile stabilire la natura della relazione – della razionalità economica
basata su canoni strettamente definiti (logico-cognitivi).
La comprensione dei processi decisionali altrui un’ulteriore difficoltà: nell’abilità soggettiva di
inferire su quanto gli altri credono, sentono e potrebbero fare. Si tratta di una capacità ad hoc, chiamata
“mentalizzazione” o “lettura della mente”, situata nella corteccia prefrontale (Baron-Cohen, 2000). Una
attitudine per così dire “limitrofa” è la capacità di avvertire empatia verso gli altri (Singer-Fehr, 2005).
La mentalizzazione e l’empatia – due filoni recenti nella ricerca delle neuroscienze sociali – sebbene
facciano riferimento a circuiti neurali differenti, mettono entrambe in condizione un individuo di
rappresentare e predire gli stati altrui (intenzioni, obiettivi, convinzioni, sensazioni ed emozioni, ecc.).
Gli esperimenti sull’empatia indicano che alcuni circuiti affettivi del cervello sono attivati
automaticamente quando si prova dolore e quando gli altri provano dolore, sebbene tale capacità sia
soggettiva e la risposta empatica muti in funzione della relazione posizionale fra soggetti.
Pertanto, una carenza – del tutto plausibile – nell’abilità del giocatore di comprendere gli stati
altrui e/o di provare empatia non trova un perfetto succedaneo nelle sue capacità logico-deduttive. In
chiave di TdG, le implicazioni sono numerose.
In un contesto di informazione incompleta in cui cioè un giocatore è incerto sulle caratteristiche
(modellate sulle preferenze) dell’altro, le congetture sul “tipo” di avversario non possono essere
facilmente derivate dal solo calcolo di tipo bayesiano, a causa dell’estrazione del segnale neurologico che
è molto articolato e complesso e dipende dalla capacità di leggere la mente degli altri28.
“Unfair offers elicited activity in brain areas related to both emotion (anterior insula) and cognition (dorsolateral prefontal
cortex). Further, significantly heightened activity in anterior insula for rejected unfair offers suggests an important role for
emotions in decision-making.” (p. 1755).
27 Lo psicologo Zajonc (1980, 1984, 1998) ha illustrato nei suoi esperimenti come spesso gli individui siano in grado di
identificare la loro risposta affettiva – positiva o negativa – verso qualcosa prima ancora di capire cosa sia; vale a dire, il
momento cognitivo e successivo a quello affettivo. Ad esempio, possiamo avere un ricordo piacevole di un libro o di una
persona senza riuscire a ricordare altri particolari. Lungo lo stesso filone, altri ricercatori hanno scoperto che il cervello
umano cataloga affettivamente quasi tutti gli oggetti e concetti e che tali “etichette” riappaiono senza alcuno sforzo alla
mente appena vengono rievocati gli oggetti, i soggetti e i concetti ad esse associati.
28 La regola di Bayes è la base dei moderni sistemi di inferenza probabilistica. In particolare, in un contesto di informazione
incompleta, gli agenti – i giocatori – se non hanno conoscenze dirette sul “tipo” di avversario (ad esempio, per l’impresa che
vuole entrare sul mercato, se il monopolista che vi opera sia forte), devono ricorrere al calcolo probabilistico per formulare le
proprie congetture sul tipo di avversario (le probabilità soggettive di un individuo sono anche chiamate “credenze”). In altri
26
18
Riguardo all’empatia, l’attitudine ad essa e la sua intensità influenzano non solo la possibilità di
comprendere ed anticipare le strategie altrui, ma anche la scelta di cooperare, pure nelle circostanze in
cui la cooperazione è la strategia dominata.
Soluzioni “anomale” del dilemma del prigioniero (non ripetuto o con un numero
finito/conosciuto di tornate) o dell’ultimatum game trovano così nelle neuroscienze nuove conferme e
spiegazioni.
La stessa ipotesi di razionalità come common knowledge ha dei forti limiti sotto il profilo
neurologico. Se non c’è una nozione univoca di razionalità e se la scelta razionale ingloba componenti
affettive/emotive, il ragionamento logico-deduttivo non è sufficiente a predire la scelta dell’altro.
Corollario è che persino la predizione dell’equilibrio di Nash non è necessariamente valida, pur
ricorrendo ai canonici postulati della teoria., così come la soluzione attraverso il meccanismo di
backward induction nei giochi ripetuti.
Se la stessa teoria ha riconosciuto i limiti di alcune sue predizioni (si richiama il gioco del
Centipede), la mentalizzazione e l’empatia – quali specifiche doti soggettive – aggiungono ulteriori
elementi di complessità nelle soluzioni dei giochi rispetto a quelle predette dalla TdG.
Ancora a proposito della cooperazione e dei suoi modi di comunicarla all’avversario, si ricorda
la rilevanza dell’espressioni facciali e degli involontari segni delle proprie emozioni. L’importanza sotto il
profilo strategico delle emozioni – richiamiamo le implicazioni nell’interazione strategica dell’arrossire,
suggerite da Frank, per segnalare determinate emozioni – mette in rilievo il ruolo di queste ultime per
veicolare informazioni all’avversario sul proprio “tipo”. Il valore e l’efficacia della “segnalazione
emotiva” trovano evidenza empirica nelle neuroscienze, in particolare negli studi che focalizzano le
caratteristiche del viso dell’avversario salienti per l’interazione strategica. Il grado di attrattività, di
affidabilità, l’identità razziale, ecc., assolvono un ruolo nell’elicitazione della cooperazione, anche senza
ricorrere ad un calcolo per individuare la strategia ottimale (Singer et al., 2004).
Sempre in teme di scelta (non-)cooperativa, le conseguenze future del proprio comportamento
– rilevanti nei giochi ripetuti – sembrano dovute alla corteccia prefrontale, una struttura cerebrale che è
prerogativa solo della specie umana (Camerer et al., 2004). La scelta intertemporale può essere
ricondotta alla combinazione di due processi – uno affettivo ed impulsivo (e, in questo senso, “miope”);
l’altro più orientato al lungo periodo e quindi più lungimirante. In particolare, nel Folk Theorem, la scelta
la cooperativa o la scelta del free-riding (avvalersi della cooperazione unilaterale da parte dell’altro) – è
affidata al calcolo basato sul tasso di sconto intertemporale. La scelta di defezionare può essere il frutto
dell’applicazione del tasso iperbolico volto alla gratificazione immediata, che è “miope” in un gioco con
termini, dire che gli altri giocatori formulano congetture/credenze sul “tipo” T significa dire che essi assegnano delle
distribuzioni di probabilità sul “tipo” di avversario. Non avendo informazioni dirette, essi ricaveranno le proprie congetture
osservandone le mosse. In termini più rigorosi, ipotizziamo che un agente abbia una probabilità soggettiva a priori P(A) sul
verificarsi di un certo evento A; sia B un evento non stocasticamente indipendente da A; se l’agente osserva il verificarsi
dell’evento B, aggiornerà la sua probabilità soggettiva sul verificarsi dell’evento A. Se, in particolare, si interpretano gli eventi
B1, B2,..., Bn come possibili cause del verificarsi dell’evento A, l’espressione P(Bk/A) rappresenta la probabilità che la causa del
verificarsi dell’evento A sia l’evento Bk. A titolo di esempio, consideriamo un medico che conosca i sintomi di una certa
patologia e cioè che, per la malattia Bk, egli conosca la probabilità che quella malattia abbia A come uno dei suoi sintomi (il
medico conosce P(A/Bk)). Il problema che si presenta al medico è di conseguenza calco lare – ogni qualvolta un paziente
accusa il sintomo A – la probabilità che il sintomo A sia determinato dalla patologia Bk per ogni K = 1, 2, ..., n. La regola di
Bayes serve proprio a calcolare la probabilità che il verificarsi dell’evento A sia determinato dall’evento Bk. Ritornando al
precedente esempio del monopolista, permette di formulare al potenziale entrante la congettura che il monopolista,
facendogli la guerra, sia un “tipo” forte. Tale meccanismo costituisce di conseguenza uno strumento di segnalazione: come gli
avversari cercheranno di estrarre il maggior numero di informazioni su T dalle sue mosse durante lo sviluppo del gioco
(“estrazione del segnale”), così T sceglierà delle mosse che segnalino la sua natura (beninteso, potrebbe anche barare
nell’invio del segnale). Pertanto, da parte di T, si ha un invio del segnale attraverso le sue mosse; da parte degli avversari, si ha
una ricezione del segnale. Dunque, la formula di Bayes ha una forte valenza segnaletica. In un gioco ripetuto, la credenza che
il giocatore ha sull’avversario T può essere rivista ad ogni round. Quindi, in un gioco ripetuto, la probabilità condizionata
descrive la variazione di credenze all’accumularsi delle evidenze disponibili. Cioè, il meccanismo bayesiano incorpora un
pro cesso di revisione delle credenze, esattamente come avviene per gli agenti economici con aspettative razionali.
L’aggiornamento bayesiano delle probabilità di eventi causali in presenza di nuove informazioni può risultare tuttavia
semplicistico quando teniamo conto che tale meccanismo può sopperire solo in parte ad una eventuale lacuna della
mentalizzazione, e di conseguenza può portare a delle credenze errate.
19
un numero infinito di tornate.. Tuttavia, la questione è più complessa in una prospettiva di
neuroeconomia poiché il meccanismo di sconto temporale iperbolico poggia, almeno in parte, sulla
competizione tra sistema affettivo e quello cognitivo. Non necessariamente un’appropriata
combinazione di incentivi sarà determinante quindi nell’opzione della gratificazione immediata; saranno
piuttosto i fattori che rafforzano l’uno o l’altro meccanismo a produrre nelle persone scelte più o meno
impulsive.
CONCLUSIONI
La metafora del gioco è talmente robusta nello spiegare le interazioni sociali che essa va
progressivamente espandendosi nei suoi campi di applicazione. In questo suo percorso – attraverso un
processo di trial and error – trova sempre nuove complessità e nuovi arricchimenti.
Il riconoscimento dei suoi limiti – anche mediante le tecniche più avanzate per la verifica
empirica – presuppone non un abbandono del “gioco”, ma una nuova ricerca.
Mariateresa Fiocca
Esperto Secit
Ministero dell’Economia e delle Finanze
20
BIBLIOGRAFIA
Camerer, C. – Loewenstein, G. – Prelec, D. (2004), Neuroeconomia, ovvero come le neuroscienze possono dare
nuova forma all’economia, in Rivista de Il Mulino, n. 3.
Cellini, R. - Lambertini, L. (1996), Una guida alla teoria dei giochi, Clueb, Bologna.
Chorvat, T. – McCabe, K. (2005), Neuroeconomics and Rationality, in Chicago-Kent Law Review.
Chorvat, T. – McCabe, K. – Smith, V. (2004), Law and Neuroeconomics, Law and Economics Working
Paper Series, George Mason University, Fairfax, Virginia, USA.
Colombo, F. (2003), Introduzione alla teoria dei giochi, Carocci, Roma.
Damasio, A. (2003a), L’errore di Cartesio. Emozione, ragione e cervello umano, Adelphi, Milano (sesta ed.).
------- (2003b), Alla ricerca di Spinoza. Emozioni, sentimenti e cervello, Adelphi, Milano, 2003.
Ecchia, G. – Gozzi, G. (1992), Scelta, mercati e benessere, Il Mulino, Bologna.
Elster, J. (1979), Ulysses and the Sirens, Cambridge University Press, Cambridge (Mass.).
Fehr, E. – Fischbacher, U. – Kosfeld, M. (2005), Neuroeconomic Foundations of Trust and Social Preferences,
Discussion Paper n. 1641, IZA, Bonn.
Fiocca, M. (1994), From Endogenous Contraints to Economic Results. The Passage Through Morality, Uncertainty
and Strategies, Dartmouth, Aldershot.
Frank, r. h. (1987), If Homo Economicus Could Choose His Own Utility Function, Would He Want One with a
Conscience?, in American Economic Review.
Forsythe, R. – Horowitz, J. L. – Savin, N. E., Sefton, M. (1994), Fairness in simple bargaining experiments, in
Games and Economic Behavior.
Hayek, F. A. (1952), The Sensory Order, University of Chicago Press, Chicago.
Hey, J. (1993), Rationality is as Rationality Does, in Gerrardd, B. (ed.), The Economics of Rationality,
Routledge, Londra e New York.
Higgins, E. T.(1996), Knowledge Activation. Accessibility, applicability, and Salience in Higgins, E. T Kruglanski, A (eds.), Social Psychology. Handbook of Basic Principles, Guilford Press, New York.
Lewis, D. (1969), Convention. A Philosophical Study, Harvard University Press, Cambridge (Mass.).
Lichtenstein, S. – Slovic, P. (1971), Reversal of Preferences Between Bids and Choices in Gambling Decisions,
in Journal of Experimental Psychology.
Kahneman, D. (2002), Mappe di razionalità limitata. Indagini sui giudizi e le scelte intuitivi, in Motterlini, M. –
Piattelli Palmerini, M. (a cura di), (2005), Critica della ragione economica, il Saggiatore, Milano.
Kording, K. P. – Fukunaga, I. – Howard, I. S. – Ingram, J. N. – Wolpert, D. (2004), A Neuroeconomics
Approach to Inferring Utility Functions in Sensorimotor Control, in PLoS Biology.
McCabe, K. (2005), Neuroeconomics, George Mason University, Fairfax, Virginia, USA.
McNeill, B. J. – Pauker, S.G. – Sox, H. C. – Tversky, A. (1982), On the Elicitation of Preferences for
Alternative Therapies, in New England Journal of Medicine.
Méro L. (2000), Calcoli morali. Teoria dei giochi, logica e fragilità umana, Edizioni Dedalo, Milano.
Rubinstein, A. (1982), Perfect Equilibrium in a Bargaining Model, in Econometrica.
Rusconi, G. E. (1984), Scambio, minaccia, decisione. Elementi di sociologia politica, Il Mulino, Bologna.
Samuelson, W. - Zekauser, R. (1988), Status Quo Bias in Decision Making, in Journal of Risk and Uncertainty.
Sandler, T. (2003), Collective Action and Transnational Terrorism, Research Paper 2003/13, University of
Nottingham.
Sandler, T. – Enders, W. (2004), An Economic Perspective on Transnational Terrorism, in European Journal of
Political Economy.
Schelling, T. (1960), The Strategy of Conflict, Harvard University Press, Harvard.
Selten, R. (1975), Re-examination of Perfectness Concept for Equilibrium Points in Extensive Games, in
International Journal of Game Theory.
Singer, T. – Feher, E. (2005), The Neuroeconomics of Mind Reading and Empathy, Discussion Paper n. 1647,
IZA, Bonn.
Singer, T. – Keibel, S. – Winston, J. – Dolan, R. – Frith, C. (2004) Brain Responses to the Acquired Moral
Status of Faces, in Neuron.
21
Smith, V. L. (2002), Razionalità costruttiva e razionalità ecologica, in Motterlini, M. – Piattelli Palmarini, M. (a
cura di), (2005), La critica della ragione economica, Il Saggiatore, Milano.
Spaventa, L. (1989), (a cura di), La teoria dei giochi e la politica economica, Il Mulino, Bologna.
Strotz, R. H. (1955), Myopia and Inconsistency in Dynamic Utility Maximization, in Review of Economic Studies.
Thaler, R. H. (1980), Toward a Positive Theory of Consumer Choic, in Journal of Economic Behavioral and
Organization.
--------- (1999), Mental Accounting Matters, in Journal of Behavioral Decision Making.
Tversky, A. – Kahneman, D. (1981), The Framing of Decisions and the Psychology of Choice, in Science.
--------- (1986), Rational Choice and the Framing of Decisions, in Journal of Business.
Varian, H. (2003), Microeconomia, CaFoscarina, Venezia.
Zaretti, A. (2004), Società del rischio, pace e sicurezza, in Maniscalco, M. L. (a cura di), Opinione pubblica,
sicurezza e difesa europea, Collana CeMiSS, Roma.
22
Scarica

teoria dei giochi e neuroeconomia