TEORIA DEI GIOCHI E NEUROECONOMIA Sommario: Introduzione – 1. Una sotto-periodizzazione e il valore aggiunto della teoria dei giochi – 2. L’apparato concettuale delle teoria: alcuni aspetti essenziali – 2.1 ... L’equilibrio di Nash – 3. Giochi strategici celebri – 3.1 Il “Dilemma del Prigioniero” – 3.2 Il “Chicken game” – 3.3 La “Battaglia dei sessi” – 4. Giochi ripetuti – 4.1 Il meccanismo di soluzione mediante induzione a ritroso – 4.2 Folk Theorem e Tit –for-Tat – 5. I refinements – 5.1 Equilibrio perfetto nei sottogiochi – 6. Applicazioni alla strategia militare – 7. Teoria dei giochi e neuroeconomia. INTRODUZIONE La Teoria dei Giochi (d’ora in poi TdG)1 è un metodo per l’analisi dei processi decisionali dove interagiscono più soggetti. Il suo campo di applicazione è sicché vastissimo: potenzialmente, tutti i contesti decisionali dove ciò che rileva non è solo la propria scelta, ma anche quella altrui. La teoria ha ricevuto nuovi spunti critici da un filone di ricerca recentissimo, la neuroeconomia l’analisi dei fondamenti neurobiologici delle scelte economiche - che va ad ampliare la metodologia alla base dell’esame microfondato delle scelte degli agenti. Recent breakthroughs in neuroscience models and technologies allow us to study in vivo brain activity as individuals solve problems involving tasks such as making choices between alternative actions, forming expectations about the future, carry out plans, and cooperating, producing, investing trading and others. Knowledge on how the brain interacts with its environment to produce economic behaviour will allow social scientist to better understand the variation both within and between individuals’ decision making, and consequently to better predict economic behavior. (McCabe, 2005, p. 294). In tale prospettiva, la neuroeconomia è stata individuata come lo spazio “where psychology and economics meet.” (Chorvat – McCabe – Smith, 2004, p. 16). Si presta di conseguenza all’osservazione delle interazioni strategiche della TdG e all’approfondimento – che inizia con lo studio della psicologia delle preferenze e con gli sviluppi dell’economia comportamentale – dei suoi assunti di base e predizioni. Scopo del lavoro è cogliere le principali interazioni tra TdG e neuroeconomia. Funzionale all’analisi dei suoi innesti della neuroeconomia nella TdG è una breve panoramica di quest’ultima, secondo l’articolazione che segue: si richiamano le origini e l’innovatività della TdG rispetto ad altri approcci più tradizionali della teoria delle decisioni, segnatamente rispetto alla teoria economica neoclassica (punto 1), e le sue principali caratteristiche metodologiche (par. 2). Si ricordano i più famosi giochi strategici (parr. 3 – 3.3), i giochi ripetuti e il meccanismo di soluzione attraverso l’“induzione a ritroso” (punti 4, 4.1, 4.2) per richiamare poi i principali refinements apportati alla teoria (par. 5). Si illustrano talune applicazioni nel campo della sicurezza della TdG (par. 6). Si analizzeranno quindi i maggiori contributi fornitele dalla neuroeconomia (par. 7). 1. UNA SOTTO-PERIODIZZAZIONE E IL VALORE AGGIUNTO DELLA TEORIA DEI GIOCHI L’approccio teorico al gioco, oggi applicato a numerose aree, prende le mosse dai lavori di von Neumann. Egli credeva nella superiorità della ragione e in un modo puramente razionale - senza cortocircuiti mentali o particolari attitudini psicologiche - per affrontare le situazioni importanti della vita. Le sue idee diedero origine ad una branca della matematica efficace per affrontare problemi decisionali, risoluzione dei conflitti, dilemmi sociali. Tali concetti furono ulteriormente sviluppati, con il matematico Morgenstern, in Theory of Games and Economic Behaviour (1947), in cui venivano formalizzate situazioni in campo sociale dove sottostanti all’interazione intersoggettiva agiscono “conflitti di interesse”. La teoria si sviluppa durante la seconda guerra mondiale, soprattutto in USA e in Gran Bretagna, dove un numero rilevante di scienziati ed economisti vennero impiegati negli Stati Maggiori. Si arricchisce negli anni cinquanta, con gli studi di Nash (Nobel dell’economia nel 1994, insignito Per una ottima panoramica della quale si rinvia a Cellini – Lambertini (1996). Gli esempi riportati nel lavoro sono tratti anche da Varian (2003) e Méro (2000). 1 1 insieme ad Harsanyi e Selten); di Tucker (matematico americano, autore del Dilemma del Prigioniero DP); di Luce e Raiffa (che in Games and Theory del 1957 estendono la teoria a contesti decisionali incerti e complessi, popolati da agenti con razionalità limitata); di Schelling, le cui analisi sono pietre miliari nel campo del coordinamento e deterrenza, autore di Strategy of Conflict (1960), premio Nobel per l’economia (2005) insieme ad Aumann. La TdG, se nel suo nascere era servita a chiarire alcuni importanti problemi concettuali ed aveva suscitato non poche aspettative nelle sue applicazioni, in seguito si andò avviluppando in una spirale di sterili elaborazioni astratte (Spaventa, 1989). A partire dagli anni ottanta, si è assistito tuttavia a una sua “seconda giovinezza”, attraverso alcuni affinamenti (refinements) che hanno permesso di ampliarne l’applicazione pratica. Il valore aggiunto rispetto ad altre impostazioni più tradizionali di analisi delle decisioni (quali la teoria del controllo ottimo, originariamente sviluppata nel campo della missilistica) sta nei suoi assunti. L’interazione fra soggetti è sì complessa, ma radicalmente diversa da un congegno che opera in modo deterministico. Il primo assunto della TdG è il riconoscimento di tale interazione, che è da intendersi come: 1) interdipendenza fra soggetti/giocatori; 2) consapevolezza da parte di ognuno di tale interdipendenza reciproca; 3) consapevolezza che gli altri giocatori sono a conoscenza di tale interdipendenza: essa è “conoscenza comune” (common knowledge)2. La natura “strategica” di tale interazione sottende: a) il conflitto di interessi fra giocatori/avversari; b) il tentativo da parte di ognuno di sfruttare tale interazione con l’obiettivo di massimizzare la propria funzione di utilità/propri guadagni (payoffs); c) la razionalità (secondo la nozione di razionalità strumentale, che indica appunto l’obiettivo di ottimizzazione). Il gioco strategico è perciò una situazione interattiva dove due o più avversari si comportano in modo interdipendente e cercano di razionalizzare a proprio vantaggio tale interdipendenza. In questa prospettiva, la tecnica dei giochi è da considerarsi uno strumento conoscitivo e previsivo dei processi decisionali; una prasseologia, logica dell’azione. L’ottimizzazione di ciascuno è sottoposta a vincoli (ottimizzazione vincolata). Alcuni postulati della TdG, sebbene comuni a quelli della teoria economica - razionalità, ottimizzazione, vincoli – sono da interpretarsi in modo più sofisticato proprio per la presenza di tale (consapevole) interdipendenza reciproca. Così l’assunto di razionalità comporta che l’agente non solo ottimizza, ma anche che capisce e prevede la scelta dell’avversario poiché ne ipotizza la razionalità; inoltre, è consapevole che l’avversario sa che egli è razionale: anche l’ipotesi di razionalità è common knowledge3. I vincoli cui è sottoposto il processo di ottimizzazione possono essere articolati in tre categorie (Fiocca, 1994): le prime due comuni alla teoria economica, la terza specifica della TdG in quanto originata dalla consapevole situazione di interdipendenza fra attori. Vincoli esogeni, cioè esterni al soggetto: le condizioni di incertezza al cui interno si contestualizza il processo decisionale; i vincoli informativi (le informazioni sono risorse scarse e costose); i vincoli istituzionali (le opportunità di reddito, il sistema dei prezzi, la regolamentazione e, più in generale, le condizioni di ambiente socio-economico e normativo). Vincoli endogeni, che condizionano le scelte del soggetto dal suo interno: la razionalità limitata à la Simon, in contrapposizione a quella perfetta “onnipotente” dell’economia neoclassica; il background culturale/professionale (sebbene anche questo sia parzialmente condizionato dal fattore istituzionale, cioè dalle opportunità offerte dall’ambiente esterno); una molteplicità di preferenze/sistemi di valori che motivano le scelte e che non sono strettamente riconducibili al proprio diretto benessere (non-selfish motivations); le emozioni. Nella categoria di vincoli endogeni possono includersi anche quelli autoimposti: il soggetto non è un’entità monistica poiché al suo interno giocano una pluralità di motivazioni, obiettivi, forze contrapposte. Questa “pluralità” di soggetti (selves) all’interno dello stesso agente sono interpretabili come altrettanti sistemi di preferenze, che possono tra loro confliggere: 2 E’ la catena di ragionamento che comincia con “Io so che tu sai che io so…”. 3 Per questa maggiore articolazione della nozione di razionalità, taluni preferiscono parlare di “intelligenza” dei giocatori; ma, a prescindere da questioni lessicali, resta il fatto che la TdG richiede una nozione più sofisticata di razionalità rispetto al paradigma economico neoclassico. 2 autoimporsi dei vincoli (self-control) in tale prospettiva è del tutto razionale se ciò serve a guidare i comportamenti e le scelte all’interno di questo sistema di spinte e contro-spinte4. Dopo la teoria della razionalità limitata di Herbert Simon, l’abbandono dell’ipotesi di razionalità perfetta è stata compiuta assumendo che agenti razionali possano “casualmente” commettere errori: nella TdG tale assunto ammette soluzioni di equilibrio quali il trembling hand (Selten, 1975). Ancora, è stata utilizzata una nozione di razionalità evolutiva derivata dalle applicazioni della TdG in biologia: considerando un orizzonte temporale infinito del gioco, allo scopo di determinare la strategia ottimale, gli agenti valutano in ogni periodo l’esito del gioco e confrontano le varie strategie disponibili in base all’utilità che ciascuna di esse fornisce (secondo un processo di trial and error). Se una strategia fornisce un’utilità superiore alla media, nel periodo successivo un maggior numero di agenti la utilizzerà; e viceversa. I soggetti cercano di individuare – e quindi di selezionare – la strategia che prevarrà nel lungo periodo (e che quindi gode di un survival value). L’analisi si concentra dunque sugli aspetti dinamici di tale processo e sull’equilibrio di lungo periodo. Riguardo alle preferenze, se nel paradigma neoclassico sono assunte esogene, nella realtà esse tendono a differire tra soggetti e a riflettere motivazioni diverse: in questa nozione più ampia – oggetto della vasta letteratura dedicata alla psicologia delle preferenze – alcune motivazioni assumono la forma di vincoli comportamentali: l’imperativo kantiano, l’esigenza di guadagnare e tutelare una buona reputazione o di non tradire la fiducia altrui, ecc. E’ un punto ormai consolidato nella teoria economica che tali comportamenti - altruistici o, quanto meno, cooperativi, o risultanti da “codici d’onore” - non possono giudicarsi irrazionali solo perché discordanti dallo stretto paradigma della razionalità strumentale. Max Weber distingueva una razionalità dei valori da quella dei mezzi. I filosofi morali si occupano soprattutto della prima: l’imperativo categorico vi rientra. La TdG si occupa essenzialmente della razionalità dei mezzi - cioè dei metodi per produrre decisioni (da qui la rilevanza della recente nozione di razionalità ecologica di Vernon Smith, premio Nobel per l’economia nel 2002) - sebbene essa debba entrare inevitabilmente anche nel merito della razionalità degli obiettivi allorquando l’ampliamento del sistema dei valori degli agenti li conduce a scelte che cambiano radicalmente il risultato di un gioco. Non è da trascurare neppure l’importanza nei processi decisionali delle emozioni proprie e di quelle dell’avversario, e la convenienza a scandagliare le seconde per proteggere le vulnerabilità proprie e per sfruttare quelle dell’altro. In qualsiasi negoziato, la valutazione di tali aspetti psicologici ed emotivi è cruciale per il successo. C’è da notare che, ancor più della teoria economica, la TdG (soprattutto nei suoi sviluppi più recenti) incorpora questa dimensione del soggettivo - con le sue componenti psicologiche, emotive ed etiche -, il probabilistico e l’incerto, tenendo conto che, come già aveva affermato Aristotele, il La coesistenza di diversi sistemi di preferenze/entità (selves) all’interno di uno stesso soggetto trova interpretazione sia in un contesto statico che dinamico della struttura del soggetto: nel primo, tale pluralità può essere spiegata dalle diverse componenti che operano e interagiscono all’interno del soggetto, secondo propri bisogni, motivazioni, obiettivi tra loro non necessariamente compatibili: tipicamente la razionalità, la parte istintuale, la componente emotiva. In una prospettiva dinamica, la pluralità è vista come l’evoluzione intertemporale delle preferenze soggettive; in tale ipotesi, a ogni sistema contingente di preferenze corrisponde una diversa entità e quindi, in ultima analisi, un soggetto diverso. Già Strotz (1955) aveva osservato che, se le preferenze variano nel tempo, un programma che è ottimale al tempo t, non lo sarà necessariamente al tempo t+1. Per un’analisi più recente, richiamiamo il noto lavoro di Elster (1979), Ulysses and the Sirens. Nel caso di Ulisse, egli ha utilizzato la propria razionalità per prendere le distanze da sé – e, in particolare, da quel sé che lo avrebbe attratto verso le Sirene – mediante un severo sistema di auto-costrizione della sua discrezionalità. Anticipando l’evoluzione delle sue preferenze all’approssimarsi delle Sirene – e quindi il conflitto di obiettivi di breve e lungo periodo (fermarsi/tornare a casa) – la razionalità di lungo periodo ha prevalso, giustificando il sistema di vincoli auto-imposti. Pertanto, l’autoregolamentazione e la riduzione volontaria del libero arbitrio possono trovare piena legittimazione anche sulla base dell’assunto di razionalità di lungo periodo dell’agente economico; in chiave evoluzionistica, con la sua sopravvivenza; in chiave strategica, con la costruzione della propria reputazione. Proprio sotto quest’ultimo profilo, grazie alle valenze di lungo periodo dell’auto-imposizione di regole/vincoli, è interesse della classe politica al governo, il cui obiettivo è ovviamente essere rieletta, investire in politiche aventi ritorni reputazionali, e quindi in primo luogo credibili. Nel caso concreto, ciò può avvenire attraverso la riduzione della discrezionalità degli interventi di politica economica, deferita a certi meccanismi (come gli stabilizzatori automatici, la regola monetaria di Friedman, ecc.) o ad altri organismi, cioè a una terza parte che abbia il potere di punire in caso di violazione dell’impegno a perseguire la politica temporalmente incoerente. 4 3 comportamento umano è determinato dalla combinazione di fattori razionali (calcolo costi-benefici, ecc.), a-razionali (cultura, principi, valori, ecc.) e irrazionali (emozioni). L’importanza delle emozioni nei processi decisionali - e finanche la loro razionalità - vengono rilevate nelle impostazioni più moderne in tutte le discipline dove al centro c’è l’uomo. In senso strategico, la razionalità delle emozioni – sottese ad esempio nell’arrossire come metodo di convogliare informazioni su di sé (sul proprio “tipo”) all’avversario – è stata già suggerita da Frank (1987): dunque anche le emozioni possono essere incluse nell’ampio armamentario a disposizione dell’ottimizzazione secondo il paradigma neoclassico della razionalità strumentale. In tutt’altra prospettiva, Damasio (2004) descrive numerosi esperimenti volti ad analizzare la relazione fra una particolare categoria di emozioni (che egli chiama marcatori somatici)5 e pensiero razionale: senza le prime, il secondo non è in grado di condurre il soggetto alla situazione per lui più vantaggiosa. In tale ottica, gli aspetti emozionali canalizzati nel processo decisionale non sono da considerare un’interferenza fuorviante nelle scelte, originata dall’intreccio fra razionalità limitata, informazione imperfetta, avversione al rischio e pervasività dell’incertezza. Piuttosto, la sfera emotiva, nella sua funzione di linea-guida nelle decisioni, è un indispensabile complemento della razionalità: “una riduzione dell’emozione può costituire una fonte ugualmente significativa di comportamento irrazionale”, osserva Damasio. Vincoli inter-soggettivi: ciascuno, non essendo un’isola/monade – come suppone l’economia classica, che affida alla mano invisibile il compito di coordinare nel mercato le azioni di agenti atomistici -, è consapevole di interagire con gli altri nella platea economica, sociale, politica, ecc., e di produrre quindi un impatto sugli altri (e viceversa), di cui dover tenere conto nelle scelte per l’ottimizzazione. Il contesto sociale influisce quindi sulla razionalità delle scelte, sulla massimizzazione dei benefici/minimizzazione di costi e rischi. Più in generale, ai fini del risultato dell’interazione strategica, il “contesto” – cioè il modo in cui viene percepito l’ambiente esterno - non è “neutrale”6. Come si osserva in una più ampia prospettiva evoluzionistica, “Human evolution can be viewed in terms of the species increasing ability to function effectively within a social context.” (Singer et al., 2004, p. 653). Nei processi decisionali complessi in condizioni di incertezza, la formulazione di un contesto (frame) – ossia del set all’interno del quale il processo si sviluppa – influisce sul modo di processare le informazioni, sulle preferenze e, quindi, sulle scelte e sull’esito del gioco (Tversky – Kahneman, 1986). Quando l’incertezza è pervasiva, un’ampia evidenza empirica mostra che il modo in cui gli individui rispondono ad un problema può dipendere esclusivamente dal modo in cui esso viene illustrato. In altri termini, il framing effect tende a determinare suggestioni, apparenti asimmetrie, una sorta d’illusione ottica che ovviamente non sono neutral1 sul risultato. In laboratorio, ciò dipende da come viene costruito l’esperimento: un modo con cui verificare l’“effetto contesto” è sottoporre ad un gruppo di persone un certo problema di scelta e di darne la descrizione (frame) in due modi diversi; ognuno sarà certamente in grado di comprendere che le due descrizioni sono logicamente equivalenti. Ma se allo stesso gruppo viene presentata separatamente ciascuna descrizione del problema e si lascia intercorrere un certo periodo di tempo tra una descrizione e l’altra - in modo che ne sfugga l’equivalenza logica - esso tenderà a dare risposte differenti in funzione della descrizione7. In laboratorio, il contesto può essere modellato anche attraverso il modo di dare le istruzioni del gioco ai partecipanti; può variare pure in funzione del grado di astrazione della interazione poiché, ad esempio, in un ultimatum game8 fa la differenza Somatici perché riguardano i vissuti corporei, a livello viscerale e non; il termine marcatore deriva dall'idea che il particolare stato corporeo richiamato costituisce una sorta di “contrassegno” o “etichetta”. 6 Tale aspetto veniva già rilevato da Hayek (1952). 7 Classico è l’esperimento condotto da Tversky e Kahneman (1986) - la cd. Asean desease – in cui i partecipanti si confrontavano con due versioni – dalla medesima equivalenza logica - di un problema di scelta in condizioni di incertezza. La versione del problema finalizzata ad elicitare preferenze di avversione al rischio è stata quella scartata dalla maggior parte degli interpellati. Analogo risultato è stato ottenuto nell’esperimento condotto da McNeill et al. (1982), in cui la scelta del trattamento terapeutico (chemioterapia o intervento chirurgico) dipendeva, nelle risposte degli interpellati, dalla descrizione del programma, e cioè a seconda che essi fossero condotti a pensare in termini di probabilità di morte ovvero di sopravvivenza dei pazienti. 8 Nella loro versione più semplice valgono le ipotesi di razionalità ed egoismo da parte dei giocatori. Secondo il primo assunto, ciascun individuo ottimizza - si suppone che massimizzi una funzione di utilità monetaria - consapevole 5 4 confrontarsi come partner con un computer o con un altro individuo. Rileva quindi il meccanismo che attribuisce un diverso grado di “personalizzazione” all’attuazione degli scambi, così come rileva la connessione o la distanza sociale percepita dai due avversari (Forsythe et al., 1994), vale a dire la loro “relazione posizionale”. Dal laboratorio al mondo reale il passo può esser breve. Spesso le tecniche del soft power sono finalizzate a “modellare” le percezioni verso direzioni volute. La comunicazione è un candidato naturale: è un settore in rapidissima espansione, non solo nei tradizionali campi della propaganda e contropropaganda, dell’informazione e della disinformazione, ma anche in quello più complesso della manipolazione simbolica, cioè della modifica dei sistemi di lettura e della griglia di valori dell’opinione pubblica. Per motivi di mercato, le nuove tecnologie audiovisive dei media mirano a soddisfare – più che la domanda di informazione – la richiesta di effetti. Domanda ed offerta di spettacolarizzazione e di emozioni “sintetiche” ben si combinano in tempi di guerra: i razionali rapporti scritti dai corrispondenti di guerra d’un tempo, che collocavano ogni atto nel suo contesto generale, appartengono alle tradizioni culturali del passato. Oggi il colpo di “zoom” crea un framing effect volto a ricostruzioni ad hoc del teatro di operazioni, a letture guidate degli avvenimenti, ad interpretazioni mirate di obiettivi e strategie. Altro esempio emblematico della produzione mediatica di framing effects è dato da al-Qaeda, che attraverso le tecnologie dell’informazione – e del soft power – persegue le proprie strategie e obiettivi politici: la leadership del terrorismo transnazionale di matrice islamica le sfrutta per i comunicati alle reti, ai popoli dell’umma, ai suoi nemici “ebrei, crociati ed apostati”. Una distinzione implicita nell’analisi degli effetti di contesto è tra: (i) come il mondo viene presentato; (ii) come esso viene percepito. Infatti, “gli effetti di contesto possono dipendere dall’esperienza autobiografica” (Vernon L. Smith, 2002, p. 179), cioè da fattori culturali, valoriali ed etici, religiosi, storici, ecc. Da questa seconda prospettiva, una propria percezione del mondo esterno non dipende necessariamente da un particolare modo in cui esso viene costruito: la differenza che qui si vuole cogliere – estremizzandola - è tra manipolazione (appunto il framing effect tradizionale) e automanipolazione; tra inganno e autoinganno. dell’interdipendenza strategica che lo lega all’altro (ottimizzazione vincolata); dal secondo assunto discende che gli argomenti contenuti nelle rispettive funzioni di utilità riguardino il loro stretto benessere e non anche quello dell’altro. In altri termini, non ci sono esternalità reciproche derivanti da preferenze altruistiche. Ne consegue che ciascun giocatore si interessi solo del proprio payoff mentre quello dell’altro lo riguarda esclusivamente nella misura in cui influisce sul proprio, data tale interdipendenza. Pertanto, l’ultimatum game in questa sua versione più semplice è un gioco non cooperativo. Questa condizione è oggetto di conoscenza comune per i due giocatori. I due giocatori (che chiamiamo Proponente e Ricevente, indicati rispettivamente con P ed R) devono dividersi una somma di denaro, la “torta”. Nella versione one-shot game, P ne propone la ripartizione, R deve limitarsi ad accettare l’offerta o a rifiutarla ponendo in ogni caso fine al gioco; in altri termini, non può lanciare una controproposta. Nel caso rifiuti, entrambi i giocatori non ricevono nulla; diversamente, la somma risulterà divisa secondo la scelta operata da P. Una vasta letteratura – si veda, ad esempio, Rubinstein (1982) - dimostra come, in giochi non ripetuti, per agenti razionali con funzioni di utilità di questo tipo esista un unico equilibrio di Nash, secondo cui R accetta ed ottiene una minima quantità di denaro (la minima unità di conto), dato che questa è pur sempre preferibile a niente. Il Proponente applica, infatti, l’induzione a ritroso al problema decisionale affrontato dal Ricevente e, così ragionando, giunge alla conclusione che qualsiasi guadagno è pur sempre meglio di zero dal punto di vista del Ricevente. Tale risultato sottende un’interazione “priva di emozioni”, in cui cioè P non prova alcun senso di colpa e/o pudore nel fare un’offerta à la Nash ed R nessun senso di indignazione e/o invidia di fronte tale sperequata proposta. L’economia sperimentale, tuttavia, accumula evidenze che la funzione di utilità è più articolata di quella corrispondente al paradigma neoclassico e che essa contiene anche argomenti non monetari collegati, nella specie, ad un senso di equità (fairness). Nel mondo reale, gli individui non reagiscano solo in base a criteri di razionalità così strettamente definiti nell’homo economicus, bensì sulla base di un trade-off tra il proprio consumo e un senso generale di giustizia. In presenza di preferenze con avversione all’iniquità, essi possono decidere di “punire” la controparte – rinunciando di conseguenza alla propria quota - qualora questi non faccia delle proposte sufficientemente corrette. Un’analoga esigenza di giustizia tende a motivare le scelta del Proponente, pur beneficiando di un vantaggio strategico rispetto all’altro: l’evidenza in laboratorio illustra che il giocatore nel ruolo di Proponente si limita a chiedere per sé solo il 50-60% della “torta”. Pertanto, per formulare correttamente il comportamento dei due giocatori, occorre considerare una funzione di utilità uniperiodale che non includa come unica variabile esplicativa il denaro (M), ma anche l’esigenza di equità (F) che nell’allocazione proposta deve trovare una risposta soddisfacente. E = E (M, F) 5 I soggetti - soprattutto in condizioni d’incertezza o in contesti decisionali complessi, rischiosi e/o in evoluzione - commettono errori di valutazione; esprimono tratti comportamentali per loro stessi fuorvianti, come una “superfiducia”; procedono per tentativi; utilizzano euristiche (rules of thumb ). Esattamente come in natura l’evoluzione e l’adattamento avvengono non secondo un processo lineare, ma attraverso la discontinuità di un incessante groping, trial and error. Così, la percezione del rischio non deriva esclusivamente da fattori oggettivi, ma dalla combinazione fra il dato oggettivo e gli elementi soggettivi. Essa crea una determinata “relazione posizionale” fra il soggetto e il fattore esterno. Si configura così un “crocevia” tra le varie classi di vincoli sopra indicate, dove esse si sovrappongono senza una precisa soluzione di continuità. Un esempio evidente di tale simultaneità proviene dall’attuale pericolo di terrorismo. La percezione di vulnerabilità da parte dell’opinione pubblica è infatti molto maggiore di fronte ad un evento altamente improbabile ma catastrofico, rispetto all’incidente ad elevata frequenza (ogni anno, sulle strade statunitensi, muoiono mediamente 40.000 persone, a fronte delle 3.000 vittime dell’11/9. Cfr. Sandler, 2003; Sandler-Enders, 2004). Un’indagine di opinioni condotta sulla popolazione italiana documenta che il rischio maggiormente temuto oggi è l’attacco terroristico. Il terrorismo transnazionale preoccupa in quanto minaccia affatto inedita che ne rende difficile la comprensione basata sui tradizionali schemi di riferimento già esperiti dal Paese durante i periodi più oscuri di eversione del terrorismo ideologico.9 Secondo le linee interpretative degli autori della ricerca, l’idea dell’incombenza di un pericolo viene socialmente costruito secondo un processo complesso dove – paradossalmente – le stesse misure di contrasto e prevenzione vengono percepite e utilizzate come indicatori di magnitudo della minaccia. La pervasività dell’incertezza, in altri termini, tende a distorcere l’assegnazione da parte dei soggetti della distribuzione di probabilità associata all’evento terroristico, persino in presenza di una riduzione oggettiva del rischio derivante dalle azioni di contrasto. Anche la fear economy trova terreno di cultura in questa interazione (sintetizzabile nel clima di fiducia degli operatori) fra condizioni di incertezza dell’ambiente, meccanismi mentali ed aspettative. Che il filtro della percezione soggettiva interpreti anche i vincoli che condizionano il soggetto dall’esterno (prima e terza categoria sopra indicate) riceve un’ampia conferma: da quella più consolidata – come l’illusione monetaria, l’effetto ricchezza, l’illusione fiscale di Puviani – a quella relativamente più recente, ma altrettanto nota, fornita dall’economia dell’incertezza - dall’effetto dotazione (Thaler, 1980) alla contabilizzazione mentale (Tvesky-Kahneman, 1981), distorsione da status quo (SamuelsonZeckauser, 1988), ecc. 2. L’APPARATO CONCETTUALE DELLE TEORIA DEI GIOCHI: ALCUNI ASPETTI ESSENZIALI Gli elementi costitutivi di un gioco sono sintetizzabili nel set delle regole – generalmente assunte come common knowledge - con cui vengono specificati l’insieme di partecipanti (giocatori-avversari); la loro struttura delle preferenze (“tipo” di giocatore); la lista di strategie disponibili a ciascuno; i possibili payoff (tipicamente espressi in termini di utilità o di valori monetari). Secondo la natura delle interazioni fra i partecipanti, la classificazione di base è tra giochi non cooperativi - di cui la TdG prevalentemente si occupa - e giochi cooperativi10. Fra i primi, un’ulteriore classificazione si fonda sull’ammontare e sulla distribuzione tra gli avversari dei payoffs: a) giochi a Cfr. Zaretti (2004). primi sintetizzano dinamiche per cui ciascun soggetto persegue il proprio interesse senza considerare guadagni/perdite altrui. Nei secondi, i soggetti si coalizzano assumendo reciproci impegni; la questione centrale non è più cercare di anticipare la mossa dell’altro, bensì come ripartirsi il surplus derivante dalla cooperazione. 9 10I 6 somma variabile (come il DP); b) a somma costante11. Sotto il profilo informativo, si distinguono i giochi ad informazione (im)perfetta e ad informazione (in)completa12. Il contesto informativo può essere parzialmente dedotto anche dalla rappresentazione del gioco, nella forma strategica (o normale) - costituita da una matrice (dei payoffs o delle vincite) - ovvero in quella estesa. La seconda – tramite l’“albero del gioco” - mette in risalto sia le informazioni di cui i giocatori dispongono al momento di muovere, sia la sequenza (temporale o logica) delle loro mosse. L’esito del gioco coincide con l’equilibrio quando ciascuno adotta la strategia migliore, quella selezionata sulla base della scelta razionale. Ma poiché l’ottimizzazione di ciascuno sottende l’interdipendenza che si instaura, la scelta migliore per ognuno coincide con la “risposta migliore” (“best reply”) all’altro. Nel caso di informazione imperfetta - il giocatore non conosce la mossa dell’altro -, la sua decisione migliore viene formulata sulla base dell’aspettativa che anche l’avversario scelga la strategia migliore. Ciò conduce ad una nozione fondamentale della TdG….. 2. 1 … L’EQUILIBRIO DI NASH Due avversari - A e B - che giocano senza conoscere la mossa dell’altro combinano una coppia di strategie che è un equilibrio di Nash (EN) quando la scelta del giocatore A è ottima, data la scelta di B, e la scelta di B è ottima, data la scelta di A13. Se i soggetti “giocano al buio” - non comunicano, né usano altro tipo di coordinamento – e giocano simultaneamente, l’equilibrio si realizza attraverso le aspettative reciproche: sebbene nessuno dei due – quando decide la propria strategia – sappia quello che farà l’altro, entrambi formulano una qualche aspettativa a proposito della scelta dell’avversario ovvero, equivalentemente, riguardo alla sua razionalità. Ciascun giocatore si attende, infatti, che l’avversario sceglierà la strategia migliore/razionale: anche attraverso il “velo” dell’informazione imperfetta, i giocatori sono capaci di pensare e vedere le mosse degli avversari. Pertanto, l’EN può essere interpretato come una coppia di aspettative circa la strategia/razionalità dell’altro: esso è quindi Nei primi, l’ammontare complessivo del payoff varia in corrispondenza di ciascun esito del gioco; negli altri indipendentemente dal mix di strategie selezionate - la somma algebrica dei payoffs complessivi a disposizione degli agenti rimane invariata, mentre ne muta l’allocazione fra giocatori in funzione dell’esito del gioco. Tale gioco non soltanto è non cooperativo, ma è anche fortemente conflittuale poiché ciò che guadagna uno è esattamente pari a ciò che perde l’altro (secondo la logica “mors tua, vita mea”). 12 In un contesto ad informazione perfetta il giocatore, in ogni istante del gioco, è interamente a conoscenza dell’intera sequenza di mosse effettuate dagli altri, cioè d ella storia del gioco. I partecipanti, se scelgono simultaneamente, se non comunicano e se non hanno assunto accordi reciproci ex ante, non conoscono come sta procedendo il gioco, che è quindi ad informazione imperfetta. Nell’ipotesi di informazione completa, gli agenti conoscono le regole del gioco (la sua struttura), cioè il numero e l’identità dei giocatori, le strategie a disposizione di ciascuno e i payoff. In tutti i contributi più recenti, il concetto di informazione (in)completa è stato rivisto, introducendo la “Natura”, un giocatore speciale che può influenzare i risultati degli altri, ma non viceversa. In tale prospettiva, un gioco è ad informazione completa quando la Natura non gioca per prima, ovvero la sua mossa è osservata da tutti. 13 Con la strategia dominante ogni giocatore dispone di una scelta ottima, quale che sia la mossa dell’altro. Vale a dire, se in un gioco vi è una strategia dominante per ciascun giocatore, questa è sempre la strategia migliore, indipendentemente dalla scelta altrui. L’adozione da parte di ciascuno della propria strategia dominante – con lo scato di quelle strettamente o debolmente dominate - portano alla soluzione di “equilibrio con strategie dominanti”. Nella matrice riportata, per qualunque scelta di B, A otterrà sempre il payoff più alto (2) giocando “Basso”, e quindi la sua scelta sarà sempre questa. E per qualunque scelta di A, B otterrà sempre il payoff più alto (1) giocando “Sinistra”. 11 Sinistra Giocatore B Destra Alto 1, 2 0, 1 Basso 2, 1 1, 0 Giocatore A Gli equilibri con strategia dominante sono assai graditi - in quanto semplificano la vita - ma non frequenti: è raro confrontarsi con una scelta che sia la migliore a prescindere da tutto il resto. Essendo un’ipotesi forte, è anche irrealistica. Proprio per questo la TdG si occupa molto poco – quale caso speciale – di questo tipo di equilibri. 7 predicibile. Un modo alternativo per definirlo è che, una volta conosciuta la decisione dell’avversario, nessuno dei due giocatori desidera cambiare la propria scelta nella fase post-decisionale: l’equilibrio di Nash è anche stabile14. Le principali questioni connesse all’EN sono che : a) esso non è Pareto-efficiente (esempio, il DP); b) può esserci più di un equilibrio (ad esempio, giochi di tipo “Chicken” e la “Battaglia dei Sessi”); c) l’equilibrio può non esistere affatto (il gioco dà luogo a preferenze cicliche)15; d) può non essere verosimile (ad esempio nel gioco del Centipede); e) l’esito cambia a seconda che si tratti di: i) one-shot games ovvero ii) repeated games (con un numero finito o indefinito/sconosciuto di tornate). 3. GIOCHI STRATEGICI CELEBRI Ci si limita a richiamarne tre: 3.1 IL “DILEMMA DEL PRIGIONIERO” 14 Nella matrice precedente, si ipotizzi che i due giocatori non comunichino e che giochino simultaneamente. Giocatore B Sinistra Destra Alto 6, 6 10, 3 Basso 5, 7 4, 8 Giocatore A Guardando il gioco dalla prospettiva di B, egli si rende conto che se il giocatore A: 1) decide per la strategia “Alto”, a lui converrà giocare “Sinistra”; 2) decide per la strategia “Basso”, a lui converrà “Destra”. La scelta di ciascuno dipende dunque da quella dell’altro. Il passo successivo è domandarsi quale sia la scelta ottima per entrambi. “Alto/Sinistra”, corrispondente al payoff (6, 6), che è infatti un equilibrio di Nash. Infatti, il giocatore B capisce che ad A conviene optare per la strategia “Alto”: se B giocasse “Sinistra”, ad A converrebbe “Alto”; così pure, se B giocasse “Destra”, all’altro converrebbe “Alto”. Attesa/data la scelta di A – “Alto” – la mossa migliore per B è “Sinistra” e attesa/data la scelta di B – “Sinistra” – la migliore strategia per A è giocare “Alto”. L’esito (6, 6) soddisfa pertanto la definizione di equilibrio di Nash. Per una contro-prova, si consideri l’esito (4, 8). Esso non è un equilibrio di Nash poiché, alla fine del gioco, quando diventa nota la scelta di entrambi, c’è un rimpianto post-decisionale: A se avesse saputo che B avrebbe giocato “Destra”, avrebbe scelto “Alto”; ma, in tal caso, anche B non avrebbe confermato la scelta precedente, bensì preferito “Sinistra”. Quindi, c’è la tendenza da parte di entrambi a muoversi verso un'altra configurazione del gioco. Solo in corrispondenza dell’esito (6, 6), ognuno confermerebbe la propria scelta anche ex post. 15 Un gioco in cui non esiste o non è verosimile l’equilibrio di Nash può essere risolto utilizzando le strategie miste. Un giocatore utilizza una strategia pura se le sue azioni sono dettate da un principio unico, tale che, in situazioni identiche, da quel principio segue sempre la stessa azione. Ciascun giocatore, scelta la propria strategia, vi si attiene rigidamente una volta per tutte. L’imperativo kantiano può essere considerato una strategia pura. Nella strategia mista, il giocatore assegna una distribuzione di probabilità alle strategie pure. L’equilibrio di Nash con strategie stocastiche si riferisce alla soluzione in cui ciascun giocatore sceglie la “frequenza ottima” per le proprie strategie, date le frequenze – ottime - scelte dall’altro. Il giocatore A per esempio potrebbe scegliere di giocare per il 50% Basso, e B potrebbe fare la stessa cosa per Sinistra e Destra. Considerando la matrice dei payoff che segue: Sinistra Giocatore B Destra Alto 0, 0 0, -1 Basso 1, 0 -1, 3 Giocatore A i giocatori avranno una probabilità di ¼ di collocarsi in ciascuna delle quattro caselle della matrice payoff. Quindi il payoff medio di A sarà 0 e quello di B ½. Nella matrice, l’equilibrio di Nash, benché non esista nelle strategie pure, esiste in quelle miste (se A gioca Alto con probabilità ¾ e Basso con probabilità ¼, mentre B gioca Sinistra con probabilità ½ e Destra le altre volte, si ottiene un equilibrio di Nash. A prima vista, può apparire bizzarro che un soggetto abdichi al proprio potere di scelta per affidarsi al caso. Ma si è già accennato che può essere perfettamente compatibile con l’assioma di razionalità ottimizzante il fatto che egli operi un’autorestrizione delle proprie scelte. 8 Esso è senz’altro il più noto e ricorrente nella vita di tutti. E’ stato definito l’“osso di gomma” della TdG; lo si può “masticare” all’infinito: matematici, economisti, politologi, psicologi, filosofi lo hanno esaminato e tuttavia rimane misterioso ed affascinante (Méro, 1996). Il suo nome è dovuto ad Albert Tucker, che nel 1951 lo illustrò appunto come detective story. La situazione è nota. La polizia arresta due complici che hanno effettuato una rapina, ma non vi sono prove sufficienti per incriminarli. La polizia può solo condannarli per un reato minore (es. detenzione d’armi da fuoco); ovvero, può ricorrere a un’adeguata strutturazione del sistema di incentivi e punizioni che solleciti una loro confessione - “incastrandosi” così a vicenda - quando verranno interrogati in celle separate. Secondo tale struttura – molto simile a quella che si utilizza nei confronti di potenziali “pentiti” - la polizia propone a ciascun criminale che, denunciando il proprio compagno, lasceranno immediatamente libero lui e condanneranno l’altro a 10 anni di reclusione. Tale offerta è tuttavia valida solo nel caso che l’altro non confessi (non collaborando a fare chiarezza sul caso): se anche questi confessasse, ognuno rimarrà in carcere per 5 anni. Naturalmente – la polizia avverte - se nessuno confessa, non saranno condannati se non per la pena minore di detenzione d’armi (1 anno di reclusione). La polizia informa pure ciascuno di loro che la medesima offerta è stata fatta anche all’altro (la struttura dei payoffs è common knowledge)16. Attraverso tale meccanismo - che mette a nudo il conflitto di interessi fra i due giocatori - la polizia riesce a ottenere che ciascuno persegua il comportamento razionale: confessare/non cooperare, cioè tradire l’altro17. Ed ecco quindi la grande contraddizione del Dilemma: la defezione, razionale a livello individuale, non porta alla migliore delle soluzioni disponibili, mentre la decisione “solidale”/“cooperativa” diventa irrazionale per chi la compie, perché penalizzante – a meno che non sia garantita da una risposta reciproca. Il “paradosso della cooperazione” trova spiegazione razionale nel DP: quanto più gli altri cooperano, tanto più è vantaggioso non cooperare (free-riding). Per inciso, il DP è concettualmente analogo al “dilemma della sicurezza”, la cui logica illustra le meccaniche interne della corsa agli armamenti, nelle classiche forme conosciute nei secoli XIX e XX. In sintesi: a) la scelta cooperativa sarebbe la migliore (Pareto-efficiente); b) la cooperazione unilaterale è però molto rischiosa; c) poiché maggiore è l’attitudine di un giocatore a cooperare, maggiore è la convenienza/l’incentivo dell’avversario a non farlo (free-riding). Situazioni di intrappolamento in un DP si riscontrano in un gran numero di esperienze sociali, politiche e strategiche. Da qui il conseguente problema di introdurre meccanismi che inducano a cooperare in modo da ottenere un risultato socialmente migliore. A livello di intera società, l’esigenza di creare sistemi che inducano alla cooperazione si concretizza in strutture ad hoc o in istituzioni che garantiscano la reciprocità delle aspettative di fiducia e il loro adempimento. Situazioni dilemmatiche che mettono in luce l’esigenza di fiducia e affidabilità nei comportamenti richiedono “costruzioni istituzionali” per indurre ad adottare scelte cooperative. L’implicazione istituzionalista della TdG è applicata alla realtà socio-politica, alla competizione economica e al settore militare. Tale razionalità può essere il frutto di accordi impliciti o espliciti (come quelli che prevalevano fra il Cremlino e la Casa Bianca nella Guerra Fredda ed esemplificati dalla “linea rossa” costruita fra le Sotto il profilo informativo, il DP è quindi un gioco a informazione imperfetta e completa. Nella matrice che segue, i payoffs sono in termini di anni di carcere (preceduti dal segno negativo ad indicare la disutilità): 16 17 Giocatore B Giocatore A Confessare Non Conf. Confessare -5, -5 0, -10 Non Conf. -10, 0 -1, -1 Poiché tale strategia è adottata da entrambi - ipotizzando entrambi razionali - la soluzione di equilibrio del DP (equilibrio di Nash) sottende la defezione da parte dei due giocatori. In tal modo, essi ottengono una soluzione congiunta (-5, -5) molto meno conveniente di quella a cui sarebbero approdati se si fossero aiutati a vicenda (“non confessando”): entrambi, infatti, sarebbero stati prosciolti dal reato di rapina, rimanendo in carcere solo 1 anno per detenzione d’armi (-1, -1). Tale esito, Pareto-efficiente, conseguibile esclusivamente attraverso la cooperazione reciproca. 9 due potenze dopo la crisi dei missili di Cuba nel 1963). Essi rendono prevedibile il comportamento avversario e, mediante la comunicazione diretta, riducono la possibilità di errori di interpretazione e di “disturbi” che rendono poco trasparenti le decisioni contrapposte. Tale razionalità può essere ulteriormente garantita dall’esistenza di un terzo che funga da arbitro, oppure dalla presenza di istituzioni internazionali (ONU, WTO, ecc.) che creino un incentivo a cooperare e definiscano le regole per la cooperazione. Come si è osservato, la presenza di valori di natura etico-morali nelle preferenze dei giocatori può modificare la predizione generale circa l’esito del DP. Al riguardo si richiamano due direzioni di approfondimento, in parte connesse fra loro. Il primo è l’esistenza di vincoli “morali”: se nella struttura delle preferenze dell’individuo sono inclusi anche dei (taciti e/o endogeni) vincoli morali/codici d’onore, secondo cui “confessare”/“tradire” è moralmente riprovevole, il risultato che emerge è di natura cooperativa, Pareto-efficiente. Ovvero, si può ipotizzare la presenza di accordi ex ante (“pre-play communication”): l’esito del gioco rispetto alla predizione generale cambia a seconda che vi siano stati fra i complici degli accordi sul comportamento da assumere nei confronti della polizia in caso di cattura (naturalmente, “negare” di aver compiuto il reato di rapina). Il passo successivo è considerare il grado di cogenza di tali accordi: (i) se l’accordo è ritenuto vincolante - in base alla parola data o ad una minaccia credibile (“Nash threat”) - allora ognuno sceglierà la strategia di non tradire, raggiungendo un esito del gioco Pareto-efficiente; (ii) se al momento di “salvare la pelle”, i giocatori non mantengono l’impegno assunto – l’accordo non era che un “cheap talk” -, il gioco conduce al tradizionale EN. 3.2 IL “CHICKEN GAME ” Il “gioco del pollo” è stato introdotto da P. M. Blackett (autore di uno dei primi studi sulle conseguenze politiche dell'arma atomica e premio Nobel per la Fisica nel 1948), che lo ha descritto in occasione della 2^ guerra mondiale e della deterrenza nucleare. Esso si traduce in una prova di forza, cioè in un braccio di ferro con un’escalation. E’ pertanto particolarmente adatto a spiegare situazioni di natura militare e di sicurezza. Nel vulgata la descrizione dell’interazione fra i giocatori si ispira al film “Gioventù bruciata” (1955). Lo scenario è quello di due ragazzi che si sfidano guidando automobili lanciate una contro l’altra a gran velocità in una strada di periferia, sotto gli occhi di un pubblico di fans. Colui che per primo sterza dalla traiettoria rettilinea per evitare lo scontro frontale è il “codardo” (il “pollo”). Vincerà quello che non deflette dalla decisione di andar dritto anche a costo della collisione, sperando naturalmente che l’avversario sterzi. Per indurre quest’ultimo a farlo tramite l’intimidazione, egli dovrà mostrarsi irreversibilmente obbligato a non sterzare, ad esempio bloccando lo sterzo: togliendosi ogni altra scelta, realizza la deterrenza. Ciò è il tradizionale “bruciarsi i ponti alle spalle”18. L’altro guidatore/giocatore che, spaventato da tale risolutezza, sterzerà per primo per evitare un frontale, sarà il perdente, additato a disprezzo del gruppo. Se entrambi, impauriti, sterzano, il gioco finisce pari (1, 1). Bruno Andrea Dritto Sterza Dritto -3, -3 2, 0 Sterza 0, 2 1, 1 La strategia del “bruciarsi i ponti alle spalle”, seguita ad esempio dai kamikaze, è vecchia quanto il Nuovo Mondo. Si narra infatti che i Conquistadores, appena toccata terra, avessero bruciato le proprie navi con il duplice intento di automotivarsi nel combattimento per la sopravvivenza contro gli indigeni e, quindi, di effettuare un signalling intimidatorio contro questi ultimi. 18 10 Ma non si può escludere la soluzione più rovinosa, cioè che lo scontro ci sia (-3, -3): esso non sarebbe necessariamente frutto di irrazionalità, ma probabilmente di un calcolo soggettivo che ha messo al primo posto la “reputazione” presso il pubblico. In questo gioco, esistono due equilibri di Nash: (0, 2) e (2, 0), e non si può predire quale dei due prevarrà. Dipende dal “potere contrattuale” dei due. L’unica possibilità per la cooperazione bilaterale (1, 1) si realizza – mediante un bluff - se ognuna delle parti segnala chiaramente all’altra che la cooperazione da parte propria è fuori questione. Il giocatore che non sa assumersi il rischio del risultato peggiore è certamente perdente in giochi di questo tipo. “Reputazione”, “minaccia”, “deterrenza” sono concetti fondamentali nella TdG, come lo furono per la deterrenza nucleare reciproca fra i due blocchi nel corso della guerra fredda. Apparentemente banale, questo gioco è molto frequente nella vita reale - dal campo economico a quello militare e della sicurezza - per interpretare sia “situazioni complesse” sia giochi con “attori complessi”. Ad esempio, il chicken game viene spesso utilizzato per descrivere i vantaggi della cooperazione nei contesti di negoziazione internazionale in campo commerciale: il fallimento della V Conferenza Ministeriale del WTO a Cancun (settembre 2003) è interpretabile con la circostanza che nessuna delle due parti – il Nord e il Sud del mondo – abbia “sterzato”, determinando così la rottura del negoziato. Pure con un chicken game vengono spiegate tanto l’entrata in guerra dell’Inghilterra, in quanto Churchill lo riconobbe nella strategia di Hitler, che la crisi dei missili di Cuba. In entrambi i casi, il gioco rappresenta un “braccio di ferro”, fondato sulla credibilità dell’escalation. Ciò che rende poi istruttiva la storia del “gioco del pollo” è l’effetto tremendamente semplificante per interpretare l’azione di “attori complessi”. E’ il caso del terrorismo e della criminalità organizzata transnazionale, in cui i fattori in gioco sono numerosi e le asimmetrie fra i “giocatori” influenzano le valutazioni. Il terrorismo georeligioso di matrice islamica, ad esempio, sfrutta le asimmetrie provenienti dal suo stesso bagaglio morale-religioso rispetto al background dell’avversario. Tali asimmetrie vengono manipolate e trasformate in punti di forza e vantaggi competitivi: “La mia vita è un’arma” è l’eloquente titolo di un libro di Christoph Reuter. Ciò – ancora una volta – illustra l’importanza dei fattori psicologici e l’essenzialità della comprensione delle culture spesso molto diverse dalle proprie. Basti ricordare la diversa capacità di assorbire perdite e distruzioni e le asimmetrie profonde nell’accettazione dei livelli elevati di rischio per le organizzazioni verticali (“piramidi”) e per quelle orizzontali (“reti”). Gli aspetti psicologici del confronto fra le “piramidi” e le “reti” assumono quindi importanza centrale per ogni decisione. Il potere del chicken game risiede nel fatto che, paradossalmente, esso è in grado di dimostrare che talvolta l’unico comportamento razionale, cioè quello che porta al risultato migliore, è l’“irrazionalità”, o meglio l’invio all’avversario di “segnali” in grado di inibire la sua scelta (allo scopo di farlo “sterzare” e, quindi, da indurlo alla scelta cooperativa). Come Hermann Kahn scrive in On Escalation: “…il giocatore “abile” entra in automobile ubriaco, gettando le bottiglie di whisky fuori dal finestrino per far conoscere a tutti il suo stato di ubriachezza. Indossa occhiali da sole molto scuri in modo tale che sia evidente che la sua capacità visiva è alquanto limitata, se non addirittura nulla. Non appena la vettura raggiunge un’alta velocità, prende il volante e lo getta fuori dal finestrino. Se il suo avversario non sta guardando, allora sorge qualche problema; così pure se entrambi i giocatori applicano questa stessa strategia”. (Cfr. Méro, 2000, p. 86). Pertanto, la suddetta strategia serve allo scopo – ed è quindi razionale: più “irrazionalmente” si gioca, più probabile è la vittoria. In pratica, in tale gioco, la decisione finale, benché sia una sola (“andare dritto” o “sterzare”), può essere preceduta da una sorta di “preludio” più o meno lungo, in grado di influire in modo determinante sull’esito del gioco. Se uno dei due riesce a convincere l’altro – inviandogli messaggi ad hoc e, quindi, segnalando la sua determinazione - che non si ritirerà in nessun caso, allora quest’ultimo sarà costretto a farsi da parte per evitare il peggio. Il segnale più efficace durante il preludio è quello che 11 riesce a persuadere l’altro che si è pronti a tutto pur di vincere, “costi quel che costi”. Le armi della persuasione in tale fase sono molteplici: si possono sintetizzare con l’espressione “bruciarsi i ponti dietro” - che sta a indicare l’irrevocabilità della propria decisione - ovvero segnalando all’avversario che “tipo” di giocatore si è (“dimmi che tipo sei e ti dirò che gioco fai”) si potrebbe sintetizzare19. 3.3 LA “BATTAGLIA DEI SESSI ” O “Gioco delle coppie” serve a rappresentare le molte situazioni in cui i soggetti - pur avendo preferenze diverse - cercano di coordinare le proprie azioni: il coordinamento dà un valore aggiunto alla loro azione, sebbene ognuno debba sacrificare qualcosa in termini di preferenze. Nell’esempio canonico, una coppia – A e B - deve programmare il tempo libero (uno preferirebbe andare allo stadio, l’altro all’opera). Benché abbiano gusti diversi, entrambi saranno disposti a sacrificare la propria preferenza piuttosto che trascorrere il pomeriggio separatamente (con corrispondenti payoffs 0, 0). Come nel chicken game, anche in questo caso, ci sono due equilibri di Nash: (5, 4) e (4, 5). A priori non è possibile predire quale dei due verrà selezionato: dipenderà da chi dei due è disposto a sacrificare le proprie preferenze. B A Calcio Opera Calcio 5, 4 0, 0 Opera 0, 0 4, 5 In questo “gioco di coordinamento”, l’equilibrio selezionato dipenderà: 1) dall’esistenza e, 2) dal tipo di meccanismo di coordinamento. Nell’esempio, un tipo di coordinamento potrebbe basarsi sul galateo. Coordinamento e cooperazione sono concetti diversi, dove il primo è sostanzialmente “ancillare”, strumentale all’altra. L’esigenza di strumenti di coordinamento è correlata positivamente alle dimensioni e complessità della comunità di giocatori, all’eterogeneità delle loro preferenze – e quindi alla varietà di “tipologie” di attori -, all’imprevedibilità dei loro comportamenti e decisioni, ecc. Un coordination failure – che può derivare da una molteplicità di motivi, soggettivi (ad esempio, la razionalità Se non si hanno segnali nel “preludio” del gioco, come nel caso di un chicken game, né accordi, il giocatore può utilizzare alcune particolari criteri-guida nella scelta della strategia, che porteranno a esiti diversi dai due possibili equilibri di Nash: i criteri del Maximin (“massiminimo”) e del Maximax. La loro diversità riflette le attitudini psicologiche degli avversari – il loro grado di pessimismo/ottimismo – e la loro attitudine al rischio – avversione/attrazione per l’azzardo. Le soluzioni di equilibrio nel chicken game – ma, anche in termini più generali, le strategie che sottendono all’equilibrio di Nash - non prendono in considerazione motivazioni di prudenza. Al contrario, gli esperimenti empirici danno conto di tale attitudine dei giocatori. L’agente, in caso sia pessimista o avverso al rischio, utilizzerà il criterio del Maximin. Egli considera quale è l’esito peggiore (il payoff minore) in corrispondenza di ogni possibile scelta e opterà per quella che lo condurrà al “migliore degli esiti peggiori”. Pertanto, il criterio fondamentale che informa il comportamento degli agenti è quello di garantirsi un risultato non inferiore al proprio livello di sicurezza, definito come il “massimo dei minimi risultati” (Maximin) che ogni agente può garantirsi indipendentemente dalle scelte effettuate degli avversari. Tale strategia esprime quindi un trade-off tra ottimizzazione e sicurezza del risultato. Se entrambi si comportano allo stesso modo prudenziale (ad esempio, “Sterza”/”Sterza”), il risultato è rovesciato rispetto alle aspettative (“Dritto/”Dritto”): invece che nella situazione “meno peggio”, gli avversari si ritrovano la migliore situazione collettiva (nella precedente matrice che rappresentava il chicken game, il risultato sarà quindi (1, 1)). Nel caso sia ottimista/amante dell’azzardo, il giocatore è fiducioso del verificarsi del migliore dei mondi, cioè che l’altro “sterzi”. Se entrambi hanno la stessa attitudine, emergerà il risultato peggiore, specularmente opposto alle loro aspettative 19 12 limitata) ed oggettivi (carenze nella dotazione istituzionale) – può pregiudicare la scelta cooperativa. In particolare, l’assenza di coordinamento può derivare dalle medesime situazioni sottostanti al dilemma del prigioniero ed al free-riding. Il “paradosso del coordinamento” sta ad indicare quella situazione per cui tutti ritengono utile il coordinamento, ma nessuno vuole farsi coordinare dagli altri20. I market failures dimostrano la difficoltà di disporre di una “mano invisibile” che riesca a coordinare situazioni non cooperative, come quelle di mercato. Moltissimi sono i meccanismi di coordinamento nella vita reale: dalle convenzioni sociali ed il linguaggio al codice della strada. Anche il processo di institutions-building e una determinata dotazione istituzionale all’interno di una collettività trovano giustificazione nell’esigenza di tali meccanismi di coordinamento e nelle preferenze da parte della collettività verso alcuni di essi. La TdG è servita e può servire - in ambito filosofico, ma anche economico – a spiegare la nascita delle istituzioni sociali. Così un classico della filosofia, Convention: A Philosophical Study (1969) di David Lewis, prende le mosse dagli argomenti di Thomas Schelling21. In un gioco ripetuto, si potrà stabilire tra i partecipanti – più o meno implicitamente – un accordo che prevede l’alternanza (nell’esempio precedente, oltre al galateo, si potrebbe decidere un avvicendamento settimanale dei programmi). Il genere di equilibrio che scaturisce dal meccanismo dell’alternanza viene definito in letteratura focal equilibrium, un equilibrio che nasce spontaneamente – quindi anche quando i soggetti non comunicano tra loro - poiché riflette il senso comune. Più in generale, il focal point di Schelling (1960) è un esito del gioco che si impone all’attenzione dei giocatori per alcune sue peculiarità all’interno della matrice dei payoff, e che spinge i giocatori a scegliere spontaneamente proprio le strategie che danno luogo a un equilibrio così peculiare. In contesti decisionali complessi con informazione imperfetta e in cui non esiste possibilità di accordi fra i soggetti che interagiscono, il punto focale costituisce un elemento attrattivo fra i giocatori, assolvendo così la funzione di segnalazione e coordinamento. Tutte le opzioni (strategie) alternative vengono scartate a favore di quella più “attraente”, cioè di quella “saliente”, come è stata denominata da Schelling. Poiché, verosimilmente, ognuno decide secondo questo stesso criterio-guida, le scelte di tutti convergeranno verso quel punto, dal quale emergerà un focal equilibrium. Tutti i fattori che differenziano sono potenziali punti focali proprio in virtù della capacità d’attrazione esercitata. Se la strategia vincente è quella che trova maggior consenso ed esiste un punto focale, allora “scommettere” sul punto focale accresce la probabilità di vincere. Il processo si autoalimenta attraverso le aspettative – sul fatto che anche gli altri facciano la stessa cosa – che si autorealizzano. E il punto focale – la “scelta saliente” - diventano così centro di aggregazione e common knowledge. Riecheggiano le dinamiche sottostanti al famoso “concorso di bellezza” illustrate da Keynes nella sua Teoria generale dell’occupazione, dell’interesse e della moneta (1936), che racchiude la spiegazione di molti fenomeni di massa. Egli suggerì che l’operatore di borsa dovrebbe adottare il comportamento di un lettore che partecipa a un gioco a premi, indetto da un giornale, che consiste nello scegliere la foto della donna più bella: vince chi sceglierà quella che riceve il maggior numero di preferenze da parte dei lettori. Se una candidata fosse nettamente più bella, vi sarebbe un punto focale necessario. Ma è raro che il compito del lettore sia così facile; lo stesso concorso non avrebbe ragione di essere. Di conseguenza, la scelta razionale di ciascun partecipante deriva - più che dall’espressione delle proprie preferenze – dalla previsione delle preferenze altrui e dalla tendenza a conformarvisi: la strategia dell’imitazione, cioè di prevedere la moda statistica delle scelte e di uniformarvisi, aumenta infatti la probabilità di successo della propria scelta. Nella necessità di scommettere “al buio” su quello che preferiscono gli altri, una qualche peculiarità nell’oggetto di scelta – capace di attrarre l’attenzione della massa - può diventare un criterio-guida. Basti pensare ad esempio alle difficoltà incontrate, anche in tale settore, nei processi di peace-building, dove la “multinazionalizzazione” degli interventi politico -militari implica una pluralità degli attori coinvolti, la differenza di ruoli, vocazioni e meccanismi decisionali. 21 Considerando altre applicazioni, in economia industriale la strategia di divisione del mercato fra due imprese rivali ha come fondamento questo tipo di gioco, così come situazioni in cui i produttori di due beni complementari devono scegliere quale standard qualitativo adottare in modo da renderli compatibili. 20 13 La “scelta saliente” di Schelling può anche spiegarsi in termini di “accessibilità” di un pensiero, secondo il significato attribuito da Higgins (1996) e ripreso da Kahneman (2002). Il pensiero intuitivo, essendo spontaneo, è di facile accesso (al contrario, quelli “inaccessibili” rimangono cristallizzati nell’inconscio). Pertanto, una scelta saliente è in qualche modo assimilabile ad un pensiero intuitivo. E, più in generale, maggiore è l’accessibilità di un oggetto, di una motivazione o di un gusto, maggiore è la vocazione di questi a diventare elementi salienti della scelta. Nella stessa vena, la decisione intuitiva rappresenta la scelta saliente. Osserva Kahneman, i decisori esperti – costretti costantemente a decidere sotto pressione – raramente devono scegliere fra opzioni poiché, nella loro mente tende a presentarsi un’unica opzione; cioè le altre non vengono nemmeno rappresentate, rendendo così più efficiente il processo decisionale. 4. GIOCHI RIPETUTI Nela vita reale, i soggetti: a) non si incontrano una volta sola (one-shot game), bensì l’interazione si ripete nel tempo, in una pluralità di incontri; b) non scelgono simultaneamente (giochi sequenziali). I giochi ripetuti incorporano elementi di informazione derivanti da due fonti, strettamente collegate: 1) l’apprendimento e l’esperienza acquisiti nel corso dei rounds; 2) gli aspetti psicologici dei rivali, cioè le informazioni sulle loro preferenze (“tipo”) che emergeranno con la ripetizione del gioco (reputazione). Riguardo agli aspetti psicologici, con i giochi ripetuti la teoria è in grado di giustificare anche la razionalità di comportamenti di cooperazione e di altruismo o quelli punitivi; l’instaurarsi di rapporti di fiducia e di reciprocità, la credibilità dei giocatori, ecc. 4. 1 IL MECCANISMO DI SOLUZIONE MEDIANTE “INDUZIONE A RITROSO” E IL SUO FALLIMENTO In un gioco non cooperativo - tipo DP – ripetuto più volte, un giocatore può decidere di cooperare per costruirsi la “reputazione” di soggetto leale, in modo da sollecitare la cooperazione altrui e raggiungere un risultato per lui più vantaggioso. Un meccanismo-chiave per la soluzione del gioco ripetuto è l’“induzione a ritroso” (backward induction, chiamato anche algoritmo di Kuhn (1953): tale meccanismo conduce a un esito del gioco diverso – cooperazione/non cooperazione - a seconda che il gioco abbia un orizzonte temporale finito (e noto), ovvero un orizzonte temporale indefinito (o comunque non noto ai giocatori). Nel primo caso, l’equilibrio coincide con quello del gioco one-shot22. 4.2 FOLK THEOREM E TIT-FOR-TAT In un gioco non cooperativo ripetuto un numero indefinito/sconosciuto di volte, il risultato può essere invece diverso, portando alla soluzione cooperativa23. L’idea che situazioni conflittuali possano condurre alla cooperazione fra gli individui affonda le radici nella filosofia, in particolare con Hobbes (1651) e Hume (1740). Poiché la relazione fra individui può sintetizzarsi nel noto “homo homini lupus”, in termini di TdG il comportamento di ciascun giocatore si fonda sulla strategia non cooperativa, che si concretizza nel risultato Pareto-inefficiente. Seguendo Hobbes, per evitarlo, occorre la presenza In un gioco ad esempio con 10 rounds, gli avversari si proiettano alla fine del gioco e ripercorrono a ritroso la sua sequenza. Poiché nell’ultimo round non c’è alcun vantaggio nel cooperare (non c’è futuro del gioco) e ciascu n giocatore si aspetta che anche l’altro farà lo stesso tipo di ragionamento, al decimo round entrambi tradiranno (giocare per l’ultima volta è come giocare una volta sola). Sulla base di tale aspettativa, non ci sarà alcun incentivo a cooperare neppure nel penultimo round; se ciascun giocatore si aspetta che al nono round non c’è alcun incentivo a cooperare da parte dell’avversario, non c’è ragione c’è di cooperare all’ottavo round … e cosi via, il gioco si dipana all’indietro e ciascuno sceglierà di non cooperare fin dalla prima mossa. Possono presentarsi casi in cui l’applicazione del criterio di backward induction conduce ad equilibri poco credibili sul piano fattuale. Il gioco del Centipede, che è l’esempio più noto, mostra i limiti di un’applicazione rigida dei criteri di soluzione a volte predetti dalla TdG. 23 Un one-shot game, quando dà un risultato diverso nella sua versione ripetuta, prende il nome di supergame. 22 14 di un’autorità esterna che punisce chi tradisce/defeziona; si giustifica così la presenza di un meccanismo esogeno, quale il Leviatano. Per Hume, poiché la vita è un “gioco ripetuto”, la cooperazione di ciascuno è da considerarsi una sorta di investimento sociale in reputazione, che indurrà gli altri a ricambiare tale comportamento. In questo caso, la cooperazione – intesa come scambio - insorge spontaneamente/endogenamente all’interno della collettività. Il folk theorem mostra che anche i giochi di natura non cooperativa, se ripetuti in un orizzonte temporale infinito possono dar luogo alla cooperazione implicita tra giocatori. Esso ipotizza che il first mover (B) adotti una strategia cooperativa. Quest’ultima può assumere valore segnaletico sul suo “tipo”; è, quindi, interpretabile come un investimento iniziale in reputazione – analogo al processo di accumulazione in stock di capitale umano -, destinato tuttavia a trasformarsi in un sunk cost qualora l’altro giocatore (A) scelga comunque di non cooperare. Quest’ultimo deve di conseguenza decidere se reciprocare la mossa cooperativa di B. Il teorema sottende un confronto intertemporale, operato dal secondo giocatore A, fra le due strategie disponibili, cooperare/non cooperare. Ovviamente, non deve trattarsi di preferenze “genuine” verso una buona reputazione e a favore della cooperazione ma di un calcolo meramente strategico, poiché A è in grado di anticipare che se non reciproca la cooperazione di B, questo a sua volta defeziona, portando entrambi ad un equilibrio di Nash. Pertanto, al tempo t, il giocatore A se defeziona, ottiene un vantaggio incrementale (rispetto all’adozione di un comportamento cooperativo), determinato dalla cooperazione unilaterale da parte dell’altro giocatore B. Tuttavia, in ogni periodo successivo, egli subirà una perdita (derivante dal fatto che l’avversario lo costringerà all’equilibrio di Nash). Quindi, A dovrà attualizzare le perdite future derivanti dalla defezione utilizzando un tasso di 1 α= (1 + r ) , è minore sconto intertemporale r; ipotizzando 0 < r < 1, il fattore di sconto intertemporale, di 1. Nell’analisi intertemporale costi-benefici,al giocatore A conviene adottare la strategia non cooperativa quando privilegia i vantaggi attuali del free-riding senza annettere particolare rilievo alle perdite future: ciò a dire, quando il tasso di sconto intertemporale, r, è “abbastanza elevato” e il fattore di sconto α , conseguentemente, piccolo; più elevato r, più basso è l’onere connesso alle perdite future derivanti dalla mancata cooperazione reciproca. In tal senso, il tasso di sconto intertemporale è un parametro cruciale per verificare se i meccanismi reputazionali possono portare a esiti efficienti del gioco nel lungo periodo. Un tasso di sconto temporale iperbolico – che mira a soddisfare i benefici immediati - sottende, di conseguenza, il disinteresse del soggetto a costruirsi una reputazione nel tempo24. Il limite della strategia sottesa dal Folk Theorem è che il soggetto sceglie una volta per tutte, cioè non ha margini di flessibilità in un suo eventuale ripensamento sulla strategia scelta. Un limite, questo, superato dal Tit-for-Tat. In termini formali, ciò è stato dimostrato da Robert Axelrod (1984), politologo dell’Università del Michigan, con la strategia Tit-for-Tat (“colpo su colpo”), la cui filosofia di base è “Occhio per occhio, dente per dente”. Tale strategia è molto semplice e si sintetizza nel seguente algoritmo: “Coopera nella prima tornata; poi copia la mossa che l’avversario ha effettuato nel round precedente”. Si tratta di una strategia molto efficace – poiché il tradimento viene immediatamente punito; ma è anche leale – poiché se chi ha defezionato torna a cooperare, la strategia “occhio per occhio” lo ricompenserà con la cooperazione da parte dell’altro: cioè, il gioco dà la possibilità a chi ha tradito di “rifarsi una reputazione”. Poiché non è noto - ovvero è indefinito - il numero di tornate, tale meccanismo permette di conseguire un risultato efficiente nel caso di “Dilemma del Prigioniero”. 5. I REFINEMENTS La nozione di sconto temporale iperbolico prevede che gli individui si comporteranno impulsivamente ogni qual volta si confronteranno con una combinazione di incentivi che comporta benefici e costi immediati. 24 15 Per acquisire ulteriori informazioni sugli equilibri di Nash – in particolare quando essi sono più di uno – ed anche per approfondirne taluni aspetti e superare la scarsa verosimilità di alcune predizioni, nella storia più recente della TdG sono stati formulati degli affinamenti. Ci si limita ad elencarne alcuni fra i più noti25: equilibrio perfetto nei sotto-giochi (subgame perfection); coordinamento tramite focal equilibrium; trembling hand, che mette a fuoco il trade-off fra ottimizzazione e prudenza; razionalità sequenziale. 6. APPLICAZIONI ALLA STRATEGIA MILITARE Per quanto sopra detto, un ampio settore della TdG si applica ai problemi di strategia militare, sia nella fase di preparazione delle forze che nel corso delle operazioni. In particolare, mediante tale approccio si integrano giochi di strategia, teorie della negoziazione, teoria della comunicazione e percezione collettiva. Le tecniche dei giochi in situazioni politico-strategiche complesse offrono spunti interpretativi sui processi decisionali degli avversari e sul tema della dissuasione e coercizione, direttamente collegato a quello della “minaccia”. La minaccia realizzata sia con la public diplomacy, sia con la “politica delle cannoniere”, usuale nel periodo della “pax britannica” del XIX secolo (oggi con l’attacco preventivo codificato nella National Security Strategy, approvata dal Presidente Bush il 20 settembre 2002), è la tecnica o la mossa che in maniera più netta mette in luce la logica dell’interdipendenza fra giocatori. Ogni minaccia contiene un implicito invito alla trattativa. Perciò molti esperti strategici sostengono che la disponibilità di bombe e ad attaccare sono anche messaggi – sicuramente meno “carini” delle note diplomatiche – che hanno almeno due significati. Il primo è la minaccia di un uso di bombe o di un attacco successivo; il secondo è l’invito a trattare per accettare le condizioni di pace che si vogliono imporre. Ma i termini esatti del possibile accordo rimangono incerti: ciascuna delle controparti conosce – almeno entro dati limiti - le proprie risorse e margini di rischio, mentre è incerta su quelli dell’avversario. Il gioco della minaccia strategica è l’aggiustamento reciproco a questo rischio critico, oltre il quale i due avversari (o uno dei due) cedono o entrano effettivamente in guerra impiegando le armi per tentare reciprocamente di imporre la propria volontà con la prova di forza. L’esito della trattativa – ovvero, la soluzione del gioco della minaccia – dipende da fattori che precedono e da fattori che si creano nella situazione stessa. Di importanza cruciale è la “credibilità” della minaccia. Senza di essa, anche la potenza militare più grande non ha effetto alcuno, cioè viene neutralizzata. Ciò dimostra, ancora una volta, l’essenzialità dei fattori psicologici e la necessità di valutare quelli dell’avversario, oltre che, beninteso, quelli propri. La guerra è il campo non solo del complesso, ma anche dell’imprevisto e del discontinuo. Non esistono regole; ciascun contendente cerca di imporre le proprie. Tende sempre a colpire di sorpresa i punti deboli dell’avversario; essi si rendono visibili in quanto fatti emergere con manovre preparatorie (anche di natura meramente psicologica-comunicativa) e colpiti prima che l’avversario possa reagire per difenderli. La logica dei giochi mantiene la sua validità, come strumento euristico per esaminare le interazioni (o “incroci”) fra le strategie seguite dai due avversari, ma sempre completata da strumenti e apparati metodologici più complessi e sofisticati che incorporano l’asimmetria, il qualitativo, il soggettivo, l’incertezza e la probabilità soggettiva attribuita ai vari eventi, primi fra i quali le decisioni dell’avversario. 7. TEORIA DEI GIOCHI E NEUROECONOMIA L’analisi microfondata dei processi decisionali, oltre che avvalersi dell’economia comportamentale – e, nelle sue verifiche empiriche, di quella sperimentale – si sta ulteriormente sviluppando mediante lo studio dei meccanismi neurali – l’attivazione delle diverse aree del cervello – coinvolti nei processi decisionali. 25 Per un approfondimento dei quali si rinvia a Cellini-Lambertini (1996). 16 La stessa nozione di razionalità rinvia preminentemente ad una questione metodologica. Piuttosto che un problema di perseguimento di obiettivi – o di quali obiettivi; più che un problema di anticipare le mosse altrui (come richiede la nozione più sofisticata di razionalità usata nella TdG), il focus dell’analisi della razionalità diventa la ricerca delle regole ottime da utilizzare nel processo decisionale – una prospettiva, questa, che privilegia l’idea della razionalità procedurale. L’ottimizzazione, sia che guardi agli obiettivi della scelta sia che guardi ai meta-obiettivi degli strumenti per la scelta, comunque si confronta con dei vincoli. In quest’ultimo caso si tratta di un’ottimizzazione vincolata delle regole adottate nel processo decisionale. I nuovi contributi a questo tipo di analisi tornano indietro agli argomenti di Herbert Simon e procedono inglobando strumenti tecnologicamente avanzati. Uno dei moderni “ritrovati”, che ingloba argomenti robusti à la Simon e metodiche tecnologicamente avanzate, è la nozione di razionalità ecologica formulata dal premio Nobel per l’economia, Vernon Smith (2002). L’ordine razionale, egli osserva, è una sorta di ecosistema. Esso rappresenta una stratificazione che emerge da processi evoluzionisti culturali e biologici del soggetto. Proprio perché conseguenza di una stratificazione non pianificata – e neppure coeva – la razionalità ecologica non pretende di raggiungere l’ottimizzazione di un risultato quanto, esattamente nella stessa vena di Herbert Simon, un’ottimizzazione vincolata nell’uso delle regole per le decisioni. I vincoli a cui si allude riguardano i costi dell’attività cognitiva per la formulazione della decisione. Tali costi, a loro volta, rinviano a fattori oggettivi – come l’acquisizione delle informazioni rilevanti – e a fattori soggettivi – i meccanismi mentali di cui si serve l’individuo nel processo decisionale. La razionalità ecologica e la ricerca neurale (attraverso la tecnologia dell’imaging cerebrale) sottendono perciò forti connessioni. Poiché l’adozione di regole per la scelta sconta un’analisi continua di costi-benefici nell’attività cognitiva (a causa delle risorse limitate oggettive e soggettive); poiché l’output neurale è diverso a seconda degli stimoli e delle aree cerebrali utilizzate per lo specifico problema decisionale, ne consegue che: (1) non esiste una ricetta univoca di elaborazione delle decisioni (la modelizzazione artificiale e stilizzata non è dunque un buon sostituto degli “ambienti naturali” delle scelte (Chorvat-McCabe, 2004); (2) il cervello deve operare selettivamente, un’idea che si riallaccia a quelle dell’“accessibilità”, dell’intuizione e della scelta saliente (punto 3. 3). Richiamando gli argomenti sviluppati separatamente da Higgins, Kahneman e Schelling all’analisi neurale, si pongono due questioni: come il cervello opera tale selezione e, una volta che questa è avvenuta, quali meccanismi neurali vengono utilizzati per la solizione del problema decisionale (Chorvat-McCabe, 2004). Sembra – come suggeriscono Chorvat e McCabe – che il cervello non usi modelli generali (costosi nella gestione e non sempre adattabili agli specifici problemi decisionali), ma abbia aree dedicate (“tissued structured for solving [specific] problems”, p. 115) o si serva di una sorta di algoritmi per formulare una decisione (Camerer et al., 2004). Inoltre, la ricerca nel campo della neuroscienza cognitiva suggerisce che il medesimo problema può essere affrontato con due approcci: non necessariamente mediante un calcolo volto ad individuare la scelta migliore (come invece prevede la TdG), ma anche impulsivamente. Questi differenti metodi di soluzione del problema – calcolo vs. impulso – sono localizzati in regioni distinte del cervello, e la ricerca si sta occupando di come avvenga la scelta di un meccanismo piuttosto che un altro. Nella prospettiva della razionalità ecologica e del suo deferire ai meccanismi neurologici, diventa quindi difficile per ciascuno predire i processi decisionali degli altri soggetti economici/giocatori poiché non sembrano esistere processi decisionali standard, stilizzabili. Essi sono piuttosto la sintesi di attività neurali “discontinue” e “confliggenti”, in cui interviene anche l’area affettiva/emotiva. Così come trova evidenza empirica mediante il monitoraggio dell’attività neurale che il contesto all’interno del quale si sviluppa il processo decisionale ha un impatto significativo sul modo in cui i meccanismi neurali si attivano per la soluzione del problema (Chorvat-McCabe, 2004). Sebbene si sappia ancora poco sul modo in cui l’attività neurale si incanali in una decisione o formi un precetto categoriale, la neuroscienza ha scoperto che il cervello non “fa una media”, cioè non integra le varie – o persino discordanti - informazioni provenienti dai diversi gruppi di neuroni. 17 L’individuo, al contrario, seleziona una fonte sopprimendo l’altra, secondo una sorta di algoritmo “chi vince piglia tutto” (Camerer et al. 2004). Pertanto, l’estrazione neurale del segnale risulta completamente biased a favore di certi neuroni – e certe informazioni – privilegiando così gli aspetti di efficienza nell’incipit dell’azione e/o dell’elaborazione di un concetto, piuttosto che indugiare sulla scelta fra le diversi opzioni; proprio a causa di questa discontinuità nell’aggiornamento dei dati, lo svantaggio è che il processo di apprendimento - ovvero la formulazione di convinzioni - procede a salti. In tale prospettiva, possono essere spiegati anche fenomeni quali il framing effect e il fenomeno del preference reversal , esaminato tra i primi da Lichtenstein e Slovic (1971). Inoltre, nel processo decisionale subentrano parti confliggenti. Ad esempio, nell’esperimento neurologico dell’ultimatum game, si è osservato che le motivazioni trovano una localizzazione in diverse aree cerebrali26 e che nel processo decisionale vengono eventualmente “mediate” da altre aree. Infatti, nel conflitto tra la parte razionale/cognitiva – la corteccia prefrontale dorsolaterale, che è una regione coinvolta nelle attività di pianificazione, esecuzione, ecc., e che indurrebbe ad accettare offerte compatibili con l’equilibrio di Nash – e la parte emotiva – tramite l’insula – interviene a mediare nel processo decisionale un’altra area – il giro del cingolo anteriore. Si sta rafforzando l’idea fra neuroscienziati e psicologi che il sistema affettivo convogli al soggetto una segnalazione-informazione grezza prima ancora che il suo sistema cognitivo abbia elaborato lo stimolo in modo compiuto. Un’idea molto simile, dunque, a quella dei “marcatori somatici” formulata da Damasio. Assolvendo – per mezzo dell’amigdala (situata al di sotto in profondità della corteccia cerebrale) - un ruolo cruciale nella motivazione e quindi nell’azione dell’individuo (Frijda, 1986), l’affetto/emozione ha una funzione primaria nelle scelte e quindi nei comportamenti economici e non27. Come suggerito da Damasio, il lato affettivo-emotivo diventa complemento o succedaneo – è difficile stabilire la natura della relazione – della razionalità economica basata su canoni strettamente definiti (logico-cognitivi). La comprensione dei processi decisionali altrui un’ulteriore difficoltà: nell’abilità soggettiva di inferire su quanto gli altri credono, sentono e potrebbero fare. Si tratta di una capacità ad hoc, chiamata “mentalizzazione” o “lettura della mente”, situata nella corteccia prefrontale (Baron-Cohen, 2000). Una attitudine per così dire “limitrofa” è la capacità di avvertire empatia verso gli altri (Singer-Fehr, 2005). La mentalizzazione e l’empatia – due filoni recenti nella ricerca delle neuroscienze sociali – sebbene facciano riferimento a circuiti neurali differenti, mettono entrambe in condizione un individuo di rappresentare e predire gli stati altrui (intenzioni, obiettivi, convinzioni, sensazioni ed emozioni, ecc.). Gli esperimenti sull’empatia indicano che alcuni circuiti affettivi del cervello sono attivati automaticamente quando si prova dolore e quando gli altri provano dolore, sebbene tale capacità sia soggettiva e la risposta empatica muti in funzione della relazione posizionale fra soggetti. Pertanto, una carenza – del tutto plausibile – nell’abilità del giocatore di comprendere gli stati altrui e/o di provare empatia non trova un perfetto succedaneo nelle sue capacità logico-deduttive. In chiave di TdG, le implicazioni sono numerose. In un contesto di informazione incompleta in cui cioè un giocatore è incerto sulle caratteristiche (modellate sulle preferenze) dell’altro, le congetture sul “tipo” di avversario non possono essere facilmente derivate dal solo calcolo di tipo bayesiano, a causa dell’estrazione del segnale neurologico che è molto articolato e complesso e dipende dalla capacità di leggere la mente degli altri28. “Unfair offers elicited activity in brain areas related to both emotion (anterior insula) and cognition (dorsolateral prefontal cortex). Further, significantly heightened activity in anterior insula for rejected unfair offers suggests an important role for emotions in decision-making.” (p. 1755). 27 Lo psicologo Zajonc (1980, 1984, 1998) ha illustrato nei suoi esperimenti come spesso gli individui siano in grado di identificare la loro risposta affettiva – positiva o negativa – verso qualcosa prima ancora di capire cosa sia; vale a dire, il momento cognitivo e successivo a quello affettivo. Ad esempio, possiamo avere un ricordo piacevole di un libro o di una persona senza riuscire a ricordare altri particolari. Lungo lo stesso filone, altri ricercatori hanno scoperto che il cervello umano cataloga affettivamente quasi tutti gli oggetti e concetti e che tali “etichette” riappaiono senza alcuno sforzo alla mente appena vengono rievocati gli oggetti, i soggetti e i concetti ad esse associati. 28 La regola di Bayes è la base dei moderni sistemi di inferenza probabilistica. In particolare, in un contesto di informazione incompleta, gli agenti – i giocatori – se non hanno conoscenze dirette sul “tipo” di avversario (ad esempio, per l’impresa che vuole entrare sul mercato, se il monopolista che vi opera sia forte), devono ricorrere al calcolo probabilistico per formulare le proprie congetture sul tipo di avversario (le probabilità soggettive di un individuo sono anche chiamate “credenze”). In altri 26 18 Riguardo all’empatia, l’attitudine ad essa e la sua intensità influenzano non solo la possibilità di comprendere ed anticipare le strategie altrui, ma anche la scelta di cooperare, pure nelle circostanze in cui la cooperazione è la strategia dominata. Soluzioni “anomale” del dilemma del prigioniero (non ripetuto o con un numero finito/conosciuto di tornate) o dell’ultimatum game trovano così nelle neuroscienze nuove conferme e spiegazioni. La stessa ipotesi di razionalità come common knowledge ha dei forti limiti sotto il profilo neurologico. Se non c’è una nozione univoca di razionalità e se la scelta razionale ingloba componenti affettive/emotive, il ragionamento logico-deduttivo non è sufficiente a predire la scelta dell’altro. Corollario è che persino la predizione dell’equilibrio di Nash non è necessariamente valida, pur ricorrendo ai canonici postulati della teoria., così come la soluzione attraverso il meccanismo di backward induction nei giochi ripetuti. Se la stessa teoria ha riconosciuto i limiti di alcune sue predizioni (si richiama il gioco del Centipede), la mentalizzazione e l’empatia – quali specifiche doti soggettive – aggiungono ulteriori elementi di complessità nelle soluzioni dei giochi rispetto a quelle predette dalla TdG. Ancora a proposito della cooperazione e dei suoi modi di comunicarla all’avversario, si ricorda la rilevanza dell’espressioni facciali e degli involontari segni delle proprie emozioni. L’importanza sotto il profilo strategico delle emozioni – richiamiamo le implicazioni nell’interazione strategica dell’arrossire, suggerite da Frank, per segnalare determinate emozioni – mette in rilievo il ruolo di queste ultime per veicolare informazioni all’avversario sul proprio “tipo”. Il valore e l’efficacia della “segnalazione emotiva” trovano evidenza empirica nelle neuroscienze, in particolare negli studi che focalizzano le caratteristiche del viso dell’avversario salienti per l’interazione strategica. Il grado di attrattività, di affidabilità, l’identità razziale, ecc., assolvono un ruolo nell’elicitazione della cooperazione, anche senza ricorrere ad un calcolo per individuare la strategia ottimale (Singer et al., 2004). Sempre in teme di scelta (non-)cooperativa, le conseguenze future del proprio comportamento – rilevanti nei giochi ripetuti – sembrano dovute alla corteccia prefrontale, una struttura cerebrale che è prerogativa solo della specie umana (Camerer et al., 2004). La scelta intertemporale può essere ricondotta alla combinazione di due processi – uno affettivo ed impulsivo (e, in questo senso, “miope”); l’altro più orientato al lungo periodo e quindi più lungimirante. In particolare, nel Folk Theorem, la scelta la cooperativa o la scelta del free-riding (avvalersi della cooperazione unilaterale da parte dell’altro) – è affidata al calcolo basato sul tasso di sconto intertemporale. La scelta di defezionare può essere il frutto dell’applicazione del tasso iperbolico volto alla gratificazione immediata, che è “miope” in un gioco con termini, dire che gli altri giocatori formulano congetture/credenze sul “tipo” T significa dire che essi assegnano delle distribuzioni di probabilità sul “tipo” di avversario. Non avendo informazioni dirette, essi ricaveranno le proprie congetture osservandone le mosse. In termini più rigorosi, ipotizziamo che un agente abbia una probabilità soggettiva a priori P(A) sul verificarsi di un certo evento A; sia B un evento non stocasticamente indipendente da A; se l’agente osserva il verificarsi dell’evento B, aggiornerà la sua probabilità soggettiva sul verificarsi dell’evento A. Se, in particolare, si interpretano gli eventi B1, B2,..., Bn come possibili cause del verificarsi dell’evento A, l’espressione P(Bk/A) rappresenta la probabilità che la causa del verificarsi dell’evento A sia l’evento Bk. A titolo di esempio, consideriamo un medico che conosca i sintomi di una certa patologia e cioè che, per la malattia Bk, egli conosca la probabilità che quella malattia abbia A come uno dei suoi sintomi (il medico conosce P(A/Bk)). Il problema che si presenta al medico è di conseguenza calco lare – ogni qualvolta un paziente accusa il sintomo A – la probabilità che il sintomo A sia determinato dalla patologia Bk per ogni K = 1, 2, ..., n. La regola di Bayes serve proprio a calcolare la probabilità che il verificarsi dell’evento A sia determinato dall’evento Bk. Ritornando al precedente esempio del monopolista, permette di formulare al potenziale entrante la congettura che il monopolista, facendogli la guerra, sia un “tipo” forte. Tale meccanismo costituisce di conseguenza uno strumento di segnalazione: come gli avversari cercheranno di estrarre il maggior numero di informazioni su T dalle sue mosse durante lo sviluppo del gioco (“estrazione del segnale”), così T sceglierà delle mosse che segnalino la sua natura (beninteso, potrebbe anche barare nell’invio del segnale). Pertanto, da parte di T, si ha un invio del segnale attraverso le sue mosse; da parte degli avversari, si ha una ricezione del segnale. Dunque, la formula di Bayes ha una forte valenza segnaletica. In un gioco ripetuto, la credenza che il giocatore ha sull’avversario T può essere rivista ad ogni round. Quindi, in un gioco ripetuto, la probabilità condizionata descrive la variazione di credenze all’accumularsi delle evidenze disponibili. Cioè, il meccanismo bayesiano incorpora un pro cesso di revisione delle credenze, esattamente come avviene per gli agenti economici con aspettative razionali. L’aggiornamento bayesiano delle probabilità di eventi causali in presenza di nuove informazioni può risultare tuttavia semplicistico quando teniamo conto che tale meccanismo può sopperire solo in parte ad una eventuale lacuna della mentalizzazione, e di conseguenza può portare a delle credenze errate. 19 un numero infinito di tornate.. Tuttavia, la questione è più complessa in una prospettiva di neuroeconomia poiché il meccanismo di sconto temporale iperbolico poggia, almeno in parte, sulla competizione tra sistema affettivo e quello cognitivo. Non necessariamente un’appropriata combinazione di incentivi sarà determinante quindi nell’opzione della gratificazione immediata; saranno piuttosto i fattori che rafforzano l’uno o l’altro meccanismo a produrre nelle persone scelte più o meno impulsive. CONCLUSIONI La metafora del gioco è talmente robusta nello spiegare le interazioni sociali che essa va progressivamente espandendosi nei suoi campi di applicazione. In questo suo percorso – attraverso un processo di trial and error – trova sempre nuove complessità e nuovi arricchimenti. Il riconoscimento dei suoi limiti – anche mediante le tecniche più avanzate per la verifica empirica – presuppone non un abbandono del “gioco”, ma una nuova ricerca. Mariateresa Fiocca Esperto Secit Ministero dell’Economia e delle Finanze 20 BIBLIOGRAFIA Camerer, C. – Loewenstein, G. – Prelec, D. (2004), Neuroeconomia, ovvero come le neuroscienze possono dare nuova forma all’economia, in Rivista de Il Mulino, n. 3. Cellini, R. - Lambertini, L. (1996), Una guida alla teoria dei giochi, Clueb, Bologna. Chorvat, T. – McCabe, K. (2005), Neuroeconomics and Rationality, in Chicago-Kent Law Review. Chorvat, T. – McCabe, K. – Smith, V. (2004), Law and Neuroeconomics, Law and Economics Working Paper Series, George Mason University, Fairfax, Virginia, USA. Colombo, F. (2003), Introduzione alla teoria dei giochi, Carocci, Roma. Damasio, A. (2003a), L’errore di Cartesio. Emozione, ragione e cervello umano, Adelphi, Milano (sesta ed.). ------- (2003b), Alla ricerca di Spinoza. Emozioni, sentimenti e cervello, Adelphi, Milano, 2003. Ecchia, G. – Gozzi, G. (1992), Scelta, mercati e benessere, Il Mulino, Bologna. Elster, J. (1979), Ulysses and the Sirens, Cambridge University Press, Cambridge (Mass.). Fehr, E. – Fischbacher, U. – Kosfeld, M. (2005), Neuroeconomic Foundations of Trust and Social Preferences, Discussion Paper n. 1641, IZA, Bonn. Fiocca, M. (1994), From Endogenous Contraints to Economic Results. The Passage Through Morality, Uncertainty and Strategies, Dartmouth, Aldershot. Frank, r. h. (1987), If Homo Economicus Could Choose His Own Utility Function, Would He Want One with a Conscience?, in American Economic Review. Forsythe, R. – Horowitz, J. L. – Savin, N. E., Sefton, M. (1994), Fairness in simple bargaining experiments, in Games and Economic Behavior. Hayek, F. A. (1952), The Sensory Order, University of Chicago Press, Chicago. Hey, J. (1993), Rationality is as Rationality Does, in Gerrardd, B. (ed.), The Economics of Rationality, Routledge, Londra e New York. Higgins, E. T.(1996), Knowledge Activation. Accessibility, applicability, and Salience in Higgins, E. T Kruglanski, A (eds.), Social Psychology. Handbook of Basic Principles, Guilford Press, New York. Lewis, D. (1969), Convention. A Philosophical Study, Harvard University Press, Cambridge (Mass.). Lichtenstein, S. – Slovic, P. (1971), Reversal of Preferences Between Bids and Choices in Gambling Decisions, in Journal of Experimental Psychology. Kahneman, D. (2002), Mappe di razionalità limitata. Indagini sui giudizi e le scelte intuitivi, in Motterlini, M. – Piattelli Palmerini, M. (a cura di), (2005), Critica della ragione economica, il Saggiatore, Milano. Kording, K. P. – Fukunaga, I. – Howard, I. S. – Ingram, J. N. – Wolpert, D. (2004), A Neuroeconomics Approach to Inferring Utility Functions in Sensorimotor Control, in PLoS Biology. McCabe, K. (2005), Neuroeconomics, George Mason University, Fairfax, Virginia, USA. McNeill, B. J. – Pauker, S.G. – Sox, H. C. – Tversky, A. (1982), On the Elicitation of Preferences for Alternative Therapies, in New England Journal of Medicine. Méro L. (2000), Calcoli morali. Teoria dei giochi, logica e fragilità umana, Edizioni Dedalo, Milano. Rubinstein, A. (1982), Perfect Equilibrium in a Bargaining Model, in Econometrica. Rusconi, G. E. (1984), Scambio, minaccia, decisione. Elementi di sociologia politica, Il Mulino, Bologna. Samuelson, W. - Zekauser, R. (1988), Status Quo Bias in Decision Making, in Journal of Risk and Uncertainty. Sandler, T. (2003), Collective Action and Transnational Terrorism, Research Paper 2003/13, University of Nottingham. Sandler, T. – Enders, W. (2004), An Economic Perspective on Transnational Terrorism, in European Journal of Political Economy. Schelling, T. (1960), The Strategy of Conflict, Harvard University Press, Harvard. Selten, R. (1975), Re-examination of Perfectness Concept for Equilibrium Points in Extensive Games, in International Journal of Game Theory. Singer, T. – Feher, E. (2005), The Neuroeconomics of Mind Reading and Empathy, Discussion Paper n. 1647, IZA, Bonn. Singer, T. – Keibel, S. – Winston, J. – Dolan, R. – Frith, C. (2004) Brain Responses to the Acquired Moral Status of Faces, in Neuron. 21 Smith, V. L. (2002), Razionalità costruttiva e razionalità ecologica, in Motterlini, M. – Piattelli Palmarini, M. (a cura di), (2005), La critica della ragione economica, Il Saggiatore, Milano. Spaventa, L. (1989), (a cura di), La teoria dei giochi e la politica economica, Il Mulino, Bologna. Strotz, R. H. (1955), Myopia and Inconsistency in Dynamic Utility Maximization, in Review of Economic Studies. Thaler, R. H. (1980), Toward a Positive Theory of Consumer Choic, in Journal of Economic Behavioral and Organization. --------- (1999), Mental Accounting Matters, in Journal of Behavioral Decision Making. Tversky, A. – Kahneman, D. (1981), The Framing of Decisions and the Psychology of Choice, in Science. --------- (1986), Rational Choice and the Framing of Decisions, in Journal of Business. Varian, H. (2003), Microeconomia, CaFoscarina, Venezia. Zaretti, A. (2004), Società del rischio, pace e sicurezza, in Maniscalco, M. L. (a cura di), Opinione pubblica, sicurezza e difesa europea, Collana CeMiSS, Roma. 22