Modellizzare le decisioni razionali con la teoria dei giochi. Gian Italo Bischi DESP - Dipartimento di Economia, Società e Politica Università di Urbino “Carlo Bo” [email protected] http://www.mdef.it/gian-italo-bischi/ Caldè 27 Luglio 2013 Galileo, da “ Il Saggiatore” Galileo Galilei 1564-1642 La filosofia è scritta in questo grandissimo libro che continuamente ci sta aperto innanzi agli occhi (io dico l’Universo), ma non si può intendere se prima non si impara a intender la lingua, e conoscer i caratteri, ne’ quali è scritto. Egli è scritto in lingua matematica, e i caratteri son triangoli, cerchi ed altre figure geometriche, senza i quali mezi è impossibile a intenderne umanamente parola; senza questi è un aggirarsi vanamente per un oscuro laberinto. The unreasonable effectiveness of mathematics in the natural sciences (Eugene P. Wigner, Nobel per la Fisica nel 1963) Capacità di descrivere e prevedere i fenomeni naturali: una mela, un pianeta, una particella elementare, un fluido, un gas … Una sfida: Può la matematica aiutare anche a descrivere, prescrivere, prevedere i comportamenti umani? (Hari Seldon, Parker Pyne …). Ma il problema del bar di Santa Fe... Vito Volterra (1860-1940) Il matematico si trova in possesso di uno strumento mirabile e prezioso, creato dagli sforzi accumulati per lungo andare di secoli dagli ingegni più acuti e dalle menti più sublimi che siano mai vissute. Egli ha, per così dire, la chiave che può aprire il varco a molti oscuri misteri dell’universo, ed un mezzo per riassumere in pochi simboli una sintesi che abbraccia e collega vasti e disparati risultati di scienze diverse Vito Volterra (1860-1940) […] Ma è intorno a quelle scienze nelle quali le matematiche solo da poco tempo hanno tentato d’introdursi, le scienze biologiche e sociali, che è più intensa la curiosità, giacché è forte il desiderio di assicurarsi se i metodi classici, i quali hanno dato così grandi risultati nelle scienze meccanico-fisiche, sono suscettibili di essere trasportati con pari successo nei nuovi ed inesplorati campi che si dischiudono loro dinanzi. dal discorso inaugurale per l’anno accademico 1901-1902 dell’Università di Roma Problema del monopolista: Più produco e più guadagno? q = quantità prodotta p = prezzo unitario di vendita c = costo unitario di produzione Profitto = Ricavo – Costo = p q – c q = (p – c) q Teorema. Se p > c allora il profitto cresce ogniqualvolta cresce la produzione Ma ci sono sempre dei consumatori disposti a comprare ciò che si produce al prezzo imposto dal monopolista ? q (quantità venduta) e p (prezzo di vendita) non sono indipendenti Il prezzo decresce al crescere della quantità ovvero la quantità acquistata è funzione decrescente del prezzo Esempio: Funzione di domanda lineare p p= A–B q q profitto del monopolista = p q – c q = (A – B q) q – cq P = f (q) = – B q2 + (A – c) q è una parabola! Profitto Ac 2B Ac B quantità prodotta Problema del duopolio A. Cournot, Récherches sur les principes matématiques de la théorie de la richesse, 1838. Due produttori, 1 e 2, vendono lo stesso prodotto Il produttore 1 produce e immette nel mercato q1 con costi c1q1 Il produttore 2 produce e immette nel mercato q2 con costi c2q2 prezzo: p = A – B QTOT = A – B ( q1 + q2) Profitto produttore 1: P1 = pq1 – c1q1 = [ A – B ( q1 + q2 )]q1 – c1q1 Profitto produttore 2: P2 = pq2 – c2q2 = [ A – B ( q1 + q2 )]q2 – c2q2 P1 = [ A – B ( q1 + q2)]q1 – c1q1 = – Bq12 + (A – c1 –Bq2 )q1 A c1 Bq 2 Max per q1 r1 (q2 ) 2B P2 = [ A – B ( q1 + q2)]q2 – c2q2 = – Bq22 + (A – c2 Bq1 )q2 A c2 Bq1 Max per q2 r2 (q1 ) 2B q1 r1 (q2 ) Equilibrio: q2 r2 (q1 ) A 2c1 c2 q 3B * 1 q2 Equilibrio di Cournot-Nash A 2c2 c1 q 3B * 2 q1 Non basta semplicemente adattare i metodi e i ragionamenti della fisica alla modellizzazione dell’economia perché l’economia è una scienza morale. Essa ha a che vedere con motivazioni, aspettative, incertezze psicologiche. È come se la caduta della mela al suolo dipendesse dalle aspirazioni della mela, se per lei sia conveniente o meno cadere a terra, se il suolo vuole che essa cada, e se vi sono stati errori di calcolo da parte della mela sulla sua reale distanza dal centro del John Maynard Keynes (1883–1946) pianeta” Aggiungiamo: come e quanto la mela si fa condizionare dal comportamento delle altre mele dello stesso albero o di alberi vicini, le aspirazioni e aspettative dellac mela, le informazioni che la mela ha, ecc. Verso una “Matematica per le decisioni”. Occorre introdurre una descrizione formale di azioni possibili, informazioni sugli esiti, preferenze, razionalità. Parte oggettiva: A= insieme di azioni {a1, a2, …, am} E = insieme di eventi {e1, e2, …, em} con ei= h(ai), i=1,…m Parte soggettiva: L’insieme E sia dotato di una relazione di preferenza: simbolo … ei ;-)) ej significa: ei preferito o indifferente a ej, ovvero ej non peggio di ei Preferenze razionali: transitività arancia ;-)) pera e pera ;-)) mela, allora arancia ;-)) mela Perché individui non transitivi non ci sono? Una possibile spiegazione evolutiva (money pump) E = {x1=mela, x2=pera, x3=arancia} Supponiamo che un individuo abbia preferenze non transitive (o cicliche) Preferenze x1 ;-) x2 , x2 ;-) x3 , x3 ;-) x1 Gli regalo una mela. Poi gli offro in cambio un’arancia e gli chiedo 1 cent in aggiunta. Poi gli offro una pera e gli chiedo 1 cent in aggiunta. Poi gli offro una mela e gli chiedo 1 cent in aggiunta. Poi… Un esempio: da transitività individuale a non transitività collettiva Il paradosso di Condorcet 1° 2° 3° 1 A B C 2 B C A 3 C A B Cioè per l’elettore 1 A ;-) B ;-) C ecc. Con un unico turno non c’è vincitore Due turni: I) A contro B ….vince A II) A contro C …. vince C Quindi per la collettività dei 3 elettori A ;-) B e C;-) A Proviamo a cambiare il primo turno I) B contro C …. vince B II) B contro A … vince A (come sapevamo) Quindi: B ;-) C e A ;-) B Riassumendo: A ;-) B , B ;-) C , C ;-) A preferenze cicliche!! Funzione di utilità: un valore numerico (una misura) alle preferenze e1 ;-)) e2 u(e1) u(e2) Es. u(mela) = 10, u(pera) = 15 , u(arancia) = 20 Azioni x1 x2 . . . xn utilità (funzione di preferenza) u(x1) u(x4) u(x2) . . . u(xn) x* : max u( xk ) k=1,…,n u(x1) u(x3) x1 x2 x3 x4 x5 Se x è una variabile continua (cioè x [a,b] ) allora u:[a,b]→ abbiamo un tipico problema di ricerca di un massimo assoluto in un compatto, detto spazio delle azioni x Interazione strategica John (János) von Neumann Budapest (Ungheria) 1903 Washington (USA) 1957 Princeton, 1947 Oskar Morgenstern Görlitz (Germania) 1902 Princeton (USA) 1977 DECISIONI IN PRESENZA DI INTERAZIONE STRATEGICA Dall'oroscopo di Linda Wolf del 3 dicembre 2009 Ariete. Anche se siete sicuri del fatto vostro fate molta attenzione alle decisioni degli altri Interazione strategica, uA = uA (xA ,yB) : matrici dei payoffs aij= u(xi,yj) b1 b2 ... bm a1 a11 a12 ... a1m a2 a21 a22 a2m B A . . . an ... an2 anm Payoff giocatore A in presenza di B A b2 ... bm a1 b11 b12 ... b1m a2 b21 b22 an bn1 . . . .. . an1 b1 A B B b1 b2 a1 (a11,b11) (a12,b12) a2 (a21,b21) (a21,b21) . . . an .. . bn2 ... bnm Payoff giocatore B in presenza di A ... ... bm (a1m,b1m) (a2m,b2m) .. . (an1,bn1) (an1,bn1) b2m Bimatrice dei payoffs ... (anm,bnm) Principio di razionalità. Un giocatore non sceglie l’azione x se ha a disposizione una scelta y che gli permetta di ottenere di più qualunque siano le scelte dell’altro (o degli altri) giocatori Esempio: b1 b2 b3 a1 (0,1) (1,0) (-1,2) a2 (2,2) (3,2) (0,1) b1 b2 b3 (1,0) (-1,2*) B A B A a1 (0,1) a2 (2*,2*) (3*,2*) (0*,1) Metodo dell’eliminazione delle strategie dominate Metodo del best reply (risposta ottima) Preferisci che dia 5 euro a te oppure 10 al tuo amico? Giocatore A: a1: 5 a me a2: 10 a B Giocatore B: b1: 5 a me b2: 10 ad A A B b1 b2 a1 (5*,5*) (15*,0) a2 (0,15*) (10,10) Dilemma del prigioniero Se denunci il tuo complice ti lasceremo libero (legge sui collaboratori) e il tuo complice starà in prigione per 10 anni. Ma se il tuo complice fa altrettanto allora sarete dichiarati entrambi colpevoli e, pur usufruendo dello sconto per aver collaboratori, rimarrete in carcere 5 anni ciascuno. Se entrambi tacete, 1 anno di prigione ciascuno per guida pericolosa e detenzione di armi. A Tace Accusa B Tace Accusa (-1,-1) (-10,0*) (0*,-10) (-5*,-5*) Gioco proposto da Merrill Flood e Melvin Dresher, Rand Corporation 1950, per le possibili applicazioni ad una strategia nucleare globale. La versione "il dilemma di prigioniero" si deve ad Albert Tucker che volle rendere più accessibili le idee di Flood e Dresher a un pubblico di psicologi di Stanford. Dilemma del Pescatore Fisherman Fisherman C R Moderate Intensive exploitaton exploitation (cooperative) (competitive) Moderate exploitaton (cooperative) (3, 3) Intensive exploitation (competitive) (4, 1) (1, 4) E la mano invisibile di Adam Smith? (2, 2) Un tipico dilemma sociale Hardin, G. “The tragedy of the commons”, Science (1968). In generale … A a1 a2 B b1 b2 (a,a) (b,c) (c,b) con c > a > d > b (d,d) Altre situazioni : Scambio a scatola chiusa Corsa agli armamenti e politiche di disarmo Parlare a voce alta in pizzeria Inquinare o no? Porto il casco per correre in bici? E’ meglio il più o il meno? u(x) Singolo decisore x Interazione strategica A a1 B a2 A a1 a2 B b1 b2 (10,10) (3,15*) (15*,3) (5*,5*) b1 b2 (8*,8*) (2*,7) (7,2*) (0,0) E’ meglio avere più possibilità di scelta? u(x) Singolo decisore x2 x1 Interazione strategica A a1 B b1 x3 b2 (1,1) (5,3*) (3*,5) (10*,10*) b1 b2 (1,1) (5,3) (0,4*) a2 (3,5) (10,10) (0,11*) a3 (4*,0) (11*,0) (1*,1*) a2 A a1 B b3 x B A b1 b2 a1 0,4* 4*,0 b3 5,3 Non ha strategie dominate da eliminare Comunque ha un unico equilibrio di Nash a2 4*,0 a3 3,5 3,5 B A b1 b2 b3 b4 a1 1,4 -1,6* 3,0 2*,2 a2 2*,0 4,0 6*,0 2*,1* a3 0,4 5*,6* 0,-2 -1,1 0,4* 5,3 6*,6* Si poteva eliminare al prima riga, poi la terza colonna e poi la prima colonna Un equilibrio di Nash sopravvive all’eliminazione iterata di strategie dominate, ma nessuno mi garantisce che l’eliminazione iterata sia in grado di rimuovere tutto tranne gli equilibri di Nash B b1 b2 a1 (1,1) (0,0) a2 (0,0) (0,0) A B b1 b2 a1 (1,1) (0,0) a2 (0,0) (1,1) A tenere la destra o la sinistra? B b1 b2 a1 (1,2) (0,0) a2 (0,0) (2,1) A battaglia dei sessi: shopping o partita? Facile se ciascuno conosce la matrice dei payoff e sa che l’altro è razionale e sa che l’altro sa… Gioco di puro coordinamento. Se giochiamo la stressa strategia va bene per entrambi, se giochiamo diverso male per entrambi. Occorre comunicazione preliminare, (poi non c’è pericolo di defezione) Anche qui due equilibri di Nash, ma difficile accordo preliminare. Se ciascuno persegue il proprio Nash preferito si finisce in (0,0). E anche un eccesso di altruismo da parte di entrambi… B A b1 b2 a1 (0,0) (1,1) a2 (1,1) (0,0) B b1 b2 a1 (0,0) (1,2) a2 (2,1) (0,0) A A B Accelera Apriamo un negozio dello stesso tipo o di tipo diverso? E se uno dei due articoli offre maggiori profitti? Frena Accelera (-1,-1) (2*,0*) Frena (0*,2*) (1,1) Gioco del Chicken (Gioventù bruciata) Attacco nucleare (guerra fredda USA URSS) Giochi a somma zero non ci sono equilibri di Nash inefficienti b1 b2 b3 B A minimo guadagno su ogni riga a1 9 ,-9 3 ,-3 0 ,0 0 a2 6,-6 5 ,-5 7,-7 5 a3 -1 ,1 4,-4 9 ,-9 -1 9 5 9 max fra i min guadagni (maxmin) massima perdita su ogni colonna min fra le max perdite (minmax) Equilibrio: maxmin = minmax = sella della matrice Gioco a somma zero - non ci sono equilibri di Nash inefficienti (interessi contrapposti) - vale la proprietà di rettangolarità: se ci sono più strategie di Nash ciascuno può scegliere le proprie Nash senza preoccuparsi di quale sceglie l’altro (purché razionale) b1 B b2 b3 b4 b5 0 4 7 3 2 0 a2 5 8 9 5 6 5 a3 1 5 3 2 1 1 a4 5 10 8 5 9 a5 0 9 6 1 7 5 10 5 9 A a1 massime perdite minmax 9 minmax minimi guadagni 5 0 maxmin maxmin Giochi senza equilibrio di Nash (in strategie pure) B A P D B A P D -1,1* 1*, -1 1*, -1 -1,1* S S 0,0 F C Morra (pari-dispari) Matching pennies Due luoghi, due ex fidanzati con interessi opposti C F 1*, -1 -1, 1* -1, 1* 0,0 1*,-1 1*,-1 -1,1* Morra cinese: Sasso, Forbici, Carta 0,0 Idea delle strategie miste e loro interpretazioni Matching pennies a strategie miste A p a1 (1- p) a2 B q b1 -1,1 1,-1 Funzioni di reazione (1- q) b2 1 1 se 0 q 2 1 p RA ( q) [0,1] se q 2 0 se 1 q 1 2 1,-1 -1,1 1 0 se 0 p 2 1 q RB ( p ) [0,1] se p 2 1 1 se p 1 2 Payoff attesi da A in base alle scelte attese da parte di B payoff atteso VA(a1) = -1q + 1(1- q) = 1−2q payoff atteso da VA(a2) = 1q −1(1- q) = 2q - 1 Quindi VA(a1)> VA(a2) se q<1/2 p 1 Analogamente per il giocatore B payoff atteso VB(b1) 1p − 1(1- p) = 2p − 1 1 2 payoff atteso da VB(b2) -1p + 1(1-p) = 1 − 2p Quindi VB(b1)> VB(b2) se p>1/2 1 2 1 q Battaglia dei sessi con strategie miste A p a1 (1- p) a2 B q b1 2,1 0,0 Funzioni di reazione (1- q) b2 1 0 se 0 q 3 1 p RA ( q) [0,1] se q 3 01 se 1 q 1 3 0,0 1,2 2 0 se 0 p 3 2 q RB ( p ) [0,1] se p 3 2 1 se p 1 3 Payoff attesi da A in base alle scelte attese da parte di B payoff atteso VA(a1) = 2q payoff atteso da VA(a2) = 1- q Quindi VA(a1)> VA(a2) se q>1/3 p=1 Analogamente per il giocatore B payoff atteso VB(b1) = p p 1 2 3 payoff atteso da VB(b2) = 2(1-p) = 1 − 2p Quindi VB(b1)> VB(b2) se p>2/3 q=1 1 3 1 q Gioco degli aiuti umanitari Due paesi ricchi hanno sovrabbondanza di beni rapidamente deteriorabili (es. alimentari) e decidono di regalarli a paesi poveri per ottenere un’influenza politica o alleanza in caso di conflitto. Due i paesi beneficiari, I e II; 4 e 3 le unità di beni a disposizione di A e B risp. Se un paese ricco dà a uno povero più unità del bene se ne assicura il controllo (+1) se meno perde il controllo (-1) se uguale neutralità (0). Può A sfruttare il vantaggio (4 contro 3) per controllarli entrambi? A a1:4,0 B b1 3,0 b2 2,1 b3 1,2 b4 0,3 1 0 0 0 0 Payoff di A: somma algebrica dei controlli a2:3,1 1 1 0 gioco a somma 0 a3 :2,2 0 1 1 0 a4 :1,3 0 0 1 1 a5 :0,4 0 0 0 1 b1 3,0 b2 2,1 b3 1,2 b4 0,3 1 0 0 0 a2:3,1 1 1 0 0 a3 :2,2 0 1 1 0 a4 :1,3 0 0 1 1 a5 :0,4 0 0 0 1 A B a1:4,0 A p B q b1 a2 1 (1- p) a4 0 (1- q) b4 0 1 Soluzione p=q=1/2 Mosse successive con informazione completa. Giochi in forma estesa e induzione a ritroso. I Ci aumentiamo lo stipendio? Passa se votato da almeno due su tre. S Si vota a turno e in modo palese II a: voto no e passa b: voto sì e passa c: voto no e non passa d: voto sì e non passa III preferenze S a>b>c>d N S S N N S N S S N S (b,b) N N (b,b,b) (b,b,a) (b,a,b) (d,c,c) (a,b,b) (c,d,c) (c,c,d) (c,c,c) S S N N (b,a) S (a,b) N N (c,c) b a Forma estesa e strategica. Un esempio Due “giocatori”, scimmia grande S e scimmia piccola s. Per mangiare almeno una deve salite sull’albero delle noci di cocco, e scuotere i rami per farle cadere. Ciascuna ha due strategie c = climb w = wait (c,c) S spende due per salire e poi mangia 7, s mangia 3: (c,w) s mangia 4 prima che S arrivi, poi S mangia 6: (w,c) S mangia 9 e s mangia 1 che è rimasto: (w,w) : (5,3) (4,4) (9,1) (0,0) Mosse simultanee (ovvero senza sapere cosa fa l’altro) S c w s c 5,3 9*, 1* S w c 4*, 4* s 0,0 c Due equilibri di Nash, scelta difficile perché entrambi presentano il pericolo di restare a digiuno se l’altro defeziona. Non è facile un accordo preventivo w (5,3) w c (4,4) (9,1) w (0,0) Passiamo a mosse consecutive a informazione completa. S decide per primo e poi s S c Potatura della scelta di s (considerato razionale) w S s c w c w c (4,4) (4,4) (5,3) (9,1) w (9,1) (0,0) Unica soluzione: (w,c) S ha due strategie: c,w S ne ha 4: cc (arrampica cmq), cw (imita), wc (fa l’opposto), ww (attende cmq) s cc cw wc c 5,3 5*,3 4,4* w 9*,1* S 0,0 9*,1* ww 4*,4* 0,0 3 Eq. Nash, ma solo (w,cc) e (w,wc) sono perfetti nei sottogiochi, ma (w,wc) è preferibile per s (perché un errore di S gli dà 4 invece di 3). La minaccia di s do giocare w potrebbe essere credibile perché perde solo 1 Ultimatum game. Due giocatori. Il primo (proponente) può ottenere un premio di E euro a patto che ne ceda una parte X al secondo giocatore (ricevente). Se questi accetta ciascuno prende la propria parte, E-X il primo, X il secondo. Se questi rifiuta non prende niente nessuno dei due. Unico equilibrio di Nash: X > 0 più piccolo possibile (E-X,X) (0,0) Le evidenze sperimentali sono molto diverse: il proponente offre tra il 30% e il 40% della somma totale, il 50% dei riceventi rifiutano se l’offerta è minore del 20% di E Dictator Game (o di puro altruismo) Il proponente ha la possibilità (non l’obbligo) di donare una parte al ricevente, senza avere ritorsioni. Le evidenze sperimentali mostrano che X è tra il 10% e il 25% se i due giocatori si conoscono. Invece in caso di doppio anonimato il 70% circa non lascia nulla e il rimanente tra il 10% e il 20% Behavioral economics (Economia comportamentale) Asta da un dollaro Si mettono all’asta 100 euro, partendo da un’offerta iniziale di 1 € . Chi offre di più si aggiudica i 100 euro, ma anche chi fa la seconda offerta paga, senza però vincere nulla. …proviamo… all’inizio sembra una buona opportunità… ai 50 euro ci si rende conto che il banditore ha fatto un affare … ai 99 euro si vorrebbe smettere ma… conviene offrire 100 e poi 101… se non vogliamo perdere tutto… aste realmente effettuare sono arrivate a 300-350 euro, con un guadagno del 700% da parte del banditore !!! Si tratta della tipica situazione in cui il vincitore paga un prezzo sproporzionato rispetto al premio che ottiene, lo sconfitto paga un alto prezzo per una battaglia che non frutta nulla. Morale: era meglio non iniziare Premio Nobel, 1994 "for their pioneering analysis of equilibria in the theory of non-cooperative games" Harsanyi Nash Selten Premio Nobel, 2005 "for having enhanced our understanding of conflict and cooperation through game-theory analysis" Aumann Schelling Premio Nobel Economia, 2007 "for having laid the foundations of mechanism design theory" Myerson Maskin Hurwicz Nobel 2012 “per le loro ricerche sulla teoria dei giochi applicata al funzionamento dei mercati. Shapley Roth Alcune letture Roberto Lucchetti “Scacchi e scimpanzé” Bruno Mondadori 2012 Pierluigi Argoneto “I Radiohead, l’arcobaleno e il piede sinistro di Dio”, Armando Editore 2009 Roberto Lucchetti “Passione per Trilli” Springer Italia 2007 Fioravante Patrone “Decisori (razionali) interagenti”, Plus edizioni 2006 Tom Siegfried “E’ la matematica, bellezza!”, Bollati Boringhieri 2006