TEORIA DEI GIOCHI – Marco Alderighi
Esempio.
La maggiore produttrice di autovetture italiane (Fiat) nel prendere le decisioni di quando introdurre
un nuovo modello sul mercato, con quali accessori, con quali motorizzazioni, a quali prezzi e con
quali campagne pubblicitarie tiene in conto sia fattori interni quali, lo stato di sviluppo del prodotto,
le risorse finanziarie, l’andamento delle vendite di altri modelli, sia fattori macroeconomici quali
l’andamento congiunturale, la fiducia dei consumatori nell’economia, l’età media dei modelli in
possesso dai potenziali acquirenti, etc.. sia delle altre imprese produttrici di auto.
In particolare la Fiat, volendo perseguire obbiettivi di profitto tiene conto sia delle possibili strategie
a disposizione da parte dei propri concorrenti (cioè a che punto sono con lo sviluppo di nuovi
modelli, la loro situazione finanziaria, etc..) sia delle aspettative che questi hanno riguardo le azioni
che Fiat vorrà compiere. In particolare nel scegliere la propria strategia, Fiat deve mettersi nei panni
degli altri produttori di auto e chiedersi “cosa mi aspetto che l’altro faccia e cosa mi aspetto che
l’altro si aspetti che io faccia, etc..”
Un contesto così delineato è un contesto strategico, cioè un contesto dove le azioni e le aspettative
di ciascun agente influiscono sulle azioni e sulle aspettative dell’altro e in definitiva sui risultati che
ciascun agente può ottenere.
Definizione
Noi forniremo due definizioni di teoria dei giochi.
La prima (classica): La teoria dei giochi è uno strumento analitico per analizzare le interazioni
strategiche degli agenti economici.
La seconda (eterodossa): La teoria dei giochi è lo strumento per prendere decisioni in contesti
strategici.
La differenza tra il primo e il secondo concetto è che nel primo si assume che le “regole del gioco”
siano date mentre nel secondo caso si assume che gli agenti siano in grado di plasmare a proprio
favore il gioco per ottenere una situazione più favorevole.
In questa nota noi studieremo come risolvere i giochi (ci riferiremo quindi al primo aspetto della
teoria dei giochi) mentre vi rimando all’articolo di Brandenburger e Nalebuff per vedere alcuni
esempi di come è possibile modificare il contesto strategico. Resta inteso che saper risolvere i
giochi (indicare come i giocatori giocheranno date le regole del gioco) risulta una condizione
necessaria per trovare il risultato del gioco qualora si decidesse di modificarlo.
Prima di proseguire bisogna dire che il primo modo di intendere la teoria dei giochi attiene
maggiormente alle tecniche di risoluzione dei giochi mentre il secondo modo di intendere la teoria
dei giochi è entro certi limiti un’arte!
Gioco (e regole del gioco)
Un gioco è caratterizzato da regole. Queste possono essere riassunte dall’acronimo PAPI.
• P=PLAYERS. I giocatori sono agenti economici. Questo significa che agiscono secondo
razionalità. L’ipotesi di razionalità implica due cose: 1) che i giocatori agiscono seguendo
un obiettivo, quale la massimizzazione del profitto, dell’utilità, etc.., 2) che i giocatori si
comportano in modo strategico: nel prendere le decisioni, i giocatori si mettono nei panni
1
•
•
•
degli altri giocatori. I giocatori sono quindi dotati di aspettative (“cosa penso che gli altri
pensino e cosa penso che gli altri pensino che io penso, etc..”)
A=AZIONI (o strategie). Le azioni sono tutte le possibili mosse che ciascun giocatore può
compiere. Nei giochi simultanei non c’è distinzione tra azione e strategie mentre nei giochi
dinamici (o sequenziali) la distinzione diventa rilevante.
P=PAYOFF. I payoff sono i “pagamenti” che un giocatore riceve, cioè i profitti o l’utilità
che un giocatore riceve dal fatto che si sono realizzate particolari mosse. In realtà si
dovrebbe distinguere tra risultato del gioco (outcome) e payoff. Ad esempio, se due
giocatori competono per ottenere una borsa contenente una somma di denaro, un possibile
risultato del gioco è che uno dei due giocatori riesca ottenere fisicamente la borsa, il payoff
corrispondente è l’ammontare di denaro che il giocatore vince ricevendo la borsa o l’utilità
che un giocatore ha nello spendere il denaro contenuto nella borsa. Noi parleremo in
generale di payoff senza considerare ulteriormente questa distinzione. Quindi il payoff è
“quanto un giocatore guadagna dal gioco”.
I=INFORMAZIONE. Noi distinguiamo i giochi in base alle informazioni possedute dai
giocatori durante il gioco. Si parlerà di giochi simultanei (o statici) quando i giocatori
scelgono contemporaneamente (o quando non hanno informazioni sulle scelte degli altri
giocatori) mentre si parlerà di giochi dinamici (o sequenziali) quando i giocatori scelgono in
momenti differenti (prima un giocatore, poi l’altro)1. Nei giochi dinamici i giocatori
acquisiscono informazioni man mano che il gioco procede in quanto osservano le mosse
degli altri giocatori.
E’ possibile riassumere le caratteristiche di un gioco simultaneo attraverso una semplice matrice. In
questo caso si dice che il gioco è rappresentato in forma normale. La figura rappresenta il gioco di
localizzazione. Ci sono due giocatori: Player1 e Player2. Player1 ha a disposizione 2 strategie
(azioni): A=alto e B=basso e Player2 ha a disposizione 3 strategie S=sinistra C=centro e D=destra.
Essendo rappresentato in forma normale, le scelte dei due giocatori avvengono in simultanea e
quindi ciascun giocatore non ha informazioni sulle scelte dell’altro. Infine i numeri all’interno della
matrice corrispondono ai payoff dei giocatori. Essendo i giochi rappresentazioni di interazioni
strategiche si suppone che i payoff di ciascun giocatore possano dipendere dalle proprie scelte ma
anche dalle scelte degli altri giocatori. Ad esempio, se il giocatore 1 sceglie A e il giocatore 2
sceglie S il giocatore 1 riceve 4 e il giocatore 2 riceve 3. Se il giocatore 2 sceglie C e il giocatore 1
lascia la sua scelta immutata (quindi continua a sceglie A) il payoff del giocatore 1 sarà ora 7 e
quello del giocatore 2 sarà 2.
Localizzazione
S
Player2►
Player1▼
A
B
4,3
3,4
C
D
7,2
8,10
1,6
2,1
Payoff di (Player1, Player2)
Definiamo π 1 (s1 , s 2 ) la funzione che descrive il payoff del giocatore 1 quando sceglie s1 e l’altro
giocatore sceglie s 2 . Allo stesso modo definiamo π 2 (s1 , s 2 ) la funzione che descrive il payoff del
giocatore 2 quando sceglie s 2 e l’altro giocatore sceglie s1 . Ad esempio abbiamo che π 1 ( A, D ) = 1
e π 2 ( A, D ) = 6 .
1
La classificazione dei giochi è molto più complessa di quanto esposto. Ci sono in particolare giochi dinamici dove i
giocatori sono solo “parzialmente informati” sul comportamento degli altri giocatori. Noi non tratteremo questi tipi di
giochi.
2
Obiettivo
La teoria dei giochi si prefigge di indicare quali sono i possibili risultati di un gioco e quindi di
trovare le soluzioni del gioco. In alcuni casi vi sembreranno intuitive (come in questo dove la
soluzione è Player1 sceglie B e Player2 sceglie C), mentre in altri casi inizialmente vi sembreranno
contro-intuitive (ad esempio nel “dilemma del prigioniero”). In ogni caso il nostro obiettivo sarà
quello di identificare quali sono le soluzioni di un gioco giocato da agenti “razionali”.
E’ importante dire che le soluzioni di un gioco sono chiamati equilibri. E’ utile fin da ora
sottolineare che ci sono diversi modo di risolvere un gioco (e questi differenti modi si basano su
differenti ipotesi di razionalità dei giocatori). Un particolare modo di risolvere un gioco è detto
“concetto di equilibrio”. Noi vedremo diversi concetti di equilibrio e in particolare:
• equilibrio in strategie dominanti
• equilibrio attraverso l’eliminazione (iterata) delle strategie dominate
• equilibrio di Nash
• equilibrio perfetto (cioè l’equilibrio di Nash ottenuto nei giochi dinamici dopo
l’eliminazione di strategie non credibili)
Per identificare il risultato di un gioco noi ci concentreremo su due principali concetti di equilibrio.
Il primo è l’equilibrio di Nash che useremo per risolvere i giochi simultanei e il secondo è
l’equilibrio perfetto che si applica ai giochi dinamici. In particolare, nei giochi dinamici non saremo
realmente interessati ad identificare l’equilibrio perfetto (che implicherebbe identificare le strategie
ottime di ciascun individuo) ma soltanto il risultato del gioco (cioè quali azioni sono scelte dai
giocatori). Per fare questo sarà sufficiente utilizzare la tecnica dell’induzione a ritroso (backward
induction).
In queste note introdurrò i vari tipi di equilibrio man mano che risulteranno necessari per risolvere il
gioco. Partiremo da concetti di equilibrio più semplici e più robusti (che richiedono “poca”
razionalità ai giocatori per arrivare a concetti più sofisticati di equilibrio che richiedono maggiore
razionalità da parte dei giocatori).
La funzione di risposta ottima
Collegato al concetto di razionalità di un individuo esiste quello di funzione di risposta ottima.
Si dice che una particolare strategia del giocatore 1 è risposta ottima ad una particolare strategia del
giocatore 2 se scegliendo quella strategia il giocatore sta massimizzando il suo payoff. Chiameremo
funzione di risposta ottima si* ( ) del giocatore i, quella funzione che restituisce la scelta ottima per
data scelta dell’avversario.
s 2 se e solo se ∀s1 (si legge per tutti gli s1 e cioè per ogni
In formule, ŝ1 è risposta ottima a ~
possibile strategia a disposizione del giocatore 1) vale π 1 (sˆ1 , ~
s 2 ) ≥ π 1 (s1 , ~
s2 ) .
*
*
*
Ad esempio nel gioco di localizzazione: s1 (S ) = A s1 (C ) = B , s 2 ( A) = D e s 2* (B ) = C .
GIOCHI SIMULTANEI
Equilibrio in strategie dominanti – il dilemma del prigioniero
Definizione: la strategia s iD è una strategia dominante per il giocatore i se per egli è risposta ottima
a tutte le possibili strategie dell’avversario. Quindi per il giocatore i , s iD , è il meglio che egli può
fare indipendentemente da quello che fa il suo avversario.
In formule, s1D è strategia dominante per il giocatore 1 se e solo se s1D = s1* (s 2 ) ∀s 2 . In altro modo,
s1D è strategia dominante per il giocatore 1 se e solo π 1 s1D , s 2 ≥ π 1 (s1 , s 2 ) ∀s1 , s 2 .
(
3
)
L’equilibrio in strategie dominanti risponde ad un concetto minimale di razionalità. E’ l’equilibrio
che si ottiene quando ogni giocatore gioca la sua strategia dominante.
Il dilemma del prigioniero.
Due furfanti vengono arrestati e accusati di un grave crimine. Tuttavia le prove a loro carico
permettono ai giudici di condannarli solo per una pena minore a meno che essi non confessino. I
due prigionieri vengono rinchiusi in due celle separate e viene chiesto loro di confessare il crimine.
Qualora i prigionieri confessino hanno diritto ad uno sconto sulla pena.
Essendoci due possibili strategie per il prigioniero 1 e cioè confesso (C1) o non confesso (N1) e lo
stesso per il prigioniero 2 e cioè C2, N2 si hanno 4 possibili risultati che sono riassunti nella matrice
dei payoff.
Dilemma del Prigioniero
Player2►
C2
N2
Player1▼
C1
N1
-5,-5
-10,-1
-1,-10
-2,-2
La soluzione del dilemma del prigioniero può essere ottenuta come equilibrio in strategie
dominanti. Infatti la strategia dominante del Prigioniero 1 è C1 (confesso). Infatti scegliendo
confesso ottiene -5 al posto di -10 nel caso in cui il Prigioniero 2 scegliesse C2 mentre otterrebbe -1
al posto di -2 nel caso in cui il Prigioniero 2 scegliesse N2. In ogni caso per il Prigioniero 1
scegliere C1 porta ad un payoff più alto che scegliendo la strategia N1. Il medesimo ragionamento
vale per il Prigioniero 1. L’equilibrio in strategie dominanti è quindi (C1,C2).
NB: Non è sempre detto che i giocatori abbiano strategie dominanti. In questo caso non è sempre
possibile quindi trovare un equilibrio in strategie dominanti (ad esempio il Gioco di Localizzazione
a pagina 2).
Equilibrio attraverso l’eliminazione (iterata) delle strategie dominate – Il gioco Riga – Colonna.
Una strategia è detta dominata se esiste un’altra strategia che fornisce un payoff superiore per ogni
possibile scelta dell’altro giocatore.
In formule, s1m è strategia dominata per il giocatore 1 se e solo se ∃~
s1 (si legge esiste almeno una
m
~
~
strategia s1 ) tale che π 1 s1 , s 2 < π 1 (s1 , s 2 ) .
(
)
Riga - Colonna
Player2►
Player1▼
C1
C2
C3
R1
R2
R3
4,3
2,1
3,0
5,1
3,4
9,6
6,2
3,6
2,8
Sotto l’ipotesi di razionalità dei giocatori sappiamo che un giocatore non giocherà mai una strategia
dominata. L’equilibrio ottenuto attraverso l’eliminazione delle strategie dominate si basa
sull’ipotesi di razionalità e sul fatto che i giocatori si mettano “nei panni” dei propri avversari.
Esporremo l’equilibrio attraverso l’eliminazione delle strategie dominate con il gioco Riga –
Colonna. Se C2 è una strategia dominata per il giocatore 2 allora il giocatore 2 non giocherà mai
C2. Quindi questa strategia può essere eliminata dal gioco.2
A questo punto il nuovo gioco ottenuto eliminando la strategia C2, è il seguente.
2
Per l’eliminazione di questa strategia serve che il giocatore 2 sia razionale e che il giocatore 1 sappia/creda che il
giocatore 2 è razionale.
4
Riga – Colonna (ridotto #1)
Player2►
C1
Player1▼
R1
R2
R3
4,3
2,1
3,0
C3
6,2
3,6
2,8
Ora il giocatore 1 trovandosi di fronte al gioco ridotto #1 (in quanto attraverso il ragionamento ha
eliminato il C2 dalle strategie del giocatore 2) può eliminare le strategie R2 e R3 in quanto
dominate da R1 (che è la strategia dominante nel gioco ridotto).
A questo punto il nuovo gioco ottenuto eliminando R2 e R3 è il seguente.
Riga – Colonna (ridotto #2)
Player2►
C1
Player1▼
R1
4,3
C3
6,2
Ora il giocatore 2, trovandosi di fronte al gioco ridotto #2 (in quanto attraverso il ragionamento sa
che il giocatore 1 aveva eliminato la sua mossa C2 e trovandosi nel gioco ridotto #1 aveva scelto la
sua strategia R1) può eliminare la strategia C3 e quindi scegliere C1.3
Il gioco risultante descrive l’equilibrio in strategie dominate. Il giocatore 1 gioca R1 e il giocatore 2
gioca C1.
Riga – Colonna (ridotto #3)
Player2►
C1
Player1▼
R1
4,3
Il gioco risultante descrive l’equilibrio in strategie dominate. Il giocatore 1 gioca R1 e il giocatore 2
gioca C1.
Chiaramente per ottenere un equilibrio attraverso l’eliminazione di strategie dominate si richiede
maggiore razionalità ai giocatori rispetto al caso di risoluzione del gioco in strategie dominanti.
Anche attraverso l’eliminazione delle strategie dominate non è sempre possibile trovare una
soluzione. Ad esempio il gioco di Localizzazione non ha equilibrio attraverso l’eliminazione di
strategie dominate.
Equilibrio di Nash
Il principale metodo di soluzione dei giochi simultanei avviene attraverso l’Equilibrio di Nash. Una
coppia strategie costituiscono un equilibrio di Nash quando ciascuna strategia è risposta ottima
all’altra strategia. Quindi ŝ1 , ŝ 2 sono un equilibrio di Nash quando simultaneamente vale che
sˆ1 = s1* (sˆ2 ) e sˆ2 = s 2* (sˆ1 ) .
Detto in altro modo, una coppia di strategie, ŝ1 , ŝ 2 , sono un equilibrio di Nash, quando ciascun
giocatore non ha un interesse a deviare dalla strategia che sta giocando. In formule, si ha equilibrio
di Nash quando:
π 1 (sˆ1 , sˆ2 ) ≥ π 1 (s1 , sˆ2 ) ∀s1 e
π 2 (sˆ1 , sˆ2 ) ≥ π 2 (sˆ1 , s 2 ) ∀s 2
Troviamo ora l’equilibrio di Nash nel gioco di localizzazione introdotto all’inizio delle note.
3
Per l’eliminazione di questa strategia serve che il giocatore 2 sia razionale e che il giocatore 1 sappia che il giocatore 2
è razionale e che il giocatore 2 sappia che il giocatore 1 sappia che il giocatore 2 è razionale.
5
Per identificare l’equilibrio o gli equilibri di Nash basta procedere nel seguente modo. Supponete
che Player 2 scelga S allora per Player 1 la risposta ottima è A. Sottolineate il payoff del Player 1 in
corrispondenza di S, A. Supponete che Player 2 scelga C allora per Player 1 la risposta ottima
sarebbe B (sottolineate il payoff 8). Nel caso in cui Player 2 scegliesse D per Player 1 la risposta
ottima sarebbe B (sottolineate 2). Ripetendo la stessa procedura otterrete D risposta ottima del
Player 2 alla strategia A del Player 1 (sottolineate il payoff del Player 2 in corrispondenza delle
strategie A e D e cioè il valore 6) e otterrete C come risposta ottima alla strategia B (sottolineate
10). L’equilibrio (o gli equilibri) di Nash è quella combinazione di strategie identificate dalla cella
dove entrambi i payoff sono sottolineati. Infatti queste strategie sono ognuna risposta ottima di
quello dell’avversario. E’ facile vedere che nell’equilibrio (B,C) i giocatori non hanno incentivo
individuale a deviare. Se il giocatore 1 al posto di B scegliesse A passerebbe da un payoff di 8 ad
uno di 7. Se il giocatore 2 al posto di C scegliesse S passerebbe da 10 a 4 e se scegliesse D
passerebbe da 10 a 1.
Localizzazione (ripreso)
Player2►
S
C
Player1▼
D
4,3
3,4
1,6
2,1
A
B
7,2
8,10
Payoff di (Player1, Player2)
Applicando il concetto di equilibrio di Nash ai giochi precedenti, si nota che si ottengono gli stessi
risultati.
Per il dilemma del prigioniero la soluzione è (C1,C2).
Dilemma del prigioniero (ripreso)
Player2►
C2
N2
Player1▼
C1
N1
-5,-5
-10,-1
-1,-10
-2,-2
Per il gioco Riga – Colonna la soluzione è (R1,C1).
Riga – Colonna (ripreso)
Player2►
C1
Player1▼
R1
R2
R3
4,3
2,1
3,0
C2
C3
5,1
3,4
9,6
6,2
3,6
2,8
Prima di concludere sull’equilibrio di Nash è necessario fare alcune considerazioni.
Primo, l’equilibrio di Nash poggia su ipotesi raffinate di razionalità degli individui. Immaginando
che l’equilibrio sia unico, come abbiamo visto sin ora, per raggiungere l’equilibrio si richiede che
ciascun giocatore sia razionale e che sia in grado di risolvere il gioco, che ciascun giocatore creda
che l’altro giocatore sia razionale e che sia in grado di risolvere il gioco e che ciascun giocatore
creda che ciascun giocatore creda che ciascun giocatore sia razionale e che sia in grado di risolvere
il gioco, etc.. In questo caso, nessun giocatore avrà incentivo a deviare dalla soluzione prevista e
quindi si raggiungerà l’equilibrio di Nash.
Secondo, anche se il concetto di razionalità necessario per raggiungere l’equilibrio è molto forte,
tuttavia l’equilibrio di Nash può essere pensato come il risultato di un processo di apprendimento.
Durante la fase di apprendimento i giocatori giocano strategie differenti. Quando tutti i giocatori
6
giocano la propria strategia di Nash non avranno più incentivi a deviare e quindi il processo di
apprendimento termina.
Terzo, l’equilibrio di Nash è molto utilizzato in quanto è estremamente semplice da calcolare.
Inoltre, nella versione estesa del concetto (cioè quando ai giocatori è permesso di giocare strategie
miste, cioè assegnando una probabilità a ciascuna strategia pura) l’equilibrio di Nash esiste
praticamente sempre. Una strategia è pura quando il giocatore decide di giocare una mossa con
certezza (quindi il giocatore giocherà una mossa con una probabilità del 100%). Una strategia è
mista se il giocatore gioca un’insieme di mosse attribuendo a ciascuna mossa una certa probabilità.
Morra Cinese
Player2►
Player1▼
C2
S2
F3
C1
S1
F1
0,0
-1,1
1,-1
1,-1
0,0
-1,1
-1,1
1,-1
0,0
Ad esempio nel gioco della Morra Cinese il giocatore potrebbe decidere di giocare sempre Sasso
(questa è una strategia pura) oppure potrebbe decidere di giocare con una probabilità del 33,33%
Sasso, Carta, Forbice (questa è una strategia mista). Chiaramente il gioco della Morra Cinese non ha
equilibrio in strategia pura in quanto per ogni data configurazione ci sarà almeno un giocatore che
ha un incentivo a deviare dalla precedente strategia. Se il giocatore 1 gioca Sasso e il giocatore 2
gioca Forbice allora il giocatore 2 avrà un incentivo a deviare e giocare Carta. Ma se il giocatore 2
giocasse Carta allora il giocatore 1 vorrebbe giocare Forbice, e così via.
Se entrambi i giocatori giocassero la strategia mista che assegna la probabilità di un terzo a ciascuna
mossa allora non ci sarebbe incentivo a deviare.
Quarto, l’equilibrio di Nash potrebbe essere multiplo. Durante il corso vedremo che nei casi di
interesse (oligopolio, etc..), l’equilibrio di Nash è unico. Tuttavia vi sono importanti situazioni come
nel caso di esternalità di rete, scelta di standard, etc.. dove l’equilibrio è multiplo.
Coordinamento Ordinato (Ranked)
Player2►
Grande
Piccolo
Player1▼
Grande
Piccolo
2,2
-1,-1
-1,-1
1,1
In alcuni casi come in quello della coordinamento ordinato4, vi sono due equilibri di Nash, ma è
possibile proporre degli affinamenti dell’equilibrio. In particolare si può supporre che i giocatori
utilizzino il concetto di Pareto dominanza5 per orientarsi verso l’equilibrio Grande-Grande piuttosto
che verso l’equilibrio Piccolo-Piccolo.
Tuttavia il concetto di Pareto dominanza potrebbe non essere un buon affinamento del gioco quando
un giocatore potrebbe andare incontro ad una situazione di pericolo scegliendo la situazione Pareto
superiore come nel gioco di Coordinamento Pericoloso.
4
Nei giochi di coordinamento, le imprese si trovano di fronte alla scelta tra diversi standard. Chiaramente scegliendo il
medesimo standard hanno dei vantaggi in quanto aumentano ad esempio il numero di fornitori e di conseguenza
avrebbero a disposizione prodotti di maggior qualità ad un costo inferiore.
5
Il concetto di Pareto-dominanza è molto importante in economia. Un’allocazione (in questo caso una soluzione del
gioco) Pareto domina un’altra allocazione quando la prima migliora il benessere di almeno un giocatore senza
peggiorare quello di nessuno. Attenzione: il concetto di Pareto-dominanza, si applica per selezionare tra diversi equilibri
di Nash ma non è sensato applicarlo ad esempio nel dilemma del prigioniero per spostarsi dall’equilibrio (C,C)
all’equilibrio (N,N). In questo caso i giocatori hanno un incentivo a deviare da (N,N) a (C,C) e quindi nessuno vorrà
giocare (N,N). Nel caso di scelta tra due equilibri, invece, una volta raggiunto un equilibrio non c’è incentivo a deviare
e quindi il coordinamento attraverso la Pareto-dominanza è possibile.
7
Coordinamento Pericoloso
Player2►
Grande
Player1▼
Grande
Piccolo
2,2
-1,-1
Piccolo
-1000,-1
1,1
In questo caso non è chiaro se il giocatore 1 voglia effettivamente giocare la strategia Grande in
quanto se ci fosse anche una piccola probabilità che i due giocatori non si coordino il giocatore 1
subirebbe una perdita ingente -1000.
Infine ci sono casi come nella Battaglia dei Sessi dove vi è più di un equilibrio. Ciascun giocatore
(uomo o donna) trova piacere a trascorrere una serata assieme al compagno o alla compagna ma la
donna preferisce andare a teatro a vedere un balletto mentre l’uomo preferisce andare a vedere un
incontro di box.
Battaglia dei Sessi
Uomo►
Balletto
Donna▼
Balletto
Box
2,1
0,0
Box
0,0
1,2
In questo caso i due equilibri sono entrambi possibili. Se i due giocatori non hanno giocato la
battaglia dei sessi in precedenza è estremamente difficile prevedere quale sarà il risultato, perché
non c’è una via ovvia per i giocatori di coordinare le loro aspettative. Tuttavia nelle situazioni reali i
giocatori possono essere in grado di coordinarsi su un equilibrio particolare. Provate voi a trovare la
ragione per la quale la previsione (Balletto, Balletto) potrebbe essere l’equilibrio....
Quinto, vi sono alcune relazioni tra equilibrio in strategie dominanti, equilibrio in eliminazione
delle strategie dominate e equilibrio di Nash:
• ogni equilibrio in strategie dominanti è anche un equilibrio in eliminazione delle strategie
dominate ed è anche un equilibrio di Nash ma non vale sempre il contrario.
• ogni equilibrio in eliminazione delle strategie dominate è anche un equilibrio di Nash ma
non vale sempre il contrario.
GIOCHI DINAMICI
La forma estesa
I giochi dinamici o sequenziali si rappresentano in forma estesa e cioè attraverso un albero. In
ciascun nodo dell’albero vi è un giocatore che deve compiere una scelta. Nel gioco del Mercato del
Cemento ci sono due imprese: l’impresa che è già sul mercato del cemento (Incumbent) e l’impresa
che deve decidere se entrare nel mercato del cemento o in un altro mercato. Nei giochi dinamici è
molto importante identificare l’ordine con cui vengono prese le decisioni. In questo caso l’Entrante
è il primo a muovere e decide se entrare nel mercato del cemento o in un altro mercato.
Successivamente l’Incumbent, dopo aver visto la mossa dell’entrante, decide se aumentare la
propria capacità produttiva oppure mantenerla invariata.
8
Mercato del Cemento (forma estesa)
Entrante
altro
mercato
Incumbent
Espandere
Payoffs:
Entrante
Incumbent
12
30
Mantenere
Cemento
Incumbent
Espandere
12
20
5
5
Mantenere
15
10
Nei giochi dinamici è importante fare una distinzione tra mosse e strategie. In questo gioco
l’Incumbent ha 2 mosse e cioè Espandere o Mantenere, ma ha 4 strategie! Una strategia è un
contingent plan e cioè un libretto di istruzioni nel quale il giocatore deve indicare come si vuole
comportare durante il gioco. In particolare, l’Incumbent essendo secondo a muovere può
condizionare (cioè far dipendere) la sua scelta in funzione di quanto ha fatto l’Entrante. Quindi le
strategie dell’Incumbent sono:
a) Strategia 1: Espandere in ogni caso: (x|a, x|c): cioè scelgo x dato che l’entrante ha scelto a e
scelgo x dato che l’entrante ha scelto c.
b) Strategia 2: Espandere quando l’entrante va nell’altro mercato ma Mantenere quando l’entrante
sceglie cemento: (x|a, m|c)
c) Strategia 3: Mantenere quando l’entrante sceglie l’altro mercato ma Espandere quando l’entrante
sceglie cemento: (m|a, x|c)
d) Strategia 4: Mantenere in ogni caso: m|a, m|c.
Le strategie dell’entrante sono semplicemente a e c.
Un gioco dinamico può essere rappresentato in forma normale (cioè a matrice) utilizzando le
singole strategie dei giocatori.
Mercato del Cemento (forma normale)
Incumbent►
s1= x|a, x|m s2= x|a, m|c
Entrante▼
Altro mkt
Cemento
12,30
5,5
12,30
15,10
s3= m|a, x|c
s4= m|a, m|c
12,20
5,5
12,20
15,10
Avendo ora un gioco in forma normale possiamo identificare gli equilibri di Nash. In particolare si
osserva che vi sono 3 equilibri di Nash e cioè (a,s1), (c,s2) e (c,s3). Come si vede nei giochi
dinamici l’equilibrio di Nash è piuttosto povero in termini di previsioni (cioè sono troppo vaghe).
Quindi si procede ad utilizzare un concetto di equilibrio più raffinato (quello che gli economisti
chiamano equilibrio perfetto).
L’equilibrio perfetto è quell’equilibrio di Nash che sopravvive una volta che si eliminano gli
equilibri che contengono strategie non credibili.
In particolare si osservi l’equilibrio (a,s1). La strategia s1 non è una strategia credibile. Infatti se la
prima parte (x|a) concorda con l’ipotesi di razionalità dell’Incumbent, la seconda parte (x|m) no.
Infatti, “non è credibile” che se l’entrante sceglie cemento, l’Incumbent voglia scegliere di
Espandere ottenendo un payoff di 5 al posto di Mantenere da cui trarrebbe un payoff di 15. Quindi
l’equilibrio (a,s1) è da scartare in quanto contiene strategie non credibili.
9
Allo stesso modo l’equilibrio (c,s3) è da scartare, in quanto non è credibile che l’Incumbent voglia
Mantenere la produzione se l’entrante sceglie Altro mercato.
L’equilibrio (c,s2) sopravvive ed è l’unico equilibrio perfetto. Infatti se l’entrante sceglie altro
l’Incumbent correttamente sceglie di Espandere ma quando l’entrante sceglie Cemento, l’Incumbent
sceglie Mantenere.
Quindi diremo che la coppia di strategie (c, s2) sono l’equilibrio di questo gioco dinamico che
portano al payoff (15,10). Diremo altresì che le mosse c e m costituiscono il percorso d’equilibrio e
cioè identificano i rami lungo cui si svolge il gioco.
Backward induction
E’ importante notare che non è necessario trasformare il gioco in forma normale per identificare il
percorso di equilibrio ma questa operazione può essere fatta molto più semplicemente attraverso la
backward induction e cioè l’induzione a ritroso. La backward induction è la tecnica abitualmente
usata per risolvere i giochi dinamici. Si parte dai nodi terminali e cioè quei nodi i cui rami
terminano tutti con i payoff e si analizza quale scelta verrà compiuta dal giocatore qualora si
trovasse nel nodo stesso. Nel nostro esempio i 2 nodi terminali sono quelli dove deve scegliere
l’Incumbent. In ciascuno dei nodi terminali si identifica la scelta compiuta dal giocatore e si pone in
evidenza il segmento scelto. Da quel momento i rami non selezionati sono da considerarsi
inesistenti. Una volta individuati tutti i rami attivi ci si sposta ai nodi di livello superiore. In questo
caso la scelta del giocatore dovrà tenere conto solo dei rami attivi. Anche in questo caso si pone in
evidenza il segmento scelto e i rami non selezionati sono da considerarsi inesistenti. La procedura
termina quando si individua a ritroso il percorso completo (percorso di equilibrio) che va dal nodo
del primo giocatore fino ai payoff.
Mercato del Cemento (forma estesa)
Entrante
altro
mercato
Incumbent
Espandere
Payoffs:
Entrante
Incumbent
12
30
B
Mantenere
12
20
A
Cemento
Incumbent
Espandere
5
5
C
Mantenere
15
10
Applicando la backward induction al Mercato del Cemento. Consideriamo prima il nodo terminale
B dove l’Incumbent qualora si trovasse a quel punto del gioco sceglierebbe Mantenere.
Evidenziamo quindi il ramo corrispondente alla mossa Mantenere. Consideriamo ora il nodo B e
con il medesimo ragionamento evidenziamo il ramo Espandere. Al nodo A, l’Entrante per scegliere
tra cemento e altro mercato considera solo i rami attivi e quindi i corrispondenti payoff. Se sceglie
Cemento sa di ottenere 15 mentre se sceglie Altro ottiene solo 12. Il percorso di equilibrio del gioco
è quindi l’entrante sceglie Cemento e l’Incumbent sceglie Mantenere.
Il Centipede è un gioco in cui in ciascun momento uno dei giocatori può decidere di terminare il
gioco. Il gioco è stato costruito di modo che l’ultimo nodo della sequenza in corrispondenza della
scelta R’’ dia un payoff maggiore per entrambi i giocatori rispetto alle scelte di terminare
immediatamente il gioco. Tuttavia il gioco non raggiunge mai la fine in quanto in ogni istante i
10
giocatori hanno un incentivo a terminare il gioco immediatamente. Usando la backward induction si
osserva che il gioco termina immediatamente in quanto il giocatore 1 sceglie L.
Il Centipede
Giocatore 1
R
L
Giocatore 2
L’
1
1
0
3
R’
Giocatore 1
L’’
4
2
R’’
3
3
ESERCIZI
Esercizio 1 - Il gioco dei maiali rinchiusi
Due maiali sono messi in una stanza dove da un lato vi è un pulsante e all’altra estremità vi è un
distributore di cibo. Quando un maiale schiaccia il pulsante a un costo di 2 in termini di utilità, il
distributore eroga cibo per un valore di 10 utilità. Uno dei due maiali (Big) la fa da padrone nel
senso che qualora arrivasse per primo al cibo, lascerebbe solo le briciole per il secondo (cioè
lascerebbe solo 1 utilità di cibo). Se invece l’altro maiale (Small) arriva per primo, consuma 4 unità.
Se arrivassero nel medesimo tempo, il maiale Small consumerebbe solo 3 unità. Le strategie di
ciascun maiale sono Schiacciare il pulsante o Aspettare. Naturalmente i maiali sono agenti
razionali.
Big 1
Pulsante
Big
Small
cibo
Domande:
1a) Scrivete la matrice dei payoff
1b) Identificate, l’equilibrio / gli equilibri di Nash
11
Esercizio 2 – Gioco Riga – Colonna bis
Considerate il seguente gioco
Player2►
Player1▼
C1
C2
C3
C4
R1
R2
R3
R4
0,7
5,2
7,0
6,6
2,5
3,3
2,5
2,2
7,0
5,2
0,7
4,4
6,6
2,2
4,4
10,3
Domande:
2a) Identificate se esistono delle strategie dominanti
2b) Trovare l’equilibrio / gli equilibri di Nash.
Esercizio 3 Marco - Paolo
Si consideri il seguente gioco, i cui payoff sono rappresentati in forma normale:
Marco►
Paolo▼
Ovest
Centro
4,9
0,6
Nord
6,2
8,4
Sud
Payoff: Paolo, Marco.
Est
0,4
5,11
Domande
3a) Indicare se esistono strategie dominanti da parte dei due giocatori.
3b) Indicare qual è/ quali sono gli equilibri di Nash.
3c) Trasformate il precedente gioco in un gioco sequenziale (dinamico), immaginando che Marco
possa scegliere prima di Paolo e Paolo scelga per secondo. Calcolate il nuovo percorso di equilibrio.
Esercizio 4 – Gioco del Cemento (rivisto)
Domande
4a) Trasformate il gioco in un gioco simultaneo e calcolate l’equilibrio di Nash
4b) Trasformate il gioco in un gioco dinamico dove l’Incumbent fa la prima mosso e trovate il
percorso di l’equilibrio.
4c) Discutete il ruolo del vantaggio della prima mossa (first mover advantage). E’ meglio essere i
primi a giocare o secondi, e perchè?
12
Scarica

1 TEORIA DEI GIOCHI – Marco Alderighi Esempio. La maggiore