Esercizi TdG per PoliMI
1
c
โFioravante
Patrone
Esercizi TdG per PoliMI
Esercizio 1 Trovare gli equilibri di Nash (in strategie pure) dei giochi seguenti.
I โ II
๐
๐ต
I โ II
๐
๐ต
๐ฟ
๐
100, 100
1, 1
1, 1
100, 100
๐ฟ
๐
99, 99 0, 0
0, 0 98, 98
Quale pensate venga e๏ฌettivamente giocato? Commentare.
Esercizio 2 Nellโesercizio precedente, si puoฬ essere indotti a ritenere che
una diminuzione dei payo๏ฌ possa portare addirittura ad un esito migliore
per i giocatori.
Dโaltro canto, le funzioni di utilitaฬ di von Neumann-Morgenstern sono
de๏ฌnite a meno di trasformazioni lineari strettamente crescenti. Cioฬ potrebbe
indurre a ritenere che lโa๏ฌermazione precedente non sia signi๏ฌcativa. Eโ una
obiezione fondata o no? Occorre fare qualche ulteriore precisazione?
Esercizio 3 Trovare gli equilibri di Nash sia in pure che in miste per seguente gioco (Dilemma del Prigioniero), in cui: ๐ < ๐ < ๐ < ๐.
I โ II
๐
๐ต
๐ฟ
๐
๐, ๐ ๐, ๐
๐, ๐ ๐, ๐
Esercizio 4 Trovare gli equilibri di Nash per lโestensione mista del gioco:
โ
๐ผ โ๐ผ๐ผ
T
L
C
R
(3, 2)
(5, 4)
(7, 8)
B
(5, 9) (1, 11) (4, 3)
Esercizio 5 Si consideri un gioco a due sole โmosseโ e ad informazione
perfetta. Individuare condizioni che garantiscano lโunicitaฬ del SPE.
Esercizio 6 Descrivere una strategia del gioco del โtrisโ, per il primo giocatore.
Esercizio 7 Determinare gli SPE per entrambi i giochi in ๏ฌgura. Commentare.
Esercizi TdG per PoliMI
2
c
โFioravante
Patrone
๐ผr
๐ผr
@
๐
๐ผ๐ผr
A
๐ AA๐
A
r
Ar
(0, 0)
(2, 0)
@
@ ๐ต
@
@
@r๐ผ๐ผ
A
๐ฟ AA๐
A
r
Ar
(1, 0)
๐
@
@
@r๐ผ๐ผ
A
๐ฟ AA๐
A
r
Ar
๐ผ๐ผr
A
๐ AA๐
A
r
Ar
(1, 0)
(0, 0)
๐ต
@
(2, 0)
(1, 1)
(1, 1)
Esercizio 8 Si consideri il seguente gioco in forma estesa:
0c
1/3
๐
๐ผ๐ผ s
A
A
๐ฟ1
A ๐
1
A
As
s
1
2
2
1
s
@
@ ๐ต
@
@
HH
HH
๐ผ
H 2/3
HH
H
HH s
@
๐
0
0
๐ฟ2
s
1
0
A
A
๐ต
@
@
๐ผ๐ผ s
@s
@
A ๐
2
A
As
0
1
a) scriverne la forma strategica;
b) determinarne gli equilibri di Nash in strategie pure;
c) esistono strategie dominate?
Esercizio 9 Si consideri il seguente gioco in forma estesa:
@s
2
2
Esercizi TdG per PoliMI
3
c
โFioravante
Patrone
๐ผc
๐ฟ1
s
5
0
HH
H
HH ๐ต1
๐1 H
HH
HHs๐ผ๐ผ
๐ผ๐ผ s
@
@
@ ๐
2
@ ๐
1
๐ฟ2
@
@
@
@
๐ผ
s
@s
@s
A
A
4
A ๐ต
A ๐ต
๐
๐
2
2
4
A 2
A 2
A
A
As
As
s
s
2
1
0
0
2
0
0
2
a) scriverne la forma strategica;
b) determinarne gli equilibri di Nash in strategie pure (se esistono);
c) trovarne gli equilibri perfetti nei sottogiochi (se esistono)
Esercizio 10 Determinare gli eventuali equilibri di Nash in strategie pure
del seguente gioco in forma strategica:
๐ผโ๐ผ๐ผ ๐ฟ
๐ถ
๐
๐
0, 1 โ1, 3 1, 3
๐ 0, 2 1, 1 2, 0
๐ต
1, 0 1, โ1 3, 0
Esistono strategie debolmente dominate? E strategie fortemente dominate?
Esercizio 11 Si considerino i seguenti due giochi in forma estesa:
Esercizi TdG per PoliMI
4
c
โFioravante
Patrone
gioca 1
@
@
E
F
@
@
@
gioca 2
@ gioca 2
A
A
C AD
A
4
0
2
1
A
A
A
A B
A
1
2
3
0
gioca 1
E
@
@
F
@
@
@
gioca 2
..........................................................
A
A
A
A B
A
1
2
3
0
@
A
A
A AB
A
4
0
2
1
Scrivere la forma strategica di entrambi (uno eฬ a informazione perfetta,
mentre lโaltro non lo eฬ).
Calcolare gli equilibri di Nash in strategie pure e gli equilibri perfetti nei
sottogiochi di quello dei due che eฬ a informazione perfetta.
Calcolare gli equilibri di Nash in strategie miste di quello non a informazione perfetta.
Esercizio 12 Dato il seguente gioco in forma estesa, descriverlo in forma
strategica:
Esercizi TdG per PoliMI
5
c
โFioravante
Patrone
gioca 1
@
A
@ B
@
@
@
gioca 2
@
2
1
A
A
C
A D
A
1
0
2
0
Calcolarne poi gli equilibri di Nash in strategie pure.
Esercizio 13 Calcolare gli equilibri di Nash in strategie miste del seguente
gioco:
I/II
๐ 1
๐ 2
๐ก1
๐ก2
1,2 2,1
3,1 1,3
Esercizio 14 Calcolare lโequilibrio di Nash in strategie completamente miste del seguente gioco (di Aumann) in forma strategica:
โ
๐ผ โ๐ผ๐ผ
T
(6, 6) (2, 7)
B
(7, 2) (0, 0)
L
R
Esercizio 15 Diciamo che un gioco (a due giocatori) ๐บ = (๐, ๐, ๐, ๐) eฬ
simmetrico se ๐ = ๐ e ๐ (๐ฅ, ๐ฆ) = ๐(๐ฆ, ๐ฅ) per ogni ๐ฅ, ๐ฆ โ ๐.
a) Si provi che, in un gioco simmetrico, se (¯
๐ฅ, ๐ฆ¯) eฬ un equilibrio di Nash,
allora (¯
๐ฆ , ๐ฅ¯) eฬ anchโesso un equilibrio.
b) Eโ vero che in un gioco simmetrico tutti gli equilibri sono del tipo (¯
๐ฅ, ๐ฅ¯)?
c) Eโ vero che in un gioco simmetrico cโeฬ sempre un equilibrio del tipo (¯
๐ฅ, ๐ฅ¯)?
d) I giochi classici come il โdilemma del prigionieroโ e la โbattaglia dei sessiโ
sono descritti da me con una tabella nella quale le strategie per ๐ผ sono ๐, ๐ต e
per ๐ผ๐ผ sono invece ๐ฟ, ๐
. In altre parole, non abbiamo che ๐ = ๐ . Tuttavia,
sembra ragionevole considerare simmetrici anche questi giochi. Riconsiderare
la de๏ฌnizione data ed adattarla convenientemente in modo da โcoprireโ anche
questi casi. Eโ il caso di criticare la de๏ฌnizione data?
Esercizi TdG per PoliMI
c
โFioravante
Patrone
6
Esercizio 16 Due giocatori devono scegliere, a turno, una lettera fra {๐ด, ๐ต, ๐ถ}.
Sono ammesse ripetizioni. Ognuno dei due giocatori ha due turni a disposizione.
Si commenti la seguente a๏ฌermazione:
Ogni โstoriaโ del gioco eฬ identi๏ฌcata da una sequenza di 4 caratteri scelti tra ๐ด, ๐ต, ๐ถ. Ad esempio, le seguenti sequenze identi๏ฌcano di๏ฌerenti storie: ๐ด๐ด๐ด๐ด, ๐ด๐ต๐ถ๐ด, ๐ถ๐ต๐ด๐ด, etc. Pertanto,
le strategie a disposizione dei due giocatori sono date da tutte le
sequenze di questo tipo e quindi sono 34 .
Esercizi TdG per PoliMI
7
c
โFioravante
Patrone
SOLUZIONI
Esercizio 1 Soluzione
Gli equilibri di Nash sono (๐, ๐ฟ) e (๐ต, ๐
) per entrambi i giochi. I commenti a voi!
Esercizio 2 Soluzione
Che una diminuzione dei payo๏ฌ possa portare a un esito (di equilibrio)
migliore per i giocatori eฬ mostrato dallโesercizio menzionato nel testo.
Lโobiezione chiede di precisare il valore interpretativo di questa osservazione. Se siamo di fronte a due situazioni diverse di gioco, lโosservazione
fatta sulle trasformazioni lineari dei payo๏ฌ puoฬ essere pertinente. Se invece
i payo๏ฌ scaturiscono dalla stessa funzione di utilitaฬ che viene applicata ad
esiti diversi, come accade nellโesempio (di game form) qui illustrato:
I โ II
๐
๐ต
๐ฟ
๐
๐
๐
๐
๐
I โ II
๐
๐ต
๐ฟ
๐
๐
๐
๐
๐
in cui i nostri decisori preferiscono lโesito ๐ ad ๐, cosฤฑฬ come ๐ ad ๐, etc., allora
possiamo e๏ฌettivamente a๏ฌermare che lโesito prevedibile della situazione di
sinistra eฬ preferito allโesito prevedibile che si ha nella situazione di destra.
Esercizio 3 Soluzione
Lโunico equilibrio di Nash in strategie pure eฬ (๐ต, ๐
).
Vediamo le strategie miste. Se ๐ผ gioca la strategia mista (๐, 1 โ ๐) e ๐ผ๐ผ
gioca (๐, 1 โ ๐), il payo๏ฌ atteso per ๐ผ eฬ:
๐๐๐ + ๐๐(1 โ ๐) + ๐(1 โ ๐)๐ + ๐(1 โ ๐)(1 โ ๐) =
= [(๐ โ ๐)๐ + (๐ โ ๐)(1 โ ๐)]๐ + (๐ โ ๐)๐ + ๐
Per ipotesi ๐ โ ๐ < 0 e ๐ โ ๐ < 0, quindi (๐ โ ๐)๐ < 0 tranne che per ๐ = 0,
peroฬ in tal caso (๐ โ ๐)(1 โ ๐) < 0, pertanto (๐ โ ๐)๐ + (๐ โ ๐)(1 โ ๐) < 0
qualunque sia ๐.
Pertanto il payo๏ฌ per ๐ผ eฬ massimo (qualunque sia ๐) per ๐ = 0. Quindi
la โbest replyโ per ๐ผ eฬ sempre ๐ = 0 per ogni ๐.
Discorso del tutto simmetrico vale per ๐ผ๐ผ, per il quale la โbest replyโ eฬ
๐ = 0 per ogni ๐ โ [0, 1].
Possiamo anche disegnare il gra๏ฌco delle โbest replyโ:
Esercizi TdG per PoliMI
๐ผ๐ผ
8
c
โFioravante
Patrone
6
1
best reply di ๐ผ
best reply di ๐ผ๐ผ
e
equilibrio di Nash
e
-
1
๐ผ
Quindi, lโestensione mista del dilemma del prigioniero ha un unico equilibrio di Nash che corrisponde allโunico equilibrio in strategie pure del gioco
dato.
Dโaltronde, questi risultati erano ampiamente scontati: dato che la strategia ๐ eฬ fortemente dominata, qualunque strategia mista che sia โbest replyโ
assegna sempre probabilitaฬ 0 a ๐ . Per i dettagli, si puoฬ consultare la soluzione
dellโesercizio seguente.
Esercizio 4 Soluzione
Osserviamo preliminarmente che la strategia ๐ฟ eฬ fortemente dominata da
๐ถ. Ne segue che ogni strategia mista di ๐ผ๐ผ che sia miglior risposta a una
qualunque strategia di ๐ผ assegna sempre probabilitaฬ 0 ad ๐ฟ (se per assurdo
fosse assegnata ad ๐ฟ una probabilitaฬ positiva, converrebbe โtrasferireโ tale
probabilitaฬ dalla strategia ๐ฟ alla strategia ๐ถ, ottenendo un payo๏ฌ atteso
di ๐ผ๐ผ strettamente maggiore, in contraddizione con lโassunto che fosse una
โmiglior rispostaโ).
Ci si puoฬ quindi restringere, nella ricerca di equilibri, alle strategie miste
del tipo (0, ๐, 1 โ ๐) per ๐ผ๐ผ (con ovvio signi๏ฌcato dei simboli, si spera!).
Il payo๏ฌ atteso per ๐ผ da (๐, 1 โ ๐) e (0, ๐, 1 โ ๐) eฬ:
5๐๐ + 7๐(1 โ ๐) + 1(1 โ ๐)๐ + 4(1 โ ๐)(1 โ ๐) =
= (๐ + 3)๐ + (4 โ 3๐)
Esercizi TdG per PoliMI
9
c
โFioravante
Patrone
Poicheฬ il coe๏ฌciente di ๐ eฬ maggiore di 0, la โbest replyโ per ๐ผ eฬ sempre
๐ = 1. Cosa che non dovrebbe sorprendere, visto che โeliminataโ la strategie
๐ฟ la strategia ๐ต di ๐ผ diventa fortemente dominata . . .
Per quanto riguarda ๐ผ๐ผ, il suo payo๏ฌ atteso e:
4๐๐ + 8๐(1 โ ๐) + 11(1 โ ๐)๐ + 3(1 โ ๐)(1 โ ๐) =
= (โ12๐ + 8)๐ + (5๐ + 3)
E, allora, se ๐ < 2/3 la โbest replyโ per ๐ผ๐ผ eฬ ๐ = 1, per ๐ > 2/3 eฬ ๐ = 0, ed
in๏ฌne per ๐ = 2/3 eฬ tutto lโintervallo [0, 1].
Disegniamo i gra๏ฌci delle migliori risposte per trovare gli equilibri di Nash:
๐ผ๐ผ
6
1
best reply di ๐ผ
best reply di ๐ผ๐ผ
e
equilibrio di Nash
e
1
-
๐ผ
Come era prevedibile, troviamo un solo equilibrio di Nash (che eฬ, di fatto, in strategie pure): dopotutto la coppia (๐, ๐
) eฬ lโunica che sopravvive
allโeliminazione iterata di strategie fortemente dominate.
Esercizio 5 Soluzione
Una condizione su๏ฌciente eฬ che i payo๏ฌ di ๐ผ๐ผ siano tutti distinti tra loro
e cosฤฑฬ i payo๏ฌ di ๐ผ. In questo modo siamo certi che quando ๐ผ๐ผ sceglie, ad
ogni nodo, la sua โmossaโ migliore, questa eฬ univocamente determinata. Per
lo stesso motivo, anche la scelta di ๐ผ saraฬ univoca.
Esercizi TdG per PoliMI
c
โFioravante
Patrone
10
Esercizio 6 Soluzione
Vediamo una descrizione parziale. Intanto, una codi๏ฌca per le caselle del
โtrisโ:
1 2 3
4 5 6
7 8 9
Allora, una strategia per il giocatore ๐ผ (cioeฬ per il giocatore che comincia
il gioco) eฬ:
โ primo turno per ๐ผ
mette la croce su 1
โ secondo turno per ๐ผ
se ๐ผ๐ผ ha messo il tondo su una delle caselle da 3 a 9, allora ๐ผ mette
la croce su 2
se ๐ผ๐ผ ha messo il tondo sulla casella 2, ๐ผ mette la croce su 3
โ terzo turno per ๐ผ
se ๐ผ๐ผ ha messo il tondo su una delle caselle da 5 a 9, allora ๐ผ mette
la croce su 3 (se non lโaveva messa su 3 giaฬ ๐ผ๐ผ o ๐ผ stesso; in tal caso ๐ผ
la mette su 4)
se ๐ผ๐ผ ha messo il tondo sulla casella 4, ๐ผ mette la croce su 3 (se
non lโaveva messa su 3 giaฬ ๐ผ๐ผ o ๐ผ stesso; in tal caso ๐ผ la mette su 4)
se ๐ผ๐ผ ha messo il tondo sulla casella 3, ๐ผ mette la croce su 4 (se
non lโaveva messa su 3 giaฬ ๐ผ๐ผ o ๐ผ stesso; in tal caso ๐ผ la mette su 4)
โ e cosฤฑฬ via . . .
In realtaฬ stiamo scrivendo un โlibretto di istruzioniโ che vuole descrivere
una strategia molto semplice da spiegare: il giocatore ๐ผ mette ad ogni suo
turno la sua crocetta sulla casella libera contraddistinta dal numero (nella
numerazione che abbiamo dato) piuฬ basso.
Lโabbozzo di descrizione minuziosa precedente puoฬ indurre a immaginare
che una descrizione esaustiva sia molto complicata (se lo eฬ giaฬ cosฤฑฬ, volendo
descrivere una strategia molto semplice, ๏ฌguriamoci la descrizione di una
strategia piuฬ โcontortaโ).
Forse vale anche la pena di โcontareโ quante sono le strategie a disposizione di ๐ผ: sono
9 โ
79โ
8 โ
59โ
8โ
7โ
6 โ
39โ
8โ
7โ
6โ
5โ
4 โ
19โ
8โ
7โ
6โ
5โ
4โ
3โ
2 = 9 โ
772 โ
53024 โ
360480 โ
Esercizi TdG per PoliMI
11
c
โFioravante
Patrone
โ 9 โ
7, 03 โ
1060 โ
4, 84 โ
102113 โ
1, 96 โ
1028856 โ
โ 6, 02 โ
1031031
Questo numero eฬ molto piuฬ grande di quanto di solito uno immagina prima
di fare i calcoli espliciti. Va detto che il calcolo fatto presuppone che il gioco
๏ฌnisca solo quando sono state riempite tutte le nove caselle. Se si ritiene
che il gioco ๏ฌnisca non appena uno dei giocatori ha fatto un tris, allora il
numero si riduce ma resta comunque molto, molto alto. Come mai allora
il tris viene considerato, ed a ragione, un gioco poco interessante? Percheฬ,
nonostante questo numero cosฤฑฬ grande di strategie, lโanalisi del gioco viene
molto sempli๏ฌcata se si tiene conto delle simmetrie del gioco e, soprattutto, se
si eฬ interessati a trovare solo una strategia vincente o quanto meno ottimale:
in tal caso, molte alternative sono ovviamente da scartare.
Esercizio 7 Soluzione
Il gioco a sinistra ha i seguenti SPE: (๐ต, ๐๐ฟ), (๐ต, ๐๐
), (๐, ๐๐ฟ), (๐, ๐๐
).
Anche per quello di destra gli SPE sono (๐ต, ๐๐ฟ), (๐ต, ๐๐
), (๐, ๐๐ฟ), (๐, ๐๐
). I
commenti a voi.
Esercizio 8 Soluzione
Le strategie a disposizione di ๐ผ sono ๐ e ๐ต. Quelle per ๐ผ๐ผ sono ๐ฟ1 ๐ฟ2 , ๐ฟ1 ๐
2 ,
๐
1 ๐ฟ2 , ๐
1 ๐
2 .
Se ๐ผ sceglie ๐ต, il payo๏ฌ atteso (per qualunque strategia di ๐ผ๐ผ) eฬ: 31 0+ 23 2 =
4
2, sia per ๐ผ che per ๐ผ๐ผ. Se invece ๐ผ sceglie ๐ , i payo๏ฌ attesi sono:
3
- se ๐ผ๐ผ gioca ๐ฟ1 ๐ฟ2 : 13 1 + 32 1 = 1 per ๐ผ e 13 2 + 23 0 =
2
3
per ๐ผ๐ผ
- se ๐ผ๐ผ gioca ๐ฟ1 ๐
2 : 31 1 + 32 0 =
1
3
per ๐ผ e 31 2 + 23 1 =
4
3
per ๐ผ๐ผ
- se ๐ผ๐ผ gioca ๐
1 ๐ฟ2 : 13 2 + 32 1 =
4
3
per ๐ผ e 31 1 + 23 0 =
1
3
per ๐ผ๐ผ
- se ๐ผ๐ผ gioca ๐
1 ๐
2 : 13 2 + 23 0 =
2
3
per ๐ผ e 31 1 + 23 1 = 1 per ๐ผ๐ผ
Pertanto, la forma strategica eฬ la seguente:
โ
๐ผ โ๐ผ๐ผ ๐ฟ1 ๐ฟ2 ๐ฟ1 ๐
2 ๐
1 ๐ฟ2 ๐
1 ๐
2
๐
(1, 32 ) ( 13 , 34 ) ( 43 , 31 ) ( 23 , 1)
๐ต
( 43 , 43 )
( 43 , 34 ) ( 43 , 34 )
( 43 , 43 )
Si veri๏ฌca immediatamente che il gioco dato ha 4 equilibri di Nash:
(๐ต, ๐ฟ1 ๐ฟ2 ), (๐ต, ๐ฟ1 ๐
2 ), (๐ต, ๐
1 ๐ฟ2 ), (๐ต, ๐
1 ๐
2 ).
Esercizi TdG per PoliMI
c
โFioravante
Patrone
12
Non vi sono strategie fortemente dominanti. Sia la strategia ๐ต per ๐ผ
che la strategia ๐ฟ1 ๐
2 per ๐ผ๐ผ sono strettamente dominanti. Altre strategie
dominanti non ve ne sono.
Esercizio 9 Soluzione
La forma strategica eฬ (eฬ sottolineata la โbest replyโ per ๐ผ e sopralineata
quella per ๐ผ๐ผ):
โ
๐ผ โ๐ผ๐ผ
๐1 ๐2
๐ฟ1 ๐ฟ2
๐ฟ1 ๐
2
๐
1 ๐ฟ2
๐
1 ๐
2
(5, 0)
(5, 0)
(4, 4)
(4, 4)
๐1 ๐ต2
(5, 0)
(5, 0)
(4, 4)
(4, 4)
๐ต1 ๐2
(2, 1)
(2, 0)
(2, 1)
(2, 0)
๐ต1 ๐ต2
(0, 0)
(0, 2)
(0, 0)
(0, 2)
Vi sono pertanto quattro equilibri in strategie pure: (๐1 ๐2 , ๐
1 ๐ฟ2 ), (๐1 ๐2 , ๐
1 ๐
2 ),
(๐1 ๐ต2 , ๐
1 ๐ฟ2 ), (๐1 ๐ต2 , ๐
1 ๐
2 ).
Il gioco dato ha due sottogiochi propri. Uno, quello a sinistra in ๏ฌgura, ha
come equilibrio ๐
1 . Il sottogioco a destra ha, come unico equilibrio, (๐2 , ๐ฟ2 ),
come si veri๏ฌca agevolmente dalla forma strategica riportata qui sotto:
โ
๐ผ โ๐ผ๐ผ
๐2
(2, 1) (2, 0)
๐ต2
(0, 0) (0, 2)
๐ฟ2
๐
2
Pertanto, dei quattro equilibri di Nash, lโunico che eฬ perfetto nei sottogiochi (cioeฬ lโunico la cui restrizione ai sottogiochi eฬ ancora un equilibrio) eฬ
(๐1 ๐2 , ๐
1 ๐ฟ2 ).
Esercizio 10 Soluzione
Indichiamo la โbest replyโ sottolineando i vari elementi della matrice:
๐ผโ๐ผ๐ผ ๐ฟ
๐ถ
๐
๐
0, 1 โ1, 3 1, 3
๐ 0, 2 1, 1 2, 0
๐ต
1, 0 1, โ1 3, 0
Quindi gli equilibri di Nash sono (๐ต, ๐ฟ) e (๐ต, ๐
).
La strategia ๐ eฬ fortemente dominata da ๐ต. La strategia ๐ eฬ debolmente
dominata da ๐ e da ๐ต. La strategia ๐ eฬ debolmente dominata da ๐ต. Il
giocatore ๐ผ๐ผ non ha strategie dominate.
Esercizi TdG per PoliMI
c
โFioravante
Patrone
13
Esercizio 11 Soluzione
La forma strategica del primo gioco eฬ:
๐ผโ๐ผ๐ผ ๐ด๐ถ ๐ด๐ท ๐ต๐ถ ๐ต๐ท
๐ธ
1, 3 1, 3 2, 0 2, 0
๐น
4, 2 0, 1 4, 2 0, 1
Nella forma strategica abbiamo giaฬ sottolineato i payo๏ฌ per mostrare la best
reply e trovare gli equilibri di Nash. Gli equilibri di Nash sono (๐ธ, ๐ด๐ท),
(๐น, ๐ด๐ถ) e (๐น, ๐ต๐ถ). Di questi (๐น, ๐ด๐ถ) eฬ lโunico equilibrio perfetto nei sottogiochi (cosa che si veri๏ฌca agevolmente applicando lโinduzione a ritroso).
La forma strategica del secondo gioco eฬ:
๐ผโ๐ผ๐ผ ๐ด ๐ต
๐ธ
1, 3 2, 0
๐น
4, 2 0, 1
Anche qui abbiamo sottolineato, etc... Il gioco ha un solo equilibrio di Nash:
(๐น, ๐ด).
Per quanto riguarda le strategie miste, usiamo come di solito ๐, 1โ๐ e ๐, 1โ๐
per indicare le strategie miste rispettivamente di ๐ผ e ๐ผ๐ผ.
Il payo๏ฌ atteso di ๐ผ eฬ:
๐ (๐, ๐) = ๐๐ + 2๐(1 โ ๐) + 4(1 โ ๐)๐ = ๐๐ + 2๐ โ 2๐๐ + 4๐ โ 4๐๐ =
= โ5๐๐ + 2๐ + 4๐ = ๐(2 โ 5๐) + 4๐
Quindi per ๐ < 2/5 la best reply per ๐ผ eฬ ๐ = 1, per ๐ = 2/5 eฬ tutto [0, 1], per
๐ > 2/5 la best reply eฬ ๐ = 0.
Per ๐ผ๐ผ il payo๏ฌ atteso eฬ:
๐(๐, ๐) = 3๐๐ + 2๐(1 โ ๐) + (1 โ ๐)(1 โ ๐) = 3๐๐ + 2๐ โ 2๐๐ + 1 โ ๐ โ ๐ + ๐๐ =
= 2๐๐ โ ๐ + 1 + ๐ = ๐(2๐ + 1) + (1 โ ๐)
La best reply per ๐ผ๐ผ eฬ sempre ๐ = 1, qualunque sia ๐.
In ๏ฌgura 1 disegniamo le best reply.
Le best reply ci permettono di individuare gli equilibri di Nash in strategie
miste. Lโunico che troviamo eฬ indicato in ๏ฌgura, e corrisponde a ๐ = 0 e
๐ = 1. Vale a dire, si tratta dellโequilibrio in strategie pure che giaฬ avevamo
trovato.
Potevamo in realtaฬ risparmiarci i conti, semplicemente osservando che la
strategia ๐ด domina strettamente ๐ต.
Esercizi TdG per PoliMI
II
14
c
โFioravante
Patrone
6
1
c
best reply di ๐ผ
best reply di ๐ผ๐ผ
c
2
5
equilibrio di Nash
-
1
I
Figura 1: I gra๏ฌci delle corrispondenze di miglior risposta
Esercizio 12 Soluzione
Strategie del giocatore ๐ผ: ๐ด e ๐ต
Strategie del giocatore ๐ผ๐ผ: se ๐ด, ๐ถ; se ๐ด, ๐ท
โ
๐ผ โ๐ผ๐ผ
A
(1, 2) (0, 0)
B
(2, 1) (2, 1)
C
D
N.B. Quando ๐ผ gioca ๐ต, il gioco si conclude prima che ๐ผ๐ผ giochi la sua
mossa.
Abbiamo due equilibri di Nash in strategie pure: (๐ต, ๐ถ) e (๐ต, ๐ท) (si noti
che solo (๐ต, ๐ถ), quello che si trova con lโinduzione a ritroso, eฬ perfetto nei
sottogiochi).
Esercizio 13 Soluzione
Esercizi TdG per PoliMI
15
c
โFioravante
Patrone
In strategie pure non cโeฬ equilibrio di Nash. Passo alle strategie miste e
assegno distribuzione di probabilitaฬ sulle diverse mosse dei giocatori.
๐๐ผ (๐, ๐) = 1(๐๐) + 3๐(1 โ ๐) + 2๐(1 โ ๐) + 1(1 โ ๐)(1 โ ๐)
๐๐ผ๐ผ (๐, ๐) = 2(๐๐) + 1๐(1 โ ๐) + 1๐(1 โ ๐) + 3(1 โ ๐)(1 โ ๐)
Fissato ๐, cerco la miglior risposta per ๐ผ, cioeฬ cerco, al variare di ๐, il max
della funzione di utilitaฬ di ๐ผ:
๐๐ผ (๐, ๐) = ๐๐ + 3๐ โ 3๐๐ + 2๐ โ 2๐๐ + 1 โ ๐ โ ๐ + ๐๐ = โ3๐๐ + 2๐ + ๐ + 1 =
(1 โ 3๐)๐ + 2๐ + 1
Per ๐ ๏ฌssato, questa eฬ lโequazione di una retta che considero nellโintervallo
[0, 1] percheฬ 0 โค ๐ โค 1.
Se 1 โ 3๐ > 0,
Se 1 โ 3๐ < 0,
Se 1 โ 3๐ = 0,
cioeฬ ๐ < 1/3 : max per ๐ = 1
cioeฬ ๐ > 1/3 : max per ๐ = 0
cioeฬ ๐ = 1/3 : max per ogni ๐
Fissato ๐, cerco la miglior risposta per ๐ผ๐ผ, cioeฬ cerco al variare di ๐ il max
della funzione di utilitaฬ di ๐ผ๐ผ:
๐๐ผ๐ผ (๐, ๐) = 2๐๐ + ๐ โ ๐๐ + ๐ โ ๐๐ + 3 โ 3๐ โ 3๐ + 3๐๐ = 3๐๐ โ 2๐ โ 2๐ + 3 =
(3๐ โ 2)๐ โ 2๐ + 3.
Se 3๐ โ 2 > 0,
Se 3๐ โ 2 < 0,
Se 3๐ โ 2 = 0,
๐ผ๐ผ
cioeฬ ๐ > 2/3 : max per ๐ = 1
cioeฬ ๐ < 2/3 : max per ๐ = 0
cioeฬ ๐ = 2/3 : max per ogni ๐
6
1
best reply di ๐ผ
best reply di ๐ผ๐ผ
e
1
3
equilibrio di Nash
e
2
3
1
๐ผ
Esercizi TdG per PoliMI
c
โFioravante
Patrone
16
Come si vede, disegnando nel piano cartesiano le curve di miglior risposta
di ๐ผ e di ๐ผ๐ผ, queste si incontrano in un solo punto (2/3, 1/3) che corrisponde
allโequilibrio di Nash in strategie miste. Questo signi๏ฌca che I gioca con
๐ = 2/3 la strategia ๐ 1 e con ๐ = 1/3 gioca ๐ 2 . ๐ผ๐ผ gioca con ๐ = 1/3 la sua
strategia ๐ก1 e con ๐ = 2/3 gioca ๐ก2 .
Si ha, inoltre:
๐๐ผ (2/3, 1/3) = 5/3
๐๐ผ๐ผ (2/3, 1/3) = 5/3
Esercizio 14 Soluzione
Per quanto riguarda le strategie miste, usiamo come di solito ๐, 1 โ ๐ e
๐, 1 โ ๐ per indicare le strategie miste rispettivamente di ๐ผ e ๐ผ๐ผ.
Il payo๏ฌ atteso di ๐ผ eฬ:
๐ (๐, ๐) = 6๐๐ + 2๐(1 โ ๐) + 7(1 โ ๐)๐ = 6๐๐ + 2๐ โ 2๐๐ + 7๐ โ 7๐๐ =
= โ3๐๐ + 2๐ + 7๐ = ๐(2 โ 3๐) + 7๐
Quindi per ๐ < 2/3 la best reply per ๐ผ eฬ ๐ = 1, per ๐ = 2/3 eฬ tutto [0, 1], per
๐ > 2/3 la best reply eฬ ๐ = 0.
Per ๐ผ๐ผ il payo๏ฌ atteso eฬ:
๐(๐, ๐) = 6๐๐ + 7๐(1 โ ๐) + 2(1 โ ๐)๐ = 6๐๐ + 7๐ + โ7๐๐ + 2๐ โ 2๐๐ =
= โ3๐๐ + 2๐ + 7๐ = ๐(2 โ 3๐) + 7๐
Quindi per ๐ < 2/3 la best reply per ๐ผ๐ผ eฬ ๐ = 1, per ๐ = 2/3 eฬ tutto [0, 1],
per ๐ > 2/3 la best reply eฬ ๐ = 0.
In ๏ฌgura 2 disegniamo le best reply.
Le best reply ci permettono di individuare gli equilibri di Nash in strategie
miste. Ritroviamo i due equilibri puri ed uno in strategie completamente
miste (il cui payo๏ฌ atteso eฬ di 14/3 per entrambi i giocatori).
Esercizio 15 Soluzione
parte a)
Se (¯
๐ฅ, ๐ฆ¯) eฬ un equilibrio di Nash, si ha (si ricordi che ๐ = ๐ ):
๐ (¯
๐ฅ, ๐ฆ¯) โฅ ๐ (๐ฅ, ๐ฆ¯)
per ogni ๐ฅ โ ๐
(1)
๐(¯
๐ฅ, ๐ฆ¯) โฅ ๐(¯
๐ฅ, ๐ฆ)
per ogni ๐ฆ โ ๐
(2)
Esercizi TdG per PoliMI
II
17
c
โFioravante
Patrone
6
1
g
best reply di ๐ผ
g
2
3
best reply di ๐ผ๐ผ
g
equilibrio di Nash
g
2
3
1
-
I
Figura 2: I gra๏ฌci delle corrispondenze di miglior risposta
Ma allora:
๐(¯
๐ฆ , ๐ฅ¯) = ๐ (¯
๐ฅ, ๐ฆ¯) โฅ ๐ (๐ฅ, ๐ฆ¯) = ๐(¯
๐ฆ , ๐ฅ)
per ogni ๐ฅ โ ๐
(3)
Ma:
๐(¯
๐ฆ , ๐ฅ¯) โฅ ๐(¯
๐ฆ , ๐ฅ)
per ogni ๐ฅ โ ๐
(4)
eฬ proprio la seconda condizione (cioeฬ quella relativa al giocatore ๐ผ๐ผ) che
viene richiesta a๏ฌncheฬ (¯
๐ฆ , ๐ฅ¯) sia un equilibrio di Nash. Si noti che essa eฬ
perfettamente equivalente a:
๐(¯
๐ฆ , ๐ฅ¯) โฅ ๐(¯
๐ฆ , ๐ฆ)
per ogni ๐ฆ โ ๐
(5)
Allo stesso modo si ottiene che (¯
๐ฆ , ๐ฅ¯) soddisfa anche la prima condizione
dellโequilibrio di Nash.
parte b)
No. Basta considerare:
I โ II
๐ด
๐ต
๐ด
๐ต
(0, 0) (0, 0)
(0, 0) (0, 0)
Esercizi TdG per PoliMI
18
c
โFioravante
Patrone
Un esempio meno banale eฬ o๏ฌerto dalla โbattaglia dei sessiโ (tenendo conto
di quanto verraฬ detto al punto d)).
parte c)
No. Tanto per cominciare, un gioco simmetrico puoฬ non avere equilibri.
Ad esempio, il โpari o dispariโ (che NON ha equilibri. Ovviamente la sua
estensione mista sฤฑฬ). Comunque, anche se ha equilibri, non eฬ detto che ne
abbia di simmetrici, come mostra il gioco โchickenโ (anche qui, non mi sto
riferendo alla sua estensione mista):
I โ II
๐ด
๐ต
๐ด
๐ต
(3, 3) (2, 4)
(4, 2) (1, 1)
parte d)
Dato un gioco (๐, ๐, ๐, ๐), lo potremmo chiamare โessenzialmente simmetricoโ se โ๐, ๐ : ๐ โ ๐, ๐ : ๐ โ ๐ , corrispondenze biunivoche, tali che,
posto ๐ห(๐ , ๐ก) = ๐ (๐(๐ ), ๐(๐ก)) e ๐ห(๐ , ๐ก) = ๐(๐(๐ ), ๐(๐ก)), il gioco (๐, ๐, ๐ห, ๐ห) eฬ
un gioco simmetrico. Lโidea eฬ quindi che lโapparente mancanza di simmetria
derivi solo dalla assegnazione delle โetichetteโ alle strategie dei giocatori.
Vediamo, per esempio, come la โbattaglia dei sessiโ sia un gioco essenzialmente simmetrico. Basta prendere ๐ = {๐ป, ๐พ} e de๏ฌnire ๐(๐ป) = ๐, ๐(๐พ) =
๐ต, ๐(๐ป) = ๐
, ๐(๐พ) = ๐ฟ. Cosฤฑฬ, trasformiamo la โbattaglia dei sessiโ rappresentata qui sotto a sinistra, nel gioco di destra che soddisfa la de๏ฌnizione
formale di gioco simmetrico:
I โ II
๐
๐ต
๐ฟ
๐
2, 1 0, 0
0, 0 1, 2
I โ II
๐ป
๐พ
๐ป
๐พ
0, 0 2, 1
1, 2 0, 0
Si puoฬ facilmente veri๏ฌcare come: ๐ห(๐ป, ๐ป) = ๐ (๐(๐ป), ๐(๐ป)) = ๐ (๐, ๐
) = 0,
๐ห(๐ป, ๐พ) = ๐ (๐(๐ป), ๐(๐พ)) = ๐ (๐, ๐ฟ) = 2, etc. Analogamente per i payo๏ฌ
di ๐ผ๐ผ, ad esempio: ๐ห(๐พ, ๐ป) = ๐(๐(๐พ), ๐(๐ป)) = ๐(๐ต, ๐
) = 2. Si noti che
๐ห(๐ป, ๐พ) = ๐ห(๐พ, ๐ป), come richiede la condizione di simmetria. In e๏ฌetti, si
puoฬ agevolmente veri๏ฌcare come il gioco (๐, ๐, ๐ห, ๐ห) sia un gioco simmetrico.
Un altro esempio eฬ dato dal dilemma del prigioniero, dato nella tabella
a sinistra. Qui basta proprio solo โridenominareโ le strategie di ๐ผ๐ผ (usare ๐
al posto di ๐ฟ e ๐ต al posto di ๐
) e si ottiene il gioco di destra che soddisfa la
condizione di simmetria.
I โ II
๐
๐ต
๐ฟ
๐
3, 3 1, 4
4, 1 2, 2
I โ II
๐
๐ต
๐
๐ต
3, 3 1, 4
4, 1 2, 2
Esercizi TdG per PoliMI
19
c
โFioravante
Patrone
Per altro verso, anche il gioco sotto a sinistra (che ovviamente eฬ la battaglia dei sessi) eฬ simmetrico, pur di de๏ฌnire ๐ = {๐ป, ๐พ} e de๏ฌnire ๐(๐ป) =
๐ป, ๐(๐พ) = ๐พ, ๐(๐ป) = ๐พ, ๐(๐พ) = ๐ป: vedasi la tabella di destra.
I โ II
๐ป
๐พ
๐ป
๐พ
2, 1 0, 0
0, 0 1, 2
I โ II
๐ป
๐พ
๐ป
๐พ
0, 0 2, 1
1, 2 0, 0
Critiche e commenti sono lasciati a voi.
Esercizio 16 Soluzione
Lโa๏ฌermazione eฬ scorretta. Ad esempio, le seguenti sono due diverse
strategie per ๐ผ:
๐ฅ1 = ๐ด ๐ด๐ด๐ด ๐ด๐ด๐ต ๐ด๐ด๐ถ ๐ด๐ต๐ด ๐ด๐ต๐ต ๐ด๐ต๐ถ ๐ด๐ถ๐ด ๐ด๐ถ๐ต ๐ด๐ถ๐ถ
(6)
๐ฅ2 = ๐ด ๐ด๐ด๐ด ๐ด๐ด๐ต ๐ด๐ด๐ถ ๐ต๐ต๐ด ๐ต๐ต๐ต ๐ต๐ต๐ถ ๐ต๐ถ๐ด ๐ต๐ถ๐ต ๐ต๐ถ๐ถ
(7)
Il signi๏ฌcato dei simboli dovrebbe essere chiaro. Il primo simbolo indica la
scelta fatta allโinizio da ๐ผ (in entrambe le strategie, ๐ผ sceglie ๐ด alla sua prima
mossa); gli altri simboli indicano cosa egli fa dopo le diverse possibili storie:
ad esempio, ๐ต๐ถ๐ด indica che ๐ผ, quando gli ritocca giocare, gioca ๐ต (qualora
lui avesse scelto ๐ถ alla prima mossa e ๐ผ๐ผ avesse giocato ๐ด).
Si veri๏ฌca agevolmente come, qualunque sia la strategia ๐ฆ usata da ๐ผ๐ผ, le
coppie di strategie (๐ฅ1 , ๐ฆ) e (๐ฅ2 , ๐ฆ) danno luogo entrambe alla storia ๐ด๐ ๐ด๐
(dove ๐ e ๐ indicano le scelte che ๐ผ๐ผ si troveraฬ ad e๏ฌettuare usando la
strategia ๐ฆ da lui scelta). In particolare, se ๐ผ๐ผ decide di usare la strategia che
prevede di scegliere sempre ๐ด ad ogni suo nodo decisionale, (๐ฅ1 , ๐ฆ) e (๐ฅ2 , ๐ฆ)
danno luogo entrambe alla storia ๐ด๐ด๐ด๐ด. Quindi, le strategie a disposizione
dei giocatori sono piuฬ delle possibili storie del gioco.
Dโaltronde, il numero di strategie per ๐ผ eฬ 3 โ
39 , mentre quello per ๐ผ๐ผ eฬ
33 โ
327 . Come si vede, i conti non tornano. Le strategie sono molte di piuฬ
delle storie.
Osservazione. Le due strategie di ๐ผ descritte in (6) e (7) di๏ฌeriscono tra
loro per via di scelte diverse che ๐ผ progetta di fare in nodi che non saranno raggiunti vista la sua scelta fatta al primo nodo decisionale. Potrebbe
cambiare qualcosa che usassimo la forma normale ridotta? (Per dettagli e
terminologia sulla forma normale ridotta, vedasi Myerson).