Esercizi TdG per PoliMI 1 c โFioravante Patrone Esercizi TdG per PoliMI Esercizio 1 Trovare gli equilibri di Nash (in strategie pure) dei giochi seguenti. I โ II ๐ ๐ต I โ II ๐ ๐ต ๐ฟ ๐ 100, 100 1, 1 1, 1 100, 100 ๐ฟ ๐ 99, 99 0, 0 0, 0 98, 98 Quale pensate venga e๏ฌettivamente giocato? Commentare. Esercizio 2 Nellโesercizio precedente, si puoฬ essere indotti a ritenere che una diminuzione dei payo๏ฌ possa portare addirittura ad un esito migliore per i giocatori. Dโaltro canto, le funzioni di utilitaฬ di von Neumann-Morgenstern sono de๏ฌnite a meno di trasformazioni lineari strettamente crescenti. Cioฬ potrebbe indurre a ritenere che lโa๏ฌermazione precedente non sia signi๏ฌcativa. Eโ una obiezione fondata o no? Occorre fare qualche ulteriore precisazione? Esercizio 3 Trovare gli equilibri di Nash sia in pure che in miste per seguente gioco (Dilemma del Prigioniero), in cui: ๐ < ๐ < ๐ < ๐. I โ II ๐ ๐ต ๐ฟ ๐ ๐, ๐ ๐, ๐ ๐, ๐ ๐, ๐ Esercizio 4 Trovare gli equilibri di Nash per lโestensione mista del gioco: โ ๐ผ โ๐ผ๐ผ T L C R (3, 2) (5, 4) (7, 8) B (5, 9) (1, 11) (4, 3) Esercizio 5 Si consideri un gioco a due sole โmosseโ e ad informazione perfetta. Individuare condizioni che garantiscano lโunicitaฬ del SPE. Esercizio 6 Descrivere una strategia del gioco del โtrisโ, per il primo giocatore. Esercizio 7 Determinare gli SPE per entrambi i giochi in ๏ฌgura. Commentare. Esercizi TdG per PoliMI 2 c โFioravante Patrone ๐ผr ๐ผr @ ๐ ๐ผ๐ผr A ๐ AA๐ A r Ar (0, 0) (2, 0) @ @ ๐ต @ @ @r๐ผ๐ผ A ๐ฟ AA๐ A r Ar (1, 0) ๐ @ @ @r๐ผ๐ผ A ๐ฟ AA๐ A r Ar ๐ผ๐ผr A ๐ AA๐ A r Ar (1, 0) (0, 0) ๐ต @ (2, 0) (1, 1) (1, 1) Esercizio 8 Si consideri il seguente gioco in forma estesa: 0c 1/3 ๐ ๐ผ๐ผ s A A ๐ฟ1 A ๐ 1 A As s 1 2 2 1 s @ @ ๐ต @ @ HH HH ๐ผ H 2/3 HH H HH s @ ๐ 0 0 ๐ฟ2 s 1 0 A A ๐ต @ @ ๐ผ๐ผ s @s @ A ๐ 2 A As 0 1 a) scriverne la forma strategica; b) determinarne gli equilibri di Nash in strategie pure; c) esistono strategie dominate? Esercizio 9 Si consideri il seguente gioco in forma estesa: @s 2 2 Esercizi TdG per PoliMI 3 c โFioravante Patrone ๐ผc ๐ฟ1 s 5 0 HH H HH ๐ต1 ๐1 H HH HHs๐ผ๐ผ ๐ผ๐ผ s @ @ @ ๐ 2 @ ๐ 1 ๐ฟ2 @ @ @ @ ๐ผ s @s @s A A 4 A ๐ต A ๐ต ๐ ๐ 2 2 4 A 2 A 2 A A As As s s 2 1 0 0 2 0 0 2 a) scriverne la forma strategica; b) determinarne gli equilibri di Nash in strategie pure (se esistono); c) trovarne gli equilibri perfetti nei sottogiochi (se esistono) Esercizio 10 Determinare gli eventuali equilibri di Nash in strategie pure del seguente gioco in forma strategica: ๐ผโ๐ผ๐ผ ๐ฟ ๐ถ ๐ ๐ 0, 1 โ1, 3 1, 3 ๐ 0, 2 1, 1 2, 0 ๐ต 1, 0 1, โ1 3, 0 Esistono strategie debolmente dominate? E strategie fortemente dominate? Esercizio 11 Si considerino i seguenti due giochi in forma estesa: Esercizi TdG per PoliMI 4 c โFioravante Patrone gioca 1 @ @ E F @ @ @ gioca 2 @ gioca 2 A A C AD A 4 0 2 1 A A A A B A 1 2 3 0 gioca 1 E @ @ F @ @ @ gioca 2 .......................................................... A A A A B A 1 2 3 0 @ A A A AB A 4 0 2 1 Scrivere la forma strategica di entrambi (uno eฬ a informazione perfetta, mentre lโaltro non lo eฬ). Calcolare gli equilibri di Nash in strategie pure e gli equilibri perfetti nei sottogiochi di quello dei due che eฬ a informazione perfetta. Calcolare gli equilibri di Nash in strategie miste di quello non a informazione perfetta. Esercizio 12 Dato il seguente gioco in forma estesa, descriverlo in forma strategica: Esercizi TdG per PoliMI 5 c โFioravante Patrone gioca 1 @ A @ B @ @ @ gioca 2 @ 2 1 A A C A D A 1 0 2 0 Calcolarne poi gli equilibri di Nash in strategie pure. Esercizio 13 Calcolare gli equilibri di Nash in strategie miste del seguente gioco: I/II ๐ 1 ๐ 2 ๐ก1 ๐ก2 1,2 2,1 3,1 1,3 Esercizio 14 Calcolare lโequilibrio di Nash in strategie completamente miste del seguente gioco (di Aumann) in forma strategica: โ ๐ผ โ๐ผ๐ผ T (6, 6) (2, 7) B (7, 2) (0, 0) L R Esercizio 15 Diciamo che un gioco (a due giocatori) ๐บ = (๐, ๐, ๐, ๐) eฬ simmetrico se ๐ = ๐ e ๐ (๐ฅ, ๐ฆ) = ๐(๐ฆ, ๐ฅ) per ogni ๐ฅ, ๐ฆ โ ๐. a) Si provi che, in un gioco simmetrico, se (¯ ๐ฅ, ๐ฆ¯) eฬ un equilibrio di Nash, allora (¯ ๐ฆ , ๐ฅ¯) eฬ anchโesso un equilibrio. b) Eโ vero che in un gioco simmetrico tutti gli equilibri sono del tipo (¯ ๐ฅ, ๐ฅ¯)? c) Eโ vero che in un gioco simmetrico cโeฬ sempre un equilibrio del tipo (¯ ๐ฅ, ๐ฅ¯)? d) I giochi classici come il โdilemma del prigionieroโ e la โbattaglia dei sessiโ sono descritti da me con una tabella nella quale le strategie per ๐ผ sono ๐, ๐ต e per ๐ผ๐ผ sono invece ๐ฟ, ๐ . In altre parole, non abbiamo che ๐ = ๐ . Tuttavia, sembra ragionevole considerare simmetrici anche questi giochi. Riconsiderare la de๏ฌnizione data ed adattarla convenientemente in modo da โcoprireโ anche questi casi. Eโ il caso di criticare la de๏ฌnizione data? Esercizi TdG per PoliMI c โFioravante Patrone 6 Esercizio 16 Due giocatori devono scegliere, a turno, una lettera fra {๐ด, ๐ต, ๐ถ}. Sono ammesse ripetizioni. Ognuno dei due giocatori ha due turni a disposizione. Si commenti la seguente a๏ฌermazione: Ogni โstoriaโ del gioco eฬ identi๏ฌcata da una sequenza di 4 caratteri scelti tra ๐ด, ๐ต, ๐ถ. Ad esempio, le seguenti sequenze identi๏ฌcano di๏ฌerenti storie: ๐ด๐ด๐ด๐ด, ๐ด๐ต๐ถ๐ด, ๐ถ๐ต๐ด๐ด, etc. Pertanto, le strategie a disposizione dei due giocatori sono date da tutte le sequenze di questo tipo e quindi sono 34 . Esercizi TdG per PoliMI 7 c โFioravante Patrone SOLUZIONI Esercizio 1 Soluzione Gli equilibri di Nash sono (๐, ๐ฟ) e (๐ต, ๐ ) per entrambi i giochi. I commenti a voi! Esercizio 2 Soluzione Che una diminuzione dei payo๏ฌ possa portare a un esito (di equilibrio) migliore per i giocatori eฬ mostrato dallโesercizio menzionato nel testo. Lโobiezione chiede di precisare il valore interpretativo di questa osservazione. Se siamo di fronte a due situazioni diverse di gioco, lโosservazione fatta sulle trasformazioni lineari dei payo๏ฌ puoฬ essere pertinente. Se invece i payo๏ฌ scaturiscono dalla stessa funzione di utilitaฬ che viene applicata ad esiti diversi, come accade nellโesempio (di game form) qui illustrato: I โ II ๐ ๐ต ๐ฟ ๐ ๐ ๐ ๐ ๐ I โ II ๐ ๐ต ๐ฟ ๐ ๐ ๐ ๐ ๐ in cui i nostri decisori preferiscono lโesito ๐ ad ๐, cosฤฑฬ come ๐ ad ๐, etc., allora possiamo e๏ฌettivamente a๏ฌermare che lโesito prevedibile della situazione di sinistra eฬ preferito allโesito prevedibile che si ha nella situazione di destra. Esercizio 3 Soluzione Lโunico equilibrio di Nash in strategie pure eฬ (๐ต, ๐ ). Vediamo le strategie miste. Se ๐ผ gioca la strategia mista (๐, 1 โ ๐) e ๐ผ๐ผ gioca (๐, 1 โ ๐), il payo๏ฌ atteso per ๐ผ eฬ: ๐๐๐ + ๐๐(1 โ ๐) + ๐(1 โ ๐)๐ + ๐(1 โ ๐)(1 โ ๐) = = [(๐ โ ๐)๐ + (๐ โ ๐)(1 โ ๐)]๐ + (๐ โ ๐)๐ + ๐ Per ipotesi ๐ โ ๐ < 0 e ๐ โ ๐ < 0, quindi (๐ โ ๐)๐ < 0 tranne che per ๐ = 0, peroฬ in tal caso (๐ โ ๐)(1 โ ๐) < 0, pertanto (๐ โ ๐)๐ + (๐ โ ๐)(1 โ ๐) < 0 qualunque sia ๐. Pertanto il payo๏ฌ per ๐ผ eฬ massimo (qualunque sia ๐) per ๐ = 0. Quindi la โbest replyโ per ๐ผ eฬ sempre ๐ = 0 per ogni ๐. Discorso del tutto simmetrico vale per ๐ผ๐ผ, per il quale la โbest replyโ eฬ ๐ = 0 per ogni ๐ โ [0, 1]. Possiamo anche disegnare il gra๏ฌco delle โbest replyโ: Esercizi TdG per PoliMI ๐ผ๐ผ 8 c โFioravante Patrone 6 1 best reply di ๐ผ best reply di ๐ผ๐ผ e equilibrio di Nash e - 1 ๐ผ Quindi, lโestensione mista del dilemma del prigioniero ha un unico equilibrio di Nash che corrisponde allโunico equilibrio in strategie pure del gioco dato. Dโaltronde, questi risultati erano ampiamente scontati: dato che la strategia ๐ eฬ fortemente dominata, qualunque strategia mista che sia โbest replyโ assegna sempre probabilitaฬ 0 a ๐ . Per i dettagli, si puoฬ consultare la soluzione dellโesercizio seguente. Esercizio 4 Soluzione Osserviamo preliminarmente che la strategia ๐ฟ eฬ fortemente dominata da ๐ถ. Ne segue che ogni strategia mista di ๐ผ๐ผ che sia miglior risposta a una qualunque strategia di ๐ผ assegna sempre probabilitaฬ 0 ad ๐ฟ (se per assurdo fosse assegnata ad ๐ฟ una probabilitaฬ positiva, converrebbe โtrasferireโ tale probabilitaฬ dalla strategia ๐ฟ alla strategia ๐ถ, ottenendo un payo๏ฌ atteso di ๐ผ๐ผ strettamente maggiore, in contraddizione con lโassunto che fosse una โmiglior rispostaโ). Ci si puoฬ quindi restringere, nella ricerca di equilibri, alle strategie miste del tipo (0, ๐, 1 โ ๐) per ๐ผ๐ผ (con ovvio signi๏ฌcato dei simboli, si spera!). Il payo๏ฌ atteso per ๐ผ da (๐, 1 โ ๐) e (0, ๐, 1 โ ๐) eฬ: 5๐๐ + 7๐(1 โ ๐) + 1(1 โ ๐)๐ + 4(1 โ ๐)(1 โ ๐) = = (๐ + 3)๐ + (4 โ 3๐) Esercizi TdG per PoliMI 9 c โFioravante Patrone Poicheฬ il coe๏ฌciente di ๐ eฬ maggiore di 0, la โbest replyโ per ๐ผ eฬ sempre ๐ = 1. Cosa che non dovrebbe sorprendere, visto che โeliminataโ la strategie ๐ฟ la strategia ๐ต di ๐ผ diventa fortemente dominata . . . Per quanto riguarda ๐ผ๐ผ, il suo payo๏ฌ atteso e: 4๐๐ + 8๐(1 โ ๐) + 11(1 โ ๐)๐ + 3(1 โ ๐)(1 โ ๐) = = (โ12๐ + 8)๐ + (5๐ + 3) E, allora, se ๐ < 2/3 la โbest replyโ per ๐ผ๐ผ eฬ ๐ = 1, per ๐ > 2/3 eฬ ๐ = 0, ed in๏ฌne per ๐ = 2/3 eฬ tutto lโintervallo [0, 1]. Disegniamo i gra๏ฌci delle migliori risposte per trovare gli equilibri di Nash: ๐ผ๐ผ 6 1 best reply di ๐ผ best reply di ๐ผ๐ผ e equilibrio di Nash e 1 - ๐ผ Come era prevedibile, troviamo un solo equilibrio di Nash (che eฬ, di fatto, in strategie pure): dopotutto la coppia (๐, ๐ ) eฬ lโunica che sopravvive allโeliminazione iterata di strategie fortemente dominate. Esercizio 5 Soluzione Una condizione su๏ฌciente eฬ che i payo๏ฌ di ๐ผ๐ผ siano tutti distinti tra loro e cosฤฑฬ i payo๏ฌ di ๐ผ. In questo modo siamo certi che quando ๐ผ๐ผ sceglie, ad ogni nodo, la sua โmossaโ migliore, questa eฬ univocamente determinata. Per lo stesso motivo, anche la scelta di ๐ผ saraฬ univoca. Esercizi TdG per PoliMI c โFioravante Patrone 10 Esercizio 6 Soluzione Vediamo una descrizione parziale. Intanto, una codi๏ฌca per le caselle del โtrisโ: 1 2 3 4 5 6 7 8 9 Allora, una strategia per il giocatore ๐ผ (cioeฬ per il giocatore che comincia il gioco) eฬ: โ primo turno per ๐ผ mette la croce su 1 โ secondo turno per ๐ผ se ๐ผ๐ผ ha messo il tondo su una delle caselle da 3 a 9, allora ๐ผ mette la croce su 2 se ๐ผ๐ผ ha messo il tondo sulla casella 2, ๐ผ mette la croce su 3 โ terzo turno per ๐ผ se ๐ผ๐ผ ha messo il tondo su una delle caselle da 5 a 9, allora ๐ผ mette la croce su 3 (se non lโaveva messa su 3 giaฬ ๐ผ๐ผ o ๐ผ stesso; in tal caso ๐ผ la mette su 4) se ๐ผ๐ผ ha messo il tondo sulla casella 4, ๐ผ mette la croce su 3 (se non lโaveva messa su 3 giaฬ ๐ผ๐ผ o ๐ผ stesso; in tal caso ๐ผ la mette su 4) se ๐ผ๐ผ ha messo il tondo sulla casella 3, ๐ผ mette la croce su 4 (se non lโaveva messa su 3 giaฬ ๐ผ๐ผ o ๐ผ stesso; in tal caso ๐ผ la mette su 4) โ e cosฤฑฬ via . . . In realtaฬ stiamo scrivendo un โlibretto di istruzioniโ che vuole descrivere una strategia molto semplice da spiegare: il giocatore ๐ผ mette ad ogni suo turno la sua crocetta sulla casella libera contraddistinta dal numero (nella numerazione che abbiamo dato) piuฬ basso. Lโabbozzo di descrizione minuziosa precedente puoฬ indurre a immaginare che una descrizione esaustiva sia molto complicata (se lo eฬ giaฬ cosฤฑฬ, volendo descrivere una strategia molto semplice, ๏ฌguriamoci la descrizione di una strategia piuฬ โcontortaโ). Forse vale anche la pena di โcontareโ quante sono le strategie a disposizione di ๐ผ: sono 9 โ 79โ 8 โ 59โ 8โ 7โ 6 โ 39โ 8โ 7โ 6โ 5โ 4 โ 19โ 8โ 7โ 6โ 5โ 4โ 3โ 2 = 9 โ 772 โ 53024 โ 360480 โ Esercizi TdG per PoliMI 11 c โFioravante Patrone โ 9 โ 7, 03 โ 1060 โ 4, 84 โ 102113 โ 1, 96 โ 1028856 โ โ 6, 02 โ 1031031 Questo numero eฬ molto piuฬ grande di quanto di solito uno immagina prima di fare i calcoli espliciti. Va detto che il calcolo fatto presuppone che il gioco ๏ฌnisca solo quando sono state riempite tutte le nove caselle. Se si ritiene che il gioco ๏ฌnisca non appena uno dei giocatori ha fatto un tris, allora il numero si riduce ma resta comunque molto, molto alto. Come mai allora il tris viene considerato, ed a ragione, un gioco poco interessante? Percheฬ, nonostante questo numero cosฤฑฬ grande di strategie, lโanalisi del gioco viene molto sempli๏ฌcata se si tiene conto delle simmetrie del gioco e, soprattutto, se si eฬ interessati a trovare solo una strategia vincente o quanto meno ottimale: in tal caso, molte alternative sono ovviamente da scartare. Esercizio 7 Soluzione Il gioco a sinistra ha i seguenti SPE: (๐ต, ๐๐ฟ), (๐ต, ๐๐ ), (๐, ๐๐ฟ), (๐, ๐๐ ). Anche per quello di destra gli SPE sono (๐ต, ๐๐ฟ), (๐ต, ๐๐ ), (๐, ๐๐ฟ), (๐, ๐๐ ). I commenti a voi. Esercizio 8 Soluzione Le strategie a disposizione di ๐ผ sono ๐ e ๐ต. Quelle per ๐ผ๐ผ sono ๐ฟ1 ๐ฟ2 , ๐ฟ1 ๐ 2 , ๐ 1 ๐ฟ2 , ๐ 1 ๐ 2 . Se ๐ผ sceglie ๐ต, il payo๏ฌ atteso (per qualunque strategia di ๐ผ๐ผ) eฬ: 31 0+ 23 2 = 4 2, sia per ๐ผ che per ๐ผ๐ผ. Se invece ๐ผ sceglie ๐ , i payo๏ฌ attesi sono: 3 - se ๐ผ๐ผ gioca ๐ฟ1 ๐ฟ2 : 13 1 + 32 1 = 1 per ๐ผ e 13 2 + 23 0 = 2 3 per ๐ผ๐ผ - se ๐ผ๐ผ gioca ๐ฟ1 ๐ 2 : 31 1 + 32 0 = 1 3 per ๐ผ e 31 2 + 23 1 = 4 3 per ๐ผ๐ผ - se ๐ผ๐ผ gioca ๐ 1 ๐ฟ2 : 13 2 + 32 1 = 4 3 per ๐ผ e 31 1 + 23 0 = 1 3 per ๐ผ๐ผ - se ๐ผ๐ผ gioca ๐ 1 ๐ 2 : 13 2 + 23 0 = 2 3 per ๐ผ e 31 1 + 23 1 = 1 per ๐ผ๐ผ Pertanto, la forma strategica eฬ la seguente: โ ๐ผ โ๐ผ๐ผ ๐ฟ1 ๐ฟ2 ๐ฟ1 ๐ 2 ๐ 1 ๐ฟ2 ๐ 1 ๐ 2 ๐ (1, 32 ) ( 13 , 34 ) ( 43 , 31 ) ( 23 , 1) ๐ต ( 43 , 43 ) ( 43 , 34 ) ( 43 , 34 ) ( 43 , 43 ) Si veri๏ฌca immediatamente che il gioco dato ha 4 equilibri di Nash: (๐ต, ๐ฟ1 ๐ฟ2 ), (๐ต, ๐ฟ1 ๐ 2 ), (๐ต, ๐ 1 ๐ฟ2 ), (๐ต, ๐ 1 ๐ 2 ). Esercizi TdG per PoliMI c โFioravante Patrone 12 Non vi sono strategie fortemente dominanti. Sia la strategia ๐ต per ๐ผ che la strategia ๐ฟ1 ๐ 2 per ๐ผ๐ผ sono strettamente dominanti. Altre strategie dominanti non ve ne sono. Esercizio 9 Soluzione La forma strategica eฬ (eฬ sottolineata la โbest replyโ per ๐ผ e sopralineata quella per ๐ผ๐ผ): โ ๐ผ โ๐ผ๐ผ ๐1 ๐2 ๐ฟ1 ๐ฟ2 ๐ฟ1 ๐ 2 ๐ 1 ๐ฟ2 ๐ 1 ๐ 2 (5, 0) (5, 0) (4, 4) (4, 4) ๐1 ๐ต2 (5, 0) (5, 0) (4, 4) (4, 4) ๐ต1 ๐2 (2, 1) (2, 0) (2, 1) (2, 0) ๐ต1 ๐ต2 (0, 0) (0, 2) (0, 0) (0, 2) Vi sono pertanto quattro equilibri in strategie pure: (๐1 ๐2 , ๐ 1 ๐ฟ2 ), (๐1 ๐2 , ๐ 1 ๐ 2 ), (๐1 ๐ต2 , ๐ 1 ๐ฟ2 ), (๐1 ๐ต2 , ๐ 1 ๐ 2 ). Il gioco dato ha due sottogiochi propri. Uno, quello a sinistra in ๏ฌgura, ha come equilibrio ๐ 1 . Il sottogioco a destra ha, come unico equilibrio, (๐2 , ๐ฟ2 ), come si veri๏ฌca agevolmente dalla forma strategica riportata qui sotto: โ ๐ผ โ๐ผ๐ผ ๐2 (2, 1) (2, 0) ๐ต2 (0, 0) (0, 2) ๐ฟ2 ๐ 2 Pertanto, dei quattro equilibri di Nash, lโunico che eฬ perfetto nei sottogiochi (cioeฬ lโunico la cui restrizione ai sottogiochi eฬ ancora un equilibrio) eฬ (๐1 ๐2 , ๐ 1 ๐ฟ2 ). Esercizio 10 Soluzione Indichiamo la โbest replyโ sottolineando i vari elementi della matrice: ๐ผโ๐ผ๐ผ ๐ฟ ๐ถ ๐ ๐ 0, 1 โ1, 3 1, 3 ๐ 0, 2 1, 1 2, 0 ๐ต 1, 0 1, โ1 3, 0 Quindi gli equilibri di Nash sono (๐ต, ๐ฟ) e (๐ต, ๐ ). La strategia ๐ eฬ fortemente dominata da ๐ต. La strategia ๐ eฬ debolmente dominata da ๐ e da ๐ต. La strategia ๐ eฬ debolmente dominata da ๐ต. Il giocatore ๐ผ๐ผ non ha strategie dominate. Esercizi TdG per PoliMI c โFioravante Patrone 13 Esercizio 11 Soluzione La forma strategica del primo gioco eฬ: ๐ผโ๐ผ๐ผ ๐ด๐ถ ๐ด๐ท ๐ต๐ถ ๐ต๐ท ๐ธ 1, 3 1, 3 2, 0 2, 0 ๐น 4, 2 0, 1 4, 2 0, 1 Nella forma strategica abbiamo giaฬ sottolineato i payo๏ฌ per mostrare la best reply e trovare gli equilibri di Nash. Gli equilibri di Nash sono (๐ธ, ๐ด๐ท), (๐น, ๐ด๐ถ) e (๐น, ๐ต๐ถ). Di questi (๐น, ๐ด๐ถ) eฬ lโunico equilibrio perfetto nei sottogiochi (cosa che si veri๏ฌca agevolmente applicando lโinduzione a ritroso). La forma strategica del secondo gioco eฬ: ๐ผโ๐ผ๐ผ ๐ด ๐ต ๐ธ 1, 3 2, 0 ๐น 4, 2 0, 1 Anche qui abbiamo sottolineato, etc... Il gioco ha un solo equilibrio di Nash: (๐น, ๐ด). Per quanto riguarda le strategie miste, usiamo come di solito ๐, 1โ๐ e ๐, 1โ๐ per indicare le strategie miste rispettivamente di ๐ผ e ๐ผ๐ผ. Il payo๏ฌ atteso di ๐ผ eฬ: ๐ (๐, ๐) = ๐๐ + 2๐(1 โ ๐) + 4(1 โ ๐)๐ = ๐๐ + 2๐ โ 2๐๐ + 4๐ โ 4๐๐ = = โ5๐๐ + 2๐ + 4๐ = ๐(2 โ 5๐) + 4๐ Quindi per ๐ < 2/5 la best reply per ๐ผ eฬ ๐ = 1, per ๐ = 2/5 eฬ tutto [0, 1], per ๐ > 2/5 la best reply eฬ ๐ = 0. Per ๐ผ๐ผ il payo๏ฌ atteso eฬ: ๐(๐, ๐) = 3๐๐ + 2๐(1 โ ๐) + (1 โ ๐)(1 โ ๐) = 3๐๐ + 2๐ โ 2๐๐ + 1 โ ๐ โ ๐ + ๐๐ = = 2๐๐ โ ๐ + 1 + ๐ = ๐(2๐ + 1) + (1 โ ๐) La best reply per ๐ผ๐ผ eฬ sempre ๐ = 1, qualunque sia ๐. In ๏ฌgura 1 disegniamo le best reply. Le best reply ci permettono di individuare gli equilibri di Nash in strategie miste. Lโunico che troviamo eฬ indicato in ๏ฌgura, e corrisponde a ๐ = 0 e ๐ = 1. Vale a dire, si tratta dellโequilibrio in strategie pure che giaฬ avevamo trovato. Potevamo in realtaฬ risparmiarci i conti, semplicemente osservando che la strategia ๐ด domina strettamente ๐ต. Esercizi TdG per PoliMI II 14 c โFioravante Patrone 6 1 c best reply di ๐ผ best reply di ๐ผ๐ผ c 2 5 equilibrio di Nash - 1 I Figura 1: I gra๏ฌci delle corrispondenze di miglior risposta Esercizio 12 Soluzione Strategie del giocatore ๐ผ: ๐ด e ๐ต Strategie del giocatore ๐ผ๐ผ: se ๐ด, ๐ถ; se ๐ด, ๐ท โ ๐ผ โ๐ผ๐ผ A (1, 2) (0, 0) B (2, 1) (2, 1) C D N.B. Quando ๐ผ gioca ๐ต, il gioco si conclude prima che ๐ผ๐ผ giochi la sua mossa. Abbiamo due equilibri di Nash in strategie pure: (๐ต, ๐ถ) e (๐ต, ๐ท) (si noti che solo (๐ต, ๐ถ), quello che si trova con lโinduzione a ritroso, eฬ perfetto nei sottogiochi). Esercizio 13 Soluzione Esercizi TdG per PoliMI 15 c โFioravante Patrone In strategie pure non cโeฬ equilibrio di Nash. Passo alle strategie miste e assegno distribuzione di probabilitaฬ sulle diverse mosse dei giocatori. ๐๐ผ (๐, ๐) = 1(๐๐) + 3๐(1 โ ๐) + 2๐(1 โ ๐) + 1(1 โ ๐)(1 โ ๐) ๐๐ผ๐ผ (๐, ๐) = 2(๐๐) + 1๐(1 โ ๐) + 1๐(1 โ ๐) + 3(1 โ ๐)(1 โ ๐) Fissato ๐, cerco la miglior risposta per ๐ผ, cioeฬ cerco, al variare di ๐, il max della funzione di utilitaฬ di ๐ผ: ๐๐ผ (๐, ๐) = ๐๐ + 3๐ โ 3๐๐ + 2๐ โ 2๐๐ + 1 โ ๐ โ ๐ + ๐๐ = โ3๐๐ + 2๐ + ๐ + 1 = (1 โ 3๐)๐ + 2๐ + 1 Per ๐ ๏ฌssato, questa eฬ lโequazione di una retta che considero nellโintervallo [0, 1] percheฬ 0 โค ๐ โค 1. Se 1 โ 3๐ > 0, Se 1 โ 3๐ < 0, Se 1 โ 3๐ = 0, cioeฬ ๐ < 1/3 : max per ๐ = 1 cioeฬ ๐ > 1/3 : max per ๐ = 0 cioeฬ ๐ = 1/3 : max per ogni ๐ Fissato ๐, cerco la miglior risposta per ๐ผ๐ผ, cioeฬ cerco al variare di ๐ il max della funzione di utilitaฬ di ๐ผ๐ผ: ๐๐ผ๐ผ (๐, ๐) = 2๐๐ + ๐ โ ๐๐ + ๐ โ ๐๐ + 3 โ 3๐ โ 3๐ + 3๐๐ = 3๐๐ โ 2๐ โ 2๐ + 3 = (3๐ โ 2)๐ โ 2๐ + 3. Se 3๐ โ 2 > 0, Se 3๐ โ 2 < 0, Se 3๐ โ 2 = 0, ๐ผ๐ผ cioeฬ ๐ > 2/3 : max per ๐ = 1 cioeฬ ๐ < 2/3 : max per ๐ = 0 cioeฬ ๐ = 2/3 : max per ogni ๐ 6 1 best reply di ๐ผ best reply di ๐ผ๐ผ e 1 3 equilibrio di Nash e 2 3 1 ๐ผ Esercizi TdG per PoliMI c โFioravante Patrone 16 Come si vede, disegnando nel piano cartesiano le curve di miglior risposta di ๐ผ e di ๐ผ๐ผ, queste si incontrano in un solo punto (2/3, 1/3) che corrisponde allโequilibrio di Nash in strategie miste. Questo signi๏ฌca che I gioca con ๐ = 2/3 la strategia ๐ 1 e con ๐ = 1/3 gioca ๐ 2 . ๐ผ๐ผ gioca con ๐ = 1/3 la sua strategia ๐ก1 e con ๐ = 2/3 gioca ๐ก2 . Si ha, inoltre: ๐๐ผ (2/3, 1/3) = 5/3 ๐๐ผ๐ผ (2/3, 1/3) = 5/3 Esercizio 14 Soluzione Per quanto riguarda le strategie miste, usiamo come di solito ๐, 1 โ ๐ e ๐, 1 โ ๐ per indicare le strategie miste rispettivamente di ๐ผ e ๐ผ๐ผ. Il payo๏ฌ atteso di ๐ผ eฬ: ๐ (๐, ๐) = 6๐๐ + 2๐(1 โ ๐) + 7(1 โ ๐)๐ = 6๐๐ + 2๐ โ 2๐๐ + 7๐ โ 7๐๐ = = โ3๐๐ + 2๐ + 7๐ = ๐(2 โ 3๐) + 7๐ Quindi per ๐ < 2/3 la best reply per ๐ผ eฬ ๐ = 1, per ๐ = 2/3 eฬ tutto [0, 1], per ๐ > 2/3 la best reply eฬ ๐ = 0. Per ๐ผ๐ผ il payo๏ฌ atteso eฬ: ๐(๐, ๐) = 6๐๐ + 7๐(1 โ ๐) + 2(1 โ ๐)๐ = 6๐๐ + 7๐ + โ7๐๐ + 2๐ โ 2๐๐ = = โ3๐๐ + 2๐ + 7๐ = ๐(2 โ 3๐) + 7๐ Quindi per ๐ < 2/3 la best reply per ๐ผ๐ผ eฬ ๐ = 1, per ๐ = 2/3 eฬ tutto [0, 1], per ๐ > 2/3 la best reply eฬ ๐ = 0. In ๏ฌgura 2 disegniamo le best reply. Le best reply ci permettono di individuare gli equilibri di Nash in strategie miste. Ritroviamo i due equilibri puri ed uno in strategie completamente miste (il cui payo๏ฌ atteso eฬ di 14/3 per entrambi i giocatori). Esercizio 15 Soluzione parte a) Se (¯ ๐ฅ, ๐ฆ¯) eฬ un equilibrio di Nash, si ha (si ricordi che ๐ = ๐ ): ๐ (¯ ๐ฅ, ๐ฆ¯) โฅ ๐ (๐ฅ, ๐ฆ¯) per ogni ๐ฅ โ ๐ (1) ๐(¯ ๐ฅ, ๐ฆ¯) โฅ ๐(¯ ๐ฅ, ๐ฆ) per ogni ๐ฆ โ ๐ (2) Esercizi TdG per PoliMI II 17 c โFioravante Patrone 6 1 g best reply di ๐ผ g 2 3 best reply di ๐ผ๐ผ g equilibrio di Nash g 2 3 1 - I Figura 2: I gra๏ฌci delle corrispondenze di miglior risposta Ma allora: ๐(¯ ๐ฆ , ๐ฅ¯) = ๐ (¯ ๐ฅ, ๐ฆ¯) โฅ ๐ (๐ฅ, ๐ฆ¯) = ๐(¯ ๐ฆ , ๐ฅ) per ogni ๐ฅ โ ๐ (3) Ma: ๐(¯ ๐ฆ , ๐ฅ¯) โฅ ๐(¯ ๐ฆ , ๐ฅ) per ogni ๐ฅ โ ๐ (4) eฬ proprio la seconda condizione (cioeฬ quella relativa al giocatore ๐ผ๐ผ) che viene richiesta a๏ฌncheฬ (¯ ๐ฆ , ๐ฅ¯) sia un equilibrio di Nash. Si noti che essa eฬ perfettamente equivalente a: ๐(¯ ๐ฆ , ๐ฅ¯) โฅ ๐(¯ ๐ฆ , ๐ฆ) per ogni ๐ฆ โ ๐ (5) Allo stesso modo si ottiene che (¯ ๐ฆ , ๐ฅ¯) soddisfa anche la prima condizione dellโequilibrio di Nash. parte b) No. Basta considerare: I โ II ๐ด ๐ต ๐ด ๐ต (0, 0) (0, 0) (0, 0) (0, 0) Esercizi TdG per PoliMI 18 c โFioravante Patrone Un esempio meno banale eฬ o๏ฌerto dalla โbattaglia dei sessiโ (tenendo conto di quanto verraฬ detto al punto d)). parte c) No. Tanto per cominciare, un gioco simmetrico puoฬ non avere equilibri. Ad esempio, il โpari o dispariโ (che NON ha equilibri. Ovviamente la sua estensione mista sฤฑฬ). Comunque, anche se ha equilibri, non eฬ detto che ne abbia di simmetrici, come mostra il gioco โchickenโ (anche qui, non mi sto riferendo alla sua estensione mista): I โ II ๐ด ๐ต ๐ด ๐ต (3, 3) (2, 4) (4, 2) (1, 1) parte d) Dato un gioco (๐, ๐, ๐, ๐), lo potremmo chiamare โessenzialmente simmetricoโ se โ๐, ๐ : ๐ โ ๐, ๐ : ๐ โ ๐ , corrispondenze biunivoche, tali che, posto ๐ห(๐ , ๐ก) = ๐ (๐(๐ ), ๐(๐ก)) e ๐ห(๐ , ๐ก) = ๐(๐(๐ ), ๐(๐ก)), il gioco (๐, ๐, ๐ห, ๐ห) eฬ un gioco simmetrico. Lโidea eฬ quindi che lโapparente mancanza di simmetria derivi solo dalla assegnazione delle โetichetteโ alle strategie dei giocatori. Vediamo, per esempio, come la โbattaglia dei sessiโ sia un gioco essenzialmente simmetrico. Basta prendere ๐ = {๐ป, ๐พ} e de๏ฌnire ๐(๐ป) = ๐, ๐(๐พ) = ๐ต, ๐(๐ป) = ๐ , ๐(๐พ) = ๐ฟ. Cosฤฑฬ, trasformiamo la โbattaglia dei sessiโ rappresentata qui sotto a sinistra, nel gioco di destra che soddisfa la de๏ฌnizione formale di gioco simmetrico: I โ II ๐ ๐ต ๐ฟ ๐ 2, 1 0, 0 0, 0 1, 2 I โ II ๐ป ๐พ ๐ป ๐พ 0, 0 2, 1 1, 2 0, 0 Si puoฬ facilmente veri๏ฌcare come: ๐ห(๐ป, ๐ป) = ๐ (๐(๐ป), ๐(๐ป)) = ๐ (๐, ๐ ) = 0, ๐ห(๐ป, ๐พ) = ๐ (๐(๐ป), ๐(๐พ)) = ๐ (๐, ๐ฟ) = 2, etc. Analogamente per i payo๏ฌ di ๐ผ๐ผ, ad esempio: ๐ห(๐พ, ๐ป) = ๐(๐(๐พ), ๐(๐ป)) = ๐(๐ต, ๐ ) = 2. Si noti che ๐ห(๐ป, ๐พ) = ๐ห(๐พ, ๐ป), come richiede la condizione di simmetria. In e๏ฌetti, si puoฬ agevolmente veri๏ฌcare come il gioco (๐, ๐, ๐ห, ๐ห) sia un gioco simmetrico. Un altro esempio eฬ dato dal dilemma del prigioniero, dato nella tabella a sinistra. Qui basta proprio solo โridenominareโ le strategie di ๐ผ๐ผ (usare ๐ al posto di ๐ฟ e ๐ต al posto di ๐ ) e si ottiene il gioco di destra che soddisfa la condizione di simmetria. I โ II ๐ ๐ต ๐ฟ ๐ 3, 3 1, 4 4, 1 2, 2 I โ II ๐ ๐ต ๐ ๐ต 3, 3 1, 4 4, 1 2, 2 Esercizi TdG per PoliMI 19 c โFioravante Patrone Per altro verso, anche il gioco sotto a sinistra (che ovviamente eฬ la battaglia dei sessi) eฬ simmetrico, pur di de๏ฌnire ๐ = {๐ป, ๐พ} e de๏ฌnire ๐(๐ป) = ๐ป, ๐(๐พ) = ๐พ, ๐(๐ป) = ๐พ, ๐(๐พ) = ๐ป: vedasi la tabella di destra. I โ II ๐ป ๐พ ๐ป ๐พ 2, 1 0, 0 0, 0 1, 2 I โ II ๐ป ๐พ ๐ป ๐พ 0, 0 2, 1 1, 2 0, 0 Critiche e commenti sono lasciati a voi. Esercizio 16 Soluzione Lโa๏ฌermazione eฬ scorretta. Ad esempio, le seguenti sono due diverse strategie per ๐ผ: ๐ฅ1 = ๐ด ๐ด๐ด๐ด ๐ด๐ด๐ต ๐ด๐ด๐ถ ๐ด๐ต๐ด ๐ด๐ต๐ต ๐ด๐ต๐ถ ๐ด๐ถ๐ด ๐ด๐ถ๐ต ๐ด๐ถ๐ถ (6) ๐ฅ2 = ๐ด ๐ด๐ด๐ด ๐ด๐ด๐ต ๐ด๐ด๐ถ ๐ต๐ต๐ด ๐ต๐ต๐ต ๐ต๐ต๐ถ ๐ต๐ถ๐ด ๐ต๐ถ๐ต ๐ต๐ถ๐ถ (7) Il signi๏ฌcato dei simboli dovrebbe essere chiaro. Il primo simbolo indica la scelta fatta allโinizio da ๐ผ (in entrambe le strategie, ๐ผ sceglie ๐ด alla sua prima mossa); gli altri simboli indicano cosa egli fa dopo le diverse possibili storie: ad esempio, ๐ต๐ถ๐ด indica che ๐ผ, quando gli ritocca giocare, gioca ๐ต (qualora lui avesse scelto ๐ถ alla prima mossa e ๐ผ๐ผ avesse giocato ๐ด). Si veri๏ฌca agevolmente come, qualunque sia la strategia ๐ฆ usata da ๐ผ๐ผ, le coppie di strategie (๐ฅ1 , ๐ฆ) e (๐ฅ2 , ๐ฆ) danno luogo entrambe alla storia ๐ด๐ ๐ด๐ (dove ๐ e ๐ indicano le scelte che ๐ผ๐ผ si troveraฬ ad e๏ฌettuare usando la strategia ๐ฆ da lui scelta). In particolare, se ๐ผ๐ผ decide di usare la strategia che prevede di scegliere sempre ๐ด ad ogni suo nodo decisionale, (๐ฅ1 , ๐ฆ) e (๐ฅ2 , ๐ฆ) danno luogo entrambe alla storia ๐ด๐ด๐ด๐ด. Quindi, le strategie a disposizione dei giocatori sono piuฬ delle possibili storie del gioco. Dโaltronde, il numero di strategie per ๐ผ eฬ 3 โ 39 , mentre quello per ๐ผ๐ผ eฬ 33 โ 327 . Come si vede, i conti non tornano. Le strategie sono molte di piuฬ delle storie. Osservazione. Le due strategie di ๐ผ descritte in (6) e (7) di๏ฌeriscono tra loro per via di scelte diverse che ๐ผ progetta di fare in nodi che non saranno raggiunti vista la sua scelta fatta al primo nodo decisionale. Potrebbe cambiare qualcosa che usassimo la forma normale ridotta? (Per dettagli e terminologia sulla forma normale ridotta, vedasi Myerson).