Teoria dei giochi
Teoria che analizza in modo formale
l’interazione strategica di soggetti
razionali che agiscono in modo
strategico
Situazione strategica
Sette persone si recano insieme al ristorante
a) Si paga alla romana  semplice problema di scelta (Max U s.t. VdB)
 Ciascuno è in grado di controllare autonomamente il risultato delle sue scelte
b) Si paga dividendo il conto per 7  problema strategico
Non riesco a controllare la mia spesa
 Il risultato delle mie azioni dipende anche dalle scelte degli altri
Gioco
insieme astratto di regole
che vincolano il
comportamento dei
giocatori
definiscono i risultati
sulla base delle azioni che
essi intraprendono
Il gioco è le regole
In un gioco vi
sono tre
elementi
caratteristici
Rappresentazione di un gioco
• Forma normale: matrice delle vincite
• Forma estesa: albero del gioco
Esempio
Giocatori
Strategie B
B
A Alto
Basso
Sinistra
Destra
1,2
0,1
2,1
1, 0
Payoff A
Strategie A
Uno dei 4 esiti del gioco
Payoff B
Forma estesa
Rami
Nodi
A
Sx
Dx
B
B
Dx
2,3
Uno dei 4 esiti del gioco
Non
Sx
Dx
1,2
2,0
Sx
Payoff A
0,1
Payoff B
Classificazione dei giochi
Cooperativi
NON Cooperativi
Informazione
completa
Informazione
incompleta
i giocatori possono assumere degli
impegni che hanno valore
VINCOLANTE
i giocatori NON possono assumere
degli impegni che hanno valore
VINCOLANTE
Tutte le informazioni del gioco sono
note a tutti i giocatori
NON tutte le informazioni del gioco
sono note a tutti i giocatori
Classificazione dei giochi
Giochi a somma
zero
il guadagno di un giocatore CORRISPONDE
sempre alla perdita di un altro giocatore
La somma delle vincite (o delle perdite) dei
giocatori NON È COSTANTE
Giochi statici
I giocatori fanno le loro mosse
SEQUENZIALMENTE
Giochi one-shot
Vengono giocati PIÙ VOLTE fra gli stessi
giocatori
Giochi NON a somma
zero
I giocatori fanno le loro mosse
SIMULTANEAMENTE
Giochi dinamici
Vengono giocati UNA SOLA volta
Giochi ripetuti
Soluzione dei giochi
Equilibrio per un gioco: situazione in cui
nessun giocatore desidera modificare il
suo comportamento unilateralmente dato il
comportamento degli altri giocatori
Equilibrio di Nash
Un insieme di strategie, una per ogni giocatore, tale
che la strategia di ogni giocatore sia la migliore per lui,
quando anche gli altri giocatori giochino la loro
strategia di equilibrio
L’equilibrio di Nash si definisce strategicamente
stabile o autovincolante perché nessun giocatore,
singolarmente preso, desidera deviare dalla propria
strategia di equilibrio ferme restando le strategie
adottate dagli altri giocatori
Equilibrio di Nash
La strategia (a2,b3) è un equilibrio di Nash perché né A né B hanno
l’incentivo a cambiare strategia data la scelta dell’altro giocatore
B
A
b1
b2
b3
a1
0,3
2,2
1,3
a2
2,1
3,2
2,3
a3
5,1
1,4
1,0
Se B cambiasse otterrebbe 1
giocando b1 e 2 giocando b2
Se A cambiasse
otterrebbe 1
giocando a1 e 1
giocando a3
Equilibrio di Nash
La strategia (a2,b3) è un equilibrio di Nash perché né A né B hanno
l’incentivo a cambiare strategia data la scelta dell’altro giocatore
A preferirebbe il 5 di (a3,b1)
B
A
b1
b2
b3
a1
0,3
2,2
1,3
a2
2,1
3,2
2,3
ma (a3,b1) non è un equilibrio
perché B cambierebbe la sua
scelta in b2
ma allora A si
sposterebbe in a2
infine B si sposterebbe in b3
a3
5,1
1,4
1,0
da qui NON ci si muove più
L’equilibrio non produce né per A né per B necessariamente il
payoff più alto
Equilibrio di Nash
* *
*
*
* *
*
i (s1 , s2 ,...si ,.., sn )  i (s1 , s2 ,...ŝi ,.., sn )
*
si
è la soluzione del problema
* *
Max i (s1 , s 2 ,...si
si
*
si
*
,.., s n )
s.t. si  Si
Può essere vista come la ottima risposta del
giocatore i-esimo alle mosse degli altri giocatori
Possiamo definire una risposta ottima per ogni strategia degli altri
giocatori costruendo una funzione di risposta ottima
BRF  funzione di risposta ottima
L’equilibrio di Nash sarà caratterizzato dal fatto che per tutti i
giocatori è una risposta ottima alle scelte degli altri
Come si trova l’equilibrio di Nash
Strategia DOMINANTE
Se esiste una strategia
dominante un giocatore
razionale giocherà
QUELLA
Se esiste una strategia
dominata un giocatore
razionale non la giocherà
MAI
Strategia DOMINATA
strategia che risulta migliore
(garantisce più alti payoffs) per
un giocatore indipendentemente
dalle strategie adottate dagli altri
giocatori
strategia che risulta inferiore
(garantisce più bassi payoffs) per
un giocatore indipendentemente
dalle strategie adottate dagli altri
giocatori
Definzione
Strategia (debolmente)
DOMINANTE
Strategia (debolmente)
DOMINATA
strategia che risulta non
peggiore (garantisce payoffs
non inferiori) per un giocatore
indipendentemente dalle
strategie adottate dagli altri
giocatori
strategia che risulta non superiore
(garantisce payoffs non più alti)
per un giocatore
indipendentemente dalle strategie
adottate dagli altri giocatori
Esempio: prendiamo i due giochi che seguono
Strategia Dominante
B
b1
b2
B
b3
b1
a1 0,3 2,2 1,3
A
a2 2,1 3,2 2,3
a3 5,1 1,4 1,0
Strategia Dominata
b2
b3
a1 1,3 2,4 1,3
A
a2 2,1 3,2 1,1
a3 5,1 4,4 2,0
Esempio: prendiamo questi altri due giochi
Gli unici valori differenti
sono i payoffs segnati in
rosso
Strategia debolmente
Dominante
B
b1
b2
B
b3
b1
a1 0,3 3,2 1,3
A
a2 2,1 3,2 2,3
a3 5,1 1,4 1,0
Strategia debolmente
Dominata
b2
b3
a1 1,3 2,4 1,3
A
a2 2,1 3,2 1,1
a3 5,1 4,4 2,4
Come si trova l’equilibrio di Nash
A
a1
a2
a3
B1
B
b2
B3
0,3
2,1
5,1
4,2
3,2
1,4
1,3
2,3
1,0
Non ci sono né strategie dominate né strategie dominanti
Per trovare la soluzione occorre utilizzare la funzione di
risposta ottima (BRF)
risposta ottima
Funzione di
risposta ottima
La migliore strategia che un giocatore può effettuare
DATA la strategia scelta dagli ALTRI GIOCATORI
L’insieme delle risposte ottime di un giocatore
Trovare l’ E.d.N. utilizzando la BRF
A
a1
a2
a3
b1
B
b2
b3
0,3
2,1
5,1
4,2
3,2
1,4
1,3
2,3
1,0
E.d.N deve essere la
coppia di strategie che
è la risposta ottima di
entrambi i giocatori
Se il giocatore B sceglie b1 la migliore risposta di A è a3
Se il giocatore B sceglie b2 la migliore risposta di A è a1
Se il giocatore B sceglie b3 la migliore risposta di A è a2
Se il giocatore A sceglie a1 la migliore risposta di B è b1 o b3
Se il giocatore A sceglie a2 la migliore risposta di B è b3
Se il giocatore A sceglie a3 la migliore risposta di B è b2
Limiti della definizione di equilibrio di Nash
P
Gioco del calcio di rigore
A
cerchiamo l’equilibrio con il
metodo della risposta ottima
dx
cx
sx
dx
0,2
2,0
2,0
cx
2,0
0,2
2,0
sx
2,0
2,0
0,2
E’ evidente che non esiste un equilibrio di
Nash per questo gioco
equilibrio di Nash
Consideriamo questo gioco classico
La guerra dei sessi
Lui
Esiste una
molteplicità
(due) di
equilibri di
Nash
Opera Stadio
Opera
1,2
0,0
Stadio
0,0
2,1
Lei
Quale selezionare ?
Limiti della definizione di equilibrio di Nash
Molteplicità equilibri di Nash
Prendiamo un altro gioco
Gioco dell’incrocio
Due auto (S e D) arrivano
contemporaneamente all’incrocio
Possono Fermarsi o Passare
S
D
P
F
P
-2, -2
2,0
F
0,2
0,0
Molteplicità equilibri di Nash: giochi sequenziali
Consideriamo il gioco dell’incrocio, immaginando che l’auto A si
presenti per prima all’incrocio
Il gioco non è più simultaneo ma sequenziale, l’auto A effettuerà
la prima mossa e successivamente muoverà l’auto B
Auto A
La
rappresentazione
del gioco a forma
estesa è
preferibile
P
F
Auto B
F
0,0
Auto B
P
F
0,2
2,0
P
-2 , -2
Giochi sequenziali in forma estesa: induzione a ritroso
Induzione a ritroso
Si parte dai nodi finali del gioco e si analizzano le scelte dei giocatori fino
a risalire all’inizio del gioco
B sceglierà P
che gli da 2 al
posto di 0
A lo sa e sa che
se sceglierà F
prenderà 0
Auto B
F
0,0
Auto A
P
F
A sceglierà P che
gli garantisce 2
mentre se
scegliesse F
F
P
avrebbe 0
0,2
2,0
B sceglierà F che gli
da 0 al posto di -2
A lo sa e sa che se
sceglierà P
prenderà 2
Auto B
P
-2 , -2
Molteplicità equilibri di Nash: meccanismi istituzionali
Quando non esistono altri sistemi per eliminare la molteplicità degli
equilibri possono intervenire dei meccanismi istituzionali che
regolamentano il comportamento individuale e risolvono l’ambiguità
Gioco dell’incrocio  il semaforo, regola
codice della strada
guerra dei sessi  Se il rapporto dura nel tempo, la
coppia cerca una regola di
buona convivenza
Risolvere questo tipo di ambiguità è una delle
spiegazioni della nascita delle istituzioni
Criterio Paretiano (da W. Pareto)
Abbiamo visto che l’individuo ordina i panieri alternativi secondo le sue
preferenze e scegli il paniere che massimizza il suo benessere dati i
vincoli cui è soggetto
Come possiamo confrontare allocazioni che coinvolgano più di un soggetto
Problema
L’utilità non è misurabile
Non possiamo semplicemente sommare la soddisfazione
individuale
Esiste un punto di vista sociale per valutare le
allocazioni? Ci sono o no criteri che ci consentano di dire
se l’allocazione A è superiore all’allocazione B,
oppure se è vero il contrario?
Allocazione = distribuzione di beni, benessere o quant’altro fra più soggetti
Criterio Paretiano
Criterio Paretiano
Il “criterio di Pareto ” afferma quanto segue:
Un’allocazione A è superiore a un’altra allocazione B,
se almeno un soggetto preferisce A a B
e nessuno preferisce B ad A (e viceversa).
oppure
Un’allocazione A è superiore a un’altra allocazione B,
se in A tutti stanno altrettanto bene che in B e
almeno uno sta meglio in A che in B
Non tutte le allocazioni
sono Pareto Ordinabili
A = (10, 3, 7)
B = (10, 2, 7)
C = (9, 5, 16)
Criterio Paretiano (da W. Pareto)
Un'allocazione è efficiente nel senso di Pareto
se non ne esiste un'altra che sia migliore sulla
base del principio di Pareto;
cioè, se non è possibile migliorare il benessere
di qualcuno senza peggiorare quello di qualcun
altro
Criterio di efficienza distributiva e non di equità
Dilemma del prigioniero
• Thelma e Louise sono complici in un grave delitto e sono
detenute in celle separate (non possono comunicare).
• Ci sono le prove solo per accusarle di un reato minore la
cui pena è 1 anno di reclusione
• Ogni prigioniera può confessare il delitto grave o negare.
• Se confessa uscirà subito di prigione, mentre la complice
avrà una pena di 10 anni di reclusione.
• Se entrambe confessano saranno condannate a una pena
intermedia di 2 anni.
• Se nessuna delle due confessa la pena sarà di 1 anno.
Dilemma del prigioniero
L’EQUILIBRIO DI NASH È SOTT'OTTIMALE (in senso
Paretiano) rispetto ad un altro esito del gioco che sarebbe
preferito da entrambi i giocatori ma che non è ottenibile
Nota: essendo anni di prigione si tende a minimizzare i payoffs
Risultato paradossale
Un comportamento teso a
massimizzare il
benessere individuale
produce un risultato non
ottimo da un punto di
vista individuale
Louise
Nega
Accusa
O.P
Nega
1,1
Thelma
10 , 0
Nash
Accusa
0 , 10
5,5
Dilemma del prigioniero
Accusa è la strategia
dominante per entrambe
Louise
Nega
Accusa
Nega
1,1
10 , 0
Accusa
0 , 10
5,5
Thelma
Dilemma del prigioniero  framework generale
Le fattispecie di questo tipo sono molto diffuse nel
mondo reale
Gioco del lavoro di gruppo a scuola
Ana e Beatrix devono fare un lavoro i gruppo per
cui saranno valutate congiuntamente L’insegante
non può valutare chi ha fatto cosa), ma devono
lavorare separatamente
Dilemma del prigioniero
Gioco del lavoro di gruppo
Ipotesi
a) Entrambe partono da una valutazione di 2 (parte del compito
già svolta)
b) Lavorare stanca (entrambe giudicano lavorare come perdere 4
punti)
c) Se entrambe lavorano otterranno il punteggio massimo, 6 punti,
il punteggio netto (tenendo conto di a) e b) sarà 2+6–4 = 4;
d) Se entrambe non lavorano non guadagnano punti aggiuntivi, il
punteggio è 0; il punteggio netto sarà 2+0-0 = 2
e) Se una sola lavora ottengono solo 3 punti e il punteggio netto
sarà
2+3-4 = 1 per quella che lavora
2+3 = 5
per quella che non lavora
Dilemma del prigioniero  framework generale
Gioco del lavoro di gruppo
Ana e Beatrix devono fare un lavoro i gruppo per cui saranno
valutate congiuntamente
Beatrix
Ana
L
NL
L
4, 4
5, 1
NL
1,5
2,2
Sotto-ottimalità dell’equilibrio di Nash
possibili soluzioni
Meccanismi istituzionali
Mafia, malavita organizzata
dilemma del prigioniero
Modificano dall’esterno la struttura degli incentivi
Se il gioco viene ripetuto
Meccanismi endogeni
accordo fra i giocatori
Dilemma del prigioniero e giochi ripetuti
Nella realtà il gioco è spesso ripetuto
Possono emergere dei meccanismi endogeni di punizione di
comportamenti devianti
Prendiamo il gioco della del
lavoro di gruppo
Immaginiamo un accordo
(esplicito o tacito) per lavorare
Se una delle due ragazze
violasse l’accordo di fare la
sua parte l’altra farebbe non
collaborerebbe più
Meccanismo punitivo
Ogni volta che sono chiamate a collaborare, Ana e Beatrix devono
decidere se collaborare o «fregarsi» a vicenda
Dilemma del prigioniero e giochi ripetuti
Vantaggio
immediato
π
Perdita
futura
5
4
2
1
2
3
4
tempo
Dilemma del prigioniero e giochi ripetuti
Se i giocatori sono sufficientemente pazienti (attribuiscono un
peso adeguato ai guadagni futuri)
Nota
Il gioco deve durare
all’infinito o avere una
durata finita ma incerta
Il risultato pareto ottimale può essere raggiunto
Reputazione -- Credibilità
Scarica

ex cap4