Patrizio Angelini Dipartimento di Informatica e Automazione Università degli Studi Roma Tre Scegliete un numero intero tra 0 e 100 Vince chi si avvicina di più ai 2/3 della media dei numeri scelti ◦ Chi vince prende un +! Non ha senso scegliere un numero superiore a 66, perché non potrà mai essere i 2/3 della media Se tutti fanno questo ragionamento, e nessuno sceglie un numero maggiore di 66, non ha senso scegliere un numero maggiore di 44 … Se tutti ragionassero bene, il numero migliore da scegliere sarebbe 0 Game theory attempts to mathematically capture behavior in strategic situations, or games, in which an individual's success in making choices depends on the choices of others Myerson, 1991 Zero-sum / Non-zero-sum games ◦ Un giocatore guadagna a spese dell’altro ◦ Le somme dei guadagni e delle perdite dei giocatori potrebbero essere differenti Cooperative / Non-cooperative games ◦ I giocatori possono cooperare oppure no Strategic Game: ◦ A set of players ◦ For each player, a set of strategies ◦ For each player, preferences over the set of action profiles (the list of all the player’s actions) Preferences are ordinal (Player 1 prefers a to b) Time is absent from the model ◦ All the players choose simultaneously Rationality assumption ◦ Each player makes her best choice Non-zero sum game Non-cooperative game Two suspects are held in separate cells. There is enough evidence to convict each of them of a minor offense, but not enough to convict either of them of the major crime, unless one of them finks. If they both stay quiet, each will be convicted of the minor offense and spend 1 year in prison. If one and only one of them finks, she will be freed and used as a witness against the other, who will spend 4 years in prison. If they both fink, each will spend 3 years in prison. Players: the two suspects S1 and S2 Strategies: Either Quiet or Fink, for both players Preferences: ◦ S1: {F,Q} (payoff 3) – {Q,Q} (2) – {F,F} (1) – {Q,F} (0) ◦ S2: {Q,F} (3) – {Q,Q} (2) – {F,F} (1) – {F,Q} (0) Q F Q (2,2) (0,3) F (3,0) (1,1) S2 S1 Q F Q (2,2) (0,3) F (3,0) (1,1) How would you act if you were suspect S1? How would you act if you were suspect S2? What is the best global solution? A set of strategies, one for each player, such that no player has incentive to unilaterally change her action ◦ each player is assumed to know the strategies of the other players A group of players is in Nash equilibrium if each one is making her best decision, taking into account the decisions of the others. Nash equilibria are used to analyze the outcome of the strategic interaction of several decision makers. ◦ predicting what will happen if several players are making decisions at the same time. ◦ there could be more than one Nash Equilibrium if it is only one, then the outcome is certain We cannot predict the result of the choices of multiple decision makers if we analyze those decisions in isolation ◦ we must ask what each player would do, taking into account the decision-making of the others. Non è detto che l'equilibrio di Nash sia la soluzione migliore per tutti. In un EN il singolo giocatore non può aumentare il proprio guadagno modificando solo la propria strategia, ma un insieme di giocatori può farlo allontanandosi congiuntamente dall'equilibrio. L'equilibrio di Nash può non essere un ottimo di Pareto. Analogamente, l’ottimo di Pareto può non essere un equilibrio. A B A (1,-1) (-1,1) B (-1,1) (1,-1) How many Nash Equilibria? What is the best global solution? ◦ Is it a Nash Equilibrium? A B A (2,2) (0,0) B (0,0) (1,1) How many Nash Equilibria? What is the best global solution? ◦ Is it a Nash Equilibrium? Instead of simply choosing an action, players choose probability distributions over the set of available actions. Such distributions can be represented by a function that assigns a real number to each action profile ◦ von Neumann-Morgenstern utility function One lottery is preferred to another if it results in a higher expected value of this utility function. Ogni gioco finito con strategie miste ammette almeno un equilibrio di Nash ◦ Gioco finito: numero finito di giocatori e strategie A B A (1,-1) (-1,1) B (-1,1) (1,-1) A mixed strategy in which both players choose A with probability ½ and B with probability ½ is a Nash Equlibrium Come scegli la mattina la strada da fare per andare a lavoro? ◦ La più corta? ◦ La più veloce? ◦ Quella con meno semafori? ◦ Quella che passa davanti al bar o al tabaccaio? ◦ Quella con meno traffico? ◦ Tenendo in considerazione quanto traffico aggiuntivo puoi causare agli altri? Sei non lo fai, sei egoista (selfish) In una rete, spesso è difficile (impossibile) imporre strategie centralizzate Gli utenti fanno le proprie scelte in modo selfish In generale, il risultato di una ottimizzazione locale degli utenti selfish è peggiore dell’ottimo globale quando gli utenti cooperano l(x) = x s t l(x) = 1 Una strada corta ma stretta Una strada larga ma lunga x è la percentuale di traffico che passa in una strada l(x) = x s t l(x) = 1 Se tutti fanno la strada corta, ci mettono tutti 1 ora Se la metà fa la strada corta, quelli ci mettono ½ ora e gli altri 1 ora, quindi tempo medio ¾ d’ora Price of Anarchy = 4/3 l(x) = x l(x) = 1 s t l(x) = 1 l(x) = x Metà del traffico passa sopra e metà sotto Tempo medio pari a 1 ora e mezza l(x) = x s l(x) = 1 l(x) = 0 l(x) = 1 t l(x) = x Viene costruita una strada di raccordo larghissima e cortissima, con costo 0 Che succede? l(x) = x s l(x) = 1 l(x) = 0 l(x) = 1 t l(x) = x Passano tutti per quella strada e… Ci mettono 2 ore! Price of Anarchy = 4/3 Non è detto che avere più alternative sia meglio ◦ Chiudiamo qualche strada per diminuire il traffico? Una decisione centralizzata può portare ad un migliore outcome per tutti i giocatori ◦ Nel caso di Pigou solo la metà dei giocatori andava meglio, per gli altri era uguale Grafo diretto con tante coppie (sorgentedestinazione), ognuna delle quali deve trasportare una certa quantità di flusso Ad ogni arco è associata una funzione di latenza che dipende dal flusso totale che passa su quell’arco Si sceglie il cammino con latenza totale minima Ogni utente controlla una parte minima del traffico ◦ Per questo si modella con il flusso Quale è il rapporto nel caso peggiore tra la latenza totale/media di un Equilibrio di Nash e la latenza ottima di un flusso sulla rete? ◦ The Price of Anarchy Se le funzioni di latenza sugli archi sono lineari, allora il prezzo dell’anarchia è al massimo 4/3 ◦ Pigou e Braess matchano il caso peggiore Se le funzioni di latenza sono polinomi di grado d, allora il prezzo dell’anarchia è [1 − d・(d+1)−(d+1)/d] ◦ d -> ∞ implica PoA -> ∞ −1 d -> ∞ implica PoA -> ∞ l(x) = x s d 1-ε ε l(x) = 1 t Se le funzioni di latenza sono continue e non decrescenti, la latenza totale di un EN è al massimo pari alla latenza totale ottima nel caso in cui ogni coppia sorgentedestinazione trasporti il doppio del traffico ◦ In mancanza di controllo centralizzato, è sufficiente aumentare la banda di un fattore costante Il prezzo dell’anarchia non cambia al variare della complessità della topologia della rete Esempi worst-case si ottengono sempre anche su reti con 2 nodi e archi paralleli tra loro ◦ Pigou Quello che conta sono solo le funzioni di latenza E’ possibile progettare reti su cui un atteggiamento selfish da parte dei router induca un’efficienza del routing vicina a quella ottima? Il paradosso di Braess suggerisce di partire da una rete e togliere archi Risultati di inapprossimabilità ◦ Con latenze non decrescenti e continue, non esiste un’approssimazione migliore di n/2, anche con solo una sorgente e una destinazione ◦ Con latenze lineari, non esiste un’approssimazione migliore di 4/3, anche con solo una sorgente e una destinazione Le approssimazioni ottime sono quelle triviali Non rimuovere nessun arco