Equilibre en stratégies strictement dominantes

publicité
Les jeux simultanés (exemple pierre papier ciseaux)
Les joueurs rationnels choisissent simultanément leurs actions et reçoivent un gain qui dépend des
stratégies choisies par l’ensemble des joueurs.
Jeux à information complète :
Chaque joueur connaît l’ensemble des actions qu’il peut entreprendre,
Chaque joueur connaît l’ensemble des actions possibles pour les autres joueurs,
Chaque joueur connaît les préférences des autres joueurs, Chaque joueur connaît les gains
résultant de ces actions.
Tout ce qu’un joueur connaît est de connaissance commune.
La connaissance commune
Supposons qu’on parle d’une information qu’on appelle X.
X est de connaissance commune si tout le monde connaît X Et tout le monde sait que tout le
monde connaît X
Et tout le monde sait que tout le monde sait que tout le monde connaît X...
Et ce indéfiniment.
⇒ Implication des concepts de rationalité et de connaissance commune sur le comportement
(stratégique) des joueurs.
Motivations - 1
1/ Comment décrire une situation de jeu ?
Définition & représentation d’un jeu sous la forme normale.
2/ Comment résoudre le problème inhérent à un jeu ?
Jeux à somme non nulle : stratégies dominantes et dominées.
Stratégie dominante : quelle est ma meilleure stratégie alors que stratégie dominée : quelle est la stratégie perdante
(qu’on écarte). A partir de ça, on donne :
Un Concept de solution et méthode de résolution :
Equilibre en stratégies dominantes et
Elimination itérative des stratégies strictement dominées Pour les jeux à somme nulle, stratégies
prudentes.
Motivations - 2
Cependant, notions insuffisantes pour avoir une idée précise de ce qui va se passer dans un jeu.
Stratégie rationalisable, meilleure réponse et équilibre de Nash.
Stratégies pures vs.mixtes, interprétées comme l’incertitude d’un joueur à propos de ce qu’un
autre joueur va faire.
Résultat d’existence de Nash (1950) : tout jeu sous forme normale admet au moins un EN en
stratégies mixtes.
Applications : concurrence imparfaite, problèmes de pollution, malédiction des ressources.
Plan
(plan incomplet)
1
Introduction
2
Représentation du jeu sous forme normale
3
Stratégies dominantes, stratégies dominées
Stratégies dominantes
2. Représentation du jeu sous forme normale
Un exemple : le dilemme du prisonnier
Deux individus sont arrêtés car suspectés d’une série de crimes et emprisonnés dans des cellules
différentes.
Ils sont interrogés séparément par un représentant de l’ordre cherchant à obtenir une confession
de chaque suspect.
Si 1 seul joueur avoue les crimes (coupable), il est récompensé : peine limitée à 1 an de détention,
l’autre écope de 5 ans.
Si les deux confessent leurs actes : peine de 3 ans de prison. Si aucun n’avoue les crimes (non
coupable), possible de les
confondre pour un des crimes : 2 ans de prison.
Jeu de la colombe et du faucon
C’est une variante du dilemme du prisonnier, métaphore pour décrire le comportement agressif des firmes sur un
marché.
2 animaux qui s’affrontent ou peuvent s’affronter pour la conquête d’un territoire ou de la nourriture.
Soit V la valeur d’une ressource que se disputent 2 joueurs.
2 stratégies possibles : faucon vs.
colombe.
Si les 2 joueurs adoptent un comportement "pacifique" (colombe), alors ils partagent la ressource et obtiennent
chacun V /2.
Un joueur adoptant l’autre stratégie "agressive" (faucon) n’abandonnera pas (une partie de) la
ressource.
Donc il laissera jamais une partie de la ressource.
Jeu de la colombe et du faucon - 2
Si un seul des 2 joueurs adopte la stratégie agressive, il récupère toute la ressource, et obtient V
contre 0 pour l’autre.
Enfin, si les 2 joueurs sont agressifs, un combat devient inévitable et fait supporter un coût C /2 à
chaque joueur.
L’issue du combat est incertaine, chaque joueur a 1 chance sur 2 de remporter le combat et la
ressource.
Représentation
(C = stratégie colombe et F = stratégie faucon)
1/ et 2/ Deux joueurs, chacun dispose de 2 stratégies : {C , F }.
3/ Résultats possibles : (C,C), (C,F), (F,C) et (F,F).
4/ Gains associés à n’importe quel profil de stratégies.
(C, C)  (V/2 , V/2)
(C, F)  ( 0, V)
(F, C) - (V, 0)
(F, F)  ( (1/2)0 + (1/2)V -(C/2), (1/2)0 + (1/2)V -(C/2)
Représentation sous la forme d’un tableau 2 × 2.
Dans chaque cellule figurent les gains associés au résultat : 2 valeurs, une pour chaque joueur.
Par convention, les stratégies du premier joueur sont indiquées en ligne et son gain est la première
valeur.
C
V/2, V/2
V, 0
C
F
F
0, V
(V – C) / 2, (V – C) /2
Remarque
Variante du dilemme du prisonnier :
Situations où les joueurs ont un intérêt à coopérer et où poursuivre son propre intérêt est
préjudiciable... Mais individuellement rationnel.
Incapacité à s’engager à adopter telle ou telle stratégie.
(impossible de communiquer pour s’engager, donc comme on sait pas ce qu’il va faire, il pourrait ne pas coopérer,
donc on a intérêt à poursuivre juste son propre intérêt).
Jeu de la poule mouillée (autre variante de ce jeu)
Quand V < C ...
Histoire inspirée du film Rebel without a cause (1955) :
Jeu de la poule mouillée - 2
Deux individus foncent l’un vers l’autre au volant de leurs voitures. Ils doivent décider s’ils stoppent
ou bien s’ils continuent.
Le premier qui s’écarte de la trajectoire perd la face ; mais conserve la vie sauve (0).
L’autre peut s’arrêter ensuite et gagne (V). Si les deux continuent... Accident ( V −C ). (maisavec C
> V donc gain négatif)
2
Enfin, si les deux s’arrêtent en même temps, ils ont fait preuve d’autant de courage l’un que
l’autre et récupèrent V/2.
Le jeu de la pièce
Jeux à somme nulle : ce que gagne un joueur, l’autre le perd. Jeu à 2 joueurs.
La règle : chaque joueur prend une pièce de 1 euro dans sa main et la place soit côté pile soit côté
face visible.
Les gains : si les 2 présentent le même côté de la pièce, J1 paie 1 euro à J2. Sinon, c’est J2 qui paie 1
euro à J1.
Formalisation
La représentation sous forme normale d’un jeu spécifie :
Qui sont les joueurs,
2 joueurs, J1, J2
Quelles sont les actions qu’ils peuvent entreprendre,
Chaque joueur a 2 stratégie, (P, F)
Quels sont les résultats possibles,
4 cas possibles : (P, P) , (P, F), (F, P), (F, F)
Quelle est la valeur qu’ils attribuent à chaque résultat.
(P, P)  (-1, 1) ; (P, F)  (1, -1) ; (F, P)  (1, -1) ; (F, F)  (-1, 1)
J1
P
F
J2
P
(-1, 1)
(1, -1)
F
(1, -1)
(-1, 1)
Notations - 1
1/ Jeu à n joueurs, indicés par i = 1, ...n. Soit N l’ensemble des joueurs : N = {1, ..., i , ..., n}.
2/ Soit Si l’ensemble des stratégies à disposition du joueur i.N’importe quel si ∈ Si constitue
une stratégie pure. Par exemple, Si = (P, F), le joueur 1 aura une stratégie : s1 = P ou s2 = F.
3/ Le vecteur s = (s1 , ..., si, ..., sn ) est un résultat possible du jeu : il va spécifier une stratégie pour
chaque joueur.
⇒ Un profil de stratégies, une et une seule pour chaque joueur.
Dans le jeu de la pièce, un résultat possible c’est s = (P, P) par exemple (les deux joueurs font
pile).
On a s ∈ S , l’ensemble de tous les résultats possibles :
S = S1 × ... × Si × ... × Sn =
ᴨ
n
Si .
(peu importe)
i =1
Notations - 2
On a besoin de connaitre la fonction de gain des joueurs, qui associe à n’importe quel résultat, un
paiement. On va la noter ui.
4/ La fonction de gain (d’utilité) du joueur i , ui : S → R,
Associe à chaque résultat possible s ∈ S un paiement ui (s) ∈ R.
Pour le joueur 1, le paiement associé à s (P, P), est ui (P, P) = -1. (revoir le jeu de la pièce).
Dans un autre cas, si ui (P, F) = 1. (si pile et face).
On note enfin s−i = (s1 , ..., si −1 , si +1 , ..., sn ) un profil de stratégies pour tous les joueurs autre que i .
On fait ça parce qu’on va préciser d’abord la stratégie du joueur i, et ensuite la stratégie du joueur
s-i.
On aura s−i ∈ S−i avec S−i = S1 × ... × Si −1 × Si +1 × ... × Sn .
Un profil
de stratégies s = (si , s−i ).
Si il n’y a que 2 joueurs, s-i, ça sera juste la stratégie du joueur 2. Si on est 3, s-i ça sera juste la
stratégie du joueur 2 et du joueur 3.
Jeu sous forme normale
Définition
La représentation sous forme normale d’un jeu à n joueurs est une liste G = [N, S1 , ..., Sn , u1 , ..., un ],
soit G = [N, {Si }, {ui }], où pour
tout i ∈ N, Si correspond à l’ensemble des stratégies disponibles
n
pour le joueur i et ui :
ᴨ Si → R est la fonction d’utilité VNM du
i =1
joueur i .
Von Neumann et Morgenstern (1944) : fondateurs de la théorie de l’utilité espérée pour la modélisation
des choix en univers incertain.
Remarques - 1
Le problème de décision d’un joueur : choisir sa stratégie afin de maximiser son niveau d’utilité (ou
d’utilité espérée).
Les joueurs choisissent simultanément, cela ne signifie pas qu’ils agissent simultanément
(dilemme du prisonnier).
Cela signifie qu’il est impossible d’observer le choix des autres avant de prendre sa décision
⇒ Nécessaire de former des croyances sur les stratégies jouées par les autres
Remarques - 2
Représentation sous forme normale, jeux simultanés et jeux dynamiques.
Représentation sous forme normale grâce à un tableau pour un nombre de joueurs ≤ 3. Au delà,
impossible de donner une représentation simple sous forme de tableau.
Ensembles de stratégies discrets vs. continus.
Résumé
Situation de jeu :
L’utilité (ou le paiement) obtenue par un joueur dépend de sa propre stratégie mais aussi de celles
suivies par les autres joueurs.
⇒ Contexte d’interaction stratégique
Le joueur rationnel va chercher à maximiser la valeur (espérée) de son utilité en adaptant sa décision
aux croyances qu’il forme sur le choix des autres.
Les éléments constitutifs du jeu sont de connaissance commune.
3. Stratégie dominante, stratégie dominée
Question centrale de la théorie des jeux
Comment jouer ?
Comment prédire le déroulement d’un jeu où les joueurs sont rationnels et pleinement informés de
la structure et de la rationalité des autres.
(plan : )
Concepts de stratégies dominantes puis d’équilibre en stratégies dominantes (premier concept de
solution).
Ensuite, concept lié de stratégies dominées.
Enfin, processus d’élimination itérative des stratégies strictement dominées.
La dominance
Moyen simple de comparer les stratégies : notion de dominance. Illustration : le dilemme du
prisonnier.
Joueur 2
Joueur 1
C
N
C
-3, 3
-1, -5
N
-5, -1
-2, 2
Il existe une unique solution plausible à ce jeu : (C , C ).
Pour comprendre cela, il faut voir que jouer C est la meilleure stratégie de chaque joueur,
indépendamment de ce que fait l’autre.
Supposons que j’anticipe que J2 joue C. Je compare les paiements associés à mes deux choix possibles.
Ici j’ai intérêt à plaider coupable. Maintenant supposons que j’anticipe que J2 joue N. Ici, j’ai encore
intérêt à plaider coupable.
C’est pourquoi la seule solution plausible est (C, C).
⇒ Cette action constitue une stratégie strictement dominante. (Stratégie qui garantit le paiement le
plus élevé dans tous les cas possibles).
Stratégie strictement dominante (STD)
Définition
Une stratégie si ∈ Si est une stratégie strictement dominante pour le joueur i dans le jeu G = [N,
{Si }, {ui }] si pour tout s t ∈ Si ,
si ≠sit , on a
uii(si , s−i ) > ui (sit , s−i ) pour tout s−i ∈ S−i
La stratégie si est celle, parmi l’ensemble Si , qui offre le paiement le plus élevé au joueur i et ce quel
que soit les stratégies choisies par les autres joueurs, s−i .
Elle est l’unique solution de la maximisation de ui par rapport à si, indépendante du profil de
stratégies joué par les rivaux de i .
Ca veut dire que la max de mon utilité par rapport aux stratégies me donnent toujours la même chose.
Y a une stratégie simplement meilleure que l’autre pour moi.
Commentaires
Peu importe ce que font les autres joueurs, si est strictement meilleure que toutes les autres
stratégies pour i. (i c’est moi, le joueur).
⇒ Si un joueur est rationnel et dispose d’une stratégie strictement dominante (SDT),
alors il ne jouera aucune autre stratégie que celle-là. Et les autres vont être capables
d’anticiper ce choix.
Equilibre en stratégies strictement dominantes
Lorsque tous les joueurs disposent d’une stratégie SDT, alors on sait facilement prédire la solution
du jeu : Equilibre en stratégies dominantes.
Définition
Un profil de stratégie s = (s1 , ..., si , ..., sn ) constitue l’équilibre en stratégies strictement dominantes
du jeu G = [N, {Si }, {ui }] si et seulement si pour tout joueur i , si ∈ Si est une stratégie strictement
dominante.
Remarques
Si un jeu admet un équilibre en stratégies SDT, alors il est unique. Pour le DDP, l’équilibre en
stratégies SDT est (C , C ).
Remarque. Ce n’est pas le meilleur résultat pour les 2 joueurs considérés conjointement : dominé au
sens de Pareto par (N , N ).  s domine s’ si ui (s) ≥ ui(s’) pour tout i appartenant à N avec inégalité
stricte pour certains i. Lorsqu’on laisse les joueurs agir indépendamment et de manière égoïste, on
obtient pas l’optimum général.
Problème d’existence : Dans la plupart des jeux, les joueurs ne disposent pas de telles
stratégies.
Téléchargement