Dossier 9 - corrigé en format docx Fichier

publicité
Dossier 9 – Jeux non coopératifs et équilibre de Nash
EXERCICE 1 –
Soit un jeu non coopératif en information complète à deux joueurs, Bonnie et Clyde, ayant
chacun le choix entre deux stratégies, B1 et B2 pour Bonnie et C1 et C2 pour Clyde. La matrice des
gains est la suivante :
C1
C2
B1
(0 , 0)
(11 , – 1)
B2
(– 1 , 11)
(10 , 10)
1. Parmi les quatre issues possibles,
a. lesquelles sont-elles comparables selon le critère de Pareto ?
Selon le critère de Pareto, une issue E est préférable à une autre E’ lorsqu’elle lui est préférée
au sens large par l’ensemble des agents (c’est-à-dire si tous les agents soit sont indifférents
entre E et E’ soit préfèrent strictement E à E’) et au sens strict par au moins l’un d’entre eux.
Seules les issues (0 , 0) et (10 , 10) sont comparables selon le critère de Pareto puisque les
deux agents préfèrent tous les deux strictement (10 , 10) à (0 , 0).
Le critère de Pareto ne permet, en revanche, de comparer aucun autre couple d’issues. Par
exemple, alors que l’issue (11 , – 1) est strictement préférée par Bonnie aux issues (0 , 0),
(10 , 10) ou (– 1 , 11), puisqu’elle lui procure la plus forte satisfaction (11 étant strictement
supérieur à 10, 0 et – 1), Clyde lui préfère chacune de ces autres issues (– 1 étant strictement
inférieur à 0, 10 et 11).
b. lesquelles sont-elles optimales au sens de Pareto ?
Seule l’issue (0 , 0) est sous-optimale. Les trois autres sont optimales au sens de Pareto.
2. Qu’est-ce qu’une stratégie dominante ? Bonnie et Clyde en ont-ils une ? Le cas échéant
laquelle ?
Si, quels que soient les choix des autres joueurs, une stratégie permet à un joueur d’avoir la
plus grande satisfaction, on dit de cette stratégie qu’elle est dominante. Dans le jeu ci-dessus,
Bonnie a une stratégie dominante ; il s’agit de B1. En effet, que Clyde choisisse C1 ou C2,
Bonnie gagne plus (ou perd moins) en choisissant B1 plutôt que B2 (si Clyde choisit C1,
Bonnie perd 1 en choisissant B2 alors qu’elle ne perd rien si elle choisit B1 ; et si Clyde
choisit C2, Bonnie gagne 11 en choisissance B1 contre 10 en choisissant B2).
Clyde a également une stratégie dominante. Il s’agit de C1. En effet, quoi que choisisse
Bonnie, Clyde gagne plus ou perd moins s’il choisit C1.
3. Les deux joueurs sont supposés rationnels.
Cela signifie qu’il maximise son gain (ou sa satisfaction) compte tenu de l’information dont il
dispose.
b. Quelle issue du jeu peut-on en déduire ?
Si Bonnie et Clyde sont rationnels, chacun va choisir sa stratégie dominante. Bonnie va donc
choisir B1 et Clayde, C1. L’issue du jeu que l’on peut en déduire est donc : (0 , 0).
4. Ce jeu illustre-t-il le « paradoxe de la rationalité » ? Pourquoi ?
1
L’issue du jeu (déterminée dans la question précédente) est (0 , 0). Or cette issue n’est pas
optimale au sens de Pareto (l’issue (10 , 10) lui est préférable selon le critère de Pareto). Ainsi,
bien que rationnels, et bien que la rationalité soit connaissance commune, les deux joueurs se
coordonnent sur une issue sous-optimale au sens de Pareto. C’est ce que l’on appelle le paradoxe
de la rationalité.
5. Quel nom peut-on donner à ce jeu ? Pourquoi ?
Ce jeu est un dilemme du prisonnier. Il en possède, en effet, les caractéristiques :





C’est un jeu à 2 joueurs,
Chacun des deux joueurs a le choix entre deux stratégies,
Parmi les 4 issues du jeu possibles, seule une est sous-optimale (au sens de Pareto).
Chaque joueur a une stratégie dominante,
La solution (stratégie dominante de A , stratégie dominante de B) conduit à la seule issue
sous-optimale du jeu.
EXERCICE 2 [Facultatif : pour s’entrainer quand on a du mal]
Soit le jeu non coopératif en information complète, à deux joueurs (A et B) et représenté par la
matrice suivante :
b1
b2
b3
a1
(2 , 0)
(5 , – 3)
(2 , 1)
a2
(3 , 1)
(4 , 4)
(0 , 3)
a3
(1 , – 2)
(12 , 0)
(1 , 2)
1. Parmi les issues (5 , – 3), (4 , 4), (12 , 0) et (2 , 1), lesquelles sont-elles comparables selon le
critère de Pareto ?
Selon le critère de Pareto une issue du jeu est préférable à une autre si elle lui est préférée
(au sens large) par tous les joueurs et au sens strict par au moins l’un d’entre eux.
A l’issue (5 , – 3), les joueurs A et B préfèrent l’issue (12 , 0), donc (12 , 0) est préférée à
(5 , – 3) selon le critère de Pareto (elles sont comparables).
A préfère l’issue (5 , – 3) à l’issue (4 , 4), mais c’est le contraire pour B. Ces deux issues ne
sont donc pas comparables selon le critère de Pareto. Même chose pour les issues (5 , – 3) et
(2 , 1).
L’issue (12 , 0) n’est pas comparable aux l’issues (4 , 4) et (2 , 1) selon le critère de Pareto : en
effet, elle leur est préférée par A, mais B les lui préfère.
En revanche l’issue (2 , 1) est comparable à l’issue (4 , 4) selon le critère de Pareto. En effet, A
et B préfèrent celle-ci à celle-là.
2. L’un des deux joueurs a-t-il une stratégie dominante ? une stratégie dominée ? Que peut-on
en déduire s’il est rationnel ?
Si, quels que soient les choix des autres joueurs, une stratégie permet à un joueur
d’avoir la plus grande satisfaction, on dit de cette stratégie qu’elle est dominante.
Dans le jeu ci-dessus, aucune stratégie n’est dominante (a1 procure la plus grande
satisfaction à A si B choisit b3, mais c’est a2 si B choisit b1 et a3 si B choisit b2 ; b3
procure la plus grande satisfaction à B si A choisit a1 ou a3, mais pas si A choisit a2).
Si, quels que soient les choix des autres joueurs, une stratégie xi procure une plus
grande satisfaction au joueur X que la stratégie xj, on dit que xj est dominée par xi.
2
Dans le jeu ci-dessus, par exemple, la stratégie b1 est dominée par b3, puisque, quoi
que fasse A, b3 apporte une plus grande satisfaction (ou une moins grande
insatisfaction) à B que b1. Si B est rationnel, il ne va donc pas choisir b1.
3. On suppose que l’hypothèse de rationalité est connaissance commune. Que cela signifie-t-il ?
Quelle solution du jeu peut-on en déduire ?
L’hypothèse de rationalité est connaissance commune quand chaque joueur sait que les
autres sont rationnels, que les autres savent que lui-même est rationnel, que les autres
savent qu’il sait qu’ils sont rationnels,… et ainsi de suite, à l’infini.
Dans ce jeu, si B est rationnel, il ne choisit pas b1 (stratégie dominée ; voir réponse à la
question 2). Si A le sait, il va donc choisir dans la sous-matrice :
a1
a2
a3
b2
(5 , – 3)
(4 , 4)
(12 , 0)
b3
(2 , 1)
(0 , 3)
(1 , 2)
Or, dans cette sous-matrice, la stratégie a2 est dominée par a1 et par a3. Si A est rationnel, il
ne choisit donc pas a2.
Si B sait tout cela (il sait que A sait qu’il est rationnel et il sait que A est rationnel), il va donc
choisir dans la sous-matrice :
b2
b3
a1
(5 , – 3)
(2 , 1)
a3
(12 , 0)
(1 , 2)
Or, dans cette sous-matrice, la stratégie b3 est dominante. S’il est rationnel, B choisit donc b3.
Si A sait tout cela (il sait que B etc.), il choisit a1 qui lui procure une plus grande satisfaction
quand B choisit b3.
La solution du jeu que l’on peut déduire de l’hypothèse de rationalité et de sa connaissance
commune est donc (a1 , b3).
4. Ce jeu illustre-t-il le paradoxe de la rationalité ? Pourquoi ?
L’issue correspondant à la solution du jeu (déterminée dans la question précédente) est (2 , 1).
Or cette issue n’est pas optimale au sens de Pareto (l’issue (4 , 4) lui est préférable selon le
critère de Pareto). Ainsi, bien que rationnels, et bien que la rationalité soit connaissance
commune, les deux joueurs se coordonnent sur une issue sous-optimale au sens de Pareto. C’est
ce que l’on appelle le paradoxe de la rationalité.
3
EXERCICE 3
Soit le jeu non coopératif en information complète, à deux joueurs (A et B) et représenté par la
matrice suivante :
B
A
b1
b2
b3
a1
(6 , 7)
(2 , -2)
(7 , 8)
a2
a3
(2 , 3)
(4 , 10)
(3 , 4)
(2 , 1)
(- 8 , 3)
(8 , 9)
1. On suppose que les deux joueurs sont rationnels et que la rationalité est connaissance
commune. Que peut-on en déduire ?
On peut en déduire des choix conditionnels à leurs croyances :
 S’il pense que A va choisir a1, B choisit b3, s’il pense que A va choisir a2, B choisit b2, et s’il
pense que A va choisir a3, B choisit b1.
 De son côté, s’il pense que B va choisir b1, A choisit a1, s’il pense que B va choisir b2, A
choisit a2, et s’il pense que B va choisir b3, A choisit a3.
En revanche, on ne peut pas en déduire leurs croyances. L’hypothèse de rationalité – et de sa
connaissance commune – ne permet pas aux joueurs de prédire quoi que ce soit d’autre
parce qu’elle ne permet pas de fonder une croyance d’un joueur sur le choix de l’autre.
2. On suppose que vous êtes A. Quelle stratégie choisiriez-vous ? Pourquoi ? (on vous demande
ici de rationaliser votre choix, quel qu’il soit). Mêmes questions si vous êtes B.
Faire voter les étudiants. Leur demander de justifier leur vote.
3. Après avoir rappelé la définition d’un équilibre de Nash, déterminer l’équilibre de Nash de ce
jeu ?
L’équilibre de Nash est un couple de stratégies (ai, bj), tel que ai est meilleure réponse
de A à bi et bj est meilleure réponse de A à ai.
Dans le jeu ci-dessus, l’équilibre de Nash est donc (a2 , b2). L’issue correspondante est
(3 , 4).
4. Cet équilibre peut-il être considéré comme une prédiction ? Est-il optimal au sens de
Pareto ?
L’équilibre de Nash se produit à la seule condition que chacun prévoie correctement ce que
l’autre choisit. Une situation qui n’est pas un équilibre de Nash ne peut arriver que par erreur
d’anticipation.
Dans le jeu ci-dessus, on ne peut pas justifier l’absence d’erreur d’anticipation : comment, en
effet, justifier que chaque joueur prévoie correctement le choix de l’autre quand l’hypothèse
de rationalité ne suffit pas pour cela ? C’est la raison pour laquelle l’issue correspondant à
l’équilibre de Nash ne peut être considérée comme une prédiction (voir les votes et leurs
justifications).
Sans compter qu’ici, l’équilibre de Nash procure aux joueurs des gains (3 , 4) inférieurs à
ceux qu’ils peuvent obtenir en prenant d’autres décisions, par exemple (6 , 7) en choisissant
respectivement a1 et b1. Ce dernier constat signale que l’issue correspondant à l’équilibre de
Nash de ce jeu n’est pas optimale au sens de Pareto.
En fait l’issue (3 , 4) procure aux joueurs les gains les plus faibles si l’on exclut les stratégies
a2 et b2.
4
Téléchargement