Concurrence imparfaite et théorie des jeux

publicité
Concurrence imparfaite et théorie des jeux
Chapitre 2 ‐ Défauts de coordination et comportements stratégiques
(Introduction à la théorie des jeux)
Plan du chapitre (1)
• Section 1 – la notion de jeu
– Définition et représentation
– Notion d’information et typologie
– Actions et stratégies
• Section 2 – jeux simultanés en information
complète
– Équilibre de Nash
– Existence, optimalité
Plan du chapitre (2)
• Section 3 – Quelques exemples de jeux simultanés
– Le dilemme du prisonnier
– La dominance itérée : la bataille de la mer de Bismarck
– Les porcs en caisse, la bataille des sexes et la coordination
ordonnée
– Le jeu de la poule mouillée et les stratégies mixtes
• Section 4 – Jeux séquentiels en information complète
– Menace et crédibilité
– Équilibre parfait en sous‐jeux
Plan du chapitre (3)
• Section 5 – Quelques exemples de jeux
séquentiels
– Séquentialité dans la bataille de la mer de Bismarck
– Suivre le leader
– Le jeu de la poursuite malveillante
• Section 6 – Les jeux répétés
– Les jeux répétés finis
– Les jeux répétés infinis
• Conclusion du chapitre
Section 1
LA NOTION DE JEUX
Retour sur la CPP
• Th de la CPP : contexte avec échanges anonymes
(interactions via les prix)
• Mais dans de nombreuses situations (vie des
entreprises, des organisations, relations sociales), le
bien‐être de chacun dépend de ce que partenaires ou
concurrents vont décider
• Pb d’information sur leur comportement
– Stratégies actives rationnelles
– Pas simplement d’adaptation passive au prix !
Les interactions stratégiques
• Idée :
–
–
–
–
chacun peut envisager de prendre plusieurs décisions,
de façon non concertée,
avec une certaine info. sur les autres,
mais le résultat final (gain, utilité) pour chacun va
dépendre de la combinaison des décisions finalement
choisies
• Outil : théorie des jeux
Théorie des jeux coopératifs/non coopératifs
• 2 grande catégorie de jeux : coopératifs et non
coopératifs
• Différence : modélisation
objectifs poursuivis
employée
et
• Nous nous concentrons sur théorie des jeux
non coopératifs dans le cours
Définition (simple) d’un jeu
• Représentation formelle d’une situation où les
décisions de plusieurs individus sont
interdépendantes
• La description complète d’un jeu suppose de
préciser :
– Les joueurs (qui participe ?)
– Les règles du jeu (ordre des joueurs ? Information
individuelle ? Actions possibles ?)
Résultat d’un jeu
• Obj du modélisateur : expliquer comment un
ensemble de circonstances conduit à un
résultat particulier.
• Définition résultat : ensemble d’éléments
pertinents que le modélisateur choisit parmi
les valeurs des actions, les paiements et
autres variables, après que le jeu ait été joué
Présentation d’un jeu (1)
• La présentation d’un jeu spécifique peut se
faire de façon littéraire, ou mathématique
• Mais pour les commodités de l’analyse (gain
de temps), on utilise par convention des
représentations synthétiques/formelles
Présentation d’un jeu (2)
• Tout jeu peut toujours se décrire sous :
– sa forme normale (tableau lignes/colonnes)
– sa forme extensive (arborescence, arbre du jeu)
• NB :
– la forme normale est privilégiée pour les jeux dits
simultanés (statiques)
– la forme extensive est privilégiée pour les jeux dits
séquentiels (dynamiques)
– Attention, ce n’est pas exclusif !!
Exemple de jeu sous forme normale
JOUEUR 2
G
JOUEUR 1
H
1
D
0
2
B
2
1
1
1
0
Représentation équivalente
JOUEUR 1
H
B
JOUEUR 2
G
(1;2)
(2;1)
D
(0;1)
(1;0)
Exemple de jeu sous forme extensive
Jeu simultané et information
• Statut informationnel
représentation du jeu
des
joueurs
et
• Prosaïquement :
– Dans un jeu simultané, typiquement, les différents
joueurs ne connaissent pas (n’observent pas) les
décisions prises par les autres joueurs
– Jeu en information imparfaite
Jeu séquentiel et information
• Jeu à information parfaite : lorsque chaque
joueur est capable de différencier chacun de ses
nœuds de décision
– illustre qu’il observe ce que ses prédécesseurs ont fait
(actions réalisées)
• Jeu à information imparfaite : lorsqu’au moins un
joueur est incapable de différencier certains de
ses nœuds de décision
– il n’observe pas intégralement
prédécesseurs ont pu faire
ce
que
ses
Jeu séquentiel avec information parfaite (jeu A)
Jeu séquentiel avec information imparfaite (jeu B)
L’ensemble d’information
• Notion d’ensemble d’information des joueurs permet
de donner une définition plus générale
• Ensemble d’information d’un joueur :
– =partition de l’ensemble de ses nœuds de décision
– =collection de ses nœuds de décision qu’il ne peut
distinguer
• Méthode : on vérifie qu’un jeu est à information
parfaite ou imparfaite, en contrôlant que chaque
ensemble d’information contient ou non plus d’un seul
nœud de décision.
Information parfaite
• Définition : un jeu est à information parfaite
lorsque, pour tous les joueurs, les ensembles
d’information sont des singletons (i.e. ne
contiennent qu’un seul nœud de décision)
• Sinon, le jeu est à information imparfaite
Application au jeu séquentiel précédent
• J1 a un seul nœud de décision (nœud initial)
• J2 a deux nœuds de décision (nœud à gauche quand J1
a joué « H » ; nœud à droite quand J1 a joué « D »)
• Le jeu A est à information parfaite, car J2 a deux
ensembles d’info. qui sont des singletons
• Le jeu B est à information imparfaite, car J2 a un
ensemble d’info. qui contient ses deux nœuds de
décision
Jeu répété
• Définition : un jeu répété est un jeu dans
lequel les joueurs prennent, de manière
répétée, la même décision dans le même
environnement
Information complète et incomplète
• Mais la source de l’incertitude peut être extérieure aux
joueurs :
– circonstances générales,
– qui résultent de l’action de Nature,
– qui influencent le déroulement et le résultat du jeu,
inégalement observés par les joueurs
• Distinction entre jeux à :
– information complète : tous les joueurs observent l’action
de Nature
– information incomplète : au moins un joueur n’observe pas
l’action de Nature
Jeu séquentiel avec information complète (jeu C)
Jeu séquentiel avec information incomplète (jeu D)
Jeu à information symétrique/asymétrique
• Définition : un jeu est dit à information
symétrique si aucun des joueurs n’a une
information différente de l’autre lorsqu’il joue
ou à la fin du jeu
La notion de stratégie
• Concept central de la théorie des jeux : stratégie
• Définition : pour un joueur, une stratégie est une
description complète de l’action qu’il pourrait
prendre à chacun de ses ensembles d’information
• Littéralement : stratégie
– = plan contingent complet
– = règle de décision spécifiant de façon exhaustive ce
que fait un joueur, partout dans le jeu, à chaque
occasion où il pourrait jouer
Postulats
• L’analyse d’un jeu (simultané ou séquentiel) est basée
sur deux postulats :
– Les joueurs sont rationnels (acceptation usuelle)
– La structure du jeu est connaissance commune
• L’hypothèse de connaissance commune dote chaque
joueur de la capacité de développer des raisonnements
récursifs du type :
– Chaque joueur sait qu’il est rationnel et connaît la
structure du jeu
– Que les autres joueurs le savent aussi,
– Que les autres savent qu’il sait,
– Etc.
Équilibre de Nash et EPSJ
• Toutefois, ces postulats ne suffisent pas la plupart
du temps (dans les situations qui vont nous
intéresser) pour préciser l’issue du jeu
• Affiner les prédictions – proposer un concept
d’équilibre :
– Équilibre de Nash : jeux simultanés
– Équilibre Parfait en Sous‐Jeu (EPSJ) : jeux séquentiels
(« raffinement » de l’équilibre de Nash)
Résumé : typologie des jeux
• Jeux coopératifs/non coopératifs
• Jeux avec décisions simultanées/séquentielles
• Jeux statiques/répétés (horizon fini ou infini)
• Jeux à information parfaite/imparfaite
• Jeux à information complète/incomplète
• Jeux à information symétrique/asymétrique
Section 2
JEUX SIMULTANÉS EN INFORMATION COMPLÈTE
Un exemple
• De façon triviale, dans un jeu simultané, les stratégies
possibles pour les différents joueurs se ramènent à
leurs actions
• Reprenons le jeu présenté avant
JOUEUR 1
H
B
• Stratégies de J1 : (H,B)
• Stratégies de J2 : (G,D)
JOUEUR 2
G
(1;2)
(2;1)
D
(0;1)
(1;0)
Stratégie strictement dominante
• La notion de stratégie est évidemment déterminante
pour décrire l’issue possible, probable d’un jeu
• L’analyse d’un jeu peut commencer en regardant les
stratégies dominantes des différents joueurs
• Définition : une stratégie strictement dominante est
une stratégie qui donne l’utilité/gain le plus élevé à un
joueur, indépendamment des décisions des autres
joueurs
– =meilleure réponse inconditionnelle
Remarques (stratégie strictement dominante)
• Si un joueur dispose d’une telle stratégie, on ne
voit pas pourquoi il ne la jouerait pas !
• Et si un joueur dispose d’une stratégie
strictement dominée, on ne voit pas pourquoi il
ne l’éliminerait pas…
• Simplifie l’analyse d’un jeu, mais peu ôter tout
l’attrait d’un contexte d’interaction stratégique
Exemple (suite)
• Reprenons l’exemple précédent : équilibre en
stratégies dominantes ?
JOUEUR 1
H
B
JOUEUR 2
G
(1;2)
(2;1)
D
(0;1)
(1;0)
Exemple (suite)
• Stratégie dominante de J1
JOUEUR 1
H
B
JOUEUR 2
G
(1;2)
(2;1)
D
(0;1)
(1;0)
• J1 a une stratégie strictement dominante : B
Exemple (suite)
• Stratégie dominante de J2
JOUEUR 1
H
B
JOUEUR 2
G
(1;2)
(2;1)
D
(0;1)
(1;0)
• J2 a une stratégie strictement dominante : G
Équilibre en stratégies dominantes (exemple)
• D’où prédiction sur l’issue probable d’un jeu
• Équilibre en stratégies dominantes
– Joueur 1 joue B : gain = 2
– Joueur 2 joue G : gain = 1
JOUEUR 1
H
B
JOUEUR 2
G
(1;2)
(2;1)
D
(0;1)
(1;0)
Interactions stratégiques
• La question de l’interaction stratégique est
alors relativement pauvre :
– Ce que fait l’autre n’influence en rien ce que l’on
fait soi‐même (décision)
– À la limite, ceci n’a d’effet que sur le paiement que
l’on reçoit
Meilleure réponse
• Mais si la décision de l’un est conditionnée par
ce que fait l’autre ?
JOUEUR 1
H
B
JOUEUR 2
G
(2;1)
(0;0)
D
(0;0)
(1;2)
• Notion de (fonction de) meilleure réponse
Stratégie de J1
• J1 joue H si J2 joue G,
• Mais joue B si J2 joue D
JOUEUR 1
H
B
JOUEUR 2
G
(2;1)
(0;0)
D
(0;0)
(1;2)
Stratégie de J2
• J2 joue G si J1 joue H,
• Mais joue D si J2 joue B
JOUEUR 1
H
B
JOUEUR 2
G
(2;1)
(0;0)
D
(0;0)
(1;2)
Interprétation
• Dans ce cas, on ne peut pas aller plus loin dans
l’analyse du jeu, même si on constate qu’il y a
deux combinaisons qui sont particulièrement
intéressantes :
– J1 joue H, J2 joue G : résultat (2;1)
– J1 joue B, J2 joue D : résultat (1;2)
• La connaissance de la structure du jeu (et le
présupposé que les joueurs ont aussi cette
connaissance) ne nous permet plus de/ne suffit
plus à en décrire les issues possibles
Équilibre de Nash
• Définition préliminaire : un profil de stratégies est
une combinaison de stratégies individuelles,
attribuant une stratégie à chaque joueur
• Définition de l’Équilibre de Nash (EN) : un profil
de stratégies est un EN si la stratégie d’équilibre
de chaque joueur est optimale étant donnée la
stratégie d’équilibre de l’autre
• NB : optimale = maximise son utilité/gain
Exemple EN (1)
• Reprenons exemple précédent
• Chaque joueur dispose de deux stratégies :
– {H,B} pour J1
– {G,D} pour J2
• Notons :
– x une stratégie possible de J1 ; xЄ{H,B}
– y une stratégie possible de J2 ; yЄ{G,D}
• Et :
– u(x,y) l’utilité/gain de J1 s’il joue x et J2 joue y
– v(y,x) l’utilité/gain de J2 s’il joue y et J1 joue x
Exemple EN (2)
• Alors, formellement, un profil de stratégie
(x,y) candidat à être un EN doit vérifier :
– u(x,y) ≥ u(x’,y) pour tout x’ ≠ x
– v(y,x) ≥ v(y’,x) pour tout y’ ≠ y
• En pratique, comment « tester » le/les
équilibres de Nash dans un jeu ?
– Deux « recettes », qui découlent de la définition
même de l’EN
Première méthode (1)
• On teste toutes les combinaisons possibles :
–
–
–
–
(H,G) → utilités/gains (2,1)
(H,D) → utilités/gains (0,0)
(B,G) → utilités/gains (0,0)
(B,D) → utilités/gains (1,2)
• En regardant si l’un des joueurs a intérêt à
« dévier » (changer sa décision), de façon à
accroître individuellement son utilité/gain
– On cherche les incitations à dévier, ou encore les
déviations profitables
Première méthode (2)
• Application à notre exemple : considérons le profil (H,D) → (0,0) JOUEUR 1
H
B
JOUEUR 2
G
(2;1)
(0;0)
D
(0;0)
(1;2)
• On voit que si J2 joue effectivement D, J1 a intérêt à dévier de H et jouer au contraire B
Première méthode (3)
• Conclusion : (H,D) ne peut pas être un EN, l’un des
joueurs ayant une incitation à dévier
• Vous vérifierez que J2 a aussi une incitation à dévier si
J1 joue H (jouer alors G plutôt que D)
• NB : le même raisonnement montre que (B;G)(→ (0,0))
n’est pas non plus un EN
• Montrons alors que le jeu a deux EN :
– (H,G) → (2,1)
– (B,D) → (1,2)
Première méthode (4)
JOUEUR 1
H
B
JOUEUR 2
G
(2;1)
(0;0)
D
(0;0)
(1;2)
Première méthode (5)
JOUEUR 1
H
B
JOUEUR 2
G
(2;1)
(0;0)
D
(0;0)
(1;2)
Deuxième méthode (1)
• Littéralement, la définition de l’EN signifie que
la stratégie de Nash de chacun des joueurs est
la meilleure des réponses à la stratégie de
Nash de l’autre joueur
• En d’autres termes, un profil (x,y) est un EN s’il
se situe au point d’intersection des fonctions
de meilleures réponses des deux joueurs
Deuxième méthode (2)
• Comme on l’a vu précédemment : – J1 joue H si J2 joue G
– J1 joue B si J2 joue D
JOUEUR 1
H
B
JOUEUR 2
G
(2;1)
(0;0)
D
(0;0)
(1;2)
Deuxième méthode (3)
• Comme on l’a vu précédemment :
– J2 joue G si J1 joue H
– J2 joue D si J1 joue B
JOUEUR 1
H
B
JOUEUR 2
G
(2;1)
(0;0)
D
(0;0)
(1;2)
Deuxième méthode (4)
• L’intersection des deux fonctions de meilleures
réponses nous conduit à sélectionner deux profils
de stratégies = EN : (H;G) et (B;D) !
JOUEUR 1
H
B
JOUEUR 2
G
(2;1)
(0;0)
D
(0;0)
(1;2)
Stratégies et équilibre
• Pour déterminer le résultat, modélisateur doit
déterminer les stratégies pertinentes des joueurs : ici
(H;G) et (B;D)
• Permet au modélisateur de déterminer un ou plusieurs
équilibres
• Définition équilibre : combinaison de stratégies
constituée d’une meilleure stratégie pour chacun des n
joueurs du jeu
• Ici, concept d’équilibre = éq. De Nash (EN)
Remarques EN (1)
• Pbs avec l’équilibre de Nash :
– Existence
• Stratégies « mixtes », si discrètes
• Utilités quasi concaves si stratégies continues
Remarques EN (2)
• Existence d’équilibres multiples (cf exemple)
JOUEUR 1
H
B
JOUEUR 2
G
(2;1)
(0;0)
• Coordination sur l’un des EN ?
D
(0;0)
(1;2)
Remarques EN (3)
• Sous optimalité de l’éq. De Nash
– Défaut de coordination (non‐coopération) conduit
à des échanges inefficaces
• Illustration : pb dit du « Dilemme du
Prisonnier »
Section 3
QUELQUES EXEMPLES DE JEUX SIMULTANÉS
Le dilemme du prisonnier (1)
• Histoire :
– Deux individus sont interpelés et suspectés d’avoir
commis ensemble un délit,
– La police manque de preuve,
– Ils sont interrogés séparément
JOUEUR 1
Nier
Avouer
JOUEUR 2
Nier
(‐1;‐1)
(0;‐10)
Avouer
(‐10;0)
(‐8;‐8)
• L’unique EN de ce jeu : (Avouer, Avouer)
Le dilemme du prisonnier (2)
• (Nier, Nier) n’est pas un EN de ce jeu
JOUEUR 2
JOUEUR 1
Nier
Avouer
Nier
(‐1;‐1)
(0;‐10)
Avouer
(‐10;0)
(‐8;‐8)
• Si J2 nie, J1 a intérêt à avouer (il dévie)
• Mais (Avouer;Nier) n’est pas un EN non plus
Le dilemme du prisonnier (3)
• Même raisonnement pour J2 :
JOUEUR 2
JOUEUR 1
Nier
Avouer
Nier
(‐1;‐1)
(0;‐10)
Avouer
(‐10;0)
(‐8;‐8)
• Si J1 nie, J2 a intérêt à avouer (il dévie)
• Mais (Nier;Avouer) n’est pas un EN non plus
Le dilemme du prisonnier (4)
• Paradoxe : (Nier;Nier) domine au sens de Pareto
(Avouer;Avouer)
JOUEUR 1
Nier
Avouer
JOUEUR 2
Nier
(‐1;‐1)
(0;‐10)
Avouer
(‐10;0)
(‐8;‐8)
• Rappel : éq. de Pareto s’il n’est pas possible
d’améliorer le bien‐être d’un agent économique
sans détériorer celui d’au moins un autre.
La bataille de la mer de Bismarck (1)
• Joueurs = généraux ennemis
– Kenney : choisit où passer (nord ou sud)
– Imamura : choisit où bombarder (nord ou sud)
Kenney
Nord
Sud
Imamura
Nord
(2;‐2)
(1;‐1)
Sud
(2;‐2)
(3;‐3)
• Pas de stratégie strictement dominante
La bataille de la mer de Bismarck (2)
• Pas de stratégie strictement dominante, mais
utilisation possible du concept de dominance faible
• Définition : une stratégie est faiblement dominée s’il
existe une autre stratégie pour le joueur qui est
éventuellement meilleure et jamais pire ; cette autre
stratégie rend au moins un des paiements plus élevé
dans la combinaison de stratégies et jamais un seul
paiement plus faible
• Équilibre faible en stratégies dominantes : profil de
stratégies obtenu en éliminant toutes les stratégies
faiblement dominées de chaque joueur
La bataille de la mer de Bismarck (3)
• Sud : stratégie faiblement dominée par Nord
pour Imamura
Kenney
Nord
Sud
Imamura
Nord
(2;‐2)
(1;‐1)
Sud
(2;‐2)
(3;‐3)
• Mais Pb : aucune stratégie faiblement
dominée pour Kenney
La bataille de la mer de Bismarck (4)
• Autre concept
résoudre
d’équilibre
nécessaire
pour
• Définition équilibre de dominance itérée :
combinaison de stratégies, trouvée
– en éliminant d’abord une stratégie faiblement
dominée de l’ensemble des stratégies des joueurs,
– identifiant une autre stratégie faiblement dominée
dans celles restantes, pour l’éliminer
– etc.
– Jusqu’à ce qu’il reste une unique stratégie pour
chaque joueur
La bataille de la mer de Bismarck (5)
• Jeu résolu par dominance itérée
Imamura
Kenney
Nord
Sud
Nord
(2;‐2)
(1;‐1)
Sud
(2;‐2)
(3;‐3)
• On élimine sud pour Imamura
• Puis on élimine sud pour Kenney
• (Nord, Nord) est un équilibre de dominance
itérée (résultat observé en 1943)
La bataille de la mer de Bismarck (6)
• Particularité : jeu à somme nulle
• Définition : un jeu à somme nulle est un jeu
dont la somme des paiements de tous les
joueurs est égale à zéro, quelles que soient les
stratégies que ces joueurs choisissent
• Inverse : jeu à somme non nulle (ou à somme
variable)
La bataille de la mer de Bismarck (7)
• Jeu de la bataille de Bismarck peut aussi être
interprété comme un jeu de stratégies
d’entreprises :
– Joueurs = compagnies (obj : max parts de marché)
– Stratégies = mode de conception d’un produit
– Avantage marketing de Kenney, qui préfère la
confrontation directe (inversement pour Imamura)
Le jeu du sentier d’itération (1)
• Autre exemple de jeu qui peut être résolu par
dominance itérée
Colonne
Ligne
R1
R2
R3
C1
(2;12)
(0;12)
(0;12)
C2
(1;10)
(0;10)
(1;10)
C3
(1;12)
(0;11)
(0;13)
• Pb : possibilités multiples d’équilibre selon l’ordre
de suppression des stratégies faiblement
dominées
Le jeu du sentier d’itération (2)
• 1er ordre de suppression possible : R2, C2, C1,
R3
Colonne
Ligne
R1
R2
R3
C1
(2;12)
(0;12)
(0;12)
C2
(1;10)
(0;10)
(1;10)
C3
(1;12)
(0;11)
(0;13)
Le jeu du sentier d’itération (2)
• 1er ordre de suppression possible : R2, C2, C1,
R3
Colonne
Ligne
R1
R2
R3
C1
(2;12)
(0;12)
(0;12)
C2
(1;10)
(0;10)
(1;10)
C3
(1;12)
(0;11)
(0;13)
Le jeu du sentier d’itération (2)
• 1er ordre de suppression possible : R2, C2, C1,
R3
Colonne
Ligne
R1
R2
R3
C1
(2;12)
(0;12)
(0;12)
C2
(1;10)
(0;10)
(1;10)
C3
(1;12)
(0;11)
(0;13)
Le jeu du sentier d’itération (2)
• 1er ordre de suppression possible : R2, C2, C1,
R3
• Équilibre (R1;C3)
Colonne
Ligne
R1
R2
R3
C1
(2;12)
(0;12)
(0;12)
C2
(1;10)
(0;10)
(1;10)
C3
(1;12)
(0;11)
(0;13)
Le jeu du sentier d’itération (2)
• 2e ordre de suppression possible : R3, C3, C2,
R2
Colonne
Ligne
R1
R2
R3
C1
(2;12)
(0;12)
(0;12)
C2
(1;10)
(0;10)
(1;10)
C3
(1;12)
(0;11)
(0;13)
Le jeu du sentier d’itération (2)
• 2e ordre de suppression possible : R3, C3, C2,
R2
Colonne
Ligne
R1
R2
R3
C1
(2;12)
(0;12)
(0;12)
C2
(1;10)
(0;10)
(1;10)
C3
(1;12)
(0;11)
(0;13)
Le jeu du sentier d’itération (2)
• 2e ordre de suppression possible : R3, C3, C2,
R2
Colonne
Ligne
R1
R2
R3
C1
(2;12)
(0;12)
(0;12)
C2
(1;10)
(0;10)
(1;10)
C3
(1;12)
(0;11)
(0;13)
Le jeu du sentier d’itération (2)
• 2e ordre de suppression possible : R3, C3, C2,
R2
• Équilibre (R1;C1) ≠ (R1;C3)
Colonne
Ligne
R1
R2
R3
C1
(2;12)
(0;12)
(0;12)
C2
(1;10)
(0;10)
(1;10)
C3
(1;12)
(0;11)
(0;13)
Les porcs en caisse
Gros porc
Appuyer
Attendre
Petit porc
Appuyer
(5;1)
(9;‐1)
Attendre
(4;4)
(0;0)
• Gros porc préfère attendre si petit porc choisit « Appuyer »,
et inversement
• Aucun éq. en stratégies dominantes
• 1 éq. de dominance itérée : (Appuyer;Attendre)
• Cet éq. est également un EN
La bataille des sexes (1)
• Homme veut assister au combat de boxe, femme
au ballet
• Ils préfèrent être ensemble que séparés
Homme
Boxe
Ballet
Femme
Boxe
(2;1)
(0;0)
• 2 EN : (Boxe;Boxe) et (Ballet;Ballet)
• Les EN sont Pareto‐efficients !
Ballet
(0;0)
(1;2)
La bataille des sexes (2)
• Quel équilibre de Nash s’applique ?
– Coordination par la répétition
• Si 1 joueur ouvre le jeu (ex : en achetant des
billets), alors il dispose d’un avantage du
premier coup : l’engagement permet la
coordination
Applications de la bataille des sexes
• Firmes avec des préférences de standards
différentes, mais souhaitant un standard
commun
• Accord de vente entre firmes qui préfèrent des
termes différents
Jeu de la coordination ordonnée
• 2 firmes (F1 et F2), 2 standards possibles (S1 et S2)
F1
S1
S2
F2
S1
(2;2)
(‐1;‐1)
S2
(‐1;‐1)
(1;1)
• EN (S1;S1) domine au sens de Pareto (S2;S2)
• Coordination possible sur (S1;S1) si
communication
La coordination dangereuse
• Considérons variante
coordination
F1
S1
S2
suivante
F2
S1
(2;2)
(‐1;‐1)
du
jeu
de
S2
(‐1000;‐1)
(1;1)
• (S1;S1) domine au sens de Pareto, mais probable
en réalité que les joueurs se coordonnent sur
(S2;S2)
• F1 ne prendrait pas le risque de jouer S1.
Les points focaux
• Lorsque plusieurs EN existent, les joueurs se
coordonnent souvent sur des points focaux
• Définition point focal : équilibre de Nash qui,
pour
des
raisons
psychologiques,
est
particulièrement contraignant (ex. : coordination
dangereuse)
• Si pas de point focal, la médiation et la
communication sont toutes deux importantes
Le jeu de la poule mouillée (1)
• Deux adolescents s’affrontent en conduisant une voiture dans des directions opposées
• Chacun préfère continuer tandis que l’autre dévie : – Si les deux continuent, ils risquent la mort
– Si les deux dévient, risque d’humiliation
Smith
Continuer
Dévier
Jones
Continuer
(‐3;‐3)
(0;2)
Dévier
(2;0)
(1;1)
Le jeu de la poule mouillée (2)
• 2 EN : (Dévier;Continuer) et (Continuer;Dévier)
Smith
Continuer
Dévier
Jones
Continuer
(‐3;‐3)
(0;2)
Dévier
(2;0)
(1;1)
• Autre possibilité : stratégie mixte (les 2 jouent
en proba)
• Ici, chacun joue Continuer avec une proba de
0,25 (proba d’accident=0,0625)
Stratégies corrélées
• Dans le jeu de la poule mouillée, les joueurs ont intérêt
à se mettre d’accord
• Une possibilité : randomisation pour obtenir des
stratégies corrélées
• Exemple : pile ou face, Smith continue si face et dévie
si pile
• Permet d’éviter les stratégies symétriques, très
coûteuses pour les joueurs
Conversation libre
• Autre possibilité de coordination
conversation libre (ou Cheap Talk)
:
la
• Inutile pour le jeu de la poule mouillée
(chacun annonce qu’il continue)
• Mais permet de créer un point focal dans un
jeu de coordination par exemple
Catégories des jeux à stratégies mixtes : jeux de non‐coordination
(a;w)
(c;y)
• Paiements : – Soit a>c, d>b, x>w, y>z
– Soit c>a, b>d, w>x, z>y
(b;x)
(d;z)
Catégories des jeux à stratégies mixtes : jeux de non‐coordination
(a;w)
(c;y)
• Paiements :
– Soit a>c, d>b, x>w, y>z
– Soit c>a, b>d, w>x, z>y
(b;x)
(d;z)
Exemple : le jeu du bien‐être
Indigent
Gouvernemen
t
Aide
Pas d’aide
Emploi
(3;2)
(‐1;1)
Flemmarder
(‐1;3)
(0;0)
• Indigent préfère Emploi si Pas d’aide et Flemmarder si Aide
• Préférences du gouvernement contraires
• Équilibre en stratégie mixte : Pr(Emploi)=0,2 et Pr(Aide)=0,5
Catégories des jeux à stratégies mixtes : jeux de coordination
(a;w)
(c;y)
(b;x)
(d;z)
• Paiements : a>c, d>b, w>x, z>y
• 2 EN en stratégies pures, et 1 en stratégie mixte
• Ex : la bataille des sexes
Catégories des jeux à stratégies mixtes : jeux de participation
(a;w)
(c;y)
(b;x)
(d;z)
• Paiements : – c>a, b>d, x>w, y>z
– c<b et y>x
• 2 EN en stratégies pures, et 1 en stratégie mixte
• Ex : – jeu de la poule mouillée
– contribution à un bien public
Section 4
JEUX SÉQUENTIELS EN INFORMATION COMPLÈTE
Cadre d’analyse
• Simultané :
– Le cadre défini par les jeux simultanés (statiques) est
adapté à l’analyse des marchés où un nombre fini de
firmes sont déjà en activité (insiders)
– Grosso modo : analyse de court terme
• Séquentiel :
– Mais les questions de guerre commerciales, ou
comme on l’a vu en CPP, d’entrée de nouveaux
concurrents (outsiders) sont évidemment importantes
– Les jeux séquentiels (dynamiques) fournissent le cadre
d’analyse approprié
Un exemple (1)
• Dans un jeu séquentiel, les stratégies possibles pour les
différents joueurs correspondent (en général) à des
combinaisons de leurs actions
Exemple – jeu A (info parfaite)
• Stratégies de J1 : (G,D)
• Stratégies de J2 :
–
–
–
–
{G si J1 joue G, G si J1 joue D}
{G si J1 joue G, D si J1 joue D}
{D si J1 joue G, G si J1 joue D}
{D si J1 joue G, D si J1 joue D}
Un exemple (2)
• Intuition : l’information étant parfaite, J2 peut conditionner
sa décision à ce que J1 a précédemment fait
– Idée de stratégie comme plan contingent
• Exemple – jeu B (info imparfaite)
– Stratégies de J1 : (G,D)
– Stratégies de J2 : (G,D)
• L’information étant imparfaite, J2 ne peut plus conditionner
sa décision à ce que J1 a précédemment fait
• Les stratégies de J2 sont confondues avec ses actions (ici)
Crédibilité des menaces
• Une première idée que l’on va illustrer est que
le concept d’équilibre de Nash n’est pas assez
fort (restrictif) lorsqu’on analyse des jeux
séquentiels
• Par exemple, ne permet pas d’éliminer, à
l’équilibre, des menaces qui ne sont pas
crédibles
Jeu séquentiel avec information complète (jeu F)
Représentation sous forme de jeu simultané
• L’outsider et l’insider ont deux stratégies
Outsider
Exit
Entrée
Insider
Guerre si entrée
(0;2)
(‐3;‐1)
Accommode si entrée
(0;2)
(2;1)
EN
• Il existe deux EN (en stratégies pures)
– (Exit, Guerre si entrée)
– (Entrée, Accommode si entrée)
Outsider
Exit
Entrée
Insider
Guerre si entrée
(0;2)
(‐3;‐1)
Accommode si entrée
(0;2)
(2;1)
Le problème de crédibilité
• Mais l’EN correspondant à (Exit, Guerre si entrée) n’est
pas une prédiction très pertinente, sensible, pour ce
jeu :
– Elle autorise l’insider à utiliser une menace (faire une
guerre commerciale) qui n’est pas crédible (inefficace, non
dissuasive) !
– Mais sous l’hyp. De connaissance commune, l’outsider a
les moyens de comprendre qu’une fois qu’il est entré, la
meilleure décision de l’insider est « Accommoder », et non
pas « Guerre »
• L’acceptation des menaces non crédibles entre en
conflit avec la connaissance commune
La rationalité séquentielle
• Pour contourner ces difficultés/incohérences,
on utilise un concept d’équilibre qui
requiert/contraint chaque joueur à :
– ne prendre que des actions efficaces/optimales
pour lui‐même,
– à tout moment du jeu où il doit jouer,
– étant données les stratégies des autres joueurs
• Idée de rationalité séquentielle
Notion de sous‐jeu
• Un sous‐jeu est une sous partie d’un jeu, qui
commence à l’ensemble d’information de l’un des
joueurs, pourvu que ce soit un singleton (unique
nœud de décision), et qui contient tous les
nœuds de décision qui suivent
• NB : ceci implique qu’un ensemble d’info
contenant au moins deux nœuds ne peut pas
initier un sous‐jeu – on ne peut pas « casser » un
ens d’info
Premier sous‐jeu
Deuxième sous‐jeu
Équilibre parfait en sous‐jeu
• Définition : un profil de stratégies constitue un
équilibre parfait en sous‐jeu (EPSJ), s’il induit
un EN dans chacun des sous‐jeux associés au
jeu complet
• Contraint les joueurs à être séquentiellement
rationnels, en jouant des stratégies qui sont
Nash, non seulement dans le jeu complet,
mais partout dans le jeu
Résolution EPSJ (1)
• Étudier le premier des deux sous‐jeux, revient à
un pur problème de décision individuelle (ici)
pour l’insider :
Résolution EPSJ (2)
• Étudier le jeu complet (second sous‐jeu) revient à
étudier un « jeu réduit », et donc la décision de
l’outsider :
Résolution EPSJ (3)
• Sachant qu’il est séquentiellement rationnel pour
l’insider de jouer « Accommode » si l’outsider
entre, l’outsider joue « Entrée »
Chemin d’équilibre
• Le tracé rouge est le chemin d’équilibre : le
chemin qui est emprunté dans l’arbre du jeu et
qui conduit à l’équilibre
Conséquences
• En raisonnant en Nash dans le seul jeu complet, on
avait trouvé deux EN
• (Entrée, Accommode si entrée) est un EPSJ ; il est
unique
• (Exit, Guerre si Entrée) est éliminé ; ce n’est pas un EPSJ
• La « perfection en sous‐jeu » permet d’éliminer la
menace non crédible
Pareto‐optimalité
• Une deuxième idée que l’on va illustrer est
qu’un EPSJ n’est pas forcément Pareto‐
Optimal
• Simple : un EPSJ est forcément sélectionné
dans l’ensemble des EN d’un jeu
• Or, un EN n’est pas nécessairement PO !
Section 5
QUELQUES EXEMPLES DE JEUX SÉQUENTIELS
Retour sur la bataille de la mer de Bismarck (1)
Kenney
Nord
Sud
Imamura
Nord
(2;‐2)
(1;‐1)
Sud
(2;‐2)
(3;‐3)
• Que se passe‐t‐il si Kenney et Imamura jouent
séquentiellement ?
Retour sur la bataille de la mer de Bismarck (2)
• Si Imamura joue le premier :
Retour sur la bataille de la mer de Bismarck (2)
• Si Imamura joue le premier :
Retour sur la bataille de la mer de Bismarck (3)
• Si Kenney joue le premier :
Suivre le leader
• Reprenons le jeu de coordination où F1 et F2
choisissent entre deux standards S1 et S2
Suivre le leader : premier EN
• (S1;(S1;S1)) est un EN
• Mais pas un EPSJ !
Suivre le leader : deuxième EN
• (S2;(S2;S2)) est un EN
• Mais pas un EPSJ non plus !
Suivre le leader : troisième EN
• (S1;(S1;S2)) est un EN
• Seul EN qui est aussi un EPSJ
Coordination non‐ordonnée et avantage du premier coup (1)
• Dans jeu précédent (coordination ordonnée), la
séquentialité des décisions permet aux firmes de
se coordonner sur l’équilibre Pareto‐optimal
• Mais dans un jeu de coordination non‐ordonnée
(cf. bataille des sexes), celui qui joue en premier
dispose d’un avantage du premier coup
• Variante du jeu précédent : chaque firme préfère
la coordination, mais préfère un standard
différent
Avantage du premier coup à la firme 1 (1)
Avantage du premier coup à la firme 1 (2)
• Conclusions :
– Le suiveur (firme 2) va toujours choisir un standard
identique à celui du meneur (firme 1)
– Il y a donc toujours coordination
– Anticipant cela, la firme 1 va choisir le standard qui lui
rapporte le paiement le plus élevé
– EPSJ est donc (S1;S1 si firme 1 choisit S1 et S2 si firme 1
choisit S2)
• Raisonnement similaire si firme 2 joue en premier,
mais c’est elle qui bénéficie de l’avantage du premier
coup, d’où résultat (S2;S2)
Avantage du premier coup à la firme 2 Le jeu de la poursuite malveillante (1)
• Jeu plus complexe (plus de 2 dates)
• Plaignant peut engager action en justice qui a peu de
chances d’aboutir et dont le seul but est l’obtention
d’un règlement à l’amiable (extorsion)
• Idée :
– Intenter un procès est coûteux et ce dernier a peu de
chances d’aboutir
– Mais un avocat est aussi coûteux pour le défendeur, qui
peut préférer payer règlement
Le jeu de la poursuite malveillante (2)
• qx<p car poursuite est malveillante (nuisance
suit)
Équilibre parfait en sous‐jeu
• Plaignant : ne rien faire, proposer s, abandon
• Défendeur : refuser
• Résultat : plaignant n’intente jamais d’action
en justice
Le chemin d’équilibre
• Pour trouver cet
induction
équilibre :
backward
Remarque
• Menace de procès peut devenir crédible si
plaignant peut payer son avocat à l’avance
• En partant de P3 :
• Résultat peut alors
être un règlement à
l’amiable
Crédibilité de la menace et coûts irrécupérables
• Même type de raisonnement dans le jeu de la crainte à
l’entrée peut rendre la menace de guerre crédible
• L’insider peut par exemple investir ex ante (avant la
décision de l’outsider d’entrer ou non) dans des
capacités de prod supplémentaires ou autres coûts
irrécupérables
• L’insider réduit ainsi son paiement s’il choisit de
s’accommoder : la possibilité de guerre commerciale
devient plus crédible pour outsider
Crainte de l’entrée et coûts irrécupérables (1)
• Soit la variante suivante du jeu F
Crainte de l’entrée et coûts irrécupérables (2)
• Considérons maintenant une seconde variante du
jeu, dans lequel l’insider investit ex ante dans des
capacités de production supplémentaires (coûts
irrécupérables)
• Cet investissement :
– Réduit le profit de l’insider de 4 s’il s’accommode ou si
l’outsider choisit « Exit »
– N’a aucun effet sur le paiement de l’outsider, ni sur le
paiement de l’insider en cas de guerre commerciale
Crainte de l’entrée et coûts irrécupérables (3)
• Variante du jeu avec coûts irrécupérables
Crainte de l’entrée et coûts irrécupérables (4)
• Conclusion : en investissant dans des capacités de
prod supplémentaires (qui ne sont pas utilisées à
l’éq.), insider rend la menace de guerre crédible,
ce qui lui permet de dissuader l’outsider d’entrer,
alors même que cet investissement ne lui apporte
pas plus de profit en cas de guerre commerciale
• Remarque : décision d’investir peut être
représentée comme une étape supplémentaire
du jeu
Section 6
LES JEUX RÉPÉTÉS
Les jeux répétés
• Classe de jeux dynamiques spécifiques : jeux dits
« répétés »
• Capte des situations où les joueurs se « rencontrent »
régulièrement : interactions répétées
• Rôle explicite du temps :
– Apprentissage,
– Acquisition d’une réputation,
– Incitations à coopérer (cadre non coopératif)
Premier exemple (1)
• Soit le jeu EG de concurrence entre deux
firmes :
Firme 1
Entente
Guerre
Firme 2
Entente
(3;3)
(4;‐1)
Guerre
(‐1;4)
(0;0)
Premier exemple (2)
• Situation de type « dilemme du prisonnier »,
où l’EN (G,G) est Pareto dominé par (E,E) :
Firme 1
Entente
Guerre
Firme 2
Entente
(3;3)
(4;‐1)
Guerre
(‐1;4)
(0;0)
Premier exemple (3)
• Admettons que les deux firmes se « rencontrent »
régulièrement, avec les mêmes actions possibles à
chaque fois (par exemple pendant T ≥ 2 périodes)
• Supposons que chacune observe ce qu’a fait l’autre à la
fin de chaque période,
• Le jeu simultané EG ne représente qu’une occurrence
(étape) d’un jeu plus long à T périodes
• Jeu répété, fini (T<∞ seulement)
• Question : émergence à LT de la coopération ?
Premier exemple (4)
• Problème : le nombre de stratégies possibles
pour chaque joueur augmente rapidement avec T
• Rappel :
– une stratégie est un plan contingent
– i.e. spécifie ce que fait chaque joueur à chacun de ses
ensembles d’info.
• Supposons T=2
Représentation sous forme extensive (sans les gains)
Jeu simultané à l’étape 1
E
G
E
(3;3) (‐1;4)
G
(4;‐1) (0;0)
Jeu simultané à l’étape 2
E
G
E
(3;3) (‐1;4)
G
(4;‐1) (0;0)
Stratégies possibles (T=2)
• F1 a :
– 1 nœud de décision en t=1
– 4 nœuds de décision en t=2
• F2 a :
– 1 ensemble d’info. En t=1
– 4 ensembles d’info. En t=2
• À l’étape 2, F1 a deux actions possibles à chacun de ses 4
nœuds de décision, soit 24 = 16 arrangements possibles
• En tenant compte des 2 actions à l’étape 1, ceci donne :
2x24=32 stratégies pour F1 du type : (E;E E E E), (E;G E E E),
(E;E G E E) … (G;E E E E) … (G;G G G G), etc.
Stratégies possibles (T=3)
• Si T=3, F1 a :
– 1 nœud de décision en t=1,
– 4 nœuds en t=2,
– 16 nœuds en t=3,
• D’où un nb de stratégies=2x24x216=2 097 152
• Conséquence : quand T devient grand, le nb de
stratégies devient extrêmement !
• Donc potentiellement très complexe à analyser
Jeu fini et EPSJ (1)
• Néanmoins dans la mesure où le jeu est fini, i.e.
l’horizon des joueurs est borné (il existe pour eux
une date terminale pour le jeu : T<∞), alors un
jeu répété fini est relativement simple à analyser
• L’application du concept d’EPSJ requiert qu’une
combinaison de stratégies est un EPSJ que s’il
induit un équilibre de Nash dans chacun de ses
sous‐jeux
Jeu fini et EPSJ (2)
• Or, chaque joueur sait :
– Qu’à l’étape 2, chaque sous‐jeu est identique au jeu
statique (peu importe l’histoire passée, i.e. les gains/pertes
antérieures)
– Que le seul EN du jeu statique est (G;G)
• (G;G) est donc l’unique EN dans chaque sous‐jeu
• Le seul EPSJ du jeu répété à T=2 correspond donc à une
combinaison de stratégies où chacun des joueurs
choisit partout G
• Généralisation à tout T<∞
Jeu fini et EPSJ (3)
• En d’autres termes, connaissant la date terminale T (quelle
qu’elle soit : T>2),
• Il est individuellement inutile (irrationnel) de tenter de se
construire une réputation d’agent coopératif en choisissant
unilatéralement « Entente », quels que soient l’instant du
jeu et la longueur T, puisqu’à la date terminale, chacun
choisira « Guerre »
• Par raisonnement inductif à rebours, cela est vrai à chaque
date
• La coopération ne peut pas émerger comme EPSJ dans un
jeu répété fini à info complète
Jeu répété infini
• L’argument d’induction à rebours utilisé pour le
jeu fini (effet dead‐line) n’a plus de pertinence
• À tout moment, l’avenir du jeu (gains/pertes)
influence les décisions présentes
• Conséquence : tout est possible, la coopération
comme la guerre !
• Multiplicité d’EN et d’EPSJ
Le Folk théorème
• Folk théorème
– Dans un jeu répété à l’infini, où les joueurs ont un nombre
fini d’actions à chaque occurrence, toute combinaison
d’actions répétées sur une séquence finie peut constituer
l’unique résultat d’un équilibre du jeu
• Conditions requises :
– Une certaine valeur du facteur d’escompte
– Proba suffisamment faible que le jeu se termine lors de
n’importe quelle répétition
– 2 joueurs (sinon condition de dimensionnalité plus
complexe)
Argument du Folk théorème
• En horizon fini, il n’est pas possible de se
construire une réputation (coopération) ni
d’inciter l’autre à coopérer (punition) en raison de
la dead‐line T
• En horizon infini, en revanche, à chaque
occurrence du jeu, il reste toujours à venir un
grand nb de périodes (potentiellement une
infinité de répétitions du jeu) qui peut inciter un
joueur à user de représailles (punir l’autre, au
moins sur une durée finie) afin d’inciter l’autre à
coopérer
Facteur d’escompte
• On note δ < 1 le facteur d’escompte : valeur
aujourd’hui d’un euro qui ne sera obtenu qu’à la
période suivante)
• Par exemple, un investisseur pourrait placer 1 euro
aujourd’hui pour avoir 1 + r euro à la période suivante.
On aurait alors :
δ=1/(1+r)
• Exemple : « Valeur Actuelle Nette » (VAN) = recette
actualisée – coûts actualisés
Équilibre de coopération
• On peut monter que jouer (E,E) est un EN (et
toujours un EPSJ)
• Jouer E à l’infini si l’autre joue E à l’infini, donne à
chaque joueur un gain cumulé égal à :
∑t=1∞ (3 x δt‐1) = 3 x (∑t=1∞ x δt‐1)
= 3/(1‐δ)
• C’est le gain max, pour tout δ suffisamment
proche de 1, donc forcément EN (et EPSJ)
Équilibre de non‐coopération
• Mais montrons que (G,G) est aussi un EN (et un EPSJ) du
jeu infini
• Jouer G à l’infini si l’autre joue aussi G à l’infini, donne à
chaque joueur un gain cumulé égal à :
∑t=1∞ x δt‐1 x 0 = 0
• Donc, une déviation unilatérale E (à la date 1, par exemple)
donnerait un gain négatif :
‐1+∑t=2∞ x δt‐1 x 0 = ‐1
• Donc, pas d’incitation à dévier (en tout t) !
Stratégie « œil pour œil » (1)
• En fait, il existe beaucoup d’autres types d’EN (en
termes de stratégies) induisant la coopération (en
termes de résultat)
• Stratégies « œil pour œil » :
– Jouer E dès le départ, et tant que l’autre joue E;
– Mais dès que l’autre joue G, jouer G à l’infini
• Cette stratégie donne à chaque joueur un gain
actualisé : ∑t=1∞ x δt‐1 x (3) = 3/(1–δ) à l’équilibre (i.e. si
l’autre
la
joue)
Stratégie « œil pour œil » (2)
• Inversement, une déviation unilatérale G (à la date 1, par
exemple) donnerait un gain :
4 + ∑t=2∞ x δt‐1 x 0 = 4
• Donc, pas d’incitation à dévier si :
3/(1 – δ) > 4
3 > 4 x (1 – δ)
4 x δ>1
δ > 1/4
• « œil pour œil » donne 1 EN avec coopération pour
certaines valeurs de δ Є (1/4, 1)
Stratégie « œil pour œil » (3)
• De même, une déviation unilatérale G à la date 2
donnerait un gain :
3 + δ x 4 + ∑t=3∞ x δt‐1 x 0 = 3 + 4 x δ
• Donc, pas d’incitation à dévier si :
3/(1 – δ) > 3 + 4 x δ
δ > 1/4
• « œil pour œil » donne encore 1 EN avec
coopération pour δ Є (1/4, 1)
Stratégie « œil pour œil » (4)
• Possibilité de continuer ce raisonnement pour
déviation à n’importe quelle période t
• Résultats similaires : si δ Є (1/4, 1), équilibre
de coopération !
Stratégie « tit for tat » (1)
• Idée : les représailles sont crédibles si T→∞,
mais peuvent être coûteuses
• Punir seulement pour certaines périodes peut
être suffisant
• Stratégies dites « tit for tat » : jouer E
initialement ; puis jouer en t ce que l’autre a
joué en t‐1
Stratégie « tit for tat » (2)
• Sous quelles conditions la firme 1 préfère la
coopération si la firme 2 joue « tit for tat » ?
• Si la coopération est maintenue, gains
cumulés actualisés de la firme 1 sont 3/(1–δ)
• Si la firme 1 dévie pour choisir G et pas de
retour à la coopération, alors firme 1 obtient
un profit de déviation de 4, puis plus rien
Stratégie « tit for tat » (3)
• Si firme 1 dévie à une période avec retour à la
coopération (E;E) après 1 période de punition, la
firme 1 obtient :
4 + δ x (‐1) + ∑t=3∞ x 3 x δt‐1 = 4 – δ + 3 x δ2/(1–δ)
• Donc, firme 1 préfère ne pas dévier si son profit
actualisé en cas de déviation (avec ou sans retour
à la coopération) est inférieur à 3/(1–δ)
Stratégie « tit for tat » (4)
• Dans le cadre de cet exemple particulier, on retrouve
des résultats proches de ceux de la stratégie « œil pour
œil » : si δ Є (1/4, 1), équilibre de coopération !
• En effet, δ > ¼ permet d’assurer que la firme 1 préfère
la coopération à
– Dévier pour entrer dans équilibre de non‐coopération
répété infiniment :
3/(1–δ) > 4  δ > ¼
– Dévier sur une seule période :
3/(1–δ) > 4 – δ + 3 x δ2/(1–δ)  δ > ¼
Stratégie « tit for tat » (5)
• Mais nous n’avons pas précisément spécifié la
stratégie utilisée par la firme 1
• Si celle‐ci joue également « tit for tat », alors une
déviation sur une période entraîne ensuite une
alternance déplorable (G;E), (E;G), (G;E), etc.
• Sauf cas particulier, « tit for tat » pour les deux
firmes n’est pas un EPSJ, car il n’est pas rationnel
pour la firme 2 de sanctionner la déviation initiale
de la firme 1
Condition de probabilité faible de fin de jeu à chaque période
• 2 situations à bien distinguer :
– (1) Le jeu se terminera à une date incertaine, mais
avant T
– (2) Il existe une probabilité constante de fin du jeu
• (1) : équivalent à un jeu fini
• (2) : à n’importe quelle période où le jeu ne s’est
pas terminé, le jeu est identique à celui joué
initialement
Illustration de la condition de probabilité faible de fin de jeu (1)
• Soit p la probabilité que le jeu continue après
chaque période
• Quelle est la condition sur p pour laquelle :
firmes choisissent (E;E) à chaque période est
un EPSJ ?
• On suppose (par simplicité) que δ=1 et que les
firmes utilisent des stratégies « œil pour œil »
Illustration de la condition de probabilité faible de fin de jeu (2)
• On calcule le profit cumulé actualisé de chacune
des firmes lorsqu’elles coopèrent et lorsqu’elles
dévient, pour déterminer si une déviation est
profitable
• Si une firme coopère, elle obtient :
∑t=1∞ (3 x pt‐1) = 3/(1‐p)
• Si elle dévie, elle obtient 4 (profit de déviation
puis plus rien)
Illustration de la condition de probabilité faible de fin de jeu (3)
• Ainsi, une firme décide de maintenir la
coopération à une période t si 3/(1‐p)>4  p>1/4
• On retrouve une condition semblable à celle sur
le facteur d’escompte : raisonnement très
similaire à condition de facteur d’escompte élevé
!
• Conclusion : coopération est un EPSJ ssi
probabilité constante de fin de jeu à chaque
période est inférieure à (1‐p)=3/4
Retour sur la crainte de l’entrée
• Reprenons le jeu de la crainte de l’entrée, mais
avec les paiements suivants
Réputation et crainte de l’entrée
• Considérons le profil de stratégies s* suivant :
– À une période t donnée, l’outsider entre sur le
marché ssi l’insider s’est accommodé dans le
passé
– L’insider s’accommode ssi il s’est déjà accommodé
à l’outsider par le passé
• Réputation peut rendre la menace de Guerre
crédible
Historique 1
• Considérons l’historique (actions passées des
joueurs) suivant : il y a déjà eu à 1 période
précédente une entrée et l’insider s’est
accommodé
• Résultat 1 : (Entrée;Accommode) à chaque
période du jeu répété
• EPSJ pour une valeur du facteur d’escompte faible
(résultat similaire au jeu simultané, à chaque
période)
Historique 2
• Considérons maintenant l’historique dans
lequel l’insider ne s’est jamais accommodé
• Résultat 2 : (Exit;Guerre) à chaque période du
jeu répété
• EPSJ pour une valeur du taux d’escompte
élevée
Le principe de déviation unique (1)
• Question : les résultats 1 et 2 sont des EPSJ,
mais comment le prouver ?
• Réponse : application du principe de déviation
unique
• Définition préalable déviation en un coup :
joueurs suivent le profil de stratégies s*, sauf
en une période précise du jeu
Le principe de déviation unique (2)
• Principe de déviation unique : un profil de
stratégies est un EPSJ d’un jeu infiniment répété
si et seulement si il n’existe pas de déviation en
un coup profitable
• Remarque : cette propriété est valable également
pour les EPSJ des jeux répétés finis
• Illustrons ce principe avec le résultat 2, pour
montrer que répétition du jeu peut rendre
menace de guerre crédible
Résultat 2 et principe de déviation unique (1)
• Supposons que l’historique du jeu est tel que
l’outsider a toujours choisi « Exit »
• Si outsider choisit à la période t d’entrer
(déviation en un coup) et qu’insider
s’accommode, alors le résultat sur le reste des
périodes sera (Entrée;Accommode)
• Insider obtient un profit cumulé actualisé à la
période t de 1/(1–δ)
Résultat 2 et principe de déviation unique (1)
• Au contraire, si insider choisit « Guerre » (pas
de déviation), alors le résultat sur le reste des
périodes sera (Exit;Guerre)
• L’insider obtient un profit cumulé actualisé de
‐1 + 2δ/(1‐δ)
• Quelle sont les valeurs de δ pour lesquelles le
résultat 2 est un EPSJ ?
Facteur d’escompte et résultat 2
• Finalement, si outsider choisit d’entrer à la
période t, l’insider préfère commencer une
guerre commerciale ssi :
‐1 + 2δ/(1‐δ) > 1/(1–δ)  δ > 2/3
• Conclusion : pour δ > 2/3, (Exit;Guerre) à chaque
période du jeu est un EPSJ. Si δ < 2/3, EPSJ du jeu
répété est (Entrée; Accommoder) à chaque
période. Profil de stratégies s* est un EPSJ
(résultat différent suivant valeur de δ)
Qualité du produit et réputation (1)
• Se construire une réputation est important dans
de nombreux autres jeux. Exemple :
Vendeur
Consommateur
Acheter
Qualité élevée
(5;5)
Qualité faible
(10;‐5)
Boycotter
(0;0)
(0;0)
• Si joué 1 fois, consommateur choisit « stratégie
de défense » Boycotter
• Réputation permet de se déplacer vers (Qualité
élevée, Acheter) à chaque période
Qualité du produit et réputation (2)
• Pour prouver cela, on peut par exemple
considérer le profil de stratégies suivant :
– Conso choisit initialement « Acheter » et continue à
acheter tant que vendeur choisit « Qualité élevée » à
la période précédente, sinon il joue « Boycotter »
jusqu’à la fin du jeu
– Vendeur choisit « Qualité élevée » à toutes les
périodes du jeu (coopération naïve)
• Pour δ suffisamment élevé, EPSJ avec (Qualité
élevée, Acheter) à chaque période du jeu répété
à horizon infini
Qualité du produit et réputation (3)
• À une période t donnée, le vendeur obtient avec
« Qualité élevée », un paiement 5/(1‐δ)
• Si vendeur choisit « qualité faible », il obtient 10
immédiatement et rien pour le reste du jeu
• Vendeur préfère qualité élevée ssi 5/(1‐δ)>10  δ>1/2
• Conclusion : pas de déviation unique profitable de la
part du vendeur si δ>1/2 !
Qualité du produit et réputation (4)
• Si le conso dévie pour choisir de boycotter à une
période t donnée, il se prive à cette période d’un
paiement de 10 pour obtenir 0, ce qui n’est jamais
profitable pour lui
• Conclusion : pas de déviation unique profitable de la
part du consommateur !
• pas de déviation unique profitable pour chacun des
joueurs : si δ>1/2, (Qualité élevée;Acheter) à chaque
période est bien un EPSJ du jeu de la qualité du produit
répété infiniment
Quelques jeux répétés dans lesquels la réputation est importante
Application
Caractère
Joueurs
Actions
Dilemme du prisonnier
Bilatéral
Ligne, Colonne
Nier/Avouer
Nier/Avouer
Duopole
Bilatéral
Firme, Firme
Prix Élevé/Bas
Prix Élevé/Bas
Emploi
Bilatéral
Employeur, Employé
Bonus/Pas de bonus
Travailler/Tirer au flanc
Qualité du produit
Unilatéral
Consommateur, Vendeur
Acheter/Boycotter
Qualité Élevée/Basse
Crainte de l’entrée
Unilatéral
Monopoleur,
Entrant
Prix Bas/Prix Élevé
Entrer/Rester Dehors
Révélation financière
Unilatéral
Compagnie commerciale,
Investisseur
Vérité/Mensonges
Investir/S’abstenir
Emprunt
Unilatéral
Prêteur, Emprunteur
Prêter/Refuser de prêter
Rembourser/Ne pas payer
Conclusion
• Présenter des concepts clés pour analyser le
fonctionnement des marchés, dès que l’on sort
des deux cas polaires que sont la CPP et le
monopole
• Utilisés dans le champ suivant, mais aussi, suite
du cursus : L3, M
– Instruments fondamentaux de l’éco moderne
– Essentiels aussi dans le champ de l’économie du droit
(Law & Economics)
Téléchargement