Concurrence imparfaite et théorie des jeux Chapitre 2 ‐ Défauts de coordination et comportements stratégiques (Introduction à la théorie des jeux) Plan du chapitre (1) • Section 1 – la notion de jeu – Définition et représentation – Notion d’information et typologie – Actions et stratégies • Section 2 – jeux simultanés en information complète – Équilibre de Nash – Existence, optimalité Plan du chapitre (2) • Section 3 – Quelques exemples de jeux simultanés – Le dilemme du prisonnier – La dominance itérée : la bataille de la mer de Bismarck – Les porcs en caisse, la bataille des sexes et la coordination ordonnée – Le jeu de la poule mouillée et les stratégies mixtes • Section 4 – Jeux séquentiels en information complète – Menace et crédibilité – Équilibre parfait en sous‐jeux Plan du chapitre (3) • Section 5 – Quelques exemples de jeux séquentiels – Séquentialité dans la bataille de la mer de Bismarck – Suivre le leader – Le jeu de la poursuite malveillante • Section 6 – Les jeux répétés – Les jeux répétés finis – Les jeux répétés infinis • Conclusion du chapitre Section 1 LA NOTION DE JEUX Retour sur la CPP • Th de la CPP : contexte avec échanges anonymes (interactions via les prix) • Mais dans de nombreuses situations (vie des entreprises, des organisations, relations sociales), le bien‐être de chacun dépend de ce que partenaires ou concurrents vont décider • Pb d’information sur leur comportement – Stratégies actives rationnelles – Pas simplement d’adaptation passive au prix ! Les interactions stratégiques • Idée : – – – – chacun peut envisager de prendre plusieurs décisions, de façon non concertée, avec une certaine info. sur les autres, mais le résultat final (gain, utilité) pour chacun va dépendre de la combinaison des décisions finalement choisies • Outil : théorie des jeux Théorie des jeux coopératifs/non coopératifs • 2 grande catégorie de jeux : coopératifs et non coopératifs • Différence : modélisation objectifs poursuivis employée et • Nous nous concentrons sur théorie des jeux non coopératifs dans le cours Définition (simple) d’un jeu • Représentation formelle d’une situation où les décisions de plusieurs individus sont interdépendantes • La description complète d’un jeu suppose de préciser : – Les joueurs (qui participe ?) – Les règles du jeu (ordre des joueurs ? Information individuelle ? Actions possibles ?) Résultat d’un jeu • Obj du modélisateur : expliquer comment un ensemble de circonstances conduit à un résultat particulier. • Définition résultat : ensemble d’éléments pertinents que le modélisateur choisit parmi les valeurs des actions, les paiements et autres variables, après que le jeu ait été joué Présentation d’un jeu (1) • La présentation d’un jeu spécifique peut se faire de façon littéraire, ou mathématique • Mais pour les commodités de l’analyse (gain de temps), on utilise par convention des représentations synthétiques/formelles Présentation d’un jeu (2) • Tout jeu peut toujours se décrire sous : – sa forme normale (tableau lignes/colonnes) – sa forme extensive (arborescence, arbre du jeu) • NB : – la forme normale est privilégiée pour les jeux dits simultanés (statiques) – la forme extensive est privilégiée pour les jeux dits séquentiels (dynamiques) – Attention, ce n’est pas exclusif !! Exemple de jeu sous forme normale JOUEUR 2 G JOUEUR 1 H 1 D 0 2 B 2 1 1 1 0 Représentation équivalente JOUEUR 1 H B JOUEUR 2 G (1;2) (2;1) D (0;1) (1;0) Exemple de jeu sous forme extensive Jeu simultané et information • Statut informationnel représentation du jeu des joueurs et • Prosaïquement : – Dans un jeu simultané, typiquement, les différents joueurs ne connaissent pas (n’observent pas) les décisions prises par les autres joueurs – Jeu en information imparfaite Jeu séquentiel et information • Jeu à information parfaite : lorsque chaque joueur est capable de différencier chacun de ses nœuds de décision – illustre qu’il observe ce que ses prédécesseurs ont fait (actions réalisées) • Jeu à information imparfaite : lorsqu’au moins un joueur est incapable de différencier certains de ses nœuds de décision – il n’observe pas intégralement prédécesseurs ont pu faire ce que ses Jeu séquentiel avec information parfaite (jeu A) Jeu séquentiel avec information imparfaite (jeu B) L’ensemble d’information • Notion d’ensemble d’information des joueurs permet de donner une définition plus générale • Ensemble d’information d’un joueur : – =partition de l’ensemble de ses nœuds de décision – =collection de ses nœuds de décision qu’il ne peut distinguer • Méthode : on vérifie qu’un jeu est à information parfaite ou imparfaite, en contrôlant que chaque ensemble d’information contient ou non plus d’un seul nœud de décision. Information parfaite • Définition : un jeu est à information parfaite lorsque, pour tous les joueurs, les ensembles d’information sont des singletons (i.e. ne contiennent qu’un seul nœud de décision) • Sinon, le jeu est à information imparfaite Application au jeu séquentiel précédent • J1 a un seul nœud de décision (nœud initial) • J2 a deux nœuds de décision (nœud à gauche quand J1 a joué « H » ; nœud à droite quand J1 a joué « D ») • Le jeu A est à information parfaite, car J2 a deux ensembles d’info. qui sont des singletons • Le jeu B est à information imparfaite, car J2 a un ensemble d’info. qui contient ses deux nœuds de décision Jeu répété • Définition : un jeu répété est un jeu dans lequel les joueurs prennent, de manière répétée, la même décision dans le même environnement Information complète et incomplète • Mais la source de l’incertitude peut être extérieure aux joueurs : – circonstances générales, – qui résultent de l’action de Nature, – qui influencent le déroulement et le résultat du jeu, inégalement observés par les joueurs • Distinction entre jeux à : – information complète : tous les joueurs observent l’action de Nature – information incomplète : au moins un joueur n’observe pas l’action de Nature Jeu séquentiel avec information complète (jeu C) Jeu séquentiel avec information incomplète (jeu D) Jeu à information symétrique/asymétrique • Définition : un jeu est dit à information symétrique si aucun des joueurs n’a une information différente de l’autre lorsqu’il joue ou à la fin du jeu La notion de stratégie • Concept central de la théorie des jeux : stratégie • Définition : pour un joueur, une stratégie est une description complète de l’action qu’il pourrait prendre à chacun de ses ensembles d’information • Littéralement : stratégie – = plan contingent complet – = règle de décision spécifiant de façon exhaustive ce que fait un joueur, partout dans le jeu, à chaque occasion où il pourrait jouer Postulats • L’analyse d’un jeu (simultané ou séquentiel) est basée sur deux postulats : – Les joueurs sont rationnels (acceptation usuelle) – La structure du jeu est connaissance commune • L’hypothèse de connaissance commune dote chaque joueur de la capacité de développer des raisonnements récursifs du type : – Chaque joueur sait qu’il est rationnel et connaît la structure du jeu – Que les autres joueurs le savent aussi, – Que les autres savent qu’il sait, – Etc. Équilibre de Nash et EPSJ • Toutefois, ces postulats ne suffisent pas la plupart du temps (dans les situations qui vont nous intéresser) pour préciser l’issue du jeu • Affiner les prédictions – proposer un concept d’équilibre : – Équilibre de Nash : jeux simultanés – Équilibre Parfait en Sous‐Jeu (EPSJ) : jeux séquentiels (« raffinement » de l’équilibre de Nash) Résumé : typologie des jeux • Jeux coopératifs/non coopératifs • Jeux avec décisions simultanées/séquentielles • Jeux statiques/répétés (horizon fini ou infini) • Jeux à information parfaite/imparfaite • Jeux à information complète/incomplète • Jeux à information symétrique/asymétrique Section 2 JEUX SIMULTANÉS EN INFORMATION COMPLÈTE Un exemple • De façon triviale, dans un jeu simultané, les stratégies possibles pour les différents joueurs se ramènent à leurs actions • Reprenons le jeu présenté avant JOUEUR 1 H B • Stratégies de J1 : (H,B) • Stratégies de J2 : (G,D) JOUEUR 2 G (1;2) (2;1) D (0;1) (1;0) Stratégie strictement dominante • La notion de stratégie est évidemment déterminante pour décrire l’issue possible, probable d’un jeu • L’analyse d’un jeu peut commencer en regardant les stratégies dominantes des différents joueurs • Définition : une stratégie strictement dominante est une stratégie qui donne l’utilité/gain le plus élevé à un joueur, indépendamment des décisions des autres joueurs – =meilleure réponse inconditionnelle Remarques (stratégie strictement dominante) • Si un joueur dispose d’une telle stratégie, on ne voit pas pourquoi il ne la jouerait pas ! • Et si un joueur dispose d’une stratégie strictement dominée, on ne voit pas pourquoi il ne l’éliminerait pas… • Simplifie l’analyse d’un jeu, mais peu ôter tout l’attrait d’un contexte d’interaction stratégique Exemple (suite) • Reprenons l’exemple précédent : équilibre en stratégies dominantes ? JOUEUR 1 H B JOUEUR 2 G (1;2) (2;1) D (0;1) (1;0) Exemple (suite) • Stratégie dominante de J1 JOUEUR 1 H B JOUEUR 2 G (1;2) (2;1) D (0;1) (1;0) • J1 a une stratégie strictement dominante : B Exemple (suite) • Stratégie dominante de J2 JOUEUR 1 H B JOUEUR 2 G (1;2) (2;1) D (0;1) (1;0) • J2 a une stratégie strictement dominante : G Équilibre en stratégies dominantes (exemple) • D’où prédiction sur l’issue probable d’un jeu • Équilibre en stratégies dominantes – Joueur 1 joue B : gain = 2 – Joueur 2 joue G : gain = 1 JOUEUR 1 H B JOUEUR 2 G (1;2) (2;1) D (0;1) (1;0) Interactions stratégiques • La question de l’interaction stratégique est alors relativement pauvre : – Ce que fait l’autre n’influence en rien ce que l’on fait soi‐même (décision) – À la limite, ceci n’a d’effet que sur le paiement que l’on reçoit Meilleure réponse • Mais si la décision de l’un est conditionnée par ce que fait l’autre ? JOUEUR 1 H B JOUEUR 2 G (2;1) (0;0) D (0;0) (1;2) • Notion de (fonction de) meilleure réponse Stratégie de J1 • J1 joue H si J2 joue G, • Mais joue B si J2 joue D JOUEUR 1 H B JOUEUR 2 G (2;1) (0;0) D (0;0) (1;2) Stratégie de J2 • J2 joue G si J1 joue H, • Mais joue D si J2 joue B JOUEUR 1 H B JOUEUR 2 G (2;1) (0;0) D (0;0) (1;2) Interprétation • Dans ce cas, on ne peut pas aller plus loin dans l’analyse du jeu, même si on constate qu’il y a deux combinaisons qui sont particulièrement intéressantes : – J1 joue H, J2 joue G : résultat (2;1) – J1 joue B, J2 joue D : résultat (1;2) • La connaissance de la structure du jeu (et le présupposé que les joueurs ont aussi cette connaissance) ne nous permet plus de/ne suffit plus à en décrire les issues possibles Équilibre de Nash • Définition préliminaire : un profil de stratégies est une combinaison de stratégies individuelles, attribuant une stratégie à chaque joueur • Définition de l’Équilibre de Nash (EN) : un profil de stratégies est un EN si la stratégie d’équilibre de chaque joueur est optimale étant donnée la stratégie d’équilibre de l’autre • NB : optimale = maximise son utilité/gain Exemple EN (1) • Reprenons exemple précédent • Chaque joueur dispose de deux stratégies : – {H,B} pour J1 – {G,D} pour J2 • Notons : – x une stratégie possible de J1 ; xЄ{H,B} – y une stratégie possible de J2 ; yЄ{G,D} • Et : – u(x,y) l’utilité/gain de J1 s’il joue x et J2 joue y – v(y,x) l’utilité/gain de J2 s’il joue y et J1 joue x Exemple EN (2) • Alors, formellement, un profil de stratégie (x,y) candidat à être un EN doit vérifier : – u(x,y) ≥ u(x’,y) pour tout x’ ≠ x – v(y,x) ≥ v(y’,x) pour tout y’ ≠ y • En pratique, comment « tester » le/les équilibres de Nash dans un jeu ? – Deux « recettes », qui découlent de la définition même de l’EN Première méthode (1) • On teste toutes les combinaisons possibles : – – – – (H,G) → utilités/gains (2,1) (H,D) → utilités/gains (0,0) (B,G) → utilités/gains (0,0) (B,D) → utilités/gains (1,2) • En regardant si l’un des joueurs a intérêt à « dévier » (changer sa décision), de façon à accroître individuellement son utilité/gain – On cherche les incitations à dévier, ou encore les déviations profitables Première méthode (2) • Application à notre exemple : considérons le profil (H,D) → (0,0) JOUEUR 1 H B JOUEUR 2 G (2;1) (0;0) D (0;0) (1;2) • On voit que si J2 joue effectivement D, J1 a intérêt à dévier de H et jouer au contraire B Première méthode (3) • Conclusion : (H,D) ne peut pas être un EN, l’un des joueurs ayant une incitation à dévier • Vous vérifierez que J2 a aussi une incitation à dévier si J1 joue H (jouer alors G plutôt que D) • NB : le même raisonnement montre que (B;G)(→ (0,0)) n’est pas non plus un EN • Montrons alors que le jeu a deux EN : – (H,G) → (2,1) – (B,D) → (1,2) Première méthode (4) JOUEUR 1 H B JOUEUR 2 G (2;1) (0;0) D (0;0) (1;2) Première méthode (5) JOUEUR 1 H B JOUEUR 2 G (2;1) (0;0) D (0;0) (1;2) Deuxième méthode (1) • Littéralement, la définition de l’EN signifie que la stratégie de Nash de chacun des joueurs est la meilleure des réponses à la stratégie de Nash de l’autre joueur • En d’autres termes, un profil (x,y) est un EN s’il se situe au point d’intersection des fonctions de meilleures réponses des deux joueurs Deuxième méthode (2) • Comme on l’a vu précédemment : – J1 joue H si J2 joue G – J1 joue B si J2 joue D JOUEUR 1 H B JOUEUR 2 G (2;1) (0;0) D (0;0) (1;2) Deuxième méthode (3) • Comme on l’a vu précédemment : – J2 joue G si J1 joue H – J2 joue D si J1 joue B JOUEUR 1 H B JOUEUR 2 G (2;1) (0;0) D (0;0) (1;2) Deuxième méthode (4) • L’intersection des deux fonctions de meilleures réponses nous conduit à sélectionner deux profils de stratégies = EN : (H;G) et (B;D) ! JOUEUR 1 H B JOUEUR 2 G (2;1) (0;0) D (0;0) (1;2) Stratégies et équilibre • Pour déterminer le résultat, modélisateur doit déterminer les stratégies pertinentes des joueurs : ici (H;G) et (B;D) • Permet au modélisateur de déterminer un ou plusieurs équilibres • Définition équilibre : combinaison de stratégies constituée d’une meilleure stratégie pour chacun des n joueurs du jeu • Ici, concept d’équilibre = éq. De Nash (EN) Remarques EN (1) • Pbs avec l’équilibre de Nash : – Existence • Stratégies « mixtes », si discrètes • Utilités quasi concaves si stratégies continues Remarques EN (2) • Existence d’équilibres multiples (cf exemple) JOUEUR 1 H B JOUEUR 2 G (2;1) (0;0) • Coordination sur l’un des EN ? D (0;0) (1;2) Remarques EN (3) • Sous optimalité de l’éq. De Nash – Défaut de coordination (non‐coopération) conduit à des échanges inefficaces • Illustration : pb dit du « Dilemme du Prisonnier » Section 3 QUELQUES EXEMPLES DE JEUX SIMULTANÉS Le dilemme du prisonnier (1) • Histoire : – Deux individus sont interpelés et suspectés d’avoir commis ensemble un délit, – La police manque de preuve, – Ils sont interrogés séparément JOUEUR 1 Nier Avouer JOUEUR 2 Nier (‐1;‐1) (0;‐10) Avouer (‐10;0) (‐8;‐8) • L’unique EN de ce jeu : (Avouer, Avouer) Le dilemme du prisonnier (2) • (Nier, Nier) n’est pas un EN de ce jeu JOUEUR 2 JOUEUR 1 Nier Avouer Nier (‐1;‐1) (0;‐10) Avouer (‐10;0) (‐8;‐8) • Si J2 nie, J1 a intérêt à avouer (il dévie) • Mais (Avouer;Nier) n’est pas un EN non plus Le dilemme du prisonnier (3) • Même raisonnement pour J2 : JOUEUR 2 JOUEUR 1 Nier Avouer Nier (‐1;‐1) (0;‐10) Avouer (‐10;0) (‐8;‐8) • Si J1 nie, J2 a intérêt à avouer (il dévie) • Mais (Nier;Avouer) n’est pas un EN non plus Le dilemme du prisonnier (4) • Paradoxe : (Nier;Nier) domine au sens de Pareto (Avouer;Avouer) JOUEUR 1 Nier Avouer JOUEUR 2 Nier (‐1;‐1) (0;‐10) Avouer (‐10;0) (‐8;‐8) • Rappel : éq. de Pareto s’il n’est pas possible d’améliorer le bien‐être d’un agent économique sans détériorer celui d’au moins un autre. La bataille de la mer de Bismarck (1) • Joueurs = généraux ennemis – Kenney : choisit où passer (nord ou sud) – Imamura : choisit où bombarder (nord ou sud) Kenney Nord Sud Imamura Nord (2;‐2) (1;‐1) Sud (2;‐2) (3;‐3) • Pas de stratégie strictement dominante La bataille de la mer de Bismarck (2) • Pas de stratégie strictement dominante, mais utilisation possible du concept de dominance faible • Définition : une stratégie est faiblement dominée s’il existe une autre stratégie pour le joueur qui est éventuellement meilleure et jamais pire ; cette autre stratégie rend au moins un des paiements plus élevé dans la combinaison de stratégies et jamais un seul paiement plus faible • Équilibre faible en stratégies dominantes : profil de stratégies obtenu en éliminant toutes les stratégies faiblement dominées de chaque joueur La bataille de la mer de Bismarck (3) • Sud : stratégie faiblement dominée par Nord pour Imamura Kenney Nord Sud Imamura Nord (2;‐2) (1;‐1) Sud (2;‐2) (3;‐3) • Mais Pb : aucune stratégie faiblement dominée pour Kenney La bataille de la mer de Bismarck (4) • Autre concept résoudre d’équilibre nécessaire pour • Définition équilibre de dominance itérée : combinaison de stratégies, trouvée – en éliminant d’abord une stratégie faiblement dominée de l’ensemble des stratégies des joueurs, – identifiant une autre stratégie faiblement dominée dans celles restantes, pour l’éliminer – etc. – Jusqu’à ce qu’il reste une unique stratégie pour chaque joueur La bataille de la mer de Bismarck (5) • Jeu résolu par dominance itérée Imamura Kenney Nord Sud Nord (2;‐2) (1;‐1) Sud (2;‐2) (3;‐3) • On élimine sud pour Imamura • Puis on élimine sud pour Kenney • (Nord, Nord) est un équilibre de dominance itérée (résultat observé en 1943) La bataille de la mer de Bismarck (6) • Particularité : jeu à somme nulle • Définition : un jeu à somme nulle est un jeu dont la somme des paiements de tous les joueurs est égale à zéro, quelles que soient les stratégies que ces joueurs choisissent • Inverse : jeu à somme non nulle (ou à somme variable) La bataille de la mer de Bismarck (7) • Jeu de la bataille de Bismarck peut aussi être interprété comme un jeu de stratégies d’entreprises : – Joueurs = compagnies (obj : max parts de marché) – Stratégies = mode de conception d’un produit – Avantage marketing de Kenney, qui préfère la confrontation directe (inversement pour Imamura) Le jeu du sentier d’itération (1) • Autre exemple de jeu qui peut être résolu par dominance itérée Colonne Ligne R1 R2 R3 C1 (2;12) (0;12) (0;12) C2 (1;10) (0;10) (1;10) C3 (1;12) (0;11) (0;13) • Pb : possibilités multiples d’équilibre selon l’ordre de suppression des stratégies faiblement dominées Le jeu du sentier d’itération (2) • 1er ordre de suppression possible : R2, C2, C1, R3 Colonne Ligne R1 R2 R3 C1 (2;12) (0;12) (0;12) C2 (1;10) (0;10) (1;10) C3 (1;12) (0;11) (0;13) Le jeu du sentier d’itération (2) • 1er ordre de suppression possible : R2, C2, C1, R3 Colonne Ligne R1 R2 R3 C1 (2;12) (0;12) (0;12) C2 (1;10) (0;10) (1;10) C3 (1;12) (0;11) (0;13) Le jeu du sentier d’itération (2) • 1er ordre de suppression possible : R2, C2, C1, R3 Colonne Ligne R1 R2 R3 C1 (2;12) (0;12) (0;12) C2 (1;10) (0;10) (1;10) C3 (1;12) (0;11) (0;13) Le jeu du sentier d’itération (2) • 1er ordre de suppression possible : R2, C2, C1, R3 • Équilibre (R1;C3) Colonne Ligne R1 R2 R3 C1 (2;12) (0;12) (0;12) C2 (1;10) (0;10) (1;10) C3 (1;12) (0;11) (0;13) Le jeu du sentier d’itération (2) • 2e ordre de suppression possible : R3, C3, C2, R2 Colonne Ligne R1 R2 R3 C1 (2;12) (0;12) (0;12) C2 (1;10) (0;10) (1;10) C3 (1;12) (0;11) (0;13) Le jeu du sentier d’itération (2) • 2e ordre de suppression possible : R3, C3, C2, R2 Colonne Ligne R1 R2 R3 C1 (2;12) (0;12) (0;12) C2 (1;10) (0;10) (1;10) C3 (1;12) (0;11) (0;13) Le jeu du sentier d’itération (2) • 2e ordre de suppression possible : R3, C3, C2, R2 Colonne Ligne R1 R2 R3 C1 (2;12) (0;12) (0;12) C2 (1;10) (0;10) (1;10) C3 (1;12) (0;11) (0;13) Le jeu du sentier d’itération (2) • 2e ordre de suppression possible : R3, C3, C2, R2 • Équilibre (R1;C1) ≠ (R1;C3) Colonne Ligne R1 R2 R3 C1 (2;12) (0;12) (0;12) C2 (1;10) (0;10) (1;10) C3 (1;12) (0;11) (0;13) Les porcs en caisse Gros porc Appuyer Attendre Petit porc Appuyer (5;1) (9;‐1) Attendre (4;4) (0;0) • Gros porc préfère attendre si petit porc choisit « Appuyer », et inversement • Aucun éq. en stratégies dominantes • 1 éq. de dominance itérée : (Appuyer;Attendre) • Cet éq. est également un EN La bataille des sexes (1) • Homme veut assister au combat de boxe, femme au ballet • Ils préfèrent être ensemble que séparés Homme Boxe Ballet Femme Boxe (2;1) (0;0) • 2 EN : (Boxe;Boxe) et (Ballet;Ballet) • Les EN sont Pareto‐efficients ! Ballet (0;0) (1;2) La bataille des sexes (2) • Quel équilibre de Nash s’applique ? – Coordination par la répétition • Si 1 joueur ouvre le jeu (ex : en achetant des billets), alors il dispose d’un avantage du premier coup : l’engagement permet la coordination Applications de la bataille des sexes • Firmes avec des préférences de standards différentes, mais souhaitant un standard commun • Accord de vente entre firmes qui préfèrent des termes différents Jeu de la coordination ordonnée • 2 firmes (F1 et F2), 2 standards possibles (S1 et S2) F1 S1 S2 F2 S1 (2;2) (‐1;‐1) S2 (‐1;‐1) (1;1) • EN (S1;S1) domine au sens de Pareto (S2;S2) • Coordination possible sur (S1;S1) si communication La coordination dangereuse • Considérons variante coordination F1 S1 S2 suivante F2 S1 (2;2) (‐1;‐1) du jeu de S2 (‐1000;‐1) (1;1) • (S1;S1) domine au sens de Pareto, mais probable en réalité que les joueurs se coordonnent sur (S2;S2) • F1 ne prendrait pas le risque de jouer S1. Les points focaux • Lorsque plusieurs EN existent, les joueurs se coordonnent souvent sur des points focaux • Définition point focal : équilibre de Nash qui, pour des raisons psychologiques, est particulièrement contraignant (ex. : coordination dangereuse) • Si pas de point focal, la médiation et la communication sont toutes deux importantes Le jeu de la poule mouillée (1) • Deux adolescents s’affrontent en conduisant une voiture dans des directions opposées • Chacun préfère continuer tandis que l’autre dévie : – Si les deux continuent, ils risquent la mort – Si les deux dévient, risque d’humiliation Smith Continuer Dévier Jones Continuer (‐3;‐3) (0;2) Dévier (2;0) (1;1) Le jeu de la poule mouillée (2) • 2 EN : (Dévier;Continuer) et (Continuer;Dévier) Smith Continuer Dévier Jones Continuer (‐3;‐3) (0;2) Dévier (2;0) (1;1) • Autre possibilité : stratégie mixte (les 2 jouent en proba) • Ici, chacun joue Continuer avec une proba de 0,25 (proba d’accident=0,0625) Stratégies corrélées • Dans le jeu de la poule mouillée, les joueurs ont intérêt à se mettre d’accord • Une possibilité : randomisation pour obtenir des stratégies corrélées • Exemple : pile ou face, Smith continue si face et dévie si pile • Permet d’éviter les stratégies symétriques, très coûteuses pour les joueurs Conversation libre • Autre possibilité de coordination conversation libre (ou Cheap Talk) : la • Inutile pour le jeu de la poule mouillée (chacun annonce qu’il continue) • Mais permet de créer un point focal dans un jeu de coordination par exemple Catégories des jeux à stratégies mixtes : jeux de non‐coordination (a;w) (c;y) • Paiements : – Soit a>c, d>b, x>w, y>z – Soit c>a, b>d, w>x, z>y (b;x) (d;z) Catégories des jeux à stratégies mixtes : jeux de non‐coordination (a;w) (c;y) • Paiements : – Soit a>c, d>b, x>w, y>z – Soit c>a, b>d, w>x, z>y (b;x) (d;z) Exemple : le jeu du bien‐être Indigent Gouvernemen t Aide Pas d’aide Emploi (3;2) (‐1;1) Flemmarder (‐1;3) (0;0) • Indigent préfère Emploi si Pas d’aide et Flemmarder si Aide • Préférences du gouvernement contraires • Équilibre en stratégie mixte : Pr(Emploi)=0,2 et Pr(Aide)=0,5 Catégories des jeux à stratégies mixtes : jeux de coordination (a;w) (c;y) (b;x) (d;z) • Paiements : a>c, d>b, w>x, z>y • 2 EN en stratégies pures, et 1 en stratégie mixte • Ex : la bataille des sexes Catégories des jeux à stratégies mixtes : jeux de participation (a;w) (c;y) (b;x) (d;z) • Paiements : – c>a, b>d, x>w, y>z – c<b et y>x • 2 EN en stratégies pures, et 1 en stratégie mixte • Ex : – jeu de la poule mouillée – contribution à un bien public Section 4 JEUX SÉQUENTIELS EN INFORMATION COMPLÈTE Cadre d’analyse • Simultané : – Le cadre défini par les jeux simultanés (statiques) est adapté à l’analyse des marchés où un nombre fini de firmes sont déjà en activité (insiders) – Grosso modo : analyse de court terme • Séquentiel : – Mais les questions de guerre commerciales, ou comme on l’a vu en CPP, d’entrée de nouveaux concurrents (outsiders) sont évidemment importantes – Les jeux séquentiels (dynamiques) fournissent le cadre d’analyse approprié Un exemple (1) • Dans un jeu séquentiel, les stratégies possibles pour les différents joueurs correspondent (en général) à des combinaisons de leurs actions Exemple – jeu A (info parfaite) • Stratégies de J1 : (G,D) • Stratégies de J2 : – – – – {G si J1 joue G, G si J1 joue D} {G si J1 joue G, D si J1 joue D} {D si J1 joue G, G si J1 joue D} {D si J1 joue G, D si J1 joue D} Un exemple (2) • Intuition : l’information étant parfaite, J2 peut conditionner sa décision à ce que J1 a précédemment fait – Idée de stratégie comme plan contingent • Exemple – jeu B (info imparfaite) – Stratégies de J1 : (G,D) – Stratégies de J2 : (G,D) • L’information étant imparfaite, J2 ne peut plus conditionner sa décision à ce que J1 a précédemment fait • Les stratégies de J2 sont confondues avec ses actions (ici) Crédibilité des menaces • Une première idée que l’on va illustrer est que le concept d’équilibre de Nash n’est pas assez fort (restrictif) lorsqu’on analyse des jeux séquentiels • Par exemple, ne permet pas d’éliminer, à l’équilibre, des menaces qui ne sont pas crédibles Jeu séquentiel avec information complète (jeu F) Représentation sous forme de jeu simultané • L’outsider et l’insider ont deux stratégies Outsider Exit Entrée Insider Guerre si entrée (0;2) (‐3;‐1) Accommode si entrée (0;2) (2;1) EN • Il existe deux EN (en stratégies pures) – (Exit, Guerre si entrée) – (Entrée, Accommode si entrée) Outsider Exit Entrée Insider Guerre si entrée (0;2) (‐3;‐1) Accommode si entrée (0;2) (2;1) Le problème de crédibilité • Mais l’EN correspondant à (Exit, Guerre si entrée) n’est pas une prédiction très pertinente, sensible, pour ce jeu : – Elle autorise l’insider à utiliser une menace (faire une guerre commerciale) qui n’est pas crédible (inefficace, non dissuasive) ! – Mais sous l’hyp. De connaissance commune, l’outsider a les moyens de comprendre qu’une fois qu’il est entré, la meilleure décision de l’insider est « Accommoder », et non pas « Guerre » • L’acceptation des menaces non crédibles entre en conflit avec la connaissance commune La rationalité séquentielle • Pour contourner ces difficultés/incohérences, on utilise un concept d’équilibre qui requiert/contraint chaque joueur à : – ne prendre que des actions efficaces/optimales pour lui‐même, – à tout moment du jeu où il doit jouer, – étant données les stratégies des autres joueurs • Idée de rationalité séquentielle Notion de sous‐jeu • Un sous‐jeu est une sous partie d’un jeu, qui commence à l’ensemble d’information de l’un des joueurs, pourvu que ce soit un singleton (unique nœud de décision), et qui contient tous les nœuds de décision qui suivent • NB : ceci implique qu’un ensemble d’info contenant au moins deux nœuds ne peut pas initier un sous‐jeu – on ne peut pas « casser » un ens d’info Premier sous‐jeu Deuxième sous‐jeu Équilibre parfait en sous‐jeu • Définition : un profil de stratégies constitue un équilibre parfait en sous‐jeu (EPSJ), s’il induit un EN dans chacun des sous‐jeux associés au jeu complet • Contraint les joueurs à être séquentiellement rationnels, en jouant des stratégies qui sont Nash, non seulement dans le jeu complet, mais partout dans le jeu Résolution EPSJ (1) • Étudier le premier des deux sous‐jeux, revient à un pur problème de décision individuelle (ici) pour l’insider : Résolution EPSJ (2) • Étudier le jeu complet (second sous‐jeu) revient à étudier un « jeu réduit », et donc la décision de l’outsider : Résolution EPSJ (3) • Sachant qu’il est séquentiellement rationnel pour l’insider de jouer « Accommode » si l’outsider entre, l’outsider joue « Entrée » Chemin d’équilibre • Le tracé rouge est le chemin d’équilibre : le chemin qui est emprunté dans l’arbre du jeu et qui conduit à l’équilibre Conséquences • En raisonnant en Nash dans le seul jeu complet, on avait trouvé deux EN • (Entrée, Accommode si entrée) est un EPSJ ; il est unique • (Exit, Guerre si Entrée) est éliminé ; ce n’est pas un EPSJ • La « perfection en sous‐jeu » permet d’éliminer la menace non crédible Pareto‐optimalité • Une deuxième idée que l’on va illustrer est qu’un EPSJ n’est pas forcément Pareto‐ Optimal • Simple : un EPSJ est forcément sélectionné dans l’ensemble des EN d’un jeu • Or, un EN n’est pas nécessairement PO ! Section 5 QUELQUES EXEMPLES DE JEUX SÉQUENTIELS Retour sur la bataille de la mer de Bismarck (1) Kenney Nord Sud Imamura Nord (2;‐2) (1;‐1) Sud (2;‐2) (3;‐3) • Que se passe‐t‐il si Kenney et Imamura jouent séquentiellement ? Retour sur la bataille de la mer de Bismarck (2) • Si Imamura joue le premier : Retour sur la bataille de la mer de Bismarck (2) • Si Imamura joue le premier : Retour sur la bataille de la mer de Bismarck (3) • Si Kenney joue le premier : Suivre le leader • Reprenons le jeu de coordination où F1 et F2 choisissent entre deux standards S1 et S2 Suivre le leader : premier EN • (S1;(S1;S1)) est un EN • Mais pas un EPSJ ! Suivre le leader : deuxième EN • (S2;(S2;S2)) est un EN • Mais pas un EPSJ non plus ! Suivre le leader : troisième EN • (S1;(S1;S2)) est un EN • Seul EN qui est aussi un EPSJ Coordination non‐ordonnée et avantage du premier coup (1) • Dans jeu précédent (coordination ordonnée), la séquentialité des décisions permet aux firmes de se coordonner sur l’équilibre Pareto‐optimal • Mais dans un jeu de coordination non‐ordonnée (cf. bataille des sexes), celui qui joue en premier dispose d’un avantage du premier coup • Variante du jeu précédent : chaque firme préfère la coordination, mais préfère un standard différent Avantage du premier coup à la firme 1 (1) Avantage du premier coup à la firme 1 (2) • Conclusions : – Le suiveur (firme 2) va toujours choisir un standard identique à celui du meneur (firme 1) – Il y a donc toujours coordination – Anticipant cela, la firme 1 va choisir le standard qui lui rapporte le paiement le plus élevé – EPSJ est donc (S1;S1 si firme 1 choisit S1 et S2 si firme 1 choisit S2) • Raisonnement similaire si firme 2 joue en premier, mais c’est elle qui bénéficie de l’avantage du premier coup, d’où résultat (S2;S2) Avantage du premier coup à la firme 2 Le jeu de la poursuite malveillante (1) • Jeu plus complexe (plus de 2 dates) • Plaignant peut engager action en justice qui a peu de chances d’aboutir et dont le seul but est l’obtention d’un règlement à l’amiable (extorsion) • Idée : – Intenter un procès est coûteux et ce dernier a peu de chances d’aboutir – Mais un avocat est aussi coûteux pour le défendeur, qui peut préférer payer règlement Le jeu de la poursuite malveillante (2) • qx<p car poursuite est malveillante (nuisance suit) Équilibre parfait en sous‐jeu • Plaignant : ne rien faire, proposer s, abandon • Défendeur : refuser • Résultat : plaignant n’intente jamais d’action en justice Le chemin d’équilibre • Pour trouver cet induction équilibre : backward Remarque • Menace de procès peut devenir crédible si plaignant peut payer son avocat à l’avance • En partant de P3 : • Résultat peut alors être un règlement à l’amiable Crédibilité de la menace et coûts irrécupérables • Même type de raisonnement dans le jeu de la crainte à l’entrée peut rendre la menace de guerre crédible • L’insider peut par exemple investir ex ante (avant la décision de l’outsider d’entrer ou non) dans des capacités de prod supplémentaires ou autres coûts irrécupérables • L’insider réduit ainsi son paiement s’il choisit de s’accommoder : la possibilité de guerre commerciale devient plus crédible pour outsider Crainte de l’entrée et coûts irrécupérables (1) • Soit la variante suivante du jeu F Crainte de l’entrée et coûts irrécupérables (2) • Considérons maintenant une seconde variante du jeu, dans lequel l’insider investit ex ante dans des capacités de production supplémentaires (coûts irrécupérables) • Cet investissement : – Réduit le profit de l’insider de 4 s’il s’accommode ou si l’outsider choisit « Exit » – N’a aucun effet sur le paiement de l’outsider, ni sur le paiement de l’insider en cas de guerre commerciale Crainte de l’entrée et coûts irrécupérables (3) • Variante du jeu avec coûts irrécupérables Crainte de l’entrée et coûts irrécupérables (4) • Conclusion : en investissant dans des capacités de prod supplémentaires (qui ne sont pas utilisées à l’éq.), insider rend la menace de guerre crédible, ce qui lui permet de dissuader l’outsider d’entrer, alors même que cet investissement ne lui apporte pas plus de profit en cas de guerre commerciale • Remarque : décision d’investir peut être représentée comme une étape supplémentaire du jeu Section 6 LES JEUX RÉPÉTÉS Les jeux répétés • Classe de jeux dynamiques spécifiques : jeux dits « répétés » • Capte des situations où les joueurs se « rencontrent » régulièrement : interactions répétées • Rôle explicite du temps : – Apprentissage, – Acquisition d’une réputation, – Incitations à coopérer (cadre non coopératif) Premier exemple (1) • Soit le jeu EG de concurrence entre deux firmes : Firme 1 Entente Guerre Firme 2 Entente (3;3) (4;‐1) Guerre (‐1;4) (0;0) Premier exemple (2) • Situation de type « dilemme du prisonnier », où l’EN (G,G) est Pareto dominé par (E,E) : Firme 1 Entente Guerre Firme 2 Entente (3;3) (4;‐1) Guerre (‐1;4) (0;0) Premier exemple (3) • Admettons que les deux firmes se « rencontrent » régulièrement, avec les mêmes actions possibles à chaque fois (par exemple pendant T ≥ 2 périodes) • Supposons que chacune observe ce qu’a fait l’autre à la fin de chaque période, • Le jeu simultané EG ne représente qu’une occurrence (étape) d’un jeu plus long à T périodes • Jeu répété, fini (T<∞ seulement) • Question : émergence à LT de la coopération ? Premier exemple (4) • Problème : le nombre de stratégies possibles pour chaque joueur augmente rapidement avec T • Rappel : – une stratégie est un plan contingent – i.e. spécifie ce que fait chaque joueur à chacun de ses ensembles d’info. • Supposons T=2 Représentation sous forme extensive (sans les gains) Jeu simultané à l’étape 1 E G E (3;3) (‐1;4) G (4;‐1) (0;0) Jeu simultané à l’étape 2 E G E (3;3) (‐1;4) G (4;‐1) (0;0) Stratégies possibles (T=2) • F1 a : – 1 nœud de décision en t=1 – 4 nœuds de décision en t=2 • F2 a : – 1 ensemble d’info. En t=1 – 4 ensembles d’info. En t=2 • À l’étape 2, F1 a deux actions possibles à chacun de ses 4 nœuds de décision, soit 24 = 16 arrangements possibles • En tenant compte des 2 actions à l’étape 1, ceci donne : 2x24=32 stratégies pour F1 du type : (E;E E E E), (E;G E E E), (E;E G E E) … (G;E E E E) … (G;G G G G), etc. Stratégies possibles (T=3) • Si T=3, F1 a : – 1 nœud de décision en t=1, – 4 nœuds en t=2, – 16 nœuds en t=3, • D’où un nb de stratégies=2x24x216=2 097 152 • Conséquence : quand T devient grand, le nb de stratégies devient extrêmement ! • Donc potentiellement très complexe à analyser Jeu fini et EPSJ (1) • Néanmoins dans la mesure où le jeu est fini, i.e. l’horizon des joueurs est borné (il existe pour eux une date terminale pour le jeu : T<∞), alors un jeu répété fini est relativement simple à analyser • L’application du concept d’EPSJ requiert qu’une combinaison de stratégies est un EPSJ que s’il induit un équilibre de Nash dans chacun de ses sous‐jeux Jeu fini et EPSJ (2) • Or, chaque joueur sait : – Qu’à l’étape 2, chaque sous‐jeu est identique au jeu statique (peu importe l’histoire passée, i.e. les gains/pertes antérieures) – Que le seul EN du jeu statique est (G;G) • (G;G) est donc l’unique EN dans chaque sous‐jeu • Le seul EPSJ du jeu répété à T=2 correspond donc à une combinaison de stratégies où chacun des joueurs choisit partout G • Généralisation à tout T<∞ Jeu fini et EPSJ (3) • En d’autres termes, connaissant la date terminale T (quelle qu’elle soit : T>2), • Il est individuellement inutile (irrationnel) de tenter de se construire une réputation d’agent coopératif en choisissant unilatéralement « Entente », quels que soient l’instant du jeu et la longueur T, puisqu’à la date terminale, chacun choisira « Guerre » • Par raisonnement inductif à rebours, cela est vrai à chaque date • La coopération ne peut pas émerger comme EPSJ dans un jeu répété fini à info complète Jeu répété infini • L’argument d’induction à rebours utilisé pour le jeu fini (effet dead‐line) n’a plus de pertinence • À tout moment, l’avenir du jeu (gains/pertes) influence les décisions présentes • Conséquence : tout est possible, la coopération comme la guerre ! • Multiplicité d’EN et d’EPSJ Le Folk théorème • Folk théorème – Dans un jeu répété à l’infini, où les joueurs ont un nombre fini d’actions à chaque occurrence, toute combinaison d’actions répétées sur une séquence finie peut constituer l’unique résultat d’un équilibre du jeu • Conditions requises : – Une certaine valeur du facteur d’escompte – Proba suffisamment faible que le jeu se termine lors de n’importe quelle répétition – 2 joueurs (sinon condition de dimensionnalité plus complexe) Argument du Folk théorème • En horizon fini, il n’est pas possible de se construire une réputation (coopération) ni d’inciter l’autre à coopérer (punition) en raison de la dead‐line T • En horizon infini, en revanche, à chaque occurrence du jeu, il reste toujours à venir un grand nb de périodes (potentiellement une infinité de répétitions du jeu) qui peut inciter un joueur à user de représailles (punir l’autre, au moins sur une durée finie) afin d’inciter l’autre à coopérer Facteur d’escompte • On note δ < 1 le facteur d’escompte : valeur aujourd’hui d’un euro qui ne sera obtenu qu’à la période suivante) • Par exemple, un investisseur pourrait placer 1 euro aujourd’hui pour avoir 1 + r euro à la période suivante. On aurait alors : δ=1/(1+r) • Exemple : « Valeur Actuelle Nette » (VAN) = recette actualisée – coûts actualisés Équilibre de coopération • On peut monter que jouer (E,E) est un EN (et toujours un EPSJ) • Jouer E à l’infini si l’autre joue E à l’infini, donne à chaque joueur un gain cumulé égal à : ∑t=1∞ (3 x δt‐1) = 3 x (∑t=1∞ x δt‐1) = 3/(1‐δ) • C’est le gain max, pour tout δ suffisamment proche de 1, donc forcément EN (et EPSJ) Équilibre de non‐coopération • Mais montrons que (G,G) est aussi un EN (et un EPSJ) du jeu infini • Jouer G à l’infini si l’autre joue aussi G à l’infini, donne à chaque joueur un gain cumulé égal à : ∑t=1∞ x δt‐1 x 0 = 0 • Donc, une déviation unilatérale E (à la date 1, par exemple) donnerait un gain négatif : ‐1+∑t=2∞ x δt‐1 x 0 = ‐1 • Donc, pas d’incitation à dévier (en tout t) ! Stratégie « œil pour œil » (1) • En fait, il existe beaucoup d’autres types d’EN (en termes de stratégies) induisant la coopération (en termes de résultat) • Stratégies « œil pour œil » : – Jouer E dès le départ, et tant que l’autre joue E; – Mais dès que l’autre joue G, jouer G à l’infini • Cette stratégie donne à chaque joueur un gain actualisé : ∑t=1∞ x δt‐1 x (3) = 3/(1–δ) à l’équilibre (i.e. si l’autre la joue) Stratégie « œil pour œil » (2) • Inversement, une déviation unilatérale G (à la date 1, par exemple) donnerait un gain : 4 + ∑t=2∞ x δt‐1 x 0 = 4 • Donc, pas d’incitation à dévier si : 3/(1 – δ) > 4 3 > 4 x (1 – δ) 4 x δ>1 δ > 1/4 • « œil pour œil » donne 1 EN avec coopération pour certaines valeurs de δ Є (1/4, 1) Stratégie « œil pour œil » (3) • De même, une déviation unilatérale G à la date 2 donnerait un gain : 3 + δ x 4 + ∑t=3∞ x δt‐1 x 0 = 3 + 4 x δ • Donc, pas d’incitation à dévier si : 3/(1 – δ) > 3 + 4 x δ δ > 1/4 • « œil pour œil » donne encore 1 EN avec coopération pour δ Є (1/4, 1) Stratégie « œil pour œil » (4) • Possibilité de continuer ce raisonnement pour déviation à n’importe quelle période t • Résultats similaires : si δ Є (1/4, 1), équilibre de coopération ! Stratégie « tit for tat » (1) • Idée : les représailles sont crédibles si T→∞, mais peuvent être coûteuses • Punir seulement pour certaines périodes peut être suffisant • Stratégies dites « tit for tat » : jouer E initialement ; puis jouer en t ce que l’autre a joué en t‐1 Stratégie « tit for tat » (2) • Sous quelles conditions la firme 1 préfère la coopération si la firme 2 joue « tit for tat » ? • Si la coopération est maintenue, gains cumulés actualisés de la firme 1 sont 3/(1–δ) • Si la firme 1 dévie pour choisir G et pas de retour à la coopération, alors firme 1 obtient un profit de déviation de 4, puis plus rien Stratégie « tit for tat » (3) • Si firme 1 dévie à une période avec retour à la coopération (E;E) après 1 période de punition, la firme 1 obtient : 4 + δ x (‐1) + ∑t=3∞ x 3 x δt‐1 = 4 – δ + 3 x δ2/(1–δ) • Donc, firme 1 préfère ne pas dévier si son profit actualisé en cas de déviation (avec ou sans retour à la coopération) est inférieur à 3/(1–δ) Stratégie « tit for tat » (4) • Dans le cadre de cet exemple particulier, on retrouve des résultats proches de ceux de la stratégie « œil pour œil » : si δ Є (1/4, 1), équilibre de coopération ! • En effet, δ > ¼ permet d’assurer que la firme 1 préfère la coopération à – Dévier pour entrer dans équilibre de non‐coopération répété infiniment : 3/(1–δ) > 4 δ > ¼ – Dévier sur une seule période : 3/(1–δ) > 4 – δ + 3 x δ2/(1–δ) δ > ¼ Stratégie « tit for tat » (5) • Mais nous n’avons pas précisément spécifié la stratégie utilisée par la firme 1 • Si celle‐ci joue également « tit for tat », alors une déviation sur une période entraîne ensuite une alternance déplorable (G;E), (E;G), (G;E), etc. • Sauf cas particulier, « tit for tat » pour les deux firmes n’est pas un EPSJ, car il n’est pas rationnel pour la firme 2 de sanctionner la déviation initiale de la firme 1 Condition de probabilité faible de fin de jeu à chaque période • 2 situations à bien distinguer : – (1) Le jeu se terminera à une date incertaine, mais avant T – (2) Il existe une probabilité constante de fin du jeu • (1) : équivalent à un jeu fini • (2) : à n’importe quelle période où le jeu ne s’est pas terminé, le jeu est identique à celui joué initialement Illustration de la condition de probabilité faible de fin de jeu (1) • Soit p la probabilité que le jeu continue après chaque période • Quelle est la condition sur p pour laquelle : firmes choisissent (E;E) à chaque période est un EPSJ ? • On suppose (par simplicité) que δ=1 et que les firmes utilisent des stratégies « œil pour œil » Illustration de la condition de probabilité faible de fin de jeu (2) • On calcule le profit cumulé actualisé de chacune des firmes lorsqu’elles coopèrent et lorsqu’elles dévient, pour déterminer si une déviation est profitable • Si une firme coopère, elle obtient : ∑t=1∞ (3 x pt‐1) = 3/(1‐p) • Si elle dévie, elle obtient 4 (profit de déviation puis plus rien) Illustration de la condition de probabilité faible de fin de jeu (3) • Ainsi, une firme décide de maintenir la coopération à une période t si 3/(1‐p)>4 p>1/4 • On retrouve une condition semblable à celle sur le facteur d’escompte : raisonnement très similaire à condition de facteur d’escompte élevé ! • Conclusion : coopération est un EPSJ ssi probabilité constante de fin de jeu à chaque période est inférieure à (1‐p)=3/4 Retour sur la crainte de l’entrée • Reprenons le jeu de la crainte de l’entrée, mais avec les paiements suivants Réputation et crainte de l’entrée • Considérons le profil de stratégies s* suivant : – À une période t donnée, l’outsider entre sur le marché ssi l’insider s’est accommodé dans le passé – L’insider s’accommode ssi il s’est déjà accommodé à l’outsider par le passé • Réputation peut rendre la menace de Guerre crédible Historique 1 • Considérons l’historique (actions passées des joueurs) suivant : il y a déjà eu à 1 période précédente une entrée et l’insider s’est accommodé • Résultat 1 : (Entrée;Accommode) à chaque période du jeu répété • EPSJ pour une valeur du facteur d’escompte faible (résultat similaire au jeu simultané, à chaque période) Historique 2 • Considérons maintenant l’historique dans lequel l’insider ne s’est jamais accommodé • Résultat 2 : (Exit;Guerre) à chaque période du jeu répété • EPSJ pour une valeur du taux d’escompte élevée Le principe de déviation unique (1) • Question : les résultats 1 et 2 sont des EPSJ, mais comment le prouver ? • Réponse : application du principe de déviation unique • Définition préalable déviation en un coup : joueurs suivent le profil de stratégies s*, sauf en une période précise du jeu Le principe de déviation unique (2) • Principe de déviation unique : un profil de stratégies est un EPSJ d’un jeu infiniment répété si et seulement si il n’existe pas de déviation en un coup profitable • Remarque : cette propriété est valable également pour les EPSJ des jeux répétés finis • Illustrons ce principe avec le résultat 2, pour montrer que répétition du jeu peut rendre menace de guerre crédible Résultat 2 et principe de déviation unique (1) • Supposons que l’historique du jeu est tel que l’outsider a toujours choisi « Exit » • Si outsider choisit à la période t d’entrer (déviation en un coup) et qu’insider s’accommode, alors le résultat sur le reste des périodes sera (Entrée;Accommode) • Insider obtient un profit cumulé actualisé à la période t de 1/(1–δ) Résultat 2 et principe de déviation unique (1) • Au contraire, si insider choisit « Guerre » (pas de déviation), alors le résultat sur le reste des périodes sera (Exit;Guerre) • L’insider obtient un profit cumulé actualisé de ‐1 + 2δ/(1‐δ) • Quelle sont les valeurs de δ pour lesquelles le résultat 2 est un EPSJ ? Facteur d’escompte et résultat 2 • Finalement, si outsider choisit d’entrer à la période t, l’insider préfère commencer une guerre commerciale ssi : ‐1 + 2δ/(1‐δ) > 1/(1–δ) δ > 2/3 • Conclusion : pour δ > 2/3, (Exit;Guerre) à chaque période du jeu est un EPSJ. Si δ < 2/3, EPSJ du jeu répété est (Entrée; Accommoder) à chaque période. Profil de stratégies s* est un EPSJ (résultat différent suivant valeur de δ) Qualité du produit et réputation (1) • Se construire une réputation est important dans de nombreux autres jeux. Exemple : Vendeur Consommateur Acheter Qualité élevée (5;5) Qualité faible (10;‐5) Boycotter (0;0) (0;0) • Si joué 1 fois, consommateur choisit « stratégie de défense » Boycotter • Réputation permet de se déplacer vers (Qualité élevée, Acheter) à chaque période Qualité du produit et réputation (2) • Pour prouver cela, on peut par exemple considérer le profil de stratégies suivant : – Conso choisit initialement « Acheter » et continue à acheter tant que vendeur choisit « Qualité élevée » à la période précédente, sinon il joue « Boycotter » jusqu’à la fin du jeu – Vendeur choisit « Qualité élevée » à toutes les périodes du jeu (coopération naïve) • Pour δ suffisamment élevé, EPSJ avec (Qualité élevée, Acheter) à chaque période du jeu répété à horizon infini Qualité du produit et réputation (3) • À une période t donnée, le vendeur obtient avec « Qualité élevée », un paiement 5/(1‐δ) • Si vendeur choisit « qualité faible », il obtient 10 immédiatement et rien pour le reste du jeu • Vendeur préfère qualité élevée ssi 5/(1‐δ)>10 δ>1/2 • Conclusion : pas de déviation unique profitable de la part du vendeur si δ>1/2 ! Qualité du produit et réputation (4) • Si le conso dévie pour choisir de boycotter à une période t donnée, il se prive à cette période d’un paiement de 10 pour obtenir 0, ce qui n’est jamais profitable pour lui • Conclusion : pas de déviation unique profitable de la part du consommateur ! • pas de déviation unique profitable pour chacun des joueurs : si δ>1/2, (Qualité élevée;Acheter) à chaque période est bien un EPSJ du jeu de la qualité du produit répété infiniment Quelques jeux répétés dans lesquels la réputation est importante Application Caractère Joueurs Actions Dilemme du prisonnier Bilatéral Ligne, Colonne Nier/Avouer Nier/Avouer Duopole Bilatéral Firme, Firme Prix Élevé/Bas Prix Élevé/Bas Emploi Bilatéral Employeur, Employé Bonus/Pas de bonus Travailler/Tirer au flanc Qualité du produit Unilatéral Consommateur, Vendeur Acheter/Boycotter Qualité Élevée/Basse Crainte de l’entrée Unilatéral Monopoleur, Entrant Prix Bas/Prix Élevé Entrer/Rester Dehors Révélation financière Unilatéral Compagnie commerciale, Investisseur Vérité/Mensonges Investir/S’abstenir Emprunt Unilatéral Prêteur, Emprunteur Prêter/Refuser de prêter Rembourser/Ne pas payer Conclusion • Présenter des concepts clés pour analyser le fonctionnement des marchés, dès que l’on sort des deux cas polaires que sont la CPP et le monopole • Utilisés dans le champ suivant, mais aussi, suite du cursus : L3, M – Instruments fondamentaux de l’éco moderne – Essentiels aussi dans le champ de l’économie du droit (Law & Economics)