Les jeux simultanés (exemple pierre papier ciseaux) Les joueurs rationnels choisissent simultanément leurs actions et reçoivent un gain qui dépend des stratégies choisies par l’ensemble des joueurs. Jeux à information complète : Chaque joueur connaît l’ensemble des actions qu’il peut entreprendre, Chaque joueur connaît l’ensemble des actions possibles pour les autres joueurs, Chaque joueur connaît les préférences des autres joueurs, Chaque joueur connaît les gains résultant de ces actions. Tout ce qu’un joueur connaît est de connaissance commune. La connaissance commune Supposons qu’on parle d’une information qu’on appelle X. X est de connaissance commune si tout le monde connaît X Et tout le monde sait que tout le monde connaît X Et tout le monde sait que tout le monde sait que tout le monde connaît X... Et ce indéfiniment. ⇒ Implication des concepts de rationalité et de connaissance commune sur le comportement (stratégique) des joueurs. Motivations - 1 1/ Comment décrire une situation de jeu ? Définition & représentation d’un jeu sous la forme normale. 2/ Comment résoudre le problème inhérent à un jeu ? Jeux à somme non nulle : stratégies dominantes et dominées. Stratégie dominante : quelle est ma meilleure stratégie alors que stratégie dominée : quelle est la stratégie perdante (qu’on écarte). A partir de ça, on donne : Un Concept de solution et méthode de résolution : Equilibre en stratégies dominantes et Elimination itérative des stratégies strictement dominées Pour les jeux à somme nulle, stratégies prudentes. Motivations - 2 Cependant, notions insuffisantes pour avoir une idée précise de ce qui va se passer dans un jeu. Stratégie rationalisable, meilleure réponse et équilibre de Nash. Stratégies pures vs.mixtes, interprétées comme l’incertitude d’un joueur à propos de ce qu’un autre joueur va faire. Résultat d’existence de Nash (1950) : tout jeu sous forme normale admet au moins un EN en stratégies mixtes. Applications : concurrence imparfaite, problèmes de pollution, malédiction des ressources. Plan (plan incomplet) 1 Introduction 2 Représentation du jeu sous forme normale 3 Stratégies dominantes, stratégies dominées Stratégies dominantes 2. Représentation du jeu sous forme normale Un exemple : le dilemme du prisonnier Deux individus sont arrêtés car suspectés d’une série de crimes et emprisonnés dans des cellules différentes. Ils sont interrogés séparément par un représentant de l’ordre cherchant à obtenir une confession de chaque suspect. Si 1 seul joueur avoue les crimes (coupable), il est récompensé : peine limitée à 1 an de détention, l’autre écope de 5 ans. Si les deux confessent leurs actes : peine de 3 ans de prison. Si aucun n’avoue les crimes (non coupable), possible de les confondre pour un des crimes : 2 ans de prison. Jeu de la colombe et du faucon C’est une variante du dilemme du prisonnier, métaphore pour décrire le comportement agressif des firmes sur un marché. 2 animaux qui s’affrontent ou peuvent s’affronter pour la conquête d’un territoire ou de la nourriture. Soit V la valeur d’une ressource que se disputent 2 joueurs. 2 stratégies possibles : faucon vs. colombe. Si les 2 joueurs adoptent un comportement "pacifique" (colombe), alors ils partagent la ressource et obtiennent chacun V /2. Un joueur adoptant l’autre stratégie "agressive" (faucon) n’abandonnera pas (une partie de) la ressource. Donc il laissera jamais une partie de la ressource. Jeu de la colombe et du faucon - 2 Si un seul des 2 joueurs adopte la stratégie agressive, il récupère toute la ressource, et obtient V contre 0 pour l’autre. Enfin, si les 2 joueurs sont agressifs, un combat devient inévitable et fait supporter un coût C /2 à chaque joueur. L’issue du combat est incertaine, chaque joueur a 1 chance sur 2 de remporter le combat et la ressource. Représentation (C = stratégie colombe et F = stratégie faucon) 1/ et 2/ Deux joueurs, chacun dispose de 2 stratégies : {C , F }. 3/ Résultats possibles : (C,C), (C,F), (F,C) et (F,F). 4/ Gains associés à n’importe quel profil de stratégies. (C, C) (V/2 , V/2) (C, F) ( 0, V) (F, C) - (V, 0) (F, F) ( (1/2)0 + (1/2)V -(C/2), (1/2)0 + (1/2)V -(C/2) Représentation sous la forme d’un tableau 2 × 2. Dans chaque cellule figurent les gains associés au résultat : 2 valeurs, une pour chaque joueur. Par convention, les stratégies du premier joueur sont indiquées en ligne et son gain est la première valeur. C V/2, V/2 V, 0 C F F 0, V (V – C) / 2, (V – C) /2 Remarque Variante du dilemme du prisonnier : Situations où les joueurs ont un intérêt à coopérer et où poursuivre son propre intérêt est préjudiciable... Mais individuellement rationnel. Incapacité à s’engager à adopter telle ou telle stratégie. (impossible de communiquer pour s’engager, donc comme on sait pas ce qu’il va faire, il pourrait ne pas coopérer, donc on a intérêt à poursuivre juste son propre intérêt). Jeu de la poule mouillée (autre variante de ce jeu) Quand V < C ... Histoire inspirée du film Rebel without a cause (1955) : Jeu de la poule mouillée - 2 Deux individus foncent l’un vers l’autre au volant de leurs voitures. Ils doivent décider s’ils stoppent ou bien s’ils continuent. Le premier qui s’écarte de la trajectoire perd la face ; mais conserve la vie sauve (0). L’autre peut s’arrêter ensuite et gagne (V). Si les deux continuent... Accident ( V −C ). (maisavec C > V donc gain négatif) 2 Enfin, si les deux s’arrêtent en même temps, ils ont fait preuve d’autant de courage l’un que l’autre et récupèrent V/2. Le jeu de la pièce Jeux à somme nulle : ce que gagne un joueur, l’autre le perd. Jeu à 2 joueurs. La règle : chaque joueur prend une pièce de 1 euro dans sa main et la place soit côté pile soit côté face visible. Les gains : si les 2 présentent le même côté de la pièce, J1 paie 1 euro à J2. Sinon, c’est J2 qui paie 1 euro à J1. Formalisation La représentation sous forme normale d’un jeu spécifie : Qui sont les joueurs, 2 joueurs, J1, J2 Quelles sont les actions qu’ils peuvent entreprendre, Chaque joueur a 2 stratégie, (P, F) Quels sont les résultats possibles, 4 cas possibles : (P, P) , (P, F), (F, P), (F, F) Quelle est la valeur qu’ils attribuent à chaque résultat. (P, P) (-1, 1) ; (P, F) (1, -1) ; (F, P) (1, -1) ; (F, F) (-1, 1) J1 P F J2 P (-1, 1) (1, -1) F (1, -1) (-1, 1) Notations - 1 1/ Jeu à n joueurs, indicés par i = 1, ...n. Soit N l’ensemble des joueurs : N = {1, ..., i , ..., n}. 2/ Soit Si l’ensemble des stratégies à disposition du joueur i.N’importe quel si ∈ Si constitue une stratégie pure. Par exemple, Si = (P, F), le joueur 1 aura une stratégie : s1 = P ou s2 = F. 3/ Le vecteur s = (s1 , ..., si, ..., sn ) est un résultat possible du jeu : il va spécifier une stratégie pour chaque joueur. ⇒ Un profil de stratégies, une et une seule pour chaque joueur. Dans le jeu de la pièce, un résultat possible c’est s = (P, P) par exemple (les deux joueurs font pile). On a s ∈ S , l’ensemble de tous les résultats possibles : S = S1 × ... × Si × ... × Sn = ᴨ n Si . (peu importe) i =1 Notations - 2 On a besoin de connaitre la fonction de gain des joueurs, qui associe à n’importe quel résultat, un paiement. On va la noter ui. 4/ La fonction de gain (d’utilité) du joueur i , ui : S → R, Associe à chaque résultat possible s ∈ S un paiement ui (s) ∈ R. Pour le joueur 1, le paiement associé à s (P, P), est ui (P, P) = -1. (revoir le jeu de la pièce). Dans un autre cas, si ui (P, F) = 1. (si pile et face). On note enfin s−i = (s1 , ..., si −1 , si +1 , ..., sn ) un profil de stratégies pour tous les joueurs autre que i . On fait ça parce qu’on va préciser d’abord la stratégie du joueur i, et ensuite la stratégie du joueur s-i. On aura s−i ∈ S−i avec S−i = S1 × ... × Si −1 × Si +1 × ... × Sn . Un profil de stratégies s = (si , s−i ). Si il n’y a que 2 joueurs, s-i, ça sera juste la stratégie du joueur 2. Si on est 3, s-i ça sera juste la stratégie du joueur 2 et du joueur 3. Jeu sous forme normale Définition La représentation sous forme normale d’un jeu à n joueurs est une liste G = [N, S1 , ..., Sn , u1 , ..., un ], soit G = [N, {Si }, {ui }], où pour tout i ∈ N, Si correspond à l’ensemble des stratégies disponibles n pour le joueur i et ui : ᴨ Si → R est la fonction d’utilité VNM du i =1 joueur i . Von Neumann et Morgenstern (1944) : fondateurs de la théorie de l’utilité espérée pour la modélisation des choix en univers incertain. Remarques - 1 Le problème de décision d’un joueur : choisir sa stratégie afin de maximiser son niveau d’utilité (ou d’utilité espérée). Les joueurs choisissent simultanément, cela ne signifie pas qu’ils agissent simultanément (dilemme du prisonnier). Cela signifie qu’il est impossible d’observer le choix des autres avant de prendre sa décision ⇒ Nécessaire de former des croyances sur les stratégies jouées par les autres Remarques - 2 Représentation sous forme normale, jeux simultanés et jeux dynamiques. Représentation sous forme normale grâce à un tableau pour un nombre de joueurs ≤ 3. Au delà, impossible de donner une représentation simple sous forme de tableau. Ensembles de stratégies discrets vs. continus. Résumé Situation de jeu : L’utilité (ou le paiement) obtenue par un joueur dépend de sa propre stratégie mais aussi de celles suivies par les autres joueurs. ⇒ Contexte d’interaction stratégique Le joueur rationnel va chercher à maximiser la valeur (espérée) de son utilité en adaptant sa décision aux croyances qu’il forme sur le choix des autres. Les éléments constitutifs du jeu sont de connaissance commune. 3. Stratégie dominante, stratégie dominée Question centrale de la théorie des jeux Comment jouer ? Comment prédire le déroulement d’un jeu où les joueurs sont rationnels et pleinement informés de la structure et de la rationalité des autres. (plan : ) Concepts de stratégies dominantes puis d’équilibre en stratégies dominantes (premier concept de solution). Ensuite, concept lié de stratégies dominées. Enfin, processus d’élimination itérative des stratégies strictement dominées. La dominance Moyen simple de comparer les stratégies : notion de dominance. Illustration : le dilemme du prisonnier. Joueur 2 Joueur 1 C N C -3, 3 -1, -5 N -5, -1 -2, 2 Il existe une unique solution plausible à ce jeu : (C , C ). Pour comprendre cela, il faut voir que jouer C est la meilleure stratégie de chaque joueur, indépendamment de ce que fait l’autre. Supposons que j’anticipe que J2 joue C. Je compare les paiements associés à mes deux choix possibles. Ici j’ai intérêt à plaider coupable. Maintenant supposons que j’anticipe que J2 joue N. Ici, j’ai encore intérêt à plaider coupable. C’est pourquoi la seule solution plausible est (C, C). ⇒ Cette action constitue une stratégie strictement dominante. (Stratégie qui garantit le paiement le plus élevé dans tous les cas possibles). Stratégie strictement dominante (STD) Définition Une stratégie si ∈ Si est une stratégie strictement dominante pour le joueur i dans le jeu G = [N, {Si }, {ui }] si pour tout s t ∈ Si , si ≠sit , on a uii(si , s−i ) > ui (sit , s−i ) pour tout s−i ∈ S−i La stratégie si est celle, parmi l’ensemble Si , qui offre le paiement le plus élevé au joueur i et ce quel que soit les stratégies choisies par les autres joueurs, s−i . Elle est l’unique solution de la maximisation de ui par rapport à si, indépendante du profil de stratégies joué par les rivaux de i . Ca veut dire que la max de mon utilité par rapport aux stratégies me donnent toujours la même chose. Y a une stratégie simplement meilleure que l’autre pour moi. Commentaires Peu importe ce que font les autres joueurs, si est strictement meilleure que toutes les autres stratégies pour i. (i c’est moi, le joueur). ⇒ Si un joueur est rationnel et dispose d’une stratégie strictement dominante (SDT), alors il ne jouera aucune autre stratégie que celle-là. Et les autres vont être capables d’anticiper ce choix. Equilibre en stratégies strictement dominantes Lorsque tous les joueurs disposent d’une stratégie SDT, alors on sait facilement prédire la solution du jeu : Equilibre en stratégies dominantes. Définition Un profil de stratégie s = (s1 , ..., si , ..., sn ) constitue l’équilibre en stratégies strictement dominantes du jeu G = [N, {Si }, {ui }] si et seulement si pour tout joueur i , si ∈ Si est une stratégie strictement dominante. Remarques Si un jeu admet un équilibre en stratégies SDT, alors il est unique. Pour le DDP, l’équilibre en stratégies SDT est (C , C ). Remarque. Ce n’est pas le meilleur résultat pour les 2 joueurs considérés conjointement : dominé au sens de Pareto par (N , N ). s domine s’ si ui (s) ≥ ui(s’) pour tout i appartenant à N avec inégalité stricte pour certains i. Lorsqu’on laisse les joueurs agir indépendamment et de manière égoïste, on obtient pas l’optimum général. Problème d’existence : Dans la plupart des jeux, les joueurs ne disposent pas de telles stratégies.