Introduction L’action individuelle L’action stratégique L’action collective L’action rationnelle M. Cozic DEC, ENS Ulm 12/II/2007 Préparation à l’agrégation 2007 M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective introduction ◮ l’objectif de la séance est double: (i) fournir quelques rudiments de théorie du choix rationnel: (1) théorie de la décision (2) théorie des jeux (3) théorie du choix social (ii) aborder pour chacun de ces domaines des problèmes qui font l’objet de discussions philosophiques: (1) le paradoxe de Newcomb (2) le dilemme du prisonnier (3) le théorème d’impossibilité d’Arrow M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective 1. L’action individuelle La théorie de la décision M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective introduction ◮ EP a déjà introduit les notions fondamentales de la théorie de la décision individuelle ◮ bref rappel : espérance de gain, d’utilité, etc. ◮ débat philosophique: théorie évidentielle de la décision vs. théorie causale de la décision M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’action rationnelle ◮ le choix d’une action par un agent est rationnel si, étant donné ce qu’il croit et étant donné ce qu’il peut choisir, l’action qu’il choisit est celle dont les conséquences satisfont le mieux ses désirs M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’action rationnelle ◮ le choix d’une action par un agent est rationnel si, étant donné ce qu’il croit et étant donné ce qu’il peut choisir, l’action qu’il choisit est celle dont les conséquences satisfont le mieux ses désirs (i) la rationalité dépend des opportunités offertes à l’agent: supposons que Pierre préfère le vin jaune au vin blanc et le vin blanc au vin rouge • situation 1: ab ar vin blanc vin rouge Pierre doit choisir ab M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’action rationnelle • situation 2: ab ar aj vin blanc vin rouge vin jaune Pierre doit cette fois choisir aj (et non ab ) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’action rationnelle • situation 2: ab ar aj vin blanc vin rouge vin jaune Pierre doit cette fois choisir aj (et non ab ) (ii) la rationalité dépend des désirs de l’agent Pierre préfère le vin blanc ou vin rouge ; Jean préfère le vin rouge au vin blanc ab ar vin blanc vin rouge Pierre doit choisir ab mais Jean doit choisir ar M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’action rationnelle (iii) la rationalité dépend des croyances de l’agent: • Jean croit que s’il choisit l’action ab , il obtiendra du vin rouge tandis que s’il choisit l’action ar , il obtiendra du vin blanc • les goûts de Jean sont les mêmes que ceux de Pierre ab ar vin rouge vin blanc Jean doit choisir ar (et non ab ) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’action rationnelle ◮ la rationalité d’un choix est une relation entre (1) les opportunités, les désirs et les croyances de l’agent et (2) l’action choisie ◮ on dit parfois que la théorie de la décision exprime une conception instrumentale de la rationalité ou encore qu’elle traite de la rationalité des moyens et non de celle des fins ◮ prima facie la théorie de la décision prend les désirs de l’agent comme donnés, elle ne dit pas quels sont les “bons” désirs et quels sont les “mauvais” ◮ mais elle impose des conditions de rationalité ou de cohérence sur ces désirs M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective les désirs les désirs de l’agent portent sur les conséquences possibles de ses actions; l’ensemble des actions réalisables est noté A, l’ensemble des conséquences C ◮ comment la théorie de la décision représente-t-elle les désirs? (i) préférences: relation comparative entre conséquences • ci cj : Pierre préfère “largement” ci à cj Pierre estime que ci est au moins aussi bonne que cj • ci ≻ cj : Pierre préfère “strictement” ci à cj Pierre estime que ci est strictement meilleure que cj • ci ∼ cj : Pierre est indifférent entre ci et cj Pierre estime que ci et cj ont la même valeur ◮ M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective les désirs (ii) utilité : fonction numérique u : C → R u(vin jaune) = 5 u(vin blanc) = 3 u(vin rouge) = 1 M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective les désirs (ii) utilité : fonction numérique u : C → R u(vin jaune) = 5 u(vin blanc) = 3 u(vin rouge) = 1 ◮ conditions de rationalité sur les désirs: (i) transitivité: si Pierre préfère le vin jaune au vin blanc et s’il préfère le vin blanc au vin rouge, alors il préfère le vin jaune au vin rouge si x y et y z alors x z • l’argument de la pompe à finance (money pump) (Davidson & Suppes): ci ≻ cj cj ≻ ck ck ≻ ci M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective les désirs (ii) complétude: Pierre est capable de comparer toute paire de conséquences possibles de ses actions : x y ou y x M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective les désirs (ii) complétude: Pierre est capable de comparer toute paire de conséquences possibles de ses actions : x y ou y x ◮ la représentation par une fonction d’utilité induit automatiquement transitivité et complétude ◮ si l’ensemble de conséquences est fini, toute relation de préférence rationnelle peut être représentée par une fonction d’utilité M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective choix certain ◮ situations de certitude: Pierre sait précisément pour chaque action a quelle est la conséquence c qui est produite par a ◮ on note a(C) la conséquence de a M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective choix certain ◮ situations de certitude: Pierre sait précisément pour chaque action a quelle est la conséquence c qui est produite par a ◮ on note a(C) la conséquence de a ◮ règle de décision [préférences]: choisir l’action a ∈ A dont la conséquence est préférée aux conséquences des autres actions (s’il en existe une!) pour tout a′ , a(C) a′ (C) ◮ règle de décision [utilité]: choisir l’action a dont l’utilité de la conséquence est supérieure à celle des autres actions pour tout a′ , u(a(C)) ≥ u(a′ (C)) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective choix incertain ◮ situations d’incertitude: Pierre ne sait pas quelle est la conséquence d’une action réalisable a ∈ A ◮ situations de risque: Pierre sait pour toute action a et pour toute conséquence c avec quelle probabilité l’action a produit la conséquence c ◮ exemple: choix entre deux paris 0.6 0.1 5 a1 10 a2 3 2 0.4 0.9 Comment choisir entre a1 et a2 ? La règle de choix en certitude ne s’applique plus: 5 ≺ 10 mais 3 ≻ 2 M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ comment déterminer la valeur d’une action risquée ? comment choisir entre différentes actions risquées ? M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ comment déterminer la valeur d’une action risquée ? comment choisir entre différentes actions risquées ? ◮ idée fondamentale: pondérer les différents gains possibles par la probabilité qu’ils arrivent • Logique de Port-Royal: “...pour juger de ce que l’on doit faire pour obtenir un bien ou pour éviter un mal, il ne faut pas seulement considérer le bien ou le mal en soi, mais aussi la probabilité qu’il arrive ou n’arrive pas, et regarder géométriquement la proportion que toutes ces choses ont ensembles” M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’espérance de gain 0.6 ◮ 0.1 10 3 0.4 0.9 EG(a1 ) = (0.6 × 5) + (0.4 × 3) = 4.2 ; EG(a2 ) = (0.1 × 10) + (0.9 × 2) = 2.8 2 5 a2 a1 M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’espérance de gain 0.6 ◮ 0.1 10 3 0.4 0.9 EG(a1 ) = (0.6 × 5) + (0.4 × 3) = 4.2 ; EG(a2 ) = (0.1 × 10) + (0.9 × 2) = 2.8 2 5 a2 a1 ◮ formule générale supposons que l’action a ait pour conséquences possibles c1 , ..., cm , chaque conséquence cj survenant avec une probabilité pja P a EG(a) = m j=1 pj (cj ) ◮ règle de décision: choisir l’action dont l’espérance de gain est maximum M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective St-Petersbourg ◮ une pièce non-biaisée est lancée de manière répétée jusqu’à ce qu’elle tombe sur face (F ) série proba. gain ◮ F 1/2 2 PF 1/4 4 PPF 1/8 8 ... ... ... P...PF 1/2n 2n ... ... ... quelle est la valeur du pari de St-Petersbourg? EG(StP) = 1 + 1 + 1 + .... = ∞ M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective espérance d’utilité ◮ proposition de Daniel Bernouilli (1738): découpler le gain monétaire et la satisfaction que l’agent en retire ou l’utilité ◮ on note u(cj ) l’utilité que l’agent retire du gain monétaire cj P a EU(a) = m j=1 pj × u(cj ) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective espérance d’utilité ◮ proposition de Daniel Bernouilli (1738): découpler le gain monétaire et la satisfaction que l’agent en retire ou l’utilité ◮ on note u(cj ) l’utilité que l’agent retire du gain monétaire cj P a EU(a) = m j=1 pj × u(cj ) ◮ règle de décision: choisir l’action dont l’espérance d’utilité est maximum M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective espérance d’utilité ◮ proposition de Daniel Bernouilli (1738): découpler le gain monétaire et la satisfaction que l’agent en retire ou l’utilité ◮ on note u(cj ) l’utilité que l’agent retire du gain monétaire cj P a EU(a) = m j=1 pj × u(cj ) ◮ règle de décision: choisir l’action dont l’espérance d’utilité est maximum ◮ l’argent a une utilité marginale décroissante ◮ u(x) = log(x) Dans ce cas, l’espérance d’utilité EU(StP) ≃ 0.6 et la valeur monétaire du Pari est (environ) 4 euros M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective remarques ◮ rem 1: on peut construire un super-paradoxe de St-Petersburg pour l’utilité (subjective): si la pièce tombe sur F au n-ème lancer, l’agent reçoit l’équivalent de 2n “utiles” ◮ rem 2 : la notion d’utilité change de signification par rapport à celle qui servait simplement à représenter les préférences; elle reflète désormais l’intensité des désirs 0.6 0.1 5 10000 a3 a1 3 2 0.4 0.9 • supposons que les conséquences soient évaluées en “utiles”; alors cette fois Pierre doit choisir a3 et non a1 M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’incertitude s.s. ◮ situations d’incertitude stricto sensu: une probabilité “objective” n’est pas donnée aux agents ◮ bayésianisme: les degrés de croyance d’un agent obéissent aux lois des probabilités ◮ chaque agent dispose d’une distribution de probabilité sur l’ensemble des paramètres qui peuvent affecter sa décision ◮ exemple : Pierre est invité, il hésite entre acheter une bouteille de vin rouge et une bouteille de vin blanc. La conséquence de son choix dépend de ce que son hôte a choisi de faire (viande ou poisson) ◮ on parle de probabilité subjective ; elles peuvent varier d’un individu à l’autre M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’ESU ◮ le cadre général du modèle d’espérance subjective d’utilité: (i) ontologie: ◮ ◮ ◮ un ensemble d’états de la nature S un ensemble d’actions réalisables A un ensemble de conséquence C ; chaque action a a une conséquence déterminée c étant donné un état de la nature s (ii) déterminants subjectifs: ◮ ◮ ◮ une fonction de probabilité P sur S (les croyances partielles de l’agent) une fonction d’utilité u sur C (les désirs de l’agent) L. Savage, The Foundations of Statistics (1954/1972) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’ESU ◮ un problème de décision: s1 s2 ... sm a1 c11 c12 ... c1m a2 c21 c21 ... c2m ... ... ... ... .... an cn1 cn2 ... cnm ◮ règle de décision: choisir l’action a dont l’espérance subjective d’utilité est maximale ESU(ai ) = P(s P 1 ) × u(ci1 ) + ... + P(sm ) × u(cim ) ESU(ai ) = j P(sj ) × u(cij ) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ vin rouge (VR) vin blanc (VB) poisson 1/4 0 4 viande 3/4 4 2 ESU(VR) = (1/4 × 0) + (3/4 × 4) = 3 ESU(VB) = (1/4 × 4) + (3/4 × 2) = 5/2 M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective remarques le terme “bayésianisme” est très souvent utilisé dans les théories formelles de la rationalité; il y a en fait trois sens distincts: (i) les degrés de croyances d’un agent rationnel se laissent représenter par une fonction de probabilité • justifications: Dutch Book (Ramsey, de Finetti) ou axiomes sur les préférences (Savage) (ii) quand un agent rationnel apprend une information I, il modifie ses croyances en suivant la règle de conditionalisation ◮ P(E /I) = P(E ∧ I)/P(E ) (iii) un agent rationnel choisit l’action qui maximise son espérance subjective d’utilité M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective le principe de dominance ◮ principe de dominance: soient deux actions a1 et a2 ; si en tout état du monde sj Pierre préfère au sens large c1j à c2j et si en un état du monde sj ∗ au moins Pierre préfère strictement c1j ∗ à c2j ∗ , alors Pierre doit choisir a1 plutôt que a2 ◮ exemple: vin rouge (VR) vin blanc (VB) poisson 0 4 viande 4 4 (VB) domine (VR) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective le principe de dominance (i) le principe de dominance requiert “moins” d’information: pas besoin de connaître les probabilités subjectives ni l’utilité (seulement les préférences) (ii) le principe de dominance fournit moins de recommandations que le principe de maximisation de l’ESU (iii) l’ESU s’“aligne” sur la dominance: si a1 domine a2 (et si leur ESU est finie), alors ESU(a1 ) > ESU(a2) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective le principe de dominance ◮ Q: le principe de dominance est-il fiable? ◮ de labore réviser ne pas réviser ◮ réussite 5 10 échec -5 0 “plutôt rouge que mort”: rester armé se désarmer invasion mort rouge pas invasion pauvre riche Hyp: rouge ≻ mort et riche ≻ pauvre M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective la dépendance ◮ qu’est-ce qui ne va pas avec le principe de dominance? ◮ la probabilité que Pierre réussisse l’examen dépend de son choix: plus forte s’il révise, plus faible s’il ne révise pas. ◮ dans les deux exemples, la probabilité pour qu’un état de la nature survienne dépend de l’acte que Pierre choisit. ◮ le principe de dominance ne semble plus valable quand les états de la nature dépendent des actions que l’agent doit choisir. ◮ puisque l’ESU s’aligne sur la dominance, cela implique que quelque chose ne va pas dans l’ESU M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective la probabilité conditionnelle ◮ idée: il faut prendre en compte la probabilité des états de la nature conditionnellement aux actions ◮ par exemple, la probabilité d’une invasion soviétique conditionnellement au choix de Pierre de rester armé ou de se désarmer ◮ on le note de la manière suivante: P(invasion / rester armé) ◮ de manière générale: P(s/a) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’ESCondU ◮ ◮ ◮ on peut représenter les probabilités conditionnelles de la manière suivante: invasion pas invasion rester armé .1 .9 se désarmer .8 .2 supposons que les utilités soient les suivantes: invasion pas invasion rester armé - 100 0 se désarmer - 50 50 alors on peut déterminer l’espérance subjective condtionnnelle d’utilité (ESCondU): ESCondU(rester armé) = (.1 × −100) + (.9 × 0) = −10 ESCondU(se désarmer) = (.8 × −50) + (.2 × 50) = −30 M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ de manière générale, l’ESCondU d’une action ai est la suivante: ESCondU(ai ) = P(s P 1 /ai ) × u(ci1 ) + ... + P(sm /ai ) × u(cim ) ESCondU(ai ) = j P(sj /ai ) × u(cij ) ◮ règle de décision: choisir l’action a dont l’espérance subjective conditionnelle d’utilité est maximale ◮ R. Jeffrey, The Logic of Decision (1965/1983) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’ESCondU ◮ l’ESCondU peut recommander des actions différentes de celles que recommande le principe de dominance ou l’ESU ◮ les recommandations sont nécessairement identiques quand les états de la nature sont indépendants des actions i.e. quand pour toute action ai et tout état de la nature sj , P(sj /ai ) = P(sj ) ◮ exemple: prendre un parapluie en fonction de sa croyance qu’il va pleuvoir ou non M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ la règle de maximisation de l’ESCondU peut être conçue comme un critère de bonne nouvelle: la meilleure action pour Pierre est celle dont il serait le plus heureux d’apprendre qu’elle a eu lieu ◮ les partisans de l’ESCondU sont appelés les partisans de la théorie évidentielle de la décision ou évidentialistes ◮ pour résumer: espérance de gain espérance d’utilité espérance subjective d’utilité espérance subjective conditionnelle d’utilité ◮ la fin de l’histoire? Pas sûr.... R. Nozick, “Newcomb’s Problem and Two Principles of Choice” (1969) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ 2 boîtes: B1: 1 000 euros B2 : 1 M euros ou rien ◮ Pierre a le choix entre deux actions: a1 : prendre les deux boîtes a2 : prendre seulement la boîte B2 ◮ c’est un prédicteur omniscient (PO) qui décide du contenu de la boîte B2: • s’il prédit que Pierre prendra les deux boîtes, il ne met rien dans B2 ; • s’il prédit que Pierre prendra seulement la boîte B2, il met 1M euros dedans • le prédicteur fait son choix avant celui de Pierre ◮ Pierre sait tout cela; a1 ou a2 ? M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ matrice de décision a1 a2 0 dans B2 1 000 0 1M dans B2 1 001 000 1 000 000 M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ matrice de décision a1 a2 0 dans B2 1 000 0 1M dans B2 1 001 000 1 000 000 (i) raisonnement par ESCondU: a1 a2 0 dans B2 1 000 (1) 0 (0) 1M dans B2 1 001 000 (0) 1 000 000 (1) ESCondU(a1) = 1 × 1000 + 0 × 1001000 = 1000 ESCondU(a2) = 0 × 0 + 1 × 1000000 = 1000000 il faut choisir a2 (one-boxer ) ! M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective (ii) raisonnement par dominance: a1 domine a2 il faut choisir a1 (two-boxer ) ! M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective (ii) raisonnement par dominance: a1 domine a2 il faut choisir a1 (two-boxer ) ! ◮ où est le problème? On a vu que le principe de dominance avait une validité limitée et que l’ESCondU semblait plus fiable ◮ dans les exemples qui parlaient en faveur de l’ESCondU contre la dominance, l’action de Pierre a un effet sur l’état de la nature; dans le problème de Newcomb, le PO a déjà fait son choix quand Pierre doit prendre sa décision à son tour M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective Newcomb médical ◮ il n’y a pas de lien causal entre tabagie et cancer mais une cause commune (le mauvais gène G) qui induit une corrélation statistique entre tabagie et cancer cancer pas de cancer fumer - 990 (.75) 10 (.25) ne pas fumer - 1000 (.2) 0 (.8) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective Newcomb médical ◮ il n’y a pas de lien causal entre tabagie et cancer mais une cause commune (le mauvais gène G) qui induit une corrélation statistique entre tabagie et cancer cancer pas de cancer fumer - 990 (.75) 10 (.25) ne pas fumer - 1000 (.2) 0 (.8) (i) raisonnement par ESCondU: ESCondU(fumer ) = (−990 × .75) + (10 × .25) = −245 ESCondU(nepasfumer ) = (−1000 × .2) + (0 × .8) = −200 il vaut mieux ne pas fumer ! (ii) raisonnement par dominance: il vaut mieux fumer ! M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ dans le cas du Newcomb médical, ce qui motive la dominance, c’est que (par hypothèse) il n’y a pas de relation causale entre tabagie et cancer ◮ la tabagie est un signe (et pas une cause) d’une forte prédisposition au cancer ◮ de manière générale, les probabilités ne discriminent pas entre les relations qui sont causales et celles qui ne le sont pas P(c/a) peut être supérieure à P(c) ◮ ◮ ◮ parce que a tend a causer c parce qu’il existe une cause commune à a et c le problème de Newcomb provient du fait qu’il y a dépendance probabiliste mais indépendance causale M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective causalistes ◮ ◮ ◮ ◮ ◮ les partisans d’une théorie causale de la décision ou causalistes) soutiennent qu’il faut se baser sur la dépendance causale et pas seulement sur la dépendance probabiliste le principe de dominance est correct quand il y a indépendance causale même s’il n’y pas indépendance probabiliste les causalistes sont two-boxers les causalistes estiment que les one-boxers sont irrationnels et adoptent une conception magique de la causalité réponse évidentialiste: lui repart avec 1M euros du problème de Newcomb, le causaliste avec 1 000 euros “ìf you’re so smart, why ain’t you so rich?” M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective théorie causale de la décision ◮ notion qui capture la dépendance probabiliste: P(a ⊲ s) ◮ l’état s est causalement indépendant de l’action a ssi P(a ⊲ s) = P(s) ◮ règle de décision ESCausU(ai ) = P(a P i ⊲ s1 ) × u(ci1 ) + ... + P(ai ⊲ sm ) × u(cim ) ESCausU(ai ) = j P(ai ⊲ sj ) × u(cij ) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective analyse causaliste de Newcomb ◮ revenons au problème de Newcomb: ◮ indépendance causale: P(0 − B2) = P(a1 ⊲ 0 − B2) = P(a2 ⊲ 0 − B2) = µ P(1M − B2) = 1 − P(0 − B2) = 1 − µ 0 dans B2 1M dans B2 a1 1 000 1 001 000 a2 0 1 000 000 ◮ calcul de l’espérance subjective causale d’utilité: ESCausU(a1) = 1000µ + 1001000(1 − µ) ESCausU(a2) = 0µ + 1000000(1 − µ) ◮ comparaison: ESCausU(a1) − ESCausU(a2) = 1000 > 0 il faut choisir a1 ! M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ l’ESCausU s’aligne sur le principe de dominance quand les actions et les états sont causalement indépendants: ◮ ◮ ◮ dans de labore, l’ESCausU peut contredire le principe de dominance dans le problème de Newcomb, l’ESCausU s’aligne sur le principe de dominance l’ESCondU était une sorte de mesure de bienvenue; l’ESCausU mesure l’efficacité espérée d’un acte à produire les conséquences que l’agent désire M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective 2. L’action stratégique La théorie des jeux M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ en théorie de la décision, l’agent est “seul face à la Nature” ◮ la théorie des jeux s’intéresse aux problèmes de décision où interviennent plusieurs agents et plus précisément aux problèmes de décision où les conséquences de l’action d’un agent (ou “joueur”) dépend de l’action des autres agents ◮ travaux fondateurs: • von Neumann & Morgenstern, Theory of Games and Economic Behavior (1944) • J. Nash, “Non-Cooperative Games” (1951) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective le dilemme du prisonnier ◮ Pierre et Jacques sont soupçonnés d’avoir commis ensemble un crime majeur et son interrogés séparément par la police ◮ les policiers ont assez d’éléments pour les convaincre d’un crime mineur, mais il faudrait que l’un témoigne contre l’autre pour convaincre l’autre du crime majeur ◮ chacun a deux actions envisageables: C: coopération, ie ne pas témoigner contre l’autre T : trahir, ie témoigner contre l’autre M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ ce que Pierre et Jacques encourent dépend de leur comportement: • s’ils coopèrent tous les deux, ils passeront 1 an en prison • s’ils trahissent tous les deux, ils passeront 3 ans en prison • si l’un coopère et l’autre trahit, celui qui coopère est libéré l’autre passera 4 ans en prison M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ ce que Pierre et Jacques encourent dépend de leur comportement: • s’ils coopèrent tous les deux, ils passeront 1 an en prison • s’ils trahissent tous les deux, ils passeront 3 ans en prison • si l’un coopère et l’autre trahit, celui qui coopère est libéré l’autre passera 4 ans en prison ◮ on peut résumer comme suit la situation: C T C (3, 3) (4, 0) M. Cozic T (0, 4) (1, 1) L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ de manière générale, un jeu (à deux joueurs) est donné par (i) un ensemble d’actions (ou stratégies) réalisables (Ai ) pour chaque joueur i - ici AP = AJ = {C, T } (ii) une fonction d’utilité ui pour chaque joueur i qui associe une utilité à chaque paire (ai , aj ) - ici Pierre comme Jacques associent l’utilité 3 à la paire d’actions (C, C) Rem: l’utilité du joueur i ne dépend pas de sa seule action, elle dépend également de l’action du joueur j M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ la théorie des jeux s’intéresse à l’issue rationnelle des jeux ainsi définis ◮ que devraient choisir Pierre et Jacques dans le dilemme du prisonnier ? C T C (3, 3) (4, 0) M. Cozic T (0, 4) (1, 1) L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ la théorie des jeux s’intéresse à l’issue rationnelle des jeux ainsi définis ◮ que devraient choisir Pierre et Jacques dans le dilemme du prisonnier ? C T C (3, 3) (4, 0) T (0, 4) (1, 1) • quel que soit le choix de Jacques, Pierre a intérêt à trahir • quel que soit le choix de Pierre, Jacques a intérêt à trahir ⇒ l’issue rationnelle du jeu semble être (T , T ) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ on retrouve ici un principe de dominance: ce n’est plus “quel que soit l’état de la nature...” mais “quel que soit le choix de l’autre...” ◮ on dit que (T , T ) est un équilibre en stratégies dominantes (ESD) ◮ pourquoi “équilibre”? Parce qu’aucun des deux joueurs n’a intérêt à dévier, i.e. à choisir une autre action ◮ l’ESD a les mêmes limitations que le principe de dominance en théorie de la décision: en général, il ne peut s’appliquer car il n’y a aucune action qui soit la meilleure quelle que soit l’action choisie par l’autre joueur M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective Jeu de la Poule Mouillée ◮ Pierre et Jacques sont en voiture sur la ligne blanche et avançent l’un vers l’autre ◮ chacun a le choix entre céder (C) et tenir (T ) • chacun préfère la situation où il tient et l’autre cède • chacun préfère que la situation où tous deux cèdent à celle où tous deux tiennent • chacun préfère la situation où il cède et l’autre tient à celle où tous deux tiennent M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective Jeu de la Poule Mouillée ◮ Pierre et Jacques sont en voiture sur la ligne blanche et avançent l’un vers l’autre ◮ chacun a le choix entre céder (C) et tenir (T ) • chacun préfère la situation où il tient et l’autre cède • chacun préfère que la situation où tous deux cèdent à celle où tous deux tiennent • chacun préfère la situation où il cède et l’autre tient à celle où tous deux tiennent ◮ on peut représenter la situation ainsi: C D C (3, 3) (4, 2) M. Cozic D (2, 4) (1, 1) L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective C T ◮ ◮ ◮ ◮ ◮ C (3, 3) (4, 2) T (2, 4) (1, 1) il n’y a plus de stratégies dominantes; que faire ? notion fondamentale: l’équilibre de Nash (EN) idée : une issue (aP , aJ ) rationnelle du jeu est une issue où, étant donné ce que Jacques a choisi (aJ ), Pierre n’a pas d’action meilleure que celle qu’il a choisie (aP ) - et mutatis mutandis pour Jacques. (T , T ) ne remplit pas cette condition: si Jacques tient, Pierre a intérêt à céder les deux issues qui remplissent la condition sont (T , C) et (C, T ); ce sont les deux EN du jeu M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’équilibre de Nash ◮ de manière générale, une paire (ai , aj ) est un équilibre de Nash du jeu G ssi • il n’existe aucune action ai ∗ telle que ui (ai ∗, aj ) > ui (ai , aj ) • il n’existe aucune action aj ∗ telle que uj (ai , aj ∗) > uj (ai , aj ) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective le Jeu de Pure Coordination ◮ dans le Jeu de la Poule Mouillée, 2 équilibres de Nash. Q: comment s’effectue la sélection ? ◮ considérons un Jeu de Pure Coordination • Pierre et Jacques doivent se retrouver • il y a trois endroits possibles où se retrouver a, b, c a b c a (1, 1) (0, 0) (0, 0) b (0, 0) (1, 1) (1, 1) c (0, 0) (0, 0) (1, 1) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective coordination et sélection ◮ dans le cas du Jeu de Pure Coordination, le seul problème pour les joueurs est de choisir le même endroit ; pas de divergence dans les intérêts ◮ dans le Jeu de la Poule Mouillée, le problème est plus délicat: des deux EN, chaque joueur en préfère un (celui où il tient et où l’autre cède) ◮ si chaque joueur choisit l’action qui correspond à l’équilibre qu’il préfère, on obtient (C, C)...qui n’est plus équilibre ! ◮ problème de la sélection de l’équilibre M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective le Jeu du Débarquement ◮ Pierre et Jacques sont deux généraux ennemis ◮ Jacques veut débarquer, il peut le faire en a ou en b; Pierre peut placer ses troupes en a ou en b • si Pierre place ses troupes là où Jacques débarque, c’est gagné pour lui et perdu pour Jacques • si Pierre place ses troupes là où Jacques ne débarque pas, c’est gagné pour Jacques et perdu pour lui ◮ représentation: a b a (1, −1) (−1, 1) M. Cozic b (−1, 1) (1, −1) L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective a b a (1, −1) (−1, 1) b (−1, 1) (1, −1) ◮ “jeu à somme nulle”: les préférences des deux joueurs sont diamétralement opposées ◮ il n’y pas de paire d’actions qui soit un équilibre de Nash: • si (a, a), Jacques a intérêt à jouer b • si (a, b), Pierre a intérêt à jouer b • si (b, a), Pierre a intérêt à jouer a • si (b, b), Jacques a intérêt à jouer a M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ quelle est alors l’issue rationnelle du jeu du débarquement ? ◮ extension probabiliste de l’EN : chaque joueur a le droit de choisir une stratégie avec une certaine probabilité - on parle alors de stratégies mixtes ◮ par exemple, il peut tirer une pièce et choisir en fonction du résultat ◮ dans le jeu du débarquement, il existe un EN en stratégies mixtes où chaque joueur joue chaque action avec probabilité 1/2 ◮ Nash (1951) a démontré que dans tout jeu fini il existe un équilibre de Nash en stratégies mixtes M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective jouer à deviner ◮ trois joueurs: Pierre, Jacques et Marc ◮ chacun doit donner un entier entre 1 et 100 ; les gagnants sont ceux qui sont le plus proche de 2/3 de la moyenne des trois nombres choisis ◮ les gagnants se partagent 1 euros M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective jouer à deviner ◮ trois joueurs: Pierre, Jacques et Marc ◮ chacun doit donner un entier entre 1 et 100 ; les gagnants sont ceux qui sont le plus proche de 2/3 de la moyenne des trois nombres choisis ◮ les gagnants se partagent 1 euros ◮ équilibre de Nash: (1, 1, 1) ! M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ revenons au Dilemme du Prisonnier: C T C (3, 3) (4, 0) T (0, 4) (1, 1) ◮ est-ce que (T , T ) est vraiment l’issue rationnelle du Dilemme ? ◮ Pierre et Jacques préfèrent (C, C) à (T , T ): (T , T ) Pareto-domine (C, C) ◮ pourquoi (C, C) ne serait pas l’issue rationnelle? M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ supposons que Pierre et Jacques puissent communiquer avant de prendre leur décision ◮ ils pourraient alors se mettre d’accord sur (C, C) ◮ problème : au moment de choisir, chacun aurait intérêt à trahir ! M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ si le Dilemme suscite autant d’attention (et de passion), c’est notamment parce qu’il semble représenter une structure d’interaction extrêmement répandue • le désarmement nucléaire entre deux super-puissances • l’investissement publicitaire de deux candidats à une élection • état de nature hobbesien: “état de guerre” = (T , T ) et “état de paix” = (C, C) [justification de l’Etat ou du Souverain : des individus rationnels laissés à eux-mêmes ne peuvent réaliser leur intérêt commun] ◮ Elster : politics is "the study of ways of transcending prisoner’s dilemma" M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ n joueurs • les paturages communs (G. Hardin) • les quantités de pêche • faire grève • prendre les transports en commun plutôt que la voiture M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective Jeu de la Chasse au Cerf ◮ Skyrms, The Stag Hunt and the Evolution of Social Structure (2004) soutient que la situation la plus appropriée pour capturer la dimension stratégique du contrat social n’est pas le Dilemme du Prisonnier mais la Chasse au Cerf ◮ Rousseau, Discours sur l’origine de l’inégalité: “S’agissait-il de prendre un cerf, chacun sentait bien qu’il devait pour cela fidèlement garder son poste; mais si un lièvre venait à passer à la portée de l’un d’eux, il ne faut pas douter qu’il ne le poursuivît sans scrupule, et qu’ayant atteint sa proie il se souciât for peu de faire manquer la leur à ses compagnons.” M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective cerf lièvre ◮ ◮ ◮ ◮ cerf (4, 4) (2, 0) lièvre (0, 2) (2, 2) 2 équilibres de Nash: (cerf, cerf) et (lièvre, lièvre) tension entre le bénéfice mutuelle et le risque: • (cerf, cerf) Pareto-domine (lièvre, lièvre): chaque joueur préfère (cerf, cerf) à (lièvre, lièvre) • (lièvre, lièvre) est risque-domine (cerf, cerf): si un joueur ne sait pas ce que l’autre va faire, il est plus prudent de choisir lièvre la course à l’armement: le coût de l’armement est tel qu’un pays juge préférable que lui et son ennemi ne s’arment pas plutôt que lui s’arme alors que l’autre ne s’arme pas le problème est celui de la sélection de l’équilibre - il faut avoir confiance dans le fait que l’autre choisit cerf M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ la coopération peut-elle “rationnellement” survenir dans une situation comme celle du Dilemme du Prisonnier ? (i) l’argument des jumeaux • chaque joueur peut voir l’autre comme son jumeau: l’autre raisonne comme moi et ce que j’entends faire me donne une indication sur ce que lui compte faire: C T ◮ C .95 .03 T .05 0.97 on se retrouve alors dans une situation bien connue, celle d’un problème de décision individuelle avec probabilités conditionnelles M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’argument des jumeaux ◮ on peut alors calculer l’ESCondU de chacune des deux actions réalisables: ESCondU(C) = (.95 × 3) + (.05 × 0) = 2.85 ESCondU(T ) = (.03 × 4) + (0.97 × 1) = 1.09 ◮ mais on se retrouve avec toutes les objections à l’évidentialisme : confusion du signe et de la cause ◮ K. Binmore, Game Theory and the Social Contract (1994) : “the game-theoretic equivalent of squaring the circle consists of justifying the use of a strongly dominated strategy in the one-shot Prisoner’s Dilemma” M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective répétition et cooopération (ii) the shadow of the future ◮ D. Hume, Traité: “ ...I learn to do a service to another, without bearing him any real kindness; because I foresee that he will return my service, in expectation of another of the same kind, and in order to maintain the same correspondence of good offices with me and with others” ◮ la théorie des jeux répétés est la branche de la théorie des jeux qui étudie l’impact du fait que les individus interagissent ensemble à plusieurs occasions dans le temps M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective répétition et coopération ◮ idée: montrer à quelles conditions la coopération peut procéder de l’intérêt bien compris de chacun ◮ jeux à horizon fini : il n’y a toujours pas d’autre issue que la trahison mutuelle ! ◮ jeux à horizon infini : la menace d’une sanction indéfinie permet de faire émerger des stratégies coopératives • exemple : Oeil-pour-Oeil ◮ mais les stratégies coopératives ne sont pas les seules à être des équilibres dans le jeu à horizon infini ⇒ on aboutit à un problème du type “Chasse au Cerf” (Skyrms 2004) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective 3. L’action collective La théorie du choix social M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective le choix social ◮ un groupe est constitué de plusieurs individus ◮ chaque individu a ses propres préférences concernant les différents états sociaux possibles ◮ comment agréger les préférences inviduelles en une préférence collective? • vote: les votants ont des préférences sur les candidats; la procédure de vote est une procédure qui abouti à une préférence collective ◮ la théorie du choix social ou théorie du choix collectif est étudie l’agrégation des préférences individuelles en une préférence collective M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective le choix social ◮ les premières contributions de la théorie du choix social remontent aux travaux de Borda et de Condorcet sur le vote (fin XVIIIème) ◮ la théorie contemporaine remonte aux travaux fondateur de K. Arrow (1951) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective paradoxe de Condorcet ◮ 3 candidats: a, b et c ; 3 électeurs: Pierre, Jean et Marc Pierre Jean Marc ◮ a≻b≻c b≻c≻a c≻a≻b règle majoritaire: x ≻c y ssi x ≻ y majoritairement: a ≻c b b ≻c c c ≻c a ◮ Condorcet, Essai sur l’application de l’analyse à la probabilité des décisions rendues à la pluralité des voix (1785) M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ problème: la préférence collective (≻c ) n’est plus transitive (elle est cyclique) ◮ Q: après tout, pourquoi ne pas se passer de la transivité? Mais comment choisir entre a, b et c? M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective le cadre ◮ un ensemble N = {1, ..., n} d’individus, chacun ayant une relation de préférence i rationnelle (réflexive, transitive et complète) sur X ◮ C est la préférence collective sur X ◮ f (.) est une fonction de choix social (ou fonction d’agrégation): elle associe à tout n-uplet de préférences individuelles (1 , ..., n ) une préférence collective C : f (1 , ..., n ) =C M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ condition R (rationalité): les préférences collectives C sont rationnelles (réflexives, transitives et complexes) ◮ condition U (universalité): une fonction d’agrégation peut avoir pour argument n’importe quel n-uplet de préférences rationnelles ◮ condition P (Pareto): soient a, b ∈ X deux options. Si pour tout i ∈ N, a ≻i b, alors a ≻C b • principe d’unanimité: si tout le monde est d’accord pour préférer strictement a à b, alors le groupe préfère strictement a à b • apparemment bénin, mais : pas de valeurs imposées aux individus au sens où si tous les individus sont d’accord, la collectivité préfère ce qu’ils préfèrent M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ condition I (Indépendance des options non-pertinentes): pour toute paire d’options a, b ∈ X , la préférence collective C sur {a, b} ne dépend que des préférences individuelles sur {a, b} soient deux profils de préférences (1 , ..., n ) et (′1 , ..., ′n ) tels que pour tout individu i a i b ssi a ′i b alors af (1 , ..., n )b ssi af (′1 , ..., ′n )b la règle majoritaire satisfait la condition I ◮ condition D (absence de dictature): il n’existe pas d’individu i tel que pour tout a, b ∈ X , si a ≻i b alors a ≻C b • un dictateur est un individu qui impose ses préférences (strictes) au groupe dans son ensemble M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective théorème d’Arrow ◮ Théorème d’impossibilité d’Arrow (1951) S’il y a moins 2 individus et 3 options, il n’existe pas de fonction de choix social qui satisfasse simultanément les conditions R, U, P, I et D. ◮ Théorème d’impossibilité d’Arrow (1951) (bis) S’il y a moins 2 individus et 3 options, si une fonction de choix social satisfait simultanément les conditions R, U, P, I, alors il existe un dictateur. M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ depuis 50 ans, la théorie du choix social cherche à contourner le théorème d’impossibilité d’Arrow en affaiblissant certaines des conditions ◮ exemple: on peut exiger que la préférence collective C soit seulement quasi-transitive: ≻C est transitive mais ∼C peut ne pas l’être. ◮ on peut montrer qu’une fonction de choix social qui est quasi-transitive et qui satisfait les conditions U, P et I est nécessairement oligarchique: il existe un groupe d’individus O ⊆ N tel que a C b ssi il existe i ∈ O tel que a ≻i b a ≻C b ssi pour tout i ∈ O, a ≻i b M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ en outre, il existe d’autres théorèmes d’impossibilité "cousins" (i) le théorème d’impossibilité du parétien libéral (Arrow 1970) (ii) le théorème de Gibbard-Satterthwaite M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective le parétien libéral ◮ Sen introduit dans le cadre de la théorie du choix social la notion de liberté individuelle via une condition minimale ◮ les états sociaux a et b ne diffèrent qu’en ceci: a l’individu porte du rouge et dans b du noir. i doit avoir la liberté de choisir entre a et b - même si les autres individus ont des préférences qui contredisent celle de i. ◮ idée: il y au moins deux options pour un individu i sur lesquelles l’individu est décisif : la préférence sociale doit alors s’aligner sur les préférences de i ◮ condition LM (liberté minimale): il existe deux individus i et j tels que pour chacun il existe deux options sur lesquelles ils sont décisifs M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective ◮ Théorème d’impossibilité du Parétien Libéral (Sen, 1970) S’il y a au moins deux individus et deux options, il n’existe pas de fonction de choix social qui satisfasse simultanément les conditons R*, U, P et LM. M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’Amant de Lady Chatterley ◮ un livre, l’Amant de Lady Chatterley ◮ 2 individus: l’un prude (pr ), l’autre libertin (lib) ◮ trois états sociaux: a: pr lit le roman b: lib lit le roman c: personne ne le lit ◮ préférences: c ≻pr a ≻pr b a ≻lib b ≻lib c ◮ pr est décisif sur {a, c} et lib sur {b, c} M. Cozic L’action rationnelle Introduction L’action individuelle L’action stratégique L’action collective l’Amant de Lady Chatterley ◮ en vertu de la condition de liberté minimale (LM), on a donc: c ≻C a et b ≻C c ◮ en vertu de la condition de Paréto, on a: a ≻C b ◮ et on obtient donc une préférence collective cyclique: c ≻C a ≻C b ≻C c ◮ interprétation de Sen: ◮ ◮ “...in very basic sense liberal values conflict with the Pareto Principle” “the ultimate guarantee for individual liberty may rest not on rules for social choice but on developing individual values that respect each other’s personal choices” M. Cozic L’action rationnelle