L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004 L’interprétation subjectiviste des probabilités Séminaire PhilSci, 27 novembre 2004 Adrien Barton I Les probabilités subjectives selon De Finetti Sauf mention contraire, les numéros de page dans ce chapitre revoient à De Finetti (1937) Définition de la probabilité de E « Supposons qu’un individu soit obligé d’évaluer le prix p pour lequel il serait disposé d’échanger la possession d’une somme quelconque S (positive ou négative) subordonnée à l’arrivée d’un évènement donné, E, avec la possession de la somme pS ; nous dirons par définition que ce nombre p est la mesure du degré de probabilité attribué par l’individu considéré à l’évènement E, ou, plus simplement, que p est la probabilité de E (selon l’individu considéré ; cette précision pourra d’ailleurs être sous-entendue s’il n’y a pas d’ambiguïté) » (p.6) Protocole permettant à A de mesurer la probabilité p d’un individu B en un évènement E : B choisit un nombre p, A choisit une mise S (positive ou négative). B paye à A la somme pS. Si E se produit, A paye à B la somme S. Vocabulaire Dutch book : Pari tel que A gagne quel que soit l’évènement qui se produit. Ensemble de coefficients de pari cohérents : Ensemble de coefficients de pari tels que A ne peut pas faire de Dutch Book à B. Théorème de Ramsey-De Finetti Définition : P ( E | F ) est défini comme le coefficient de pari que B choisirait pour E si l’on convient le pari est annulé et les mises rendues si F ne se produit pas. Notons Ω l’évènement certain. Théorème Un ensemble de coefficients de paris est cohérent ssi il respecte les trois axiomes de probabilités suivants : 1. 0 ≤ P ( E ) ≤ 1 pour tout E et P ( Ω ) = 1 2. (additivité) Si E1, E2, E3, ..., En sont des évènements exclusifs (i.e. qui ne peuvent se produire simultanément) et exhaustifs (i.e. que au moins l’un d’entre eux doit se produire), alors P ( E1 ) + P ( E2 ) + ... + P ( En ) = 1 (cf. p.7) 3. (loi de multiplication) Pour deux évènements E et F : P ( E ∧ F ) = P ( E | F ) P ( F ) (cf. p.14) 1 L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004 Preuve 1) Axiome 1 a. Cohérence -> axiome 1 Si l’évènement se produit, A gagne ( q − 1) S Si l’évènement ne se produit pas, A gagne qS Coefficients de B q (Ω) < 1 Choix de A permettant le Dutch Book SΩ < 0 q (Ω) > 1 SΩ > 0 Donc B doit choisir q ( Ω ) = 1 q(E) < 0 SE < 0 q(E) >1 SE > 0 Donc B doit choisir 0 ≤ q ( E ) ≤ 1 b. Réciproque Si q ( Ω ) = 1 , ( q − 1) S est toujours nul donc aucun Dutch Book n’est possible. Si 0 ≤ q ( E ) ≤ 1 , ( q − 1) S et qS ne sont jamais de même signe donc aucun Dutch Book n’est possible. 2) Axiome 2 a. Cohérence -> axiome 2 Si l’évènement Ei se produit, A gagne q1S1 + q2 S2 + ... + qn Sn − Si Si S1 = S2 = ... = S n = S , si l’évènement Ei se produit, A gagne ( q1 + q2 + ... + qn − 1) S Coefficients de B q1 + q2 + ... + qn < 1 Choix de A permettant le Dutch Book S <0 q1 + q2 + ... + qn > 1 S >0 Donc B doit choisir q1 + q2 + ... + qn = 1 b. Réciproque Si l’évènement Ei se produit, A gagne Gi = q1S1 + q2 S2 + ... + qn S n − Si En utilisant q1 + q2 + ... + qn = 1 , on montre que q1G1 + q2G2 + ... + qnGn = 0 Or l’un au moins des qi est strictement plus grand que zéro, et donc tous les Gi ne sont pas positifs (sinon on aurait q1G1 + q2G2 + ... + qnGn > 0 ). Ainsi, aucun Dutch Book n’est possible et les coefficients sont cohérents. 3. Axiome 3 a. Cohérence -> axiome 3 Notons : q = q(E ∧ F ) q' = q(E | F ) 2 L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004 q '' = q ( F ) Si A choisit les mises S, S’ et S’’ sur les événements E ∧ F , E | F et F , alors les gains de A sont les suivants : si E et F se produisent : G1 = ( q − 1) S + ( q '− 1) S '+ ( q ''− 1) S '' Si E ne se produit pas et F se produit : G2 = qS + q ' S '+ ( q ''− 1) S '' Si ni E, ni F ne se produisent : G3 = qS + 0 + q '' S '' Montrons que la cohérence implique l’axiome 3 : Si A choisit S=1, S’=-1, S’’=-q’, alors : G1 = G2 = G3 = q − q ' q '' Donc pour que tous les gains ne soient pas positifs, B doit choisir q ≤ q ' q '' Si A choisit S=-1, S’=1, S’’=q’, alors : G1 = G2 = G3 = q ' q ''− q Donc pour que tous les gains ne soient pas positifs, B doit choisir q ≥ q ' q '' Donc pour être cohérent B doit choisir : q = q ' q '' b. Réciproque On montre que si q = q ' q '' , alors : q ' q '' G1 + (1 − q ' ) q '' G2 + (1 − q '' ) G3 = 0 Or : - si q '' ≠ 1 , alors 1 − q '' ≠ 0 - si q '' = 1 , alors soit q ' q '' , soit (1 − q ') q '' est différent de zéro Dans tous les cas, l’un au moins des coefficients devant les Gi est non nul. Par conséquent, tous les Gi ne peuvent pas être tous positifs (sinon on aurait q ' q '' G1 + (1 − q ' ) q '' G2 + (1 − q '' ) G3 > 0 ), et donc les coefficients de B sont cohérents. La question de l’additivité dénombrable “[The assumption of countable additivity] is the one most commonly accepted at present ; it had, if not its origin, its systematisation in Kolmogorov’s axioms (1933). Its success owes much to the mathematical convenience of making the calculus of probability merely a translation of modern measure theory... No-one has given a real justification of countable additivity (other than it as a ‘natural extension’ of finite additivity).” (de Finetti 1974, vol. 1, p.119) 2’. (axiome d’additivité dénombrable) Si les ( Ei )0≤i <+∞ (autrement dit, {E1, E2, E3, ..., En, ...}) sont des évènements exclusifs (i.e. qui ne peuvent se produire simultanément) et exhaustifs (i.e. que au moins l’un d’entre eux doit se produire), alors la +∞ série ∑ P ( Ei ) (autrement dit, P ( E1 ) + P ( E2 ) + ... + P ( En ) + ... ) converge et vaut 1. i =1 Lignes directrices de la preuve (Williamson 1999) Supposition : seule une somme finie d’argent peut être échangée. 3 L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004 Alors dans une situation comme celle rencontrée dans la démonstration de l’axiome 2, tous les gains Gi sont finis ; autrement dit, pour tout i, − qi Si + q1S1 + q2 S2 + ... + qn Sn + ... converge ; et donc la série q1S1 + q2 S 2 + ... + qn Sn + ... converge. Par ailleurs, d’après l’axiome 1, la série la série q1 + q2 + ... + qn + ... est croissante et majorée par 1, donc elle converge. Les quantités q1S1 + q2 S 2 + ... + qn Sn + ... et q1 + q2 + ... + qn + ... étant bien définies, on peut adapter la démonstration de l’axiome 2 pour démontrer l’axiome 2’. Apparence de probabilités objectives Situation de départ Nous disposons d’une pièce biaisée, et voulons évaluer ce déséquilibre. Nous la lançons n fois, et considérons la séquence de résultats (notée A) suivante : E1 , E2 , ..., En (chaque Ei valant Pi ou Fi selon que le résultat est pile ou face), dans laquelle le résultat « face » apparaît r fois. Quel est mon degré de croyance en Fn+1 ? La position de De Finetti sur la modification de nos probabilités « [...] quelle que soit l’influence de l’observation sur la prévision future, elle n’implique et ne signifie nullement que nous corrigeons l’évaluation primitive de la probabilité P(En+1) qui a été démentie par l’expérience, en lui substituant une autre P*(En+1) qui est conforme à cette expérience et donc probablement plus voisine de la probabilité réelle ; au contraire, elle se manifeste seulement dans le sens que, lorsque l’expérience nous apprend le résultat A des n premières épreuves, notre jugement sera exprimé non plus par la probabilité P(En+1) mais par la probabilité P(En+1|A), à savoir celle que notre opinion initiale attribuait déjà à l’évènement En+1 considéré comme dépendant de l’éventualité A. Rien donc de cette opinion initiale n’est répudié ou corrigé : ce n’est pas la fonction P qui a été modifiée (et remplacée par une autre P*), mais bien l’argument En+1 qui a été remplacé par En+1 | A, et c’est précisément pour demeurer fidèles à l’opinion initiale (telle qu’elle se manifeste dans le choix de la fonction P) et cohérents dans notre jugement que nos prévisions varient lorsqu’un changement a lieu dans des circonstances connues. » (p.54-55) Calcul de P ( Fn +1 | A ) Cas général P ( Fn +1 ∧ A ) On a : P ( Fn +1 | A ) = P ( A) Hypothèse d’échangeabilité : B assigne le même quotient de probabilité à différentes séquences d’évènements si elles font apparaître le même nombre de fois « face » dans n lancers. Notation : ωnr : probabilité qu’il y aura r « face » dans n épreuves n ( n − 1) ... ( n − r + 1) n! = différentes manières dont r faces peuvent r !(n − r )! r ( r − 1) ...3.2.1 apparaître dans n lancers. Il y a Cnr = On en déduit d’après l’hypothèse d’échangeabilité : P ( A ) = ωnr Cnr et P ( Fn +1 ∧ A ) = ωnr++11 Cnr++11 4 L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004 Donc : P ( Fn +1 | A ) = Si on suppose r + 1 ωnr++11 n + 1 ωnr ωnr++11 r +1 →1 (supposition très raisonnable), alors : P ( Fn +1 | A ) ~ n →+∞ r n +1 ωn r n Cas particulier donc : P ( Fn +1 | A ) ~ Si on applique le principe d’indifférence, on a : ωn0 = ωn1 = ωn2 = ... = ωnn = Dans ce cas : P ( Fn +1 | A ) = r +1 (règle de succession de Laplace) n+2 1 n +1 Application au problème de l’induction L’histoire enregistrée remonte à 5000 ans (1.826.250 jours), le soleil a été vu se levant chaque jour ; alors la probabilité que le Soleil se lève demain est : P ( Fn +1 | A ) = 0.9999994 Problème (Popper) : si un jour le soleil ne se lève pas, alors on aura tout de même, pour le lendemain : P ( Fn +1 | A ) = 0.9999989 II Les probabilités subjectives et l’utilité Sauf mention contraire, les numéros de page dans ce chapitre revoient à Ramsey (1926). Critique de l’utilisation de l’argent pour définir les probabilités subjectives Critiques principales : - le pari peut avoir en lui-même une certaine valeur, indépendamment de l’argent misé (p.169) - l’utilité marginale de l’argent est décroissante (p.169) L’approche de Ramsey La démarche de Ramsey revient à dériver : - une fonction d’utilité à partir des préférences d’un agent, qui satisfont un certain ensemble d’axiomes (p.171) - une fonction de probabilité à partir de cette fonction d’utilité Si l’individu est indifférent entre « α avec certitude » et « β si p est vraie et γ si p est fausse »., alors on peut en définir la probabilité comme la grandeur satisfaisant à la relation suivante (où l’on note α la valeur du monde α, etc.) (p.172) : α = Pr ( p ) β + (1 − Pr( p) ) γ α = Pr ( p )( β − γ ) + γ α −γ Pr ( p ) = β −γ Exemple (p 168) : - α vaut r-f(d), l’avantage d’arriver à destination moins celui d’avoir parcouru d yards pour demander son chemin - β vaut r, l’avantage d’arriver à destination - γ vaut w, le désavantage de ne pas arriver à destination 5 L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004 Ramsey suppose que l’on a une fonction d’utilité U qui associe : - r à l’option « je suis sur le bon chemin » - w à l’option « je suis sur le mauvais chemin » - f(x) au fait d’avoir franchi x yards pour interroger quelqu’un Si je suis indifférent entre les deux options, à savoir : - je suis sur le bon chemin est j’ai franchi d (valeur r-f(d)) - soit je suis sur le bon chemin sans le savoir (valeur r) ; soit je suis sur le mauvais chemin sans le savoir (valeur w) Alors les deux utilités attendues sont égales : rP + w (1 − P ) = r − f ( d ) ( r − w) P = r − w − f ( d ) f (d ) P = 1− r−w Problème : l’ensemble d’axiomes que pose Ramsey est trop riche (il implique qu’à chaque nombre réel correspond un monde dont c’est la valeur). Mais dans le même esprit a été développé la théorie de la décision, qui part d’un ensemble d’axiomes moins riches. Théorie de la décision La théorie de la décision s’intéresse aux préférences des agents rationnels, et aux décisions prises sous incertitude. Selon l’état du monde, une même action aura différentes conséquences. L’agent a par ailleurs certaines préférences entre ses actions. exemple : j’ai déjà cassé cinq oeufs pour faire une omelette ; j’ai des doutes sur l’état de fraîcheur du sixième oeuf ; dois-je le mettre dans l’omelette ou le jeter ? S = {bon= « oeuf bon » ; mauvais= « oeuf mauvais »} A= {f= « mettre le sixième oeuf dans l’omelette » ; g= « ne pas le mettre »} C= {cinq= « omelette à 5 oeufs » ; six= « omelette à 6 oeufs » ; jeter= « je dois jeter l’omelette »} Une action f ∈ A est une fonction de S dans C : à chaque état du monde elle associe une conséquence possible Ici : f(bon) = six f(mauvais) = jeter g(bon) = cinq g(mauvais) = cinq Théorème de l’utilité attendue (Savage) Les préférences d’un agent qui respectent un certain ensemble d’axiomes déterminent une unique fonction de probabilité P sur les états du monde et une fonction d’utilité U unique à une constante additive et une constante multiplicative près, telle que les préférences sont complètement représentées par la règle de l’utilité attendue. Règle de l’utilité attendue P est une fonction qui à chaque état du monde associe un nombre réel. U est une fonction qui à chaque conséquence associe un nombre réel. 6 L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004 Pour toutes actions f et g, f est préférée à g ssi EU ( g ) < EU ( f ) où EU(f) est l’utilité attendue de f, définie comme EU ( f ) = ∑ P ( S ) U ( f ( S ) ) S exemple : Les fonctions d’utilité telle que U(jeter)=0, U(cinq)=1.9, U(six)=2 et de probabilité telle que P(bon)=2/3 et P(mauvais)=1/3, impliquent que : 2 1 2 1 EU ( f ) = × 2 + × 0 = 1.333... et EU ( f ) = × 1.9 + × 1.9 = 1.9 3 3 3 3 Elles rationalisent mon comportement si je préfère ne pas mettre l’oeuf dans l’omelette plutôt que le mettre. Bibliographie De Finetti, B. (1937), “La Prévision: Ses Lois Logiques, Ses Sources Subjectives”, Annales de l”Institut Henri Poincaré 7, p. 1-68 De Finetti, B., (1974), Theory of probability, vols 1 et 2, Wiley, 1974 Gilies, D., (2000), Philosophical theories of probability, Routledge Hájek, A., "Interpretations of Probability", The Stanford Encyclopedia of Philosophy (Summer 2003 Edition), Edward N. Zalta (ed.) URL = <http://plato.stanford.edu/archives/sum2003/entries/probability-interpret/> Ramsey, F. P. (1926), “Truth and Probability”, in Foundations of Mathematics and other Essays, R. B. Braithwaite (ed.), Routledge & P. Kegan , 1931, p. 156-198; Trad. fr. par A. Voizard in Logique, Philosophie et probabilités, Vrin, 2003 Savage, L. J. (1954), The Foundations of Statistics, John Wiley von Neumann, J. et Morgenstern, O. (1944), Theory of Games and Economic Behavior, Princeton University Press Williamson, J.O.D. (1999) « Countable Additivity and Subjective Probability », British Journal for the Philosophy of Science 50, p.401-416 7