I Les probabilités subjectives selon De Finetti

publicité
L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004
L’interprétation subjectiviste des
probabilités
Séminaire PhilSci, 27 novembre 2004
Adrien Barton
I Les probabilités subjectives selon De Finetti
Sauf mention contraire, les numéros de page dans ce chapitre revoient à De Finetti (1937)
Définition de la probabilité de E
« Supposons qu’un individu soit obligé d’évaluer le prix p pour lequel il serait disposé
d’échanger la possession d’une somme quelconque S (positive ou négative) subordonnée à
l’arrivée d’un évènement donné, E, avec la possession de la somme pS ; nous dirons par
définition que ce nombre p est la mesure du degré de probabilité attribué par l’individu
considéré à l’évènement E, ou, plus simplement, que p est la probabilité de E (selon l’individu
considéré ; cette précision pourra d’ailleurs être sous-entendue s’il n’y a pas d’ambiguïté) »
(p.6)
Protocole permettant à A de mesurer la probabilité p d’un individu B en un évènement E :
B choisit un nombre p, A choisit une mise S (positive ou négative).
B paye à A la somme pS.
Si E se produit, A paye à B la somme S.
Vocabulaire
Dutch book : Pari tel que A gagne quel que soit l’évènement qui se produit.
Ensemble de coefficients de pari cohérents : Ensemble de coefficients de pari tels que A ne
peut pas faire de Dutch Book à B.
Théorème de Ramsey-De Finetti
Définition : P ( E | F ) est défini comme le coefficient de pari que B choisirait pour E si l’on
convient le pari est annulé et les mises rendues si F ne se produit pas.
Notons Ω l’évènement certain.
Théorème
Un ensemble de coefficients de paris est cohérent
ssi
il respecte les trois axiomes de probabilités suivants :
1. 0 ≤ P ( E ) ≤ 1 pour tout E et P ( Ω ) = 1
2. (additivité) Si E1, E2, E3, ..., En sont des évènements exclusifs (i.e. qui ne peuvent se
produire simultanément) et exhaustifs (i.e. que au moins l’un d’entre eux doit se
produire), alors P ( E1 ) + P ( E2 ) + ... + P ( En ) = 1 (cf. p.7)
3. (loi de multiplication) Pour deux évènements E et F : P ( E ∧ F ) = P ( E | F ) P ( F )
(cf. p.14)
1
L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004
Preuve
1) Axiome 1
a. Cohérence -> axiome 1
Si l’évènement se produit, A gagne ( q − 1) S
Si l’évènement ne se produit pas, A gagne qS
Coefficients de B
q (Ω) < 1
Choix de A permettant le Dutch Book
SΩ < 0
q (Ω) > 1
SΩ > 0
Donc B doit choisir q ( Ω ) = 1
q(E) < 0
SE < 0
q(E) >1
SE > 0
Donc B doit choisir 0 ≤ q ( E ) ≤ 1
b. Réciproque
Si q ( Ω ) = 1 , ( q − 1) S est toujours nul donc aucun Dutch Book n’est possible.
Si 0 ≤ q ( E ) ≤ 1 , ( q − 1) S et qS ne sont jamais de même signe donc aucun Dutch Book n’est
possible.
2) Axiome 2
a. Cohérence -> axiome 2
Si l’évènement Ei se produit, A gagne q1S1 + q2 S2 + ... + qn Sn − Si
Si S1 = S2 = ... = S n = S , si l’évènement Ei se produit, A gagne ( q1 + q2 + ... + qn − 1) S
Coefficients de B
q1 + q2 + ... + qn < 1
Choix de A permettant le Dutch Book
S <0
q1 + q2 + ... + qn > 1
S >0
Donc B doit choisir q1 + q2 + ... + qn = 1
b. Réciproque
Si l’évènement Ei se produit, A gagne Gi = q1S1 + q2 S2 + ... + qn S n − Si
En utilisant q1 + q2 + ... + qn = 1 , on montre que q1G1 + q2G2 + ... + qnGn = 0
Or l’un au moins des qi est strictement plus grand que zéro, et donc tous les Gi ne sont pas
positifs (sinon on aurait q1G1 + q2G2 + ... + qnGn > 0 ).
Ainsi, aucun Dutch Book n’est possible et les coefficients sont cohérents.
3. Axiome 3
a. Cohérence -> axiome 3
Notons :
q = q(E ∧ F )
q' = q(E | F )
2
L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004
q '' = q ( F )
Si A choisit les mises S, S’ et S’’ sur les événements E ∧ F , E | F et F , alors les gains de A
sont les suivants :
si E et F se produisent :
G1 = ( q − 1) S + ( q '− 1) S '+ ( q ''− 1) S ''
Si E ne se produit pas et F se produit :
G2 = qS + q ' S '+ ( q ''− 1) S ''
Si ni E, ni F ne se produisent :
G3 = qS + 0 + q '' S ''
Montrons que la cohérence implique l’axiome 3 :
Si A choisit S=1, S’=-1, S’’=-q’, alors :
G1 = G2 = G3 = q − q ' q ''
Donc pour que tous les gains ne soient pas positifs, B doit choisir q ≤ q ' q ''
Si A choisit S=-1, S’=1, S’’=q’, alors :
G1 = G2 = G3 = q ' q ''− q
Donc pour que tous les gains ne soient pas positifs, B doit choisir q ≥ q ' q ''
Donc pour être cohérent B doit choisir : q = q ' q ''
b. Réciproque
On montre que si q = q ' q '' , alors :
q ' q '' G1 + (1 − q ' ) q '' G2 + (1 − q '' ) G3 = 0
Or :
- si q '' ≠ 1 , alors 1 − q '' ≠ 0
- si q '' = 1 , alors soit q ' q '' , soit (1 − q ') q '' est différent de zéro
Dans tous les cas, l’un au moins des coefficients devant les Gi est non nul.
Par conséquent, tous les Gi ne peuvent pas être tous positifs (sinon on aurait
q ' q '' G1 + (1 − q ' ) q '' G2 + (1 − q '' ) G3 > 0 ), et donc les coefficients de B sont cohérents.
La question de l’additivité dénombrable
“[The assumption of countable additivity] is the one most commonly accepted at present ; it
had, if not its origin, its systematisation in Kolmogorov’s axioms (1933). Its success owes
much to the mathematical convenience of making the calculus of probability merely a
translation of modern measure theory... No-one has given a real justification of countable
additivity (other than it as a ‘natural extension’ of finite additivity).” (de Finetti 1974, vol. 1,
p.119)
2’. (axiome d’additivité dénombrable) Si les ( Ei )0≤i <+∞ (autrement dit, {E1, E2, E3, ...,
En, ...}) sont des évènements exclusifs (i.e. qui ne peuvent se produire simultanément)
et exhaustifs (i.e. que au moins l’un d’entre eux doit se produire), alors la
+∞
série ∑ P ( Ei ) (autrement dit, P ( E1 ) + P ( E2 ) + ... + P ( En ) + ... ) converge et vaut 1.
i =1
Lignes directrices de la preuve (Williamson 1999)
Supposition : seule une somme finie d’argent peut être échangée.
3
L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004
Alors dans une situation comme celle rencontrée dans la démonstration de l’axiome 2, tous les
gains Gi sont finis ; autrement dit, pour tout i, − qi Si + q1S1 + q2 S2 + ... + qn Sn + ... converge ; et
donc la série q1S1 + q2 S 2 + ... + qn Sn + ... converge.
Par ailleurs, d’après l’axiome 1, la série la série q1 + q2 + ... + qn + ... est croissante et majorée
par 1, donc elle converge.
Les quantités q1S1 + q2 S 2 + ... + qn Sn + ... et q1 + q2 + ... + qn + ... étant bien définies, on peut
adapter la démonstration de l’axiome 2 pour démontrer l’axiome 2’.
Apparence de probabilités objectives
Situation de départ
Nous disposons d’une pièce biaisée, et voulons évaluer ce déséquilibre.
Nous la lançons n fois, et considérons la séquence de résultats (notée A) suivante : E1 , E2 , ...,
En (chaque Ei valant Pi ou Fi selon que le résultat est pile ou face), dans laquelle le résultat
« face » apparaît r fois. Quel est mon degré de croyance en Fn+1 ?
La position de De Finetti sur la modification de nos probabilités
« [...] quelle que soit l’influence de l’observation sur la prévision future, elle n’implique et ne
signifie nullement que nous corrigeons l’évaluation primitive de la probabilité P(En+1) qui a
été démentie par l’expérience, en lui substituant une autre P*(En+1) qui est conforme à cette
expérience et donc probablement plus voisine de la probabilité réelle ; au contraire, elle se
manifeste seulement dans le sens que, lorsque l’expérience nous apprend le résultat A des n
premières épreuves, notre jugement sera exprimé non plus par la probabilité P(En+1) mais par
la probabilité P(En+1|A), à savoir celle que notre opinion initiale attribuait déjà à l’évènement
En+1 considéré comme dépendant de l’éventualité A. Rien donc de cette opinion initiale n’est
répudié ou corrigé : ce n’est pas la fonction P qui a été modifiée (et remplacée par une autre
P*), mais bien l’argument En+1 qui a été remplacé par En+1 | A, et c’est précisément pour
demeurer fidèles à l’opinion initiale (telle qu’elle se manifeste dans le choix de la fonction P)
et cohérents dans notre jugement que nos prévisions varient lorsqu’un changement a lieu dans
des circonstances connues. » (p.54-55)
Calcul de P ( Fn +1 | A )
Cas général
P ( Fn +1 ∧ A )
On a : P ( Fn +1 | A ) =
P ( A)
Hypothèse d’échangeabilité : B assigne le même quotient de probabilité à différentes
séquences d’évènements si elles font apparaître le même nombre de fois « face » dans n
lancers.
Notation : ωnr : probabilité qu’il y aura r « face » dans n épreuves
n ( n − 1) ... ( n − r + 1)
n!
=
différentes manières dont r faces peuvent
r !(n − r )!
r ( r − 1) ...3.2.1
apparaître dans n lancers.
Il y a Cnr =
On en déduit d’après l’hypothèse d’échangeabilité : P ( A ) =
ωnr
Cnr
et P ( Fn +1 ∧ A ) =
ωnr++11
Cnr++11
4
L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004
Donc : P ( Fn +1 | A ) =
Si on suppose
r + 1 ωnr++11
n + 1 ωnr
ωnr++11
r +1

→1 (supposition très raisonnable), alors : P ( Fn +1 | A ) ~
n →+∞
r
n +1
ωn
r
n
Cas particulier
donc : P ( Fn +1 | A ) ~
Si on applique le principe d’indifférence, on a : ωn0 = ωn1 = ωn2 = ... = ωnn =
Dans ce cas : P ( Fn +1 | A ) =
r +1
(règle de succession de Laplace)
n+2
1
n +1
Application au problème de l’induction
L’histoire enregistrée remonte à 5000 ans (1.826.250 jours), le soleil a été vu se levant chaque
jour ; alors la probabilité que le Soleil se lève demain est : P ( Fn +1 | A ) = 0.9999994
Problème (Popper) : si un jour le soleil ne se lève pas, alors on aura tout de même, pour le
lendemain : P ( Fn +1 | A ) = 0.9999989
II Les probabilités subjectives et l’utilité
Sauf mention contraire, les numéros de page dans ce chapitre revoient à Ramsey (1926).
Critique de l’utilisation de l’argent pour définir les probabilités
subjectives
Critiques principales :
- le pari peut avoir en lui-même une certaine valeur, indépendamment de l’argent misé (p.169)
- l’utilité marginale de l’argent est décroissante (p.169)
L’approche de Ramsey
La démarche de Ramsey revient à dériver :
- une fonction d’utilité à partir des préférences d’un agent, qui satisfont un certain
ensemble d’axiomes (p.171)
- une fonction de probabilité à partir de cette fonction d’utilité
Si l’individu est indifférent entre « α avec certitude » et « β si p est vraie et γ si p est fausse ».,
alors on peut en définir la probabilité comme la grandeur satisfaisant à la relation suivante (où
l’on note α la valeur du monde α, etc.) (p.172) :
α = Pr ( p ) β + (1 − Pr( p) ) γ
α = Pr ( p )( β − γ ) + γ
α −γ
Pr ( p ) =
β −γ
Exemple (p 168) :
- α vaut r-f(d), l’avantage d’arriver à destination moins celui d’avoir parcouru d yards pour
demander son chemin
- β vaut r, l’avantage d’arriver à destination
- γ vaut w, le désavantage de ne pas arriver à destination
5
L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004
Ramsey suppose que l’on a une fonction d’utilité U qui associe :
- r à l’option « je suis sur le bon chemin »
- w à l’option « je suis sur le mauvais chemin »
- f(x) au fait d’avoir franchi x yards pour interroger quelqu’un
Si je suis indifférent entre les deux options, à savoir :
- je suis sur le bon chemin est j’ai franchi d (valeur r-f(d))
- soit je suis sur le bon chemin sans le savoir (valeur r) ; soit je suis sur le mauvais chemin
sans le savoir (valeur w)
Alors les deux utilités attendues sont égales :
rP + w (1 − P ) = r − f ( d )
( r − w) P = r − w − f ( d )
f (d )
P = 1−
r−w
Problème : l’ensemble d’axiomes que pose Ramsey est trop riche (il implique qu’à chaque
nombre réel correspond un monde dont c’est la valeur).
Mais dans le même esprit a été développé la théorie de la décision, qui part d’un ensemble
d’axiomes moins riches.
Théorie de la décision
La théorie de la décision s’intéresse aux préférences des agents rationnels, et aux décisions
prises sous incertitude.
Selon l’état du monde, une même action aura différentes conséquences. L’agent a par ailleurs
certaines préférences entre ses actions.
exemple : j’ai déjà cassé cinq oeufs pour faire une omelette ; j’ai des doutes sur l’état de
fraîcheur du sixième oeuf ; dois-je le mettre dans l’omelette ou le jeter ?
S = {bon= « oeuf bon » ; mauvais= « oeuf mauvais »}
A= {f= « mettre le sixième oeuf dans l’omelette » ; g= « ne pas le mettre »}
C= {cinq= « omelette à 5 oeufs » ; six= « omelette à 6 oeufs » ; jeter= « je dois jeter
l’omelette »}
Une action f ∈ A est une fonction de S dans C : à chaque état du monde elle associe une
conséquence possible
Ici :
f(bon) = six
f(mauvais) = jeter
g(bon) = cinq
g(mauvais) = cinq
Théorème de l’utilité attendue (Savage)
Les préférences d’un agent qui respectent un certain ensemble d’axiomes déterminent une
unique fonction de probabilité P sur les états du monde et une fonction d’utilité U unique à
une constante additive et une constante multiplicative près, telle que les préférences sont
complètement représentées par la règle de l’utilité attendue.
Règle de l’utilité attendue
P est une fonction qui à chaque état du monde associe un nombre réel.
U est une fonction qui à chaque conséquence associe un nombre réel.
6
L’interprétation subjectiviste des probabilités, séminaire PhilSci, 27 nov. 2004
Pour toutes actions f et g, f est préférée à g ssi EU ( g ) < EU ( f ) où EU(f) est l’utilité attendue
de f, définie comme EU ( f ) = ∑ P ( S ) U ( f ( S ) )
S
exemple :
Les fonctions d’utilité telle que U(jeter)=0, U(cinq)=1.9, U(six)=2 et de probabilité telle que
P(bon)=2/3 et P(mauvais)=1/3, impliquent que :
2
1
2
1
EU ( f ) = × 2 + × 0 = 1.333... et EU ( f ) = × 1.9 + × 1.9 = 1.9
3
3
3
3
Elles rationalisent mon comportement si je préfère ne pas mettre l’oeuf dans l’omelette plutôt
que le mettre.
Bibliographie
De Finetti, B. (1937), “La Prévision: Ses Lois Logiques, Ses Sources Subjectives”, Annales
de l”Institut Henri Poincaré 7, p. 1-68
De Finetti, B., (1974), Theory of probability, vols 1 et 2, Wiley, 1974
Gilies, D., (2000), Philosophical theories of probability, Routledge
Hájek, A., "Interpretations of Probability", The Stanford Encyclopedia of Philosophy
(Summer 2003 Edition), Edward N. Zalta (ed.)
URL = <http://plato.stanford.edu/archives/sum2003/entries/probability-interpret/>
Ramsey, F. P. (1926), “Truth and Probability”, in Foundations of Mathematics and other
Essays, R. B. Braithwaite (ed.), Routledge & P. Kegan , 1931, p. 156-198; Trad. fr.
par A. Voizard in Logique, Philosophie et probabilités, Vrin, 2003
Savage, L. J. (1954), The Foundations of Statistics, John Wiley
von Neumann, J. et Morgenstern, O. (1944), Theory of Games and Economic Behavior,
Princeton University Press
Williamson, J.O.D. (1999) « Countable Additivity and Subjective Probability », British
Journal for the Philosophy of Science 50, p.401-416
7
Téléchargement