PUC-SP

publicité
Émergence du calcul des
probabilités (II)
De l’espérance pascalienne
à la théorie laplacienne
3 - Fondateurs et développeurs
Jacques Bernoulli : l’approche fréquentiste
Abraham de Moivre : la doctrine des chances
Georges Louis Leclerc, comte de Buffon :
probabilités géométriques
Jean Le Rond D’Alembert : probabilités,
mathématiques et réalité ?
Marie-Jean Antoine Caritat, marquis de
Condorcet : didactique et vulgarisation
Jacques Bernoulli
(1654-1705)
Ars Conjectandi, 1713
Jean Bernoulli
1667-1748
Daniel Bernoulli
1700-1782
La famille Bernoulli
Jacques Bernoulli déterministe:
“ Tout ce qui bénéficie sous le soleil de l'être ou du devenir,
passé, présent ou futur, possède toujours en soi et objectivement
une certitude totale.
C'est évident du présent et du passé, ce qui est ou a été ne peut
pas ne pas être ou avoir été.
Sur le futur il n'y a pas à discuter ; cependant ce n'est pas par la
nécessité de quelque destin qu'il ne peut pas ne pas advenir, mais
en raison soit de la prescience soit de la prédétermination divine ;
car si n’arrivait pas avec certitude tout ce qui est futur, on ne voit
pas comment le Créateur suprême pourrait conserver entière la
gloire de son omniscience et de son omnipotence.
Quant à dire comment cette certitude de l'avenir peut subsister
avec la contingence ou la liberté des causes secondes, que d'autres
en disputent ; pour nous, nous ne voulons pas toucher aux points
étrangers au but que nous visons. ”
Ars Conjectandi, quatrième partie, chapitre I
Quatrième partie (1689): De l’usage et
l’application de la doctrine précédente
aux affaires civiles, morales et
économiques
Chapitre I : Préliminaires : la certitude,
la probabilité, la nécessité, la
contingence.
« la probabilité est un degré de la
certitude et en diffère comme la partie
diffère du tout ».
Chapitre II : Science et conjecture. L’art
de conjecturer. Les arguments des
conjectures. Axiomes généraux touchant
ces points.
« Conjecturer quelque chose, c’est
mesurer sa probabilité : ainsi l’art de
conjecturer ou la stochastique se définit
pour nous comme l’art de mesurer aussi
exactement que possible les probabilités
des choses… ».
Chapitre III : Les divers espèces d’arguments, et comment estimer leur poids pour
supputer les probabilités.
« Posons que le nombre des cas, dans lesquels un argument quelconque peut exister est
b ; le nombre de ceux dans lesquels il peut arriver qu’il n’existe pas est c, (…). Or je pose
que tous les cas sont également possibles, ou qu’ils peuvent survenir avec une
b
égale facilité ; (…) en sorte qu’un tel argument prouve
bc
certitude de la chose ».
de la chose ou de la
Chapitre IV : La double manière de chercher les nombres de cas. Ce qu’il faut penser de
celui qui est établi par des expériences.
 selon les règles des conjectures sur
« On en est ainsi venu à ce point que pour former
n’importe quelle chose, il est seulement requis d’une part que les nombres de cas soient
soigneusement déterminés, et d’autre part que soit défini combien les uns peuvent
arriver plus facilement que les autres ».
« Mais c’est ici enfin que surgit une difficulté, nous semble-t-il : cela peut se voir à peine
dans quelques très rares cas et ne se produit presque pas en dehors des jeux de hasard
que leurs premiers inventeurs ont pris soin d’organiser en vue de se ménager l’équité.
(…) Mais qui donc parmi les mortels définira par exemple le nombre de maladies, (…)
qui encore recensera les cas innombrables des changements auxquels l’air est soumis
chaque jour. (…) Il serait donc absolument d’un insensé de vouloir connaître quelque
chose de cette matière ».
Réponse : l’approche fréquentiste
(…) « Mais à la vérité ici s’offre à nous un autre chemin pour
obtenir ce que nous cherchons. »
« Ce qu’il n’est pas donné d’obtenir a priori l’est du moins a
posteriori, c’est-à-dire qu’il sera possible de l’extraire en
observant l’issue de nombreux exemples semblables, car on doit
présumer que, par la suite, chaque fait peut arriver et ne pas
arriver dans le même nombre de cas qu'il avait été constaté
auparavant, dans un état de choses semblables, qu'il arrivait ou
n'arrivait pas ».
Mais il reste à démontrer que la fréquence observée d’un
événement « issu de nombreux exemples semblables » est aussi
proche que l’on veut de la probabilité de cet événement, supposé
réalisé par une multitude de cas équiprobables inaccessibles.
Théorème de Bernoulli :
D’une urne de Bernoulli contenant t boules dont r blanches (fertiles) et s noires (stériles),
on tire nt boules avec remises et on compte les boules blanches obtenues (schéma
binomial). Bernoulli formule ainsi son théorème:
« On peut concevoir des expériences en un nombre tel qu’il soit plus vraisemblable
d’autant de fois que l’on veut que le nombre des observations fertiles soit au nombre de
r 1
r 1
toutes les observations dans un rapport ni plus grand que
, ni plus petit que
».
t
t
Traduction moderne : Une même expérience aléatoire est répétée un nombre n de fois
suffisamment grand. On s’intéresse à la fréquence F des issues qui réalisent un
événement de probabilité p. On représente cette
binomial où
 situation par un schéma

l’on pose  = 1/t et p = r/t (il y a donc une hypothèse d’équiprobabilité quelque part).
Alors, il y a une probabilité aussi voisine de 1 que l’on veut (niveau de confiance 1–)
que la fréquence F des issues réalisant un événement donné soit plus proche que tout 
(précision de l’approximation) de la probabilité p de cet événement.
Cette fréquence observée F peut donc être prise pour estimer cette probabilité p et cett
énoncé explicite la condition de confiance :
P(F –  < p < F + ) > 1– 
Abraham de Moivre (1667-1754)
The doctrine of chances, 1718
1.
La Probabilité d’un Événement est plus
ou moins grande suivant le nombre de
Chances par lesquelles il peut arriver,
rapporté au nombre total des Chances
par lesquelles il peut ou ne peut pas
arriver.
2. Ainsi, si on forme une Fraction dont le
Numérateur est le nombre de Chances
par lesquelles un Événement peut
arriver, et le Dénominateur le nombre
de toutes les Chances par lesquelles il
peut arriver ou ne pas arriver, cette
Fraction sera une véritable définition de
la probabilité que se produise cet
Événement.
De Moivre reprend le problème sur lequel Bernoulli avait désespérément « séché » de
1689 à 1705: d’une urne de Bernoulli contenant t boules dont a blanches et b noires,
on tire n boules avec remises. La fréquence Fn des boules blanches extraites « tend »
a
vers la probabilité p =
(théorème de Bernoulli, loi faible des grands nombres).
ab
L’énoncé précis qui découle directement de la formulation de Bernoulli est le suivant:
pour tout  > 0, P(|Fn–p| < )
1 quand n tend vers l’infini.
 contrôler l’écart |F –p| en fonction de n ? Autrement dit, Peut-on
Mais comment
n
limiter raisonnablement ce nombre n tout en minimisant à la fois cet écart et le risque
de se tromper en affirmant que |Fn–p| <  ? Pour cela il faut évaluer la probabilité
P(|Fn–p| < ) , donc connaître la loi de |Fn–p|!
n n
En approximant les coefficients binomiaux par la formule de Stirling : n !    2n
e 
de Moivre arrive à la courbe que l’on appellera « normale », mais considère son
résultat (qui prendra le nom de théorème de Moivre-Laplace, précurseur du théorème
limite-central) comme une approximation et non comme la densité
d’une loi continue.

Il l’insère dans les 2ème et 3ème éditions (1756) de la Doctrine des chances qui resta Le
Traité de calcul des probabilités jusqu’à la parution de la Théorie Analytique de
Laplace en 1812.
Soit X le nombre de boules blanches obtenues en n tirages de l’urne de Bernoulli. X ~ B(n,
p), E(X) = np et Var(X) = np(1–p). Soit Fn = X/n, E(Fn) = p et Var(Fn) = pq.
Les probabilités binomiales pk = P(X = k) proviennent du développement du binôme:
n  k nk
n n 
n
A(k)
n
k nk
=  p q
(a  b)    a b
  A(k ) , pk =
n
k 
(a  b)
k0 k 
k0
Comparons les résultats de Bernoulli et de de Moivre.


Bernoulli pose n = m(a+b) (sans inconvénient quand n est grand). On a np = ma.
Lemme 3 de Bernoulli: Quand k va de 0 à n, A(k) croit, passe par un maximum
 n  np nq
M =  a b
np
de rang np, puis décroît.
mam
 A(k)
Lemme 5 de Bernoulli: kmam 1 , ce qui s’interprète par: les probabilités
n

(a + b) n
n
n
1
P[(ma–m) ≤ X ≤ (ma+m)] = P[( –
) ≤ X– np ≤ (
) ] = P(|Fn–p| ≤
)
ab
ab
ab
tendent vers 1 quand n tend vers l’infini.




Résultats de Moivre, précurseur du théorème-limite central :
Corollaire 8.
“Le rapport que, dans une puissance infinie d'une binomiale, dénotée par n, le plus grand
a  b “.
2abn
quand n tend vers l’infini, ce qui
terme porte à la somme de tout le reste, sera justement exprimé par la fraction
ab
2nab
(a  b) n  M
entraîne que la probabilité binomiale maximale est équivalente à
Ce qui peut s’écrire :
M

1

2npq
“Corollaire 9.
Si, dans unepuissance infinie, quelque terme est distant du plus grand par l'intervalle l,
alors le logarithme hyperbolique du rapport que ce terme porte au plus grand sera exprimé

2
par la fraction  (a  b)  l 2 , pourvu que le rapport de l à n ne soit pas un rapport fini,
2abn
mais soit tel qu'il puisse être conçu [comme un rapport] entre tout nombre donné p et
sorte que l soit exprimable par p n ”.
n de

En reprenant
les notations précédentes, le corollaire 9 indique que si l’indice k vérifie

2 2
(a  b) l ,à condition que l/n tende vers 0, et soit identifiable

|k–np| = l, alors ln( A(k)
)
M
2nab
1 ( k np ) 2

1
à un rapport p/
, de sorte que l ~ p n : P(X = k) ~
e 2 npq si | k  np<| B.
n
2npq
npq
Téléchargement