1
Quelques paris sur les plus longues suites de succès consécutifs (épreuves de Bernoulli)
JF Kentzel - Lycée Pardailhan à Auch (32) - jkentzel@ac-toulouse.fr
Remerciements à Anne Bauval (Université de Toulouse 3)
Sans son aide, je n’aurais pas rencontré les résultats qui suivent.
Soit
n
un entier valant au moins 1. On réalise
n
expériences de Bernoulli identiques et indépendantes
dont les issues sont désignées par succès, noté 1, de probabilité
p
,
10 p
, et échec, noté 0.
On désigne par
)(p
n
L
la variable aléatoire : « longueur de « la » plus longue suite de succès
consécutifs obtenue à l’issue de la
n
ième expérience ». Exemple : avec 0101110100,
3
)(
10
p
L
.
Résumé
La loi de
)(p
n
L
est bien connue pour les petites valeurs de
n
(formules de récurrence et même
formules explicites mais donnant lieu à des calculs impraticables quand
n
grandit) et pour les grandes
valeurs de
n
(formules asymptotiques). On propose une unique formule permettant, pour tout
2/1p
et pour tout
n
assez grand, de parier sur la valeur de
)(p
n
L
avec une probabilité de
gagner assez importante.
La démarche suivie montre qu’on ne peut pas trouver de meilleur pari sur la valeur de
)(p
n
L
, au sens où, pour tout
2/1p
, aucun meilleur minorant, indépendant de
n
, du maximum sur
des
 
kLP p
n
)(
ne peut être donné.
Pour certains énoncés on se limite au cas
2/1p
, bien que le cas inverse ne soit pas fondamentalement différent, pour
deux raisons : les calculs sont facilités (voir la preuve du lemme) et on obtient des probabilités plus grandes donc plus
étonnantes. Toutes les affirmations contenues dans ce texte sont justifiées en détails sur le site [1] où on trouve aussi divers
compléments. Toutes sont compréhensibles par un élève, théorique !, de Terminale, à l’exception de certaines données au
paragraphe 1 qui est un survol historique informel et indépendant du reste.
Le paramètre
p
est parfois omis quand il n’y a pas de confusion possible.
1 ) DEUX FORMULES CLASSIQUES
L’étude de cette variable aléatoire
)(p
n
L
est si naturelle qu’elle a débuté avec A de Moivre en 1738. Les formules (1) et (2)
qui suivent sont connues depuis longtemps et justifiées correctement depuis au moins 1944 (résultat de V Goncharov).
a ) Représentation fondamentale : Soit
n
un entier fixé, assez grand...
En désignant par
r
S
l’événement : succès lors de la
ème
r
épreuve, une suite de
n
épreuves peut être
représentée sous la forme :
............................................................................... 321 N
SSSS
N
llllongueurllongueur 321
où les points représentent des succès et la variable aléatoire
 
nNN
est le nombre d’échecs.
La loi de
)(p
n
L
est alors proche de celle de
 
i
l
Ni
Max
1
.
Les longueurs
i
l
sont des variables aléatoires indépendantes (valant éventuellement 0) et vérifient
évidemment pour tout entier
x
,
nx 0
:
 
x
ipxlP
.
(elles suivent approximativement une loi géométrique; ce n’est qu’approximatif car
 
0nlP i
)
b ) Approximation exponentielle de
)(p
n
L
Puisque les
i
l
sont indépendantes, on a
 
 
N
x
Nin pxlPxlPxlPxl
Ni
PxLP
1......)
1
()( 21
donc
 
)1(.exp1)( x
N
x
npLnNpxLP
.
 
nN
suit la loi binomiale
 
pnB 1;
donc
 
)1( pnNE
, autrement dit
)1( pnN
.
Par ailleurs si
x
est assez grand,
x
p
est assez petit et
xx ppLn )1(
(
1)( AALn
si
1A
)
On a donc :
 
kLP p
n
)(
)1( ppn k
e
(1)
2
Cette approximation sera partiellement précisée puis utilisée au paragraphe 2.
On obtient des approximations plus précises de
 
kLP p
n
)(
avec la méthode dite de Stein-Chen (approximation sous
certaines conditions de la loi d’une somme de variables de Bernoulli éventuellement dépendantes par une loi de Poisson -
1975) mais il semble que leur forme est trop compliquée pour être utilisée comme dans la démarche qui va suivre.
c ) Valeur la plus probable de
)(p
n
L
On vient de voir que la proportion des nombres
i
l
vérifiant
xli
est environ
x
p
. Il y a donc environ
)( x
pN
suites de succès de longueur au moins
x
. Il est « raisonnable » d’estimer que la longueur
maximale
)(p
n
L
vaut
x
quand ce nombre
x
pN
vaut environ 1 :
 
   
pLnpnLnx
pLn
NLn
xpLnNLnpN xx /1/10)(1
.
On pose
 
pLnpnLnpn /1/1;
. (2)
C’est une valeur approchée de la valeur la plus probable de
)(p
n
L
.
On obtient une valeur
« assez proche » de
en dérivant par rapport à
k
l'expression
 
kLP p
n
)(
issue de (1).
Par ailleurs quand on utilise (1) avec
k
valant
ou
pour obtenir une valeur du maximum sur
des
 
kLP p
n
)(
on
obtient des valeurs aberrantes car trop grandes; en effet
)(p
n
L
prend des valeurs entières contrairement à
et
.
d ) Commentaires
L Gordon, M F Schilling et M S Waterman donnent dans [2] les approximations suivantes (1986) :
 
)(p
n
LE
 
npLn p
2/1)/1(/
577,0
est la constante d’Euler.
Cette approximation est assez précise,
 
n
p
tend vers 0 quand
n
et, par exemple,
 
4
2/1 10
n
pour tout
n
.
)()(12/1)/1(6/)( 22)( nnrpLnLVar p
n
00006,0)( nr
et
0)( n
quand
n
.
On voit que cette variance ne dépend que très peu de
n
et que l’écart-type
2
1
)( ))(( p
n
LVar
est majoré pour tout
2/1p
par
2
1
)
2
1
())(( n
LVar
qui vaut environ
873,1)12/1)2(6/( 2
1
22 Ln
.
Dans ce qui suit on va améliorer le nombre
de l’approximation (2) pour proposer de meilleurs paris
sur
)(p
n
L
. Les résultats de Schilling,
 
)(p
n
LE
et
)( )(p
n
LVar
« assez petite », montrent d’une part
qu’une telle amélioration ne peut être que modeste (en effet elle le sera, voir la remarque 7) et d’autre
part que l’obtention de probabilités assez grandes n’a rien d’étonnant.
2 ) UN LEMME D’APPROXIMATION
a ) formule de récurrence donnant
 
kLP p
n
)(
La formule donnée ici est plus simple que la plus couramment utilisée.
Le cas particulier simple
 
0
)(
p
n
LP
est à part :
 
np
npLP )1(0
)(
. On suppose
k
fixé,
1k
.
On considère la suite d’indice
n
dont le terme général est
)( )( kLP p
n
.
Elle est définie par ses
)1( k
valeurs initiales :
si
11 kn
,
0)( )( kLP p
n
(cas évidemment exclu si
1k
) ;
kp
kpkLP )( )(
;
)( )( 1kLP p
k
1
)1(2
kk ppp
;
et par la relation de récurrence valable si
2kn
:
)( )( kLP p
n
)( )( 1kLP p
n
k
pp)1(
))(1( )( 1kLP pkn
.
3
Preuve de cette relation : soit on avait déjà une suite de
k
succès consécutifs à l’issue de la
)1( n
ème
expérience, soit une telle suite apparaît pour la première fois à la
n
ème expérience sous la forme
(
""
..............
RIEN
foisk
11...111110
).
(où « rien » signifie pas de suite de
k
succès consécutifs, , c'est-à-dire
 
kL kn
1
)
On a représenté ci-contre les suites
501
)( ))((
n
p
nkLP
pour
k
entre
1 et 9 dans le cas
2/1p
. Ces suites sont (strictement) croissantes et
convergent vers 1.
La ligne qui suit montre que l’allure des courbes de la figure 2 donnée
plus loin n’est pas étonnante. FIGURE 1
Si
1k
, {
1
)( kL p
n
}
{
kL p
n
)(
} donc
 
kLP p
n
)(
=
)( )( kLP p
n
)1( )( kLP p
n
.
Pour préciser la formule d’approximation (1) on utilise ensuite la suite d’indice
n
dont le terme
général est
 
)( )( kLP p
n
)(1 )( kLP p
n
.
b ) Enoncé du lemme (donné par Anne Bauval)
LEMME : Si
p
est un réel fixé dans l’intervalle
2
1
;0
et si
k
est fixé et vaut au moins 2,
l’inégalité qui suit, désignée par
 
)();(kp
n
I
 
)(k
n
I
, est vraie pour tout
n
vérifiant
kn
.
 
)1()1()( 2)1(3 ppn
k
ppnp
n
kk e
pkp
ekLP
 
)(k
n
I
Indications sur la preuve de ce lemme : cette preuve est trop longue et calculatoire pour figurer ici.
On procède par récurrence sur
n
, l’initialisation étant :
 
 
n
k
nII
)(
est vraie pour tout entier
n
tel que
knk 2
.
On pose
)()( kp
n
q
n
k
nqq )(
 
)( )( kLP p
n
. La relation de récurrence vérifiée par la suite
n
p
nkLP ))(( )(
donne la relation suivante pour la suite
 
n
q
, valable elle aussi pour
2kn
:
11 )1( kn
k
nn qppqq
. On la désigne par ( * ).
On peut donc, avec les
)1( k
valeurs initiales de
 
n
q
, calculer
 
kLPq nn
pour tout entier
n
tel
que
knk 2
et traiter l’initialisation de la récurrence.
On passe du rang
1n
au rang
n
en utilisant les inégalités
 
)( 1
k
n
I
et
 
)( 1
kkn
I
, la relation ( * ) et
l’encadrement élémentaire
2/11 2
xxex x
valable pour tout
0x
.
Voir le site [1] : deux pages de calculs très détaillées.
Pour
2/1p
il faudrait considérer des valeurs de
k
un peu plus grandes.
Notation : Soit
1k
un entier. Soit
:
;kkp dd
   
kk ppxppx eex
11 1
( pour
0x
).
Remarque 1 : L’allure de l’inégalité
 
)(k
n
I
montre qu’elle ne peut avoir d’intérêt que dans un cadre
très restreint. On va donc préciser dans quel cadre (en terme de relations entre
p
,
k
et
n
) on peut
considérer grâce au lemme que
 
nd kp ;
est une valeur approchée de
 
kLP p
n
)(
.
3 ) ETUDE DES FONCTIONS
k
d
On résume d’abord la démarche d’approximation qui va être utilisée :
4
On a vu que pour tous
k
et
p
fixés on peut facilement, grâce à
une formule de récurrence,
calculer
 
kLP p
n
)(
pour tout
n
.
Considérons pour ce résumé
l’exemple
4,0p
.
Par exemple, pour
k
entre 1 et 6 et
n
entre 1 et 200, on obtient à
l’aide d’un tableur ce dessin :
FIGURE 2
0
0,1
0,2
0,3
0,4
0,5
0,6
1
21
41
61
81
101
121
141
161
181
201
Le cas particulier simple
0k
est traité à part.
Pour les mêmes valeurs de
k
et
n
que
ci-dessus, on obtient pour les
fonctions
4,0;kk dd
les six courbes
ci-contre (appelées « arches »).
On verra que
)(ndk
est une (bonne)
approximation de
)( kLP n
dans un
cadre précis (
k
donc
n
») assez
grand et
1
kk xnx
).
FIGURE 3
Remarque 2 On va définir et calculer les nombres
M
,
k
x
et
m
visibles sur la figure 3. Une
explication de ce qui suit est que sur cette figure 3, on passe d’une courbe à une autre par une
affinité. En effet, on a bien pour tout
x
:
 
pxdxd kpkp ;1; )(
.
§ En dérivant
kp
d;
on obtient : toutes les fonctions
kp
d;
ont le sens de variations observé sur la
figure 3 et le maximum de
kp
d;
k
d
vaut
)(
1
1
)(
1
2)
)1( )/1(
(pLn
p
pLn
p
p
k
kee
pp pLn
d
pp
ppp 11
1
.
Ce maximum, qui n’est pas essentiel dans ce qui suit, est noté
M
ou
p
M
(voir la figure 5 plus loin).
§ On détermine l’abscisse des points A, B…de la figure 3 :
Si
2k
,
)(xdk
)(
1xdk
s’écrit
   
kk ppxppx ee
11 1
=
   
1
11
kk ppxppx ee
. (3)
(3) équivaut à :
12
)1(
k
ppx
eY
et
012
1
YY p
. (4)
L’étude de la fonction
p
f
définie par
12: 1
xxxf p
p
montre que (4) a deux solutions réelles
(distinctes car
10 p
) dont l’une est 1. Désignons l’autre par
p
y
. Il est clair que
1
p
y
.
Notation : on obtient facilement l’unique solution non nulle de (3) :
kp
x;
12
)1(
)(
k
p
kpp
yLn
x
.
Remarque 3 : On a la valeur exacte de
p
y
si
p
vaut
2/1
ou
3/1
. Par ailleurs
p
p
yp 1
2/1
et la
fonction définie sur
 
1;0
par
p
yp
est décroissante et vérifie

)(lim
0p
py
et
1)(lim
1
p
py
.
Notation : on pose
1;p
x
2
)1(
)(
p
yLn p
pour rendre valide le calcul qui suit si
1k
.
5
§ On détermine l’ordonnée des points A, B…de la figure 3 :
On prouve facilement que pour tous
p
et
k
,
1k
,
)( ;kpk xd
)( 1;
kpk xd
. Ce nombre vaut :
1
1
11 )(
)(.
1
;; )(
ppp
p
yLn
yLn
p
p
kpkp yyeexd
.
Ce nombre indépendant de
k
est noté m sur la figure ci-contre et
m
ou
p
m
dans tout ce qui suit :
1
1
1p
p
p
p
pp yym
. FIGURE 4
Voir ci-contre quelques points
);( p
mp
dont les points-limite D et E.
On a aussi tracé en pointillés quelques points
);( p
Mp
.
p
m
va être la probabilité minimum de gagner un pari sur
n
L
.
(et, accessoirement,
p
M
en sera la probabilité maximum)
FIGURE 5
4 ) PRINCIPE DES PARIS SUR LA VALEUR DE
)( p
n
L
(pour
n
supposé assez grand)
Ce principe est simple : pour chaque
n
, on parie sur le
k
de « la courbe
k
d
la plus haute »
kkp
x)( ;
est une suite géométrique de raison
p/1
donc tout entier
n
vérifiant
11; xxn p
(si
1
xn
, voir la remarque 5) est dans
un intervalle du type
 
1
;kk xx
pour une valeur de
k
qu’on peut
facilement calculer en fonction de
n
.
On appellera
00 );( knpk
cette valeur de
k
.
On pariera que
0
)( kL p
n
. Sur
 
1
;kk xx
,
k
d
est minorée par
m
cependant que
)(ndk
)( )( kLP p
n
. FIGURE 4
On a une idée de la qualité de cette approximation si
2k
grâce au lemme :
en ajoutant
 
)();(kp
n
I
et
 
)1();(kp
n
I
vues au lemme, on obtient la majoration de
 
 
 
)(ndkLP p
k
p
n
par
   
 
 
 
kk ppn
k
ppn
k
ke
ppk
e
ppk
nf
1
1
12
113
2
13
qui est une fonction croissante de
n
.
Pour
n
donné, on ne s’intéresse qu’au maximum sur
k
des
)( )( kLP p
n
donc pour chaque valeur de
k
on n’utilisera le lemme que dans le cas où
1
kk xnx
. On obtiendra donc
 
 
 
 
1
)(
kk
p
k
p
nxfndkLP
avec
 
].)1(3.3)[1(
2
111
1
1p
p
p
p
p
k
kk ypkykppxf
, nombre désigné ensuite par
kp
A;
. Voir la figure 7.
On peut constater avec un tableur (voir [1] ) que l’erreur
 
 
 
)(ndkLP p
k
p
n
est faible même si
n
est extérieur à
];[ 1kk xx
(mais on n’en aura pas besoin cependant que le lemme ne le prouve pas).
RESULTAT :
Soit
p
dans
2
1
;0
. Soit
p
y
la racine réelle autre que 1 de l’équation
012
1
yyp
.
Soit
1
1
1p
p
p
p
pp yym
. Alors pour tout
0
, on peut calculer un entier
;p
N
tel que :
1 / 7 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!