1
Quelques paris sur les plus longues suites de succès consécutifs (épreuves de Bernoulli)
JF Kentzel - Lycée Pardailhan à Auch (32) - jkentzel@ac-toulouse.fr
Remerciements à Anne Bauval (Université de Toulouse 3)
Sans son aide, je n’aurais pas rencontré les résultats qui suivent.
Soit
n
un entier valant au moins 1. On réalise
n
expériences de Bernoulli identiques et indépendantes
dont les issues sont désignées par succès, noté 1, de probabilité
p
,
10 p
, et échec, noté 0.
On désigne par
)( p
n
L
la variable aléatoire : « longueur de « la » plus longue suite de succès
consécutifs obtenue à l’issue de la
n
ième expérience ». Exemple : avec 0101110100,
3
)(
10
p
L
.
Résumé
La loi de
)( p
n
L
est bien connue pour les petites valeurs de
n
(formules de récurrence et même formules explicites mais
donnant lieu à des calculs impraticables quand
n
grandit) et pour les grandes valeurs de
n
(formules asymptotiques). On
propose une unique formule permettant, pour tout
2/1p
et pour tout
n
assez grand, de parier sur la valeur de
)( p
n
L
;
c’est le résultat 1. On montre ensuite que pour trois valeurs de
p
(1/6, 1/3 et 1 /2), ce pari fonctionne pour presque toutes
les valeurs de
n
(une ou deux exceptions); c’est le sultat 2. La démarche suivie montre qu’on ne peut pas trouver de
meilleur résultat, au sens où, pour tout
2/1p
, aucun meilleur minorant, indépendant de
n
, du maximum sur
des
 
kLP p
n
)(
ne peut être donné.
Pour certains énoncés on se limite au cas
2/1p
, bien que le cas inverse ne soit pas fondamentalement différent, pour
deux raisons : les calculs sont facilités (voir la preuve du lemme) et on obtient des probabilités plus grandes (voir la figure
8) donc plus étonnantes. Toutes les affirmations contenues dans ce texte sont justifiées en détails sur le site [1] où on trouve
aussi divers compléments. Toutes sont compréhensibles par un élève, théorique !, de Terminale, à l’exception de certaines
données au paragraphe 1 qui est un survol historique informel et indépendant du reste.
Le paramètre
p
est parfois omis quand il n’y a pas de confusion possible.
1 ) DEUX FORMULES CLASSIQUES
L’étude de cette variable aléatoire
)( p
n
L
est si naturelle qu’elle a débuté avec A de Moivre en 1738. Les formules (1) et (2)
qui suivent sont connues depuis longtemps et justifiées correctement depuis au moins 1944 (résultat de V Goncharov).
a ) Représentation fondamentale : Soit
n
un entier fixé, assez grand...
En désignant par
r
S
l’événement : succès lors de la
ème
r
épreuve, une suite de
n
épreuves peut être
représentée sous la forme :
............................................................................... 321 N
SSSS
N
llllongueurllongueur 321
où les points représentent des succès et la variable aléatoire
 
nNN
est le nombre d’échecs.
La loi de
)( p
n
L
est alors proche de celle de
 
i
l
Ni
Max
1
.
Les longueurs
i
l
sont des variables aléatoires indépendantes (valant éventuellement 0) et vérifient
évidemment pour tout entier
x
,
nx 0
:
 
x
ipxlP
.
(elles suivent approximativement une loi géométrique; ce n’est qu’approximatif car
 
0nlP i
)
b ) Approximation exponentielle de
)( p
n
L
Puisque les
i
l
sont indépendantes, on a
 
 
N
x
Nin pxlPxlPxlPxl
Ni
PxLP
1......)
1
()( 21
donc
 
)1(.exp1)( x
N
x
npLnNpxLP
.
 
nN
suit la loi binomiale
 
pnB 1;
donc
 
)1( pnNE
, autrement dit
)1( pnN
.
Par ailleurs si
x
est assez grand,
x
p
est assez petit et
xx ppLn )1(
(
1)( AALn
si
1A
)
On a donc :
 
kLP p
n
)(
)1( ppn k
e
(1)
Cette approximation sera partiellement précisée puis utilisée au paragraphe 2.
2
On obtient des approximations plus précises de
 
kLP p
n
)(
avec la méthode dite de Stein-Chen (approximation sous
certaines conditions de la loi d’une somme de variables de Bernoulli éventuellement dépendantes par une loi de Poisson -
1975) mais il semble que leur forme est trop compliquée pour être utilisée comme dans la démarche qui va suivre.
c ) Valeur la plus probable de
)( p
n
L
On vient de voir que la proportion des nombres
i
l
vérifiant
xli
est environ
x
p
. Il y a donc environ
)( x
pN
suites de succès de longueur au moins
x
. Il est « raisonnable » d’estimer que la longueur
maximale
)( p
n
L
vaut
x
quand ce nombre
x
pN
vaut environ 1 :
 
   
pLnpnLnx
pLn
NLn
xpLnNLnpN xx /1/10)(1
.
On pose
 
pLnpnLnpn /1/1;
. (2)
C’est une valeur approchée de la valeur la plus probable de
)( p
n
L
.
On obtient une valeur
« assez proche » de
en dérivant par rapport à
l'expression
 
kLP p
n
)(
issue de (1).
Par ailleurs quand on utilise (1) avec
k
valant
ou
pour obtenir une valeur du maximum sur
k
des
 
kLP p
n
)(
on
obtient des valeurs aberrantes car trop grandes; en effet
)( p
n
L
prend des valeurs entières contrairement à
et
.
d ) Commentaires
L Gordon, M F Schilling et M S Waterman donnent dans [2] les approximations suivantes (1986) :
 
)( p
n
LE
 
npLn p
2/1)/1(/
577,0
est la constante d’Euler.
Cette approximation est assez précise,
 
n
p
tend vers 0 quand
n
et, par exemple,
 
4
2/1 10
n
pour tout
n
.
)()(12/1)/1(6/)( 22)( nnrpLnLVar p
n
00006,0)( nr
et
0)( n
quand
n
.
On voit que cette variance ne dépend que très peu de
n
et que l’écart-type
2
1
)( ))(( p
n
LVar
est majoré pour tout
2/1p
par
2
1
)
2
1
())(( n
LVar
qui vaut environ
873,1)12/1)2(6/( 2
1
22 Ln
.
Dans ce qui suit on va améliorer le nombre
de l’approximation (2) pour proposer de meilleurs paris
sur
)( p
n
L
. Les résultats de Schilling,
 
)( p
n
LE
et
)( )( p
n
LVar
« assez petite », montrent d’une part
qu’une telle amélioration ne peut être que modeste (en effet elle le sera, voir la remarque 7) et d’autre
part que l’obtention de probabilités assez grandes n’a rien d’étonnant.
1 ) FORMULE DE RECURRENCE DONNANT
 
kLP p
n
)(
La formule donnée ici est plus simple que la plus couramment utilisée.
Le cas particulier simple
 
0
)(
p
n
LP
est à part :
 
np
npLP )1(0
)(
. On suppose
1k
.
Pour tout entier
n
valant au moins 1, soit
)(k
n
s
)()( kp
n
s
la probabilité de l’événement {
kL p
n
)(
}.
)(k
n
s
est définie par ses
)1( k
valeurs initiales :
si
11 kn
,
0
)(
k
n
s
(cas évidemment exclu si
1k
) ;
kk
kps
)(
;
1)( 1)1(2
kkk
kppps
;
et par la relation de récurrence valable si
2kn
:
 
)( 1
)( 1
)( 1)1( kkn
kk
n
k
nsppss
, plus lisible
sous la forme
 
11 1)1( kn
k
nn sppss
.
Principe de la preuve de cette relation : soit on avait déjà une suite de
k
succès consécutifs à l’issue
de la
)1( n
ème expérience, soit une telle suite apparaît pour la première fois à la
n
ème expérience sous
la forme (
""
..............
RIEN
foisk
11...111110
).
(où « rien » signifie pas de suite de
k
succès consécutifs, , c'est-à-dire
 
kL kn
1
)
3
On a représenté ci-contre chacune des suites
501
)( )( n
k
n
s
pour
k
entre 1 et 9 dans le cas
2/1p
. Ces suites
n
k
n
s1
)( )(
sont
(strictement) croissantes et convergent vers 1.
La ligne qui suit montre que l’allure des courbes de la figure 2 donnée
plus loin n’est pas étonnante. FIGURE 1
Si
1k
,
 
kLP p
n
)(
)1()(
k
n
k
nss
car {
1
)( kL p
n
}
{
kL p
n
)(
}.(et
 
)1()( )1(0 n
np
nspLP
)
Pour simplifier les calculs on utilisera souvent la suite définie par
)()( kp
n
q
)()( 1k
n
k
nsq
.
Bien sûr,
)(k
n
q
)()( kp
n
q
 
)( )( kLP p
n
et si
1k
,
 
kLP p
n
)(
)()1( k
n
k
nqq
.
Cette formule de récurrence permet d’obtenir l’inégalité qui suit, donnée par Anne Bauval, qui
permettra de préciser la formule d’approximation (1).
2 ) UN LEMME D’APPROXIMATION Pour simplifier on pose
k
pphkph )1();(
.
LEMME : Si
p
est un réel fixé dans l’intervalle
2
1
;0
et si
k
est fixé et vaut au moins 2,
l’inégalité qui suit, désignée par
 
)();(kp
n
I
 
)(k
n
I
, est vraie pour tout
n
vérifiant
kn
.
hnhnkp
ne
kh
eq 2
3
)()(
 
)(k
n
I
La preuve de ce lemme est trop longue pour figurer ici. Voir le site [1] : deux pages de calculs très détaillées. Il « suffit »
de procéder par récurrence sur
n
, l’initialisation étant :
 
 
n
k
nII
)(
est vraie pour tout entier
n
tel que
knk 2
.
Pour
2/1p
il faudrait considérer des valeurs de
k
un peu plus grandes.
Notations : Soit
1k
un entier. Soit
:
;kkp dd
   
kk ppxppx eex
11 1
( pour tout réel
x
).
Remarque 1 :
 
)(k
n
I
n’a évidemment d’intérêt que si
kh
et
nh
sont très petits.
On rappelle que
 
kLP p
n
)(
)()1( k
n
k
nqq
. On va montrer dans quel cadre on peut considérer grâce au
lemme que
 
nd kp ;
est une valeur approchée de
 
kLP p
n
)(
.
3 ) ETUDE DES FONCTIONS
k
d
On résume d’abord la démarche d’approximation qui va être utilisée :
On a vu que pour tous
k
et
p
fixés on peut
facilement, grâce à une formule de récurrence,
calculer
 
kLP p
n
)(
pour tout
n
.
Considérons pour ce résumé l’exemple
4,0p
.
Par exemple, pour
k
entre 1 et 6 et
n
entre 1 et 200,
on obtient à l’aide d’un tableur ce dessin :
FIGURE 2
0
0,1
0,2
0,3
0,4
0,5
0,6
1
21
41
61
81
101
121
141
161
181
201
Le cas particulier simple
0k
est traité à part.
Pour les mêmes valeurs de
k
et
n
que ci-dessus, on
obtient pour
4,0;k
d
les six courbes ci-contre (appelées
« arches »).
On verra que
)(ndk
est une (bonne) approximation de
)( kLP n
dans un cadre précis (
k
donc
n
») assez
grand et
1
kk xnx
). FIGURE 3
4
Remarque 2 On va calculer les nombres
M
,
k
x
et
m
visibles sur la figure 3. Une explication de
ce qui suit est que sur cette figure 3, on passe d’une courbe à une autre par une affinité :
en effet, puisque pour tout
x
,
)(xdk
=
   
kk ppxppx ee
11 1
, on a bien
 
pxdxd kpkp ;1; )(
.
§ En dérivant
kp
d;
on obtient : toutes les fonctions
kp
d;
ont le sens de variations observé sur la
figure 3 et le maximum de
kp
d;
k
d
vaut
)(
1
1
)(
1
)
)1( )(
(pLn
p
pLn
p
p
kee
hp pLn
d
pp
ppp 1
1
1
.
Ce maximum, qui n’est pas essentiel dans ce qui suit, est noté
M
ou
p
M
(voir la figure 5 plus loin).
§ On détermine l’abscisse des points A, B…de la figure 3 :
Si
2k
,
)(xdk
)(
1xdk
s’écrit
hxhpx ee
=
pxhhx ee /
. (3)
(3) équivaut à :
 
12
)1(/1
k
ppxphpx eeY
et
012
1
YY p
. (4)
L’étude de la fonction
p
f
définie par
12: 1
xxxf p
p
montre que (4) a deux solutions réelles
(distinctes car
10 p
) dont l’une est 1. Désignons l’autre par
p
y
. Il est clair que
1
p
y
.
Notation : on obtient facilement l’unique solution non nulle de (3) :
kp
x;
12
)1(
)(
k
p
kpp
yLn
x
.
Remarque 3 : On a la valeur exacte de
p
y
si
p
vaut
2/1
ou
3/1
. Par ailleurs
p
p
yp 1
2/1
et la
fonction définie sur
 
1;0
par
p
yp
est décroissante et vérifie

)(lim0p
py
et
1)(lim1
p
py
.
Notation : on pose
1;p
x
2
)1(
)(
p
yLn p
pour rendre valide le calcul qui suit si
1k
.
1;p
x
sera important à la remarque 5.
§ On détermine l’ordonnée des points A, B…de la figure 3 :
On prouve facilement que pour tous
p
et
k
,
1k
,
)( ;kpk xd
)( 1;
kpk xd
. Ce nombre vaut :
1
1
11 )(
)(.
1
;; )(
ppp
p
yLn
yLn
p
p
kpkp yyeexd
.
Ce nombre indépendant de
k
est noté m sur la figure ci-contre et
m
ou
p
m
dans tout ce qui suit :
1
1
1p
p
p
p
pp yym
. FIGURE 4
Voir ci-contre quelques points
);( p
mp
dont les points-limite D et E.
On a aussi tracé en pointillés quelques points
);( p
Mp
.
p
m
va être la probabilité minimum de gagner un pari sur
n
L
.
(et, accessoirement,
p
M
en sera la probabilité maximum) FIGURE 5
Le dessin ci-dessous, une approximation des
)( )( kLP p
n
par
)(
;nd pk
pour
six valeurs de
p
,
41 k
et
2401n
, montre six valeurs de
p
m
.
5
FIGURE 6
4 ) PRINCIPE DES PARIS SUR LA VALEUR DE
)( p
n
L
(pour
n
supposé assez grand)
Ce principe est simple : pour chaque
n
, on parie sur le
k
de « la courbe
k
d
la plus haute »
kkp
x)( ;
est une suite géométrique de raison
p/1
donc tout entier
n
vérifiant
11; xxn p
(si
1
xn
, voir la remarque 5) est dans
un intervalle du type
 
1
;kk xx
pour une valeur de
k
qu’on peut
facilement calculer en fonction de
n
.
On appellera
00 );( knpk
cette valeur de
k
.
On pariera que
0
)( kL p
n
. Sur
 
1
;kk xx
,
k
d
est minorée par
m
cependant que
)(ndk
)( )( kLP p
n
. FIGURE 4
On a une idée de la qualité de cette approximation si
2k
grâce au lemme :
en ajoutant
 
)();(kp
n
I
et
 
)1();(kp
n
I
vues au lemme, on obtient la majoration de
 
 
 
)(ndkLP p
k
p
n
par
   
nhphn
ke
hpk
e
kh
nf 213
2
3
qui est une fonction croissante de
n
. Pour
n
donné, on ne
s’intéresse qu’au maximum sur
k
des
)( )( kLP p
n
donc pour chaque valeur de
k
on n’utilisera le
lemme que dans le cas où
1
kk xnx
. On obtiendra donc
 
 
 
 
1
)(
kk
p
k
p
nxfndkLP
avec
 
].)1(3.3)[1(
2
111
1
1p
p
p
p
p
k
kk ypkykppxf
, nombre désigné ensuite par
kp
A;
. Voir la figure 7.
On peut constater avec un tableur (voir [1] ) que l’erreur
 
 
 
)(ndkLP p
k
p
n
est faible même si
n
est extérieur à
];[ 1kk xx
(mais on n’en aura pas besoin cependant que le lemme ne le prouve pas).
RESULTAT 1 :
Soit
p
dans
2
1
;0
. Soit
p
y
la racine réelle autre que 1 de l’équation
012
1
yyp
.
Soit
1
1
1p
p
p
p
pp yym
. Alors pour tout
0
, on peut calculer un entier
;p
N
tel que :
pour tout entier
n
valant au moins
;p
N
, on a
 
 
p
p
nmnpkLP ;
0
)(
en posant
();(
00 Entnpkk
1)
1
/
)( )1( 2
p
Lnn
yLn p
Ln
p
.
PREUVE DU RESULTAT 1 :
1 / 8 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !