
302 STATISTIQUE EN ACTION
qu’a priori, les paiements ne sont pas donnés par une loi de Bernoulli, mais par une loi plus
compliquée, discrète et admettant pour support les lots disponibles. La simplification proposée,
dans le texte du chapitre 10, par le modèle de Bernoulli admet deux justifications (et demie).
Premièrement, on pourrait imaginer que l’on ne s’intéresse qu’au fait d’avoir un gain, peu
importe son montant : on veut activer le bras qui obtient le plus souvent un gain, quel que soit
le montant de ce dernier, ou alors, le plus souvent un gros gain (supérieur à un certain seuil
psychologique, ce qui permet de considérer les petits gains comme peu intéressants pour le
joueur). La mise de 1
e
n’entre alors plus en ligne de compte. C’est une modélisation en termes
d’ivresse ou de frisson du gain, pas tellement en termes d’efficacité des gains ; on pourrait
notamment se retrouver à actionner presque exclusivement un bras qui gagne souvent mais
peu, alors que l’autre bras a une meilleure espérance de gain.
Plus raisonnablement, on pourrait penser que le seul lot disponible est 2
e
; à chaque coup,
on gagne ainsi, tous comptes faits et mise déduite,
2ECt
t−1e
, que l’on veut comparer au
gain moyen du meilleur bras, 2 max {θA, θ B} − 1. La différence,
2ECt
t−max θA, θ B,
est, au facteur 2 près, la quantité d’intérêt dans le texte et dans ce qui suit. On pourra noter
que les variables en jeu ici ne sont plus alors distribuées selon des lois de Bernoulli, mais selon
des lois de Rademacher (id est, elles ont pour support
{−1,1}
) ; il est par ailleurs évident que
les paramètres
θA
et
θB
doivent alors être plus petits que
1/2
, sans quoi, dans ce modèle, le
casino perdrait de l’argent !
Enfin – et c’est la demi-justification –, les calculs ci-dessous, et notamment ceux mettant
en jeu la loi des grands nombres pour les martingales, sont valables pour tout couple de lois
sur les bras admettant toutes deux un moment d’ordre deux. Or, c’est le cas pour toutes les
lois sur les gains des machines à sous, qui ont un support fini. Les lois de Bernoulli offrent
une simplification encore suffisamment riche pour illustrer les méthodes de martingales sans
trop alourdir ou compliquer le raisonnement ; les mêmes stratégies atteignent l’objectif fixé au
paragraphe 22.1.4 sur des lois plus complexes. Seule la dérivation des intervalles de confiance
par méthode de réinjection (« plug-in ») au paragraphe 22.1.7 utilise la forme particulière de
la variance des lois de Bernoulli et leur estimation consistante à partir d’estimateurs de leur
moyenne (de leur paramètre).
Définition mathématique d’une stratégie
On a parlé ci-dessus de stratégies, sans vraiment les définir formellement ; mais en faisant
simplement appel à l’intuition que l’on peut s’en faire, à savoir que l’action choisie au tour
t
repose uniquement sur l’information disponible au début du tour
t
, qui est formée par la suite
des actions et gains passés. Voici maintenant la même définition, mais formulée de manière
rigoureuse mathématiquement.
Une stratégie (déterministe) est une suite de variables aléatoires
(Cn)n>1
à valeurs dans
{A,B}
telle que
C1
est déterministe, et pour
t>2
, la variable aléatoire
Ct
est mesurable par
http://www.dma.ens.fr/statenaction