Chapitre 1
Modélisation statistique
1.1 Un exemple
Une pièce a une probabilité p0∈]0,1[de tomber sur "pile". Sur les 1000 lan-
cers réalisés indépendamment les uns des autres, on compte 520 "pile" et 480
"face". On est donc tenté de conclure que p0≈0.52. Cependant, de la même ma-
nière qu’il est sans intérêt de donner une valeur approchée d’une intégrale sans
préciser l’erreur d’approximation, ce résultat n’a que peu de valeur, car il ne nous
renseigne pas sur l’erreur commise.
Nous allons examiner de quelle manière la construction d’un modèle permet
de combler cette lacune. On note x1,··· ,xnles résultats des n=1000 lancers de
pièce, avec la convention suivante : xi=1 si le i-ème lancer a donné "pile", et 0
dans le cas contraire. Le principe de base de l’estimation statistique est de considé-
rer que x1,··· ,xnest une réalisation de la loi B(p0)⊗n, si pour chaque p∈[0,1],
B(p)désigne la loi de Bernouilli de paramètre p(i.e. B(p) = pδ1+ (1−p)δ0,
avec δ0et δ1les mesures de Dirac en 0 et 1). En l’absence d’informations sur la
valeur de p0, on ne peut en fait que supposer que x1,··· ,xnest une réalisation de
l’une des lois {B(p)⊗n,p∈]0,1[}.
De cet ensemble de probabilités, appelé modèle statistique, on cherche à dé-
duire la valeur de pqui s’ajuste le mieux aux observations x1,··· ,xn. Une réponse
raisonnable est basée sur l’intuition suivante : compte tenu des informations dont
on dispose, la meilleure approximation de p0que l’on puisse donner est une valeur
5