Estimation paramétrique 3
1 Estimation ponctuelle
1.1 Modèles paramétrés
Le postulat de modélisation sur lequel toute étude statistique est basée est
le suivant :
Les données observées sont des réalisations de variables aléatoires.
Quand le résultat d’une expérience n’est pas reproductible exactement, on
suppose qu’il est la réalisation d’une variable aléatoire. La théorie des pro-
babilités fournit des outils, comme la loi des grands nombres ou le théorème
central limite, permettant d’extraire des données ce qui est reproductible et
qui pourra donc fonder une prédiction ou une décision.
Quand on observe un caractère statistique sur une population, si l’ordre
dans lequel on prend les individus n’a pas d’importance, on choisira de consi-
dérer que les données sont des réalisations de variables aléatoires indépen-
dantes et de même loi. Cette loi de probabilité décrit la variabilité du carac-
tère. Même dans le cas où les individus ne sont pas interchangeables, comme
pour une série chronologique, la modélisation consistera à se ramener, en
soustrayant au besoin une fonction déterministe, au cas d’un échantillon de
variables aléatoires indépendantes.
Définition 1.1 Soit Pune loi de probabilité sur IR. On appelle échantillon
de la loi Pun n-uplet de variables aléatoires indépendantes et de même loi
P.
Le mot échantillon prend en statistique deux sens différents, selon que
l’on parle des données observées ou du modèle probabiliste. L’hypothèse de
modélisation consiste à voir l’échantillon (observé) comme une réalisation
d’un échantillon (théorique) d’une certaine loi de probabilité P. En d’autres
termes, on considère que les données auraient pu être produites en simulant
de façon répétée la loi de probabilité P. Pour éviter les confusions, nous dési-
gnerons par données ou échantillon observé, la séquence de nombres recueillie
(x1,...,xn). Les échantillons (théoriques) au sens de la définition ci-dessus
seront désignés par des majuscules : (X1,...,Xn).
La loi de probabilité Pmodélisant la variabilité des données n’a aucune
réalité physique. Cependant elle est considérée comme un objet caché. Tout
se passe comme si on disposait d’un algorithme de simulation de la loi P,
sans connaître Pelle-même : Les données sont des appels indépendants de
cet algorithme. L’objet de l’analyse statistique est d’en extraire toute infor-
mation utile sur P. Si l’hypothèse de modélisation par la loi Pest correcte
(l’algorithme simule effectivement cette loi), la loi des grands nombres per-
met d’affirmer que la distribution empirique des données est proche de P,
pour un grand échantillon. Mais deux échantillons observés, simulés selon la
même loi, ont rarement la même distribution empirique. Afin d’extraire des
données des informations reproductibles, on est amené à réduire l’ensemble
des lois possibles à une famille particulière de lois de probabilité.