1
Chapitre X : ESTIMATION
I – Introduction
Les statisticiens connaissent en général le type de loi qui décrit un phénomène (grâce à des
observations) mais souvent, ils ne connaissent pas tous les paramètres de la dite loi. Ils doivent donc
les estimer : c’est ce que l’on appelle la statistique inférentielle.
L’objectif de ce chapitre est d’introduire le vocabulaire et la démarche de la statistique inférentielle en
abordant, sur quelques cas simples, le problème de l’estimation, ponctuelle ou par intervalle de
confiance.
On considère un phénomène aléatoire et on s’intéresse à une variable aléatoire réelle qui lui est liée,
dont on suppose que la loi de probabilité n’est pas complètement spécifiée et appartient à une famille
de lois dépendant d’un paramètre θ décrivant un sous-ensemble Θ de (éventuellement de
).
Exemple 1 :
1. suit une loi de Bernoulli de paramètre : θ et Θ ;
2. suit la loi de Poisson (ou la loi exponentielle) de paramètre : θ et Θ ;
3. suit la loi normale de paramètres et
où est connu et inconnu : θ et Θ .
Le paramètre θ est une quantité inconnue, fixée dans toute l’étude, que l’on cherche à déterminer ou
pour laquelle on cherche une information partielle.
Le problème de l’estimation consiste alors à estimer la vraie valeur du paramètre θ ou de θ
(fonction à valeurs réelles du paramètre θ), à partir d’un échantillon de données
obtenues en observant fois le phénomène.
On supposera que cet échantillon est la réalisation de variables aléatoires
où les
sont des variables aléatoires réelles de même loi que . On supposera de plus que ces variables
aléatoires sont mutuellement indépendantes.
On appellera estimateur de θ ou de (θ) toute variable aléatoire réelle de la forme
où
est une fonction de
dans, éventuellement dépendante de , et
indépendante de θ, dont la réalisation après expérience est envisagée comme estimation de θ ou de
(θ).
Un estimateur se définit donc dans l’intention de fournir une estimation.
Si
est un estimateur, on notera, lorsque ces valeurs existent,
θ
l’espérance de
et
θ
la
variance de
, pour la probabilité
θ
.
II – Estimation ponctuelle
1) Définitions
Définition 1 : On appelle -échantillon de la loi tout -uplet
de variables aléatoires
réelles définies sur le même espace probabilisé , mutuellement indépendantes et suivant
toutes la même loi que .
Remarque 1 : On parle d’échantillon iid (pour indépendant et identiquement distribué)
Définition 2 : Si
est un échantillon de la loi , on appelle réalisation de cet échantillon
ou échantillon observé, tout -uplet
où .
Autrement dit : pour tout
est la valeur prise par la variable aléatoire
.
Remarque 2 :
Ne pas confondre l’échantillon
qui est un -uplet de variables aléatoires et
l’échantillon observé
qui est un -uplet de réels.