Ch. 6.
Introduction à
l’Inférence Statistique
6.1 Intervalles de confiance
Dans l'inférence statistique, on souhaite estimer des paramètres de population en utilisant
des données observées d'échantillon. La notation commune pour le paramètre en question
est
θ
. Souvent, ce paramètre est la moyenne de population
, qui est estimée par la
moyenne d'échantillon. Bien que la moyenne d’échantillon puisse servir comme un
estimateur sans biais de la moyenne de la population, on ne peut qualifier la précision
atteinte par une estimation ponctuelle. En fait, les mathématiques nous apprennent que la
probabilité que la moyenne d’échantillon soit exactement égale à la moyenne de la
population est nulle. Cette moyenne d’échantillon sera entachée alors d’une erreur. On
aimerait bien connaître une borne supérieure ou inférieure de cette erreur. C’est justement
ce que l’on obtient dans l’estimation par intervalle de confiance.
Un intervalle de confiance donne un intervalle estimé de valeurs qui est susceptible
d'inclure le paramètre inconnu de la population, l'intervalle estimé étant calculé à partir
d'un ensemble indiqué de données d'échantillon. Également, il est plus instructif qu’une
estimation ponctuelle puisqu'il fournit un intervalle de valeurs plausibles pour le
paramètre inconnu de la population.
Le niveau C d'un intervalle de confiance donne la probabilité que cet intervalle inclut la
valeur vraie du paramètre
θ
. Il est souvent exprimé en pourcentage, soit par exemple un
niveau de confiance de 95%.
On peut aussi présenter un niveau de confiance, comme dans l’exemple qui suit.
Supposons qu’un sondage d'opinion a prévu que, si l'élection était tenue aujourd'hui, la
partie libérale gagnerait avec 42% des voix. Le sondeur pourrait attacher un niveau de
confiance de 19 sur 20 à l'intervalle de 42%, plus ou moins 3.5%. C'est-à-dire, il pense
avec une probabilité de 95% que la partie libérale obtiendrait entre 41.5% et 48.5% de
toutes les voix.
Exemple
Supposons qu’un étudiant mesure la température d’ébullition d'un certain liquide. Il
observe les lectures (en degrés Celsius) 102,5, 101,7, 103,1, 100,9, 100,5, et 102,2 d’un
échantillon du liquide de taille 6. Il calcule la moyenne d'échantillon qui est de 101,82.
S’il sait que l'écart type pour ce procédé est de 1,2 degrés, quel est l'intervalle de
confiance pour la moyenne d’ébullition à un niveau de la confiance 95%? En d'autres