III- Théorème de la limite centrée
On considère un espace de probabilité (
, P), une variable aléatoire X définie sur
et à valeurs dans
, l’espace de probabilité (
,
) décrivant N répétitions indépendantes de (
, P), et X1,...,XN les
variables aléatoires correspondant à X dans chacune des réalisations successives.
De manière plus précise, les variables aléatoires Xi sont définies sur
par Xi((
,...,
))= X(
).
Nous ferons l’hypothèse que E(X) et V(X) sont définies et que
, ce sans quoi les variables
aléatoires considérées sont en fait constantes, et leur étude de peu d’intérêt !
Nous utiliserons dans la suite la notation SN = X1 + ··· + XN
Le théorème de la limite centrale s’énonce alors de la manière suivante : lorsque N tend vers l'infini, la
loi de la variable aléatoire
tend vers une loi normale centrée réduite.
IV- Sondage
Le fait que le théorème de la limite centrale permette de préciser l’ordre de grandeur de l’erreur dans la
loi des grands nombres fait qu’il intervient de manière systématique lorsque la loi des grands nombres est
employée pour estimer une certaine quantité.
Pour prendre un exemple très simple, supposons que l’on sonde la population pour déterminer la
proportion p d’individus ayant telle caractéristique particulière. Un modèle très simple de sondage est le
suivant : on interroge N personnes, choisies aléatoirement selon la loi uniforme dans la population
étudiée.
En appelant Xi la variable aléatoire prenant la valeur 1 lors que la réponse à la question posée est «oui», et
0 lorsque celle-ci est «non», les variables X1,...,XN sont alors des variables aléatoires indépendantes,
possédant toutes la loi de Bernoulli de paramètre p.
L’estimation de p obtenue par le sondage est alors égale à
D’après la loi des grands nombres, on s’attend à ce que, typiquement :
lorsque N est grand, et le théorème de la limite centrale affirme que l’erreur d’estimation
- p est de la forme
On a :
=
=
L'écart type est donc égal à :
=