Théorème central limite

publicité
Théorème central limite
1
Théorème central limite
Le théorème central limite est un résultat sur la convergence en probabilités d'une suite de variables aléatoires.
Intuitivement, ce résultat affirme que toute somme de variables aléatoires indépendantes et identiquement distribuées
tend vers une variable aléatoire gaussienne. Il admet plusieurs généralisations qui donnent la convergence de cette
somme sous des hypothèses beaucoup plus faibles.
Ces généralisations ne nécessitent pas des lois identiques mais font appel à des conditions qui assurent qu'aucune des
variables n'exerce une influence significativement plus importante que les autres. Telles sont la condition de
Lindeberg et la condition de Lyapounov. D'autres généralisations autorisent même une dépendance «faible». De plus,
une généralisation due à Gnedenko et Kolmogorov stipule que la somme d'un certain nombre de variables aléatoires
avec une queue de distribution décroissante selon
avec
(ayant donc une variance infinie)
tend vers une loi de Lévy tronquée symétrique et stable quand le nombre de variables augmente. Cet article se
limitera au théorème de la limite centrale concernant les lois à variance finie.
Ainsi, ce théorème et ses généralisations offrent une explication à l'omniprésence de la loi normale dans la nature :
de nombreux phénomènes sont dus à l'addition d'un grand nombre de petites perturbations aléatoires.
« Le » théorème de la limite centrale
Soit
une suite de variables aléatoires définies sur le même espace de probabilité, suivant la même loi
D et indépendantes. Supposons que l'espérance
Considérons la somme
et l'écart-type
de D existent et soient finis (
. Alors l'espérance de
. De plus, pour parler de manière informelle, la loi de
est
tend vers la loi normale
).
et son écart-type vaut
quand n
tend vers l'infini.
Afin de clarifier cette idée de convergence, nous allons poser
de sorte que l'espérance et l'écart-type de
valent respectivement 0 et 1 : la variable est ainsi dite centrée et
réduite.
Alors la loi de
converge vers la loi normale centrée réduite
convergence en loi). Cela signifie que si Φ est la fonction de répartition de
ou, de façon équivalente :
où
lorsque n tend vers l'infini (il s'agit de la
, alors pour tout réel z :
Théorème central limite
2
Démonstration du théorème de la limite centrale
Pour un théorème d'une telle importance en statistiques et en probabilité appliquée, il existe une démonstration
particulièrement simple utilisant les fonctions caractéristiques. Cette démonstration ressemble à celle d'une des lois
des grands nombres. Pour une variable aléatoire Y d'espérance 0 et de variance 1, la fonction caractéristique de Y
admet le développement limité :
Si Yi vaut
, il est facile de voir que la moyenne centrée réduite des observations X1, X2, ..., Xn est
simplement :
D'après les propriétés élémentaires des fonctions caractéristiques, la fonction caractéristique de
est
lorsque
Mais cette limite est la fonction caractéristique de la loi normale centrée réduite N(0,1), d'où l'on déduit le théorème
de la limite centrale grâce au théorème de continuité de Lévy, qui affirme que la convergence des fonctions
caractéristiques implique la convergence en loi.
Convergence vers la limite
La convergence de la fonction de répartition de
moment d'ordre 3,
est uniforme, en vertu du deuxième théorème de Dini. Si le
existe et est fini, alors la vitesse de convergence est au moins d'ordre
(voir le théorème de Berry-Esseen (en)).
Images d'une loi lissées par sommation qui montrent la distribution de la loi originale et trois sommations
successives (obtenues par convolution) :
Dans les applications pratiques, ce théorème permet en particulier de remplacer une somme de variables aléatoires en
nombre assez grand mais fini par une approximation normale, généralement plus facile à manipuler. Il est donc
intéressant de voir comment la somme s'approche de la limite. Les termes utilisés sont expliqués dans Variable
aléatoire.
Une somme de variables continues est une variable continue dont on peut comparer la densité de probabilité à celle
de la limite normale.
Théorème central limite
Avec une somme de variables discrètes, il est parfois commode de
définir une pseudo-densité de probabilité mais l'outil le plus efficace
est la fonction de probabilité représentée par un diagramme en bâtons.
On peut constater graphiquement une certaine cohérence entre les deux
diagrammes, difficile à interpréter. Dans ce cas, il est plus efficace de
comparer les fonctions de répartition.
D'autre part, l'approximation normale est particulièrement efficace au
voisinage des valeurs centrales. Certains disent même qu'en matière de
convergence vers la loi normale, l'infini commence souvent à six.
La précision se dégrade à mesure qu'on s'éloigne de ces valeurs
centrales. C'est particulièrement vrai pour une somme de variables
positives par nature : la loi normale fait toujours apparaître des valeurs
négatives avec des probabilités faibles mais non nulles. Même si c'est
moins choquant, cela reste vrai en toutes circonstances : alors que toute
grandeur physique est nécessairement bornée, la loi normale qui
couvre un intervalle infini n'est qu'une approximation utile.
Enfin, pour un nombre donné de termes de la somme, l'approximation normale est d'autant meilleure que la
distribution est plus symétrique.
Application à la statistique mathématique
Ce théorème de probabilités possède une interprétation en statistique mathématique. Cette dernière associe une loi de
probabilité à une population. Chaque élément extrait de la population est donc considéré comme une variable
aléatoire et, en réunissant un nombre n de ces variables supposées indépendantes, on obtient un échantillon. La
somme de ces variables aléatoires divisée par n donne une nouvelle variable nommée la moyenne empirique.
Celle-ci, une fois réduite, tend vers une variable normale réduite lorsque n tend vers l'infini.
Autres formulations du théorème
Densités de probabilité
La densité de probabilité de la somme de plusieurs variables indépendantes s'obtient par convolution de leurs
densités (si celles-ci existent). Ainsi on peut interpréter le théorème de la limite centrale comme une formulation des
propriétés des densités de probabilité soumises à une convolution : sous les conditions établies précédemment, la
convoluée d'un certain nombre de densités de probabilité tend vers la densité normale lorsque leur nombre croît
indéfiniment.
Comme la fonction caractéristique d'une convolution est le produit des fonctions caractéristiques des variables en
cause, le théorème de la limite centrale peut se formuler d'une manière différente : sous les conditions précédentes, le
produit des fonctions caractéristiques de plusieurs densités de probabilité tend vers la fonction caractéristique de la
loi normale lorsque le nombre de variables croît indéfiniment.
Produits de variables aléatoires
Le théorème de la limite centrale nous dit à quoi il faut s'attendre en matière de sommes de variables aléatoires
indépendantes ; mais qu'en est-il des produits ? Eh bien, le logarithme d'un produit (à facteurs strictement positifs)
est la somme des logarithmes des facteurs, de sorte que le logarithme d'un produit de variables aléatoires (à valeurs
strictement positives) tend vers une loi normale, ce qui entraîne une loi log-normale pour le produit lui-même. Bon
nombre de grandeurs physiques (en particulier la masse et la longueur, c'est une question de dimension, ne peuvent
être négatives) sont le produit de différents facteurs aléatoires, de sorte qu'elles suivent une loi log-normale. Il en va
3
Théorème central limite
4
de même pour le cours en Bourse d'un actif risqué.
Les théorèmes de la limite centrale
Condition de Lyapounov
Soit
une séquence de variables définies sur le même espace de probabilité. Supposons que
espérance finie
et un écart-type fini
ait une
. Nous définirons
Supposons que les moments centrés d'ordre 3
soient finis pour tout n et que
(C'est la condition de Lyapounov ).
Considérons de nouveau la somme
et son écart-type
alors la loi de
. Si nous normalisons
. L'espérance mathématique de
est
en posant
converge vers la loi normale centrée réduite N(0,1) comme ci-dessus.
Condition de Lindeberg
Avec les mêmes définitions et les mêmes notations que précédemment, nous pouvons remplacer la condition de
Lyapounov par la suivante qui est plus faible (Lindeberg 1920). Pour tout ε > 0
où E( U : V > c ) représente l'espérance conditionnelle : l'espérance de U sous la condition V > c. Alors la loi de
converge vers la loi normale centrée réduite N(0,1).
Cas des variables dépendantes
Il existe quelques théorèmes qui traitent le cas de sommes de variables dépendantes, par exemple le théorème de la
limite centrale m-dépendante, le théorème de la limite centrale des martingales et le théorème de la limite centrale
pour les processus de mélange.
Intérêt de ce théorème
On peut parfois lire dans la presse générale que la courbe en cloche représente la loi du hasard, ce qui n'a pas grande
signification. Le succès sans égal de la loi de Gauss est la conséquence directe du théorème de la limite centrale et il
est renforcé par la commodité relative d'utilisation de cette loi.
En elle-même, la convergence vers la loi normale de nombreuses sommes de variables aléatoires lorsque leur
nombre tend vers l'infini n'intéresse que le mathématicien. Pour le praticien, il est intéressant de s'arrêter un peu
Théorème central limite
avant la limite : la somme d'un grand nombre de ces variables est presque gaussienne, ce qui fournit une
approximation souvent plus facilement utilisable que la loi exacte.
En s'éloignant encore plus de la théorie, on peut dire que bon nombre de phénomènes naturels sont dus à la
superposition de causes nombreuses, plus ou moins indépendantes. Il en résulte que la loi normale les représente de
manière raisonnablement efficace.
À l'inverse, on peut dire qu'aucun phénomène concret n'est vraiment gaussien car il ne peut dépasser certaines
limites, en particulier s'il est à valeurs positives.
Voir aussi
Liens externes
• Théorème Central Limit, Java [1]
• Central Limit Theorem [2] Simulation interactive pour faire des expériences utilisant plusieurs paramètres.
Références
[1] http:/ / www. math. csusb. edu/ faculty/ stanton/ m262/ central_limit_theorem/ clt. html
[2] http:/ / www. vias. org/ simulations/ simusoft_cenlimit. html
5
Sources et contributeurs de l'article
Sources et contributeurs de l'article
Théorème central limite Source: http://fr.wikipedia.org/w/index.php?oldid=51926173 Contributeurs: Ambigraphe, Amoceann, Archibald, Charles Dyon, Chassain, Crochet.david, Ediacara,
EtudiantEco, GL, Gassendi, Goliadkine, HB, Jct, Kelam, Kreutoreuk, Leag, Lmaltier, Lpele, Ludovic89, MaCRoEco, Mikefuhr, Mirgolth, Nono64, Oxo, Padawane, Pld, Sloonz, Speedspid,
Ste281, Vivarés, 27 modifications anonymes
Source des images, licences et contributeurs
Image:Central_limit_thm_1.png Source: http://fr.wikipedia.org/w/index.php?title=Fichier:Central_limit_thm_1.png Licence: GNU Free Documentation License Contributeurs: Darapti,
Maksim
Image:Central_limit_thm_2.png Source: http://fr.wikipedia.org/w/index.php?title=Fichier:Central_limit_thm_2.png Licence: GNU Free Documentation License Contributeurs: Darapti,
Maksim
Image:Central_limit_thm_3.png Source: http://fr.wikipedia.org/w/index.php?title=Fichier:Central_limit_thm_3.png Licence: GNU Free Documentation License Contributeurs: Darapti,
Maksim, Mike Rosoft
Image:Central_limit_thm_4.png Source: http://fr.wikipedia.org/w/index.php?title=Fichier:Central_limit_thm_4.png Licence: GNU Free Documentation License Contributeurs: Darapti,
Maksim, Mike Rosoft
Image:Theoreme de la limite centrale.png Source: http://fr.wikipedia.org/w/index.php?title=Fichier:Theoreme_de_la_limite_centrale.png Licence: GNU Free Documentation License
Contributeurs: Original uploader was Jct at fr.wikipedia
Licence
Creative Commons Attribution-Share Alike 3.0 Unported
http:/ / creativecommons. org/ licenses/ by-sa/ 3. 0/
6
Téléchargement