Introduction aux théorèmes limites et aux intervalles de confiance

Chapitre 5
Introduction aux théorèmes limites et aux
intervalles de confiance
Objectifs du chapitre
1. Savoir approcher une loi binomiale par une loi de Poisson ou une loi normale.
2. Savoir approcher une loi en appliquant le théorème central limite.
3. Savoir calculer un intervalle de confiance dans le cadre d’un sondage.
4. Comprendre le lien entre l’approche fréquentielle des probabilités et la loi des grands nombres.
Application : méthode de Monte-Carlo de calculs d’intégrales.
5.1
Approximation d’une loi binomiale
Nous l’avons vu dans les chapitres précédents, les loi binomiale et hypergéométrique interviennent dans des jeux de
hasard et utilisent des factorielles. L’usage de factorielles induit en général de “gros” chiffres, dont la manipulation à la main
est risquée et fut naguère source d’instabilités numériques. A titre d’exemple nous vous recommandons de taper sur votre
calculatrice 10!, 32!, 52! et 365! pour avoir un aperçu du problème.
Dans ces conditions il est nécessaire d’avoir une approximation de ces lois là nettement plus magniable et dont on sait
contrôler l’erreur.
5.1.1
Approximation d’une loi binomiale par une loi de Poisson
Le théorème de Poisson donne une approximation de la loi binomiale B(n, p) lorsque n est “grand” et p “petit”.
Théorème 5.1.1 (Théorème de Poisson). Soit (pn ) une suite de réels de l’intervalle ]0, 1[ telle que limn→∞ npn = λ où λ > 0.
Considérons pour chaque entier une variable aléatoire Sn de loi B(n, pn ). On a donc
k k
Cn pn (1 − pn )n−k
si
0≤k≤n
P(Sn = k) = Pn (k) =
.
0
sinon
Alors pour tout entier k ∈ N, la suite de terme général P(Sn = k) est convergente et on a
lim P(Sn = k) = e−λ
n→∞
λk
.
k!
Démonstration. Par hypothèse la suite n pn − λn
notée (un ) tend vers 0 quand n → ∞. Donc pn = λn + unn . Pour tout k,
n(n − 1)...(n − k + 1)
P(Sn = k) =
k!
λ un
+
n
n
1
k n−k
λ un
λk
1−
+
→ e−λ .
n
n
k!
en particulier
n(n − 1)...(n − k + 1)
k!
et
λ un
+
n
n
k
=
n(n − 1)...(n − k + 1)
λk
k
(λ
+~
u
)
→
n
nk k!
k!
λ un n−k
(n−k) − λn − unn + vn2
n
=e
→ e−λ .
1− −
n
n
Vitesse de convergence Si pour tout n nous avons npn = λ avec λ > 0 on a alors l’estimation
∞ k
2λ
−λ λ ∑ Pn (k) − e k! ≤ n min(2, λ).
k=0
En particulier, pour tout k ∈ N, on a
k
Pn (k) − e−λ λ ≤ 2λ min(2, λ).
k! n
Intuitivement, le théorème de Poisson donne une approximation de la loi binomiale lorsque le paramètre p est petit. En
particulier, on remplace la loi binomiale B(n, p) par la loi de Poisson P(np) dès que n est assez grand de l’ordre de 30 et p
est petit de l’ordre de 0.1.
Exemple 5.1.2. On veut déterminer numériquement la probabilité Pn (k) pour que parmis n personnes k soient nées le 1er
janvier. On suppose qu’aucune personne n’est née le 29 février et de plus que tous les jours sont équiprobables. On fait
l’étude pour n = 500. Le nombre de personnes nées le premier janvier suit une loi binomiale B(n, 1/365). Si n = 500 alors
np ' 1, 369 :
PB(500,1/365) (N = 0) = 0.2536 ; PP(λ1 (N = 0) = 0.2541
PB(500,1/365) (N = 4) = 0.0369 ; PP(λ1 (N = 0) = 0.0372
PB(500,1/365) (N = 7) = 0.0004 ; PP(λ1 (N = 0) = 0.0004
5.1.2
Approximation d’une loi binomiale par la loi de Gauss
Si p n’est pas trop petit et n est grand comment approximer P(Sn = k) lorsque Sn suit une loi binomiale B(n, p) ?
Théorème 5.1.3 (Moivre-Laplace). Si Sn est une variable aléatoire suivant une loi binomiale B(n, p).
• Pour tout k,
2
1
− (k−E(Sn ))
e 2.var(Sn ) .
P(Sn = k) ' p
2.var(Sn )
• Pour tout 0 < a < b,
Z b
2
Sn − E(Sn )
1
P a<
≤b → √
e−x /2 dx.
σ(Sn )
2π a
Remarque 5.1.4. On a le résultat d’uniformité plus fort :
Z b
2
Sn − E(Sn )
1
sup
P a<
≤b −√
e−x /2 dx → 0
σ(Sn )
2π a
−∞<a<b≤+∞
Corollaire 5.1.5. Si Sn est une variable aléatoire suivant une loi binomiale B(n, p), alors pour tout α, β avec
−∞ ≤ α < β ≤ +∞
on a
1
P(α < Sn ≤ β) ' √
2π
2
Z
β−E(Sn )
σ(Sn )
α−E(Sn )
σ(Sn )
e−x
2 /2
dx.
5.2
Le théorème de la limite centrale
Le théorème suivant montre combien la loi normale est centrale !
Théorème 5.2.1 (Théorème de la limite centrée). Soit (Ω, A , P) un espace probabilisé. Soit (Xn ) une suite de variables
aléatoires indépendantes, de même loi, de classe L2 , de moyenne E et d’écart-type σ. Soit
∑nj=1 X j − nE
√
Sn =
.
nσ
Pour tout couple (a, b) avec a, b ∈ [−∞, ∞] nous avons
1
P(a < Sn ≤ b) → √
n→∞
2π
Z b
e−x
2 /2
dx.
a
Remarque 5.2.2. Ce théorème généralise le théorème de Moivre-Laplace car une variable aléatoire Sn de loi B(n, p) a même
loi qu’une somme X1 + ... + Xn de n variables aléatoires de Bernouilli indépendantes de paramètre p. Plus généralement, si
X = ∑nj=1 X j où les (X j ) sont indépendantes de même loi L2 alors on peut approximer X par N (E(X),Var(X)).
Exemple 5.2.3. On jette un dé équilibré 12000 fois. On cherche la probabilité pour que le nombre de 6 obtenus soit compris
entre 1800 et 2100.
(→) Le nombre de 6 obtenus est une variable aléatoire de loi binomiale B(12000, 1/6). On a a = 1800 et b = 2100. Par le
théorème de Moivre-Laplace on a
2100 − 2000
1800 − 2000
P(1800 ≤ N ≤ 2000) ' Φ( p
) − Φ( p
) ≤ 0.992.
12000.(1/6).(5/6)
12000.(1/6).(5/6)
Avec
1
Φ(x) = √
2π
Z x
e−t
2 /2
dt.
−∞
Terminons ce paragraphe par un lemme, utile par exemple pour la construction d’un intervalle de confiance.
Lemme 5.2.4. Soit X une variable aléatoire suivant une loi normale centrée réduite. Pour tout α ∈]0, 1[, il existe un unique
réel positif tα tel que P(−tα ≤ X ≤ tα ) = 1 − α.
Démonstration. Soit α ∈]0, 1[. Considérons la fonction
f : t 7→ P(−t ≤ X ≤ t) =
Z t
−t
2
1
√ e−x /2 dx = 2
2π
Z t
0
2
1
√ e−x /2 dx.
2π
2
Cette fonction est dérivable de dérivée f 0 (t) = √22π e−t /2 qui est strictement positive. On en déduit donc que la fonction f
est continue, strictement croissante sur ]0, +∞[ avec f (0) = 0 et limt→+∞ f (t) = 1. Cette fonction est donc une bijection
strictement croissante de ]0, +∞[ sur ]0, 1[. Il existe donc tα tel que
f (tα ) = P(−tα ≤ X ≤ tα ) = 1 − α.
Exemple 5.2.5. Déterminons t0.05 et t0.01 .
On note Φ la fonction de répartition de la loi normale centrée réduite. On a
P(X ∈ [−t,t]) = ϕ(t) − ϕ(−t) = 2ϕ(t) − 1.
Par conséquent, on en déduit l’équivalence
α
P(X ∈ [−tα ,tα ]) = 1 − α ⇔ Φ(tα ) = 1 − .
2
La table de la loi normale donne Φ(1.96) = 0.975 et donc t0.05 ' 1.96. De même t0.01 ' 2.58.
3
Introduction au sondage : estimation d’une proportion Dans une population, un caractère est présent dans une proportion p. On cherche à estimer la valeur de p. Pour cela on étudie un échantillon de n éléments de cette population, et on
désigne par Xn le nombre de fois où ce caractère est retrouvé dans l’échantillon.
Définition 5.2.6. On fixe α ∈]0, 1[ et on note tα l’unique réel tel que
Z tα
2
1
√ e−x /2 dx = 1 − α.
−tα
2π
h
i
On note f la fréquence Xnn . L’intervalle f − 2t√α n ; f + 2t√α n est appelé intervalle de confiance au niveau 1 − α de p.
Nous justifions ci dessous
h que pour n grand
i (en pratique si n ≥ 30, np ≥ 5 et n(1 − p) ≥ 5) et f =
t√
t√
α
α
p soit dans l’intervalle f − 2 n ; f + 2 n est supérieure ou égale à 1 − α.
Xn
n
la probabilité que
Construction d’un intervalle de confiance au niveau 1 − α
1. Pour tout n, la variable aléatoire Xn suit une loi binomiale B(n, p) comme répétition de n expériences aléatoires indépendantes avec probabilité p de succès. En particulier nous avons
Xn = Y1 + ... +Yn
où les Yi sont des variables aléatoires de Bernoulli indépendantes de même paramètre p et d’écart type
2. On pose Zn = √Xn −np . Par application du théorème central limite, pour tous réels a < b on a
np(1−p)
1
P(Zn ∈ [−tα ,tα ]) → √
2π
Z tα
e−t
2 /2
dt = 1 − α.
−tα
3. Notons que
Xn
∈ In ⇔ Zn ∈ [−tα ,tα ]
n
où
"
p
In = p − tα
p(1 − p)
√
; p + tα
n
p
#
p(1 − p)
√
.
n
On en déduit donc que
lim P(Xn /n ∈ In ) = 1 − α.
n→∞
4. La fonction p 7→ p(1 − p) admet
1
4
comme maximum on obtient donc l’encadrement
tα
tα
In ⊂ p − √ ; p + √ .
2 n
2 n
5. On en déduit alors la définition précédente de l’intervalle de confiance au niveau 1 − α :
tα
tα
Xn
tα Xn
tα
Xn /n ∈ p − √ ; p + √ ⇔ p ∈
− √ ; + √ .
2 n
2 n
n
2 n n
2 n
4
p
p(1 − p).
Exemple 5.2.7. Lors d’une élection opposant deux candidats, un sondage d’opinion réalisé sur un échantillon de 1000
personnes donne 52% des voix au candidat A et 48% au candidat B.
1. Donnons un intervalle de confiance au niveau 0.95 des intentions de vote pour A. Nous sommes dans les conditions
d’application de la méthode précédente car
n ≥ 30, np = 1000 × 0.52 ≥ 5, n(1 − p) ≥ 5.
Un intervalle de confiance est donc donné par
tα
tα
I = 0.52 − √ ; 0.52 + √
2 n
2 n
avec α = 0.05, tα ' 1.96. On trouve
[0.489; 0.551] ⊂ I.
2. Combien de personnes suffirait-il d’interroger pour qu’il y ait moins de 5% de chances que B l’emporte si A a recueilli
52% des intentions de vote dans le sondage ? Pour répondre à cette question nous allons chercher le nombre de
personnes nécessaire pour que le pourcentage obtenu par A soit compris entre 50 et 54%. Il suffit donc de résoudre
l’inéquation
1.96
0.52 − √ ≥ 0.5
2 n
et on obtient n ≥ 2401.
5.3
Loi des grands nombres
Théorème 5.3.1 (Loi forte des grands nombres). On considère (Ω, A , P) un espace probabilisé. On considère une suite
de variables aléatoire Xn indépendantes, de même loi de classe L1 et d’espérance E. Il existe un événement F ∈ A avec
P(F) = 0 tel que
X1 (ω) + ... + Xn (ω)
∀ω ∈ Ω \ F,
→ E.
n
Remarque 5.3.2. Si Xn = X pour tout n alors pour tout ω ∈ Ω,
X1 (ω) + ... + Xn (ω)
= X(ω),
n
il faudrait donc avoir X(ω) = E pour presque tout ω ! c’est à dire X constant presque sûrement. L’hypothèse (Xn ) est une
famille de variables aléatoires indépendantes permet de ne pas considérer ce cas là.
Retour sur l’approche des fréquences Considérons une expérience aléatoire et un évènement A. Répétons une infinité
de fois l’expérience. On note Xn la variable aléatoire qui vaut 1 si l’évènement est réalisé à l’a n-ième expérience et 0 sinon.
Notons fn (A) la variable aléatoire
1
fn (A) = (X1 + ... + Xn ).
n
Les expériences répétées étant toutes indépendantes, les variables aléatoires Xi le sont et ont la même loi. Donc
E(Xi ) = P(Xi = 1) = P(A)
, donc
fn (A)(ω) → P(A)
pour presque toute éventualité ω ( c’est à dire : sauf pour un ensemble de probabilité d’éventualités). Remarquons qu’ici une
éventualité ω = (ωn ) est une infinité d’expériences successives et indépendantes.
5
Exemple 5.3.3 (Méthode de Monte-Carlo). Soit (Un ) une suite de variables aléatoires indépendantes toutes de loi uniforme
sur l’intervalle [0, 1]. Soit f : [0, 1] → R une fonction continue. Que peut on dire de
f (U1 ) + ... + f (Un )
n
lorsque n tend vers l’infini ?
Les variables aléatoires f (Un ) sont indépendantes, de même loi et sont toutes de classe L1 car la fonction est continue sur
[0, 1] donc intégrable. Par la loi des grands nombres, en dehors d’un ensemble de probabilité nulle, pour tout ω appartenant
à l’univers sous jacent
Z 1
f (U1 ) + ... + f (Un )
→
f (t)dt.
n
0
Cette méthode est utilisée pour calculer des valeurs approchées d’intégrales et s’appelle la méthode de Monte-Carlo.
6