TD10. Loi des grands nombres, théorème central limite.

publicité
Université Pierre & Marie Curie
UE LM345 – Probabilités élémentaires
Licence de Mathématiques L3
Année 2014–15
TD10. Loi des grands nombres, théorème central limite.
1. Soit (Un )n≥1 une suite de variables aléatoires indépendantes toutes de loi uniforme
sur l’intervalle [0, 1]. Soit f : [0, 1] → R une fonction continue. Que peut-on dire de
f (U1 ) + . . . + f (Un )
n
lorsque n tend vers +∞ ?
Solution de l’exercice 1. La fonction f , continue sur le segment [0, 1], y est bornée.
Ainsi, les variables aléatoires (f (Un ))n≥1 sont indépendantes, de même loi et admettent
un moment d’ordre 1. On peut leur appliquer la loi forte des grands nombres (puisque
la fonction f est bornée, les variables admettent un moment d’ordre 2 et on est même
(Un )
dans le cas dont on a étudié la démonstration en cours) pour trouver que f (U1 )+...+f
n
converge presque sûrement, lorsque n tend vers l’infini, vers
Z 1
E[f (U1 )] =
f (t) dt.
0
Cette méthode est parfois utilisée pour calculer des valeurs approchées d’intégrales et
s’appelle la méthode de Monte-Carlo.
2. On considère une suite de jets indépendants d’un dé équilibré. On désigne par Xk
le résultat du k-ème jet et par Yn le plus grand résultat observé au cours des n premiers
jets.
Yn = max Xk
1≤k≤n
a) Que peut-on dire des propriétés de convergence de la suite (Yn )n ?
b) On pose : Nn = Card{k ≤ n : Xk = 6} pour tout n ∈ N∗ . Etablir la convergence
presque sûre de la suite Nnn n∈N∗ .
Solution de l’exercice 2.
a) Il est assez évident que la suite va converger presque sûrement vers 6 : Yn vaut 6 à
partir de la première observation d’un 6, et la probabilité qu’on ne fasse aucun 6 est
nulle. Formalisons ceci
P(∃k ∈ N : Xk = 6) = 1
Or (ω : ∃k ∈ N : Xk (ω) = 6) ⊂ (ω : limn→∞ Yn (ω) = 6), d’où
P lim Yn = 6 = 1
n→∞
et la convergence presque sûre de Yn vers 6.
1
P
b) Nn la variable aléatoire qui compte le nombre de 6 peut se réécrire Nn = nk=1 1Xk =6 .
La suite de variables aléatoires (Zk := 1(Xk =6) ) est indépendante identiquement
distribuée. Et 1(X1 =6) suit une loi de Bernoulli de paramètre P(X1 = 6) = 16 , elle
possède donc une espérance. D’après la loi forte des grands nombres, on a
Z1 + ... + Zn p.s. 1
Nn
=
→
n
n
6
3. A l’approche des élections, un institut de sondage contacte successivement des
individus. Notre modèle est le suivant : les appels sont indépendants et chaque individu
répond qu’il va voter pour le candidat A avec probabilité pA (et pour le candidat B avec
probabilité pB = 1 − pA ). Le but est d’estimer le paramètre pA du modèle.
a) Soit NA (n) le nombre de réponses en faveur du candidat A collectées en n appels.
Que dire de la convergence de la suite NAn(n) ?
b) L’application de l’inégalité de Tchebychev à la variable aléatoire
de retrouver ce résultat ?
NA (n)
n
permet-elle
c) Déduire de cette même inégalité un intervalle I(n, δ) tel que
P (pA ∈ I(n, δ)) ≥ 1 − δ
Un tel intervalle est appelé intervalle de confiance pour le paramètre pA .
Solution de l’exercice 3. Introduisons une suite Xk de Bernoullis indépendantes de
paramètre pA telle que Xk prend la valeur 1 si le k-ème individu appelé se prononce pour
le candidat A, et 0 dans le cas contraire.
P
a) On note que NA (n) = nk=1 Xk et donc d’après la loi forte des grands nombres,
NA (n)
X1 + X2 + ... + Xn p.s
=
→ pA
n
n
car la suite (Xk ) est iid et que X1 admet pour espérance pA .
b) On a
NA (n)
= pA
E
n
NA (n)
1
pA (1 − pA )
Var
=
nVar(X
)
=
1
n
n2
n
donc l’inégalité de Tchebychev appliquée à la variable aléatoire
tout ε > 0,
NA (n)
pA (1 − pA )
P − pA ≥ ε ≤
n
nε2
2
NA (n)
n
donne, pour
Si on avait
NA (n)
P
−
p
≥
ε
< ∞ par application du lemme de Borel
A
t=0
n
P∞
Cantelli (cf exercice 5 TD 8), on obtiendrait la convergence presque sûre de NAn(n)
vers pA . Mais l’inégalité obtenue par l’inégalité obtenue ne nous donne pas une
majoration par le terme général d’une série convergente, donc n’est pas suffisante
pour obtenir la convergence presque sûre...
c) Utiliser l’inégalité de Tchebychev va toutefois nous permettre de construire un intervalle de confiance de niveau 1 − δ pour pA , c’est-à-dire une région qui contienne pA
avec probabilité au moins 1 − δ. Pour cela on choisit dans l’inégalité de Tchebychev
A)
ci-dessus ε tel que pA (1−p
= δ. Pour cette valeur de ε on a alors
nε
NA (n)
− pA ≤ ε ≥ 1 − δ
P n
q
A)
En remarquant que ε = √1n pA (1−p
, on peut poser
δ
"
#
r
r
1
1
pA (1 − pA ) NA (n)
pA (1 − pA )
NA (n)
−√
;
+√
I(n, δ) =
n
δ
n
δ
n
n
4. Soit f : [0, 1] → R une fonction continue. Pour tout n ≥ 0, on définit la fonction
bn : [0, 1] → R par la formule
n X
n
k
xk (1 − x)n−k .
∀x ∈ [0, 1], bn (x) =
f
n
k
k=0
a. Montrer que la suite de fonctions (bn )n≥0 converge simplement vers f , c’est-à-dire
∀x ∈ [0, 1], lim bn (x) = f (x).
n→∞
b. Montrer que la convergence est uniforme, c’est-à-dire que
lim sup{|bn (x) − f (x)| : x ∈ [0, 1]} = 0.
n→∞
On a démontré le théorème de Stone-Weierstrass : toute fonction continue sur un segment
y est uniformément approximable par une suite de fonction polynômiales. Plus précisemment on a approximé f par une famille de polynômes de Bernstein.
1.0
2.5
0.8
2.0
0.6
1.5
0.4
1.0
0.2
0.5
0.0
0.0
0.2
0.4
0.6
0.8
0.0
0.0
1.0
Solution de l’exercice 4.
3
0.2
0.4
0.6
0.8
1.0
a) Soit x ∈ [0, 1]. On observe que bn (x) = E[f (B/n)], où B suit la loi binomiale
de paramètres n et x. Considérons donc (Xn )n≥1 une suite de v.a.i.i.d. de loi de
Bernoulli de paramètre x. On a
X1 + . . . + X n
bn (x) = E f
.
n
n
D’après la loi des grands nombres, X1 +...+X
tend presque sûrement,
quand n tend
n
X1 +...+Xn
vers l’infini, vers E[X1 ] = x. Puisque f est continue, f
tend donc presque
n
sûrement vers f (x). Enfin, puisque f est continue sur [0, 1], elle est bornée. La convern
vers f (x) est donc dominée par le supremum de
gence presque sûre de f X1 +...+X
n
f et le théorème de convergence dominée permet d’affirmer que
X 1 + . . . + Xn
bn (x) = E f
−→ f (x).
n→∞
n
b) On cherche à majorer la différence |bn (x) − f (x)| indépendamment de x.
X1 + ... + Xn
|bn (x) − f (x)| ≤ E f
− f (x)
n
X1 + ... + Xn
− f (x) 1| X1 +...+Xn −x|≥α
≤ E f
n
n
X
+
...
+
X
1
n
+E f
− f (x) 1| X1 +...+Xn −x|<α
n
n
où l’inégalité ci-dessus est vraie pour tout α. On se fixe ε > 0. Par uniforme continuité de f (f est continue sur un segment), il existe un α > 0 tel que |y − x| ≤ α ⇒
|f (y) − f (x)| ≤ ε/2. On a donc pour ce choix de α,
X1 + ... + Xn
|bn (x) − f (x)| ≤ 2||f ||∞ P − x ≥ α +ε/2
n
|
{z
}
A(x)
Il suffit maintenant de majorer A(x) par un petit nombre indépendamment de x :
pour cela il faut appliquer l’inégalité de Tchebychev. Pour tout x ∈ [0, 1], on a :
1
A(x) ≤ nα1 2 V ar(X1 ) = nα1 2 (x ∗ (1 − x)) ≤ 1∗nα
2.
Donc en prenant n assez grand, on peut rendre aussi petit que l’on veut supx A(x)
ce qui finit la preuve.
5. Soit (Xn )n≥1 une suite
variables aléatoires indépendantes de même loi de Poisson
Pde
n
de
paramètre
1.
Soit
S
=
n
k=1 Xk . Rappeler la loi de Sn et calculer la limite de la suite
P
k
n
e−n k=0 nk!
.
n≥1
4
Solution de l’exercice 5. Une somme de v.a. de Poisson indépendantes est une v.a. de
Poisson dont le paramètre (qui est aussi l’espérance et la variance) est la somme de ceux
des v.a. qu’on a ajoutées. Ainsi Sn suit une loi de Poisson de paramètre n. En particulier,
k
si k ∈ N, alors e−n nk! = P(Sn = k). En sommant, on obtient
!
n
k
X
n
e−n
= P(Sn ≤ n) = P(Sn /n ≤ 1).
k!
k=0
La loi des grands nombres nous dit que Sn /n → E[X1 ] = 1 p.s. Ainsi Sn /n est proche de
1, mais ce résultat ne nous dit pas s’il est un peu plus grand ou un peu plus petit. Pour
avoir des informations sur Sn /n − 1, (et en particulier son signe), on applique le théorème
de la limite centrale :
Sn − n loi
√
−→ N (0, 1).
n n→∞
D’après le corrolaire 4.2.1 du cours, on en déduit que, si Y suit une loi normale standard,
alors, lorsque n → ∞,
Sn − n
P(Sn /n ≤ 1) = P( √
≤ 0) → P(Y ≤ 0) = 1/2.
n
L’égalité P(Y ≤ 0) = 1/2 découle du fait que Y est symétrique.
Ainsi, on a montré que
!
n
X
nk
−n
e
→ 1/2.
k!
k=0
6.
a) Soit (pn )n≥0 une suite de réels dans ]0, 1[ telle que limn→+∞ npn = λ > 0. Soit
(Xn )n≥0 une suite de v.a. telles que pour tout n : Xn ∼ B(n, pn ) et X une v.a. de
loi de Poisson paramètre λ. Montrer que (Xn )n≥0 converge en loi vers X.
b) Soit (Xn )n≥0 une suite de v.a. réelles indépendantes de P
même√loi N (0, 1). Etudier
le comportement asymptotique en loi de la suite Yn = n1 nk=1 kXk
Solution de l’exercice 6.
a) Afin de montrer la convergence en loi de (Xn )n≥0 vers X. Montrons que φXn (t) −−−−→
n→+∞
φX (t) pour tout t ∈ R, où φX designe la fonction caractéristique d’une variable aléatoire X.
5
n
φXn (t) = 1 − pn + pn ei t
= exp n ln(1 − pn + pn ei t)
= exp −npn (1 − ei t) + npn εn
∼n exp −npn (1 − ei t)
it −1)
−−−−→ eλ(e
n→+∞
où εn −−−−→ 0
n→+∞
= φX (t).
b) Vu la forme de la variable de Yn , on est tenté d’appliquer √
la loi des grands nombres.
Cependant on ne peut pas l’appliquer car les variables kXk ne sont pas identiquement distribuées. On va donc à nouveau utiliser les fonctions caractéristiques
afin de démontrer un résultat de convergence en loi. Les variables aléatoires Xn sont
indépendantes, donc Yn est une variable gaussienne de moyenne 0 et de variance
n(n+1)
donc :
2n2
φYn (t) = e−
n(n+1) 2
t
2n2
2 /2
−−−−→ e−t
n→+∞
.
On a donc montré que (Yn )n≥1 converge en loi vers une loi normale centrée réduite
N (0, 21 ).
7. On suppose que l’intervalle de temps entre deux voitures successives à un passage
à niveau (peu fréquenté) suit une loi exponentielle de moyenne 30 minutes. On suppose de
plus qu’il y a indépendance entre les intervalles de temps séparant les instants de passage
de voitures. Calculer (une valeur approchée) de la probabilité qu’il y ait plus de 50 voitures
qui empruntent le passage à niveau une journée donnée.
Solution de l’exercice 7. Soit (Xn )n≥0 une suite de v.a. i.i.d suivant la loi exponentielle
de paramètre 1/30. On a alors E[X1 ] = 30 et V ar(X1 ) = 900. Xn représente le temps
(en minutes) qui sépare le passage de la (n − 1)ième voiture de la n−ième voiture. On
considère ensuite Sn = X1 + . . . Xn . Sn donne l’instant de passage de la n−ième voiture.
On veut déterminer
P[S50 ≤ 24 × 60].
Or on a
24 × 60 − 50 × 30
−2
S50 − 50 × 30
√
√
≤
≈F √
,
≤ 24 × 60] = P
30 × 50
30 × 50
50
P[S50
où F est la fonction de répartition
de
la loi normale centrée réduite, l’approximation étant
−2
donnée par le TCL. De plus F √50 ≈ F (−0.283) = 1 − F (0.283). En utilisant une table
ou un logiciel on obtient F (0.283) ≈ 0.61. On a donc P[S50 ≤ 24 × 60] ≈ 0.39.
6
8. Soit f : R → R une fonction continue bornée. Montrer qu’on a
Z +∞
∞
X
t2
k − n nk
1
−n
√
lim e
f
=√
f (t)e− 2 dt.
n→+∞
k!
n
2π −∞
k=0
Solution de l’exercice 8. Soit (Xn )n≥1 une suite de variables aléatoires indépendantes
de loi de Poisson de paramètre 1. On a E[X1 ] = 1 et Var(X1 ) =
1.
√ n −n
D’une part, le théorème central limite assure que la suite X1 +...+X
converge
n
n≥1
en loi vers la loi normale centrée réduite. Ainsi, puisque f est continue et bornée,
Z +∞
t2
X1 + . . . + X n − n
1
√
lim E f
=√
f (t)e− 2 dt.
n→∞
n
2π −∞
D’autre part, pour tout n ≥ 1, la variable aléatoire X1 + . . . + Xn suit la loi de Poisson
de paramètre n. Ainsi,
∞
X
X 1 + . . . + Xn − n
k − n nk
−n
√
√
.
E f
=e
f
k!
n
n
k=0
En comparant ces deux égalités, on a la convergence voulue.
9. Soient (Xn )n≥1 des variables aléatoires indépendantes identiquement distribuées et
de carré
√ intégrable. On suppose que leur loi a la propriété suivante : X1 + X2 a même loi
que 2X1 .
a) Exprimer, pour tout n ≥ 0, la loi de X1 + . . . + X2n en fonction de celle de X1 .
b) Déterminer la loi commune des variables aléatoires (Xn )n≥1 .
Solution de l’exercice 9.
√ n
a) On va montrer par récurrence que X1 + . . . + X2n a même loi que 2 X1 , pour tout
n ≥ 1. Pour n = 1, c’est l’hypothèse. Supposons le résultat démontré jusqu’au rang
n et démontrons le au rang n + 1. On écrit
X1 + . . . + X2n+1 = (X1 + . . . + X2n ) + (X2n +1 + . . . + X2n+1 ).
La v.a. X2n +1 + . . . + X2n+1 est indépendante de X1 + . . . + X2n (car les Xn sont
indépendantes et on utilise des paquets d’indices disjoints)
√ n et de même loi. Par l’hypothèse de récurrence,
loi que 2 X1 . Mais alors leur somme
√ n ces deux
√ n v.a. ont
√ même
n
a même loi que 2 X1 + 2 X2 = 2 (X1 + X2 ), qui a bien même loi (d’après
√ n+1
l’hypothèse pour n = 1) que 2 X1 . Ce qui achève la preuve par récurrence.
b) Comme X1 est de carré
√ intégrable, X1 est intégrable. L’hypothèse entraine alors
que E[X1 ] + E[X1 ] = 2E[X1 ], et donc E[X1 ] = 0. Soit σ 2 = E[X12 ]. On applique le
théorème de la limite centrale :
X1 + . . . + Xn loi
√
−→ N (0, σ 2 ).
n→∞
n
7
On a la même convergence pour les sous-suites, et en particulier :
X1 + . . . + X2n loi
√
−→ N (0, σ 2 ).
n
n→∞
2
Or, d’après la question précédente, le terme de gauche a même loi que X1 , qui suit
donc la loi N (0, σ 2 ).
8
Téléchargement