Théorème de Dini et application au théorème de

publicité
Développement: Théorème de Dini
et application au théorème de Glivenko Cantelli
Adrien Fontaine
1er juillet 2014
Référence : Gourdon, Analyse
Nourdin, Agrégation de mathématiques, épreuve orale
Théorème 1 (Deuxième théorème de Dini)
Soient a, b ∈ R avec a < b, et (fn )n∈N une suite de fonctions croissantes de [a, b] dans R, qui
converge simplement vers une fonction continue f . Alors, (fn
)n∈N converge uniformément vers f sur [a, b].
Démonstration : Soit ε > 0. La fonction f étant continue sur le compact [a, b], elle est uniformément
continue sur [a, b] par le théorème de Heine. Il existe donc η > 0 tel que
∀x, y ∈ [a, b], |x − y| < η ⇒ |f (x) − f (y)| < ε
Soit alors S = (a = a0 < a1 < ... < an−1 < an = b) une subdivision de [a, b] de pas < η. Puisque
(fn ) converge simplement vers f , et que les ai sont en nombre fini, il existe un entier n0 ∈ N, tel
que ∀n ≥ n0 , et ∀1 ≤ i ≤ n, on ait |f (ai ) − fn (ai )| < ε.
Soit x ∈ [a, b] et n ≥ n0 . Il existe i ∈ {1, ..., n} tel que x ∈ [ai , ai+1 ]. Alors,
|f (x) − f (ai )| < ε
Donc,
|f (x) − fn (x)| ≤ |f (x) − f (ai )| + |f (ai ) − fn (ai )| + |fn (ai ) − fn (x)|
≤ ε + ε + (fn (x) − fn (ai )) car fn est croissante
≤ 2ε + fn (ai+1 ) − fn (ai ) car fn est croissante
≤ 2ε + |fn (ai+1 ) − f (ai+1 )| + |f (ai+1 − f (ai )| + |f (ai ) − fn (ai )|
≤ 5ε
La convergence est donc uniforme.
1
2
Application :
Théorème 2 (de Glivenko-Cantelli)
Soit (Xn )n∈N une suite de v.a.i.i.d. Notons F la fonction de répartition commune des Xn et
posons si t ∈ R et n ∈ N∗ , la variable aléatoire :
Fn (t) =
n
1X
1]−∞,t] (Xk )
n k=1
Alors, presque surement, on a :
sup |Fn (t) − F (t)| −→ 0
n→+∞
t∈R
Démonstration : Idée de la preuve : La loi forte des grands nombres nous donne facilement
Fn (t) −→p.s
n→+∞ F (t) pour tout t ∈ R. Par ailleurs, chaque fonction Fn est croissante. On a donc
envie d’appliquer le deuxième théorème de Dini. Plusieurs problèmes se posent alors :
— la fonction F n’est pas, a priori, continue.
— la convergence n’a pas, a priori, lieu sur un segment.
— la loi forte des grands nombres nous donne
∀t ∈ R, ∃At /P(At ) = 1 et ∀ω ∈ At , Fn (t)(ω) −→ F (t)(ω)
n→+∞
Pour appliquer le théorème de Dini, il nous faut trouver un ensemble A de mesure pleine
uniforme pour tous les t ∈ R. Autrement dit, on cherche A tel que P(A) = 1 et
∀ω ∈ A, ∀t ∈ R, Fn (t)(ω) −→ F (t)(ω)
n→+∞
Les deux premiers points seront résolus grâce à l’inverse généralisé de la fonction de répartition,
le troisième grâce à la séparabilité de R.
Commençons par deux résultats fondamentaux sur l’inverse généralisé de la fonction F .
Lemme 1
On introduit l’inverse généralisé de la fonction F :
∀u ∈ [0, 1], F ← (u) := inf{x ∈ R/F (x) ≥ u}
Alors, on a l’équivalence suivante, pour tout x ∈ R et u ∈ [0, 1],
F ← (u) ≤ x ⇐⇒ u ≤ F (x)
Démonstration : Si F ← (u) ≤ x, alors il existe y ≤ x tel que F (y) ≥ u. Mais par croissance
de F , on a F (y) ≤ F (x), et donc
u ≤ F (y) ≤ F (x)
Réciproquement, si u ≤ F (x), alors x ∈ {y ∈ R/F (y) ≥ u}, et doncx ≥ inf{y ∈ R/F (y) ≥
u}, i.e
F ← (u) ≤ x
3
Corollaire 1
Si Y est une v.a réelle de fonction de répartition F et U ∼ U([0, 1]), alors F ← (U ) ∼ Y .
Démonstration : Il suffit d’écrire
P(F ← (U ) ≤ x) = P(U ≤ F (x)) = F (x)
car la restriction à [0, 1] de la fonction de répartition d’une loi uniforme est l’identité.
On va maintenant pouvoir se ramener, dans la preuve du théorème de Glivenko-Cantelli, au cas
de v.a qui suivent une loi uniforme sur [0, 1].
En effet, soit (Un )n∈N une suite de v.a réelles indépendantes de même loi U([0, 1]). Alors, on a :
sup |
t∈R
n
n
n
1X
1X
1X
1Xk ≤t − F (t)| ∼ sup |
1F ← (Uk )≤t − F (t)| ∼ sup |
1Uk ≤F (t) − F (t)|
n k=1
t∈R n k=1
t∈R n k=1
Par ailleurs, si on pose s = F (t), il vient :
sup |
t∈R
n
n
n
1X
1X
1X
1Uk ≤F (t) − F (t)| = sup |
1Uk ≤s − s| ≤ sup |
1Uk ≤s − s|
n k=1
s∈F (R) n k=1
s∈[0,1] n k=1
Ainsi, il suffit de montrer que le théorème de Glivenko-Cantelli est vrai dans le cas particulier de
v.a qui suivent des lois U([0, 1]), et où s ∈ [0, 1].
Grâce à loi forte des grands nombres, on sait que pour tout s ∈ [0, 1], il existe As de mesure pleine
tel que
n
1X
1
→s
∀ω ∈ As ,
n k=1 Uk (ω)≤s
On va maintenant essayer de trouver un ensemble A de mesure pleine, qui soit uniforme pour
tous les s ∈ [0, 1].
Q étant dénombrable, et une intersection dénombrable d’ensembles de mesure pleine étant de
mesure pleine, on en déduit l’existence d’un ensemble A de mesure pleine tel que
∀ω ∈ A, ∀s ∈ [0, 1] ∩ Q,
n
1X
1
→s
n k=1 Uk (ω)≤s
Montrons que la propriété ci-dessus est vraie pour tout s ∈ [0, 1] et pas seulement pour tout
s ∈ [0, 1] ∩ Q.
Fixons s ∈ [0, 1] et ε > 0. Q ∩ [0, 1] étant dense dans [0, 1], il existe p et q deux éléments de
Q ∩ [0, 1] tels que s − ε ≤ p ≤ s ≤ q ≤ s + ε.
P
Alors, par croissance de s 7→ n1 nk=1 1Uk (ω)≤s , on a
n
n
n
1X
1X
1X
1Uk (ω)≤p ≤
1Uk (ω)≤s ≤
1
n k=1
n k=1
n k=1 Uk (ω)≤q
pour tout ω ∈ A.
D’où, en passant à la lim sup à droite et à la lim inf à gauche, on en déduit (la propriété étant
vérifiée pour p et q) :
n
n
1X
1X
s − ε ≤ lim inf
1Uk (ω)≤s ≤ lim sup
1Uk (ω)≤s ≤ s + ε
n→+∞ n
n→+∞ n k=1
k=1
pour tout ω ∈ A.
P
Pour chaque ω ∈ A, la suite de fonctions croissantes n1 nk=1 1Uk (ω)≤s converge donc simplement
vers s sur [0, 1]. Le deuxième théorème de Dini, nous assure alors que la convergence est uniforme
sur [0, 1]. Ce qui achève la démonstration.
4
Remarques :
• Pour justifier que l’application définie sur Ω par supt∈R |Fn (t) − F (t)| est bien une variable
aléatoire (ce qui justifie par la même occasion la suite d’équivalences en loi de la preuve du
théorème de Glivenko-Cantelli), on a besoin du lemme suivant :
Lemme 2
La fonction de répartition empirique Fn bâtie sur les variables aléatoires X1 , ..., Xn de fonction
de répartition F vérifie :
∀ω ∈ Ω, sup |Fn (x)(ω) − F (x)| = sup |Fn (ω)(x) − F (x)|
x∈R
x∈Q
En conséquence, kFn − F k∞ est une variable aléatoire réelle.
Démonstration : Fixons ω quelconque dans Ω et notons pour alléger
τ := kFn (.)(ω) − F k∞ = sup |Fn (x)(ω) − F (x)|
x∈R
Comme Fn (x)(ω) et F (x) sont toujours deux réels de [0, 1], ce suprémum τ est fini. Alors, pour
tout ε > 0, il existe un xε tel que
τ − ε < |Fn (xε )(ω) − F (xε )| ≤ τ
Les fonctions de répartitions Fn (.)(ω) et F étant continues à droite au point xε , la valeur absolue
de leur différence l’est aussi. Il existe donc un δ > 0 tel que
∀t ∈]xε , xε + δ[, |Fn (t)(ω) − F (t)| > |Fn (xε )(ω) − F (xε )| − ε
Par ailleurs, Q étant dense dans R, il y a au moins un rationnel t dans l’intervalle ]xε , xε + δ[. Ce
rationnel vérifiant l’inégalité ci-dessus, on en déduit
sup |Fn (r)(ω) − F (r)| > τ − 2ε
r∈Q
Le premier membre ne dépendant pas de ε et ε > 0 étant arbitraire, on en déduit
sup |Fn (r)(ω) − F (r)| ≥ τ := sup |Fn (r)(ω) − F (r)|
r∈Q
r∈R
Puisque ω était quelconque, ceci vaut pour tout ω ∈ Ω. L’inégalité dans l’autre sens est évidente,
donc l’égalité du lemme est démontrée pour tout ω ∈ Ω.
• Il existe bien sur un premier théorème de Dini dont l’énoncé est le suivant :
Théorème 3 (Premier théorème de Dini)
Soient a, b ∈ R avec a < b, et (fn )n∈N une suite croissante de fonctions continues de [a, b] dans
R, qui converge simplement vers une fonction continue f . Alors, (fn )n∈N converge uniformément
vers f sur [a, b].
Prendre garde au fait que dans ce théorème, on a besoin de la continuité des fn , contrairement au deuxième théorème de Dini. Dans Gourdon, les fonctions fn sont supposées
continues dans les deux théorèmes de Dini, mais comme on le voit ici, cette hypothèse
n’est pas nécessaire pour le deuxième. La démonstration du théorème de Glivenko-Cantelli
nécessite d’ailleurs cet énoncé plus précis, puisqu’a priori, il n’y a aucune raison pour que
les fonctions Fn soient continues.
5
• Pour tout n, si (Xk )1≤k≤n est un échantillon de taille n, la fonction Fn est appelée la fonction
de répartition empirique de l’échantillon (Xk )1≤k≤n .
• Le théorème de Glivenko-Cantelli est parfois appelé théorème fondamental de la statistique,
car il exprime en quoi une loi de probabilité peut être révélée par la connaissance d’un
échantillon suffisamment grand de ladite loi de probabilité.
• Le théorème de Glivenko-Cantelli est parfois considéré comme une généralisation du deuxième
théorème de Dini, car il ne suppose pas en particulier la continuité de F , ni le fait d’être
défini sur un compact.
• Le théorème de Kolmogorov-Smirnov précise l’énoncé du théorème de Glivenko-Cantelli
dans le cas où F est continue : il donne une estimation de la vitesse de convergence en √1n :
Théorème 4 (de Kolmogorov-Smirnov)
Soit (X1 , ..., Xn ) un échantillon de loi µ sur R de fonction de répartition F . Si F est continue,
alors
√
Kn = n sup |Fn (x) − F (x)| −→L µKS
x∈R
où µKS est une loi universelle ne dépendant pas de F . Elle est portée par R+ et a pour fonction
de répartition pour t ≥ 0 :
FKS (t) = 1 + 2
+∞
X
(−1)k e−2k
2 t2
k=1
• Le théorème de Kolmogorov-Smirnov est à la base du test d’adéquation à une loi de
Kolomogorov-Smirnov.
Téléchargement