Développement: Théorème de Dini et application au théorème de Glivenko Cantelli Adrien Fontaine 1er juillet 2014 Référence : Gourdon, Analyse Nourdin, Agrégation de mathématiques, épreuve orale Théorème 1 (Deuxième théorème de Dini) Soient a, b ∈ R avec a < b, et (fn )n∈N une suite de fonctions croissantes de [a, b] dans R, qui converge simplement vers une fonction continue f . Alors, (fn )n∈N converge uniformément vers f sur [a, b]. Démonstration : Soit ε > 0. La fonction f étant continue sur le compact [a, b], elle est uniformément continue sur [a, b] par le théorème de Heine. Il existe donc η > 0 tel que ∀x, y ∈ [a, b], |x − y| < η ⇒ |f (x) − f (y)| < ε Soit alors S = (a = a0 < a1 < ... < an−1 < an = b) une subdivision de [a, b] de pas < η. Puisque (fn ) converge simplement vers f , et que les ai sont en nombre fini, il existe un entier n0 ∈ N, tel que ∀n ≥ n0 , et ∀1 ≤ i ≤ n, on ait |f (ai ) − fn (ai )| < ε. Soit x ∈ [a, b] et n ≥ n0 . Il existe i ∈ {1, ..., n} tel que x ∈ [ai , ai+1 ]. Alors, |f (x) − f (ai )| < ε Donc, |f (x) − fn (x)| ≤ |f (x) − f (ai )| + |f (ai ) − fn (ai )| + |fn (ai ) − fn (x)| ≤ ε + ε + (fn (x) − fn (ai )) car fn est croissante ≤ 2ε + fn (ai+1 ) − fn (ai ) car fn est croissante ≤ 2ε + |fn (ai+1 ) − f (ai+1 )| + |f (ai+1 − f (ai )| + |f (ai ) − fn (ai )| ≤ 5ε La convergence est donc uniforme. 1 2 Application : Théorème 2 (de Glivenko-Cantelli) Soit (Xn )n∈N une suite de v.a.i.i.d. Notons F la fonction de répartition commune des Xn et posons si t ∈ R et n ∈ N∗ , la variable aléatoire : Fn (t) = n 1X 1]−∞,t] (Xk ) n k=1 Alors, presque surement, on a : sup |Fn (t) − F (t)| −→ 0 n→+∞ t∈R Démonstration : Idée de la preuve : La loi forte des grands nombres nous donne facilement Fn (t) −→p.s n→+∞ F (t) pour tout t ∈ R. Par ailleurs, chaque fonction Fn est croissante. On a donc envie d’appliquer le deuxième théorème de Dini. Plusieurs problèmes se posent alors : — la fonction F n’est pas, a priori, continue. — la convergence n’a pas, a priori, lieu sur un segment. — la loi forte des grands nombres nous donne ∀t ∈ R, ∃At /P(At ) = 1 et ∀ω ∈ At , Fn (t)(ω) −→ F (t)(ω) n→+∞ Pour appliquer le théorème de Dini, il nous faut trouver un ensemble A de mesure pleine uniforme pour tous les t ∈ R. Autrement dit, on cherche A tel que P(A) = 1 et ∀ω ∈ A, ∀t ∈ R, Fn (t)(ω) −→ F (t)(ω) n→+∞ Les deux premiers points seront résolus grâce à l’inverse généralisé de la fonction de répartition, le troisième grâce à la séparabilité de R. Commençons par deux résultats fondamentaux sur l’inverse généralisé de la fonction F . Lemme 1 On introduit l’inverse généralisé de la fonction F : ∀u ∈ [0, 1], F ← (u) := inf{x ∈ R/F (x) ≥ u} Alors, on a l’équivalence suivante, pour tout x ∈ R et u ∈ [0, 1], F ← (u) ≤ x ⇐⇒ u ≤ F (x) Démonstration : Si F ← (u) ≤ x, alors il existe y ≤ x tel que F (y) ≥ u. Mais par croissance de F , on a F (y) ≤ F (x), et donc u ≤ F (y) ≤ F (x) Réciproquement, si u ≤ F (x), alors x ∈ {y ∈ R/F (y) ≥ u}, et doncx ≥ inf{y ∈ R/F (y) ≥ u}, i.e F ← (u) ≤ x 3 Corollaire 1 Si Y est une v.a réelle de fonction de répartition F et U ∼ U([0, 1]), alors F ← (U ) ∼ Y . Démonstration : Il suffit d’écrire P(F ← (U ) ≤ x) = P(U ≤ F (x)) = F (x) car la restriction à [0, 1] de la fonction de répartition d’une loi uniforme est l’identité. On va maintenant pouvoir se ramener, dans la preuve du théorème de Glivenko-Cantelli, au cas de v.a qui suivent une loi uniforme sur [0, 1]. En effet, soit (Un )n∈N une suite de v.a réelles indépendantes de même loi U([0, 1]). Alors, on a : sup | t∈R n n n 1X 1X 1X 1Xk ≤t − F (t)| ∼ sup | 1F ← (Uk )≤t − F (t)| ∼ sup | 1Uk ≤F (t) − F (t)| n k=1 t∈R n k=1 t∈R n k=1 Par ailleurs, si on pose s = F (t), il vient : sup | t∈R n n n 1X 1X 1X 1Uk ≤F (t) − F (t)| = sup | 1Uk ≤s − s| ≤ sup | 1Uk ≤s − s| n k=1 s∈F (R) n k=1 s∈[0,1] n k=1 Ainsi, il suffit de montrer que le théorème de Glivenko-Cantelli est vrai dans le cas particulier de v.a qui suivent des lois U([0, 1]), et où s ∈ [0, 1]. Grâce à loi forte des grands nombres, on sait que pour tout s ∈ [0, 1], il existe As de mesure pleine tel que n 1X 1 →s ∀ω ∈ As , n k=1 Uk (ω)≤s On va maintenant essayer de trouver un ensemble A de mesure pleine, qui soit uniforme pour tous les s ∈ [0, 1]. Q étant dénombrable, et une intersection dénombrable d’ensembles de mesure pleine étant de mesure pleine, on en déduit l’existence d’un ensemble A de mesure pleine tel que ∀ω ∈ A, ∀s ∈ [0, 1] ∩ Q, n 1X 1 →s n k=1 Uk (ω)≤s Montrons que la propriété ci-dessus est vraie pour tout s ∈ [0, 1] et pas seulement pour tout s ∈ [0, 1] ∩ Q. Fixons s ∈ [0, 1] et ε > 0. Q ∩ [0, 1] étant dense dans [0, 1], il existe p et q deux éléments de Q ∩ [0, 1] tels que s − ε ≤ p ≤ s ≤ q ≤ s + ε. P Alors, par croissance de s 7→ n1 nk=1 1Uk (ω)≤s , on a n n n 1X 1X 1X 1Uk (ω)≤p ≤ 1Uk (ω)≤s ≤ 1 n k=1 n k=1 n k=1 Uk (ω)≤q pour tout ω ∈ A. D’où, en passant à la lim sup à droite et à la lim inf à gauche, on en déduit (la propriété étant vérifiée pour p et q) : n n 1X 1X s − ε ≤ lim inf 1Uk (ω)≤s ≤ lim sup 1Uk (ω)≤s ≤ s + ε n→+∞ n n→+∞ n k=1 k=1 pour tout ω ∈ A. P Pour chaque ω ∈ A, la suite de fonctions croissantes n1 nk=1 1Uk (ω)≤s converge donc simplement vers s sur [0, 1]. Le deuxième théorème de Dini, nous assure alors que la convergence est uniforme sur [0, 1]. Ce qui achève la démonstration. 4 Remarques : • Pour justifier que l’application définie sur Ω par supt∈R |Fn (t) − F (t)| est bien une variable aléatoire (ce qui justifie par la même occasion la suite d’équivalences en loi de la preuve du théorème de Glivenko-Cantelli), on a besoin du lemme suivant : Lemme 2 La fonction de répartition empirique Fn bâtie sur les variables aléatoires X1 , ..., Xn de fonction de répartition F vérifie : ∀ω ∈ Ω, sup |Fn (x)(ω) − F (x)| = sup |Fn (ω)(x) − F (x)| x∈R x∈Q En conséquence, kFn − F k∞ est une variable aléatoire réelle. Démonstration : Fixons ω quelconque dans Ω et notons pour alléger τ := kFn (.)(ω) − F k∞ = sup |Fn (x)(ω) − F (x)| x∈R Comme Fn (x)(ω) et F (x) sont toujours deux réels de [0, 1], ce suprémum τ est fini. Alors, pour tout ε > 0, il existe un xε tel que τ − ε < |Fn (xε )(ω) − F (xε )| ≤ τ Les fonctions de répartitions Fn (.)(ω) et F étant continues à droite au point xε , la valeur absolue de leur différence l’est aussi. Il existe donc un δ > 0 tel que ∀t ∈]xε , xε + δ[, |Fn (t)(ω) − F (t)| > |Fn (xε )(ω) − F (xε )| − ε Par ailleurs, Q étant dense dans R, il y a au moins un rationnel t dans l’intervalle ]xε , xε + δ[. Ce rationnel vérifiant l’inégalité ci-dessus, on en déduit sup |Fn (r)(ω) − F (r)| > τ − 2ε r∈Q Le premier membre ne dépendant pas de ε et ε > 0 étant arbitraire, on en déduit sup |Fn (r)(ω) − F (r)| ≥ τ := sup |Fn (r)(ω) − F (r)| r∈Q r∈R Puisque ω était quelconque, ceci vaut pour tout ω ∈ Ω. L’inégalité dans l’autre sens est évidente, donc l’égalité du lemme est démontrée pour tout ω ∈ Ω. • Il existe bien sur un premier théorème de Dini dont l’énoncé est le suivant : Théorème 3 (Premier théorème de Dini) Soient a, b ∈ R avec a < b, et (fn )n∈N une suite croissante de fonctions continues de [a, b] dans R, qui converge simplement vers une fonction continue f . Alors, (fn )n∈N converge uniformément vers f sur [a, b]. Prendre garde au fait que dans ce théorème, on a besoin de la continuité des fn , contrairement au deuxième théorème de Dini. Dans Gourdon, les fonctions fn sont supposées continues dans les deux théorèmes de Dini, mais comme on le voit ici, cette hypothèse n’est pas nécessaire pour le deuxième. La démonstration du théorème de Glivenko-Cantelli nécessite d’ailleurs cet énoncé plus précis, puisqu’a priori, il n’y a aucune raison pour que les fonctions Fn soient continues. 5 • Pour tout n, si (Xk )1≤k≤n est un échantillon de taille n, la fonction Fn est appelée la fonction de répartition empirique de l’échantillon (Xk )1≤k≤n . • Le théorème de Glivenko-Cantelli est parfois appelé théorème fondamental de la statistique, car il exprime en quoi une loi de probabilité peut être révélée par la connaissance d’un échantillon suffisamment grand de ladite loi de probabilité. • Le théorème de Glivenko-Cantelli est parfois considéré comme une généralisation du deuxième théorème de Dini, car il ne suppose pas en particulier la continuité de F , ni le fait d’être défini sur un compact. • Le théorème de Kolmogorov-Smirnov précise l’énoncé du théorème de Glivenko-Cantelli dans le cas où F est continue : il donne une estimation de la vitesse de convergence en √1n : Théorème 4 (de Kolmogorov-Smirnov) Soit (X1 , ..., Xn ) un échantillon de loi µ sur R de fonction de répartition F . Si F est continue, alors √ Kn = n sup |Fn (x) − F (x)| −→L µKS x∈R où µKS est une loi universelle ne dépendant pas de F . Elle est portée par R+ et a pour fonction de répartition pour t ≥ 0 : FKS (t) = 1 + 2 +∞ X (−1)k e−2k 2 t2 k=1 • Le théorème de Kolmogorov-Smirnov est à la base du test d’adéquation à une loi de Kolomogorov-Smirnov.