École Normale Supérieure FIMFA — Statistique 2014–2015 Devoir 1 Les statistiques d’ordre X1:n ≤ X2:n ≤ Xn:n d’un n-échantillon X1 , . . . , Xn d’observations indépendantes identiquement distribuées sont formées par le réarrangement croissant (convention) de l’échantillon. Quand n est clair d’après le contexte on peut les noter X(1) ≤ . . . ≤ X(n) . Exercice 1 Vérifier que la loi jointe des statistiques d’ordre est absolument continue par rapport à la loi de l’échantillon. On suppose que X est une variable aléatoire réelle, absolument continue de densité continue. Montrer que l’échantillon est presque sûrement formé de valeurs deux à deux distinctes. Donner la densité de la loi jointe des statistiques d’ordre. Exercice 2 Si la loi des Xi définie par sa fonction de répartition F , admet une densité f , quelle est la denisté de la loi de Xk:n pour 1 ≤ k ≤ n ? Exercice 3 Montrer que conditionnellement à Xk:n = x, la suite (Xi:n − Xk:n )i=k+1,...,n est distribuée comme les statistiques d’ordre d’un k − 1 échantillon de la loi d’excès au dessus de x (fonction de survie F (x + ·)/F (x)) avec la convention F = 1 − F ). Exercice 4 Si X1 , . . . , Xn est un échantillon i.i.d. de la loi exponentielle d’espérance 1 (densité Ix>0 e−x ), et Xn:n ≥ Xn−1:n ≥ . . . ≥ X1:n les statistiques d’ordre associées, montrer que : — avec la convention X0:n = 0, les écarts (Xi:n − Xi−1:n )1≤i≤n (spacings) forment une collection de variables aléatoires indépendantes ; — Xi:n − Xi−1:n est distribuée selon une loi exponentielle d’espérance 1i . Exercice 5 Dans cet exercice, X1 , . . . , Xn est un échantillon i.i.d. de la loi exponentielle d’espérance 1 (densité Ix>0 e−x ), et Xn:n ≥ Xn−1:n ≥ . . . ≥ X1:n les statistiques d’ordre associées, et (kn )n 1 est une suite croissante d’entiers qui tend vers l’inifini, telle que kn /n tende vers une limite finie (éventuellement nulle). Xkn :n −EXkn :n Montrer que √ converge en loi vers une Gaussienne centrée réduite. var(Xkn :n ) Exercice 6 Si f est une fonction croissante sur [a, b], on définit son inverse généralisée f ← par f ← (y) = inf{x : x ∈ [a, b], f (x) ≥ y} pour y ∈ [f (a), f (b)] . Montrer que si (fn )n est une suite de fonctions croissantes sur [a, b] ⊂ R qui converge simplement vers f une autre fonction croissante sur [a, b] en tout point de continuité de f , alors la suite (fn← (y)) converge simplement vers f ← (y) en tout y ∈ [f (a), f (b)] où f ← est continue. Exercice 7 Soit F une fonction de répartition, on définit la fonction quantile associée F ← par F ← (p) = inf{x : F (x) ≥ p} pour p ∈]0, 1[ . Vérifier que si deux fonctions de répartitions ont même fonction quantiles alors elles sont égales. Dans cette définition F est une fonction de répartition, F ← la fonction quantile associée. Montrer que pour tout x ∈ R, p ∈]0, 1[, 1. F ← (p) ≤ x ⇔ p ≤ F (x). 2. F ◦ F ← (p) ≥ p avec égalité si et seulement si il existe x tel que F (x) = p. Si F ◦ F ← (p) > p alors F ← est discontinue en p. 3. F ← ◦ F (x) ≤ x. Si F ← ◦ F (x) < x, alors il existe > 0 tel que F (x − ) = F (x). 4. (F ◦ G)← = G← ◦ F ← Comment la convergence en distribution se traduit elle sur les fonctions quantiles ? Exercice 8 Si Y1:n ≤ Y2:n ≤ . . . ≤ Yn:n forme les statistiques d’ordre d’un n-échantillon de la loi exponentielle d’espérance 1, et si X1:n ≤ X2:n ≤ . . . ≤ Xn:n désigne les statistiques d’ordre d’un n-échantillon d’une loi de fonction de répartition F qui admet une densité partout positive, montrer que (X1:n , X2:n , . . . , Xn:n ) ∼ (F ← (1 − exp(−Y1:n )), . . . , F ← (1 − exp(−Yn:n ))) . Exercice 9 La fonction quantile empirique Fn← est la fonction quantile associée à la fonction de répartition empirique Fn . Si les points de l’échantillon sont deux à deux distincts Fn← (p) = Xk:n pour 2 k k−1 <p≤ . n n Soit F une fonction de répartition qui est dérivable en F ← (p) de dérivée non nulle notée f (p) pour une valeur p ∈]0, 1[. Montrer que √ n (Fn← (p) − F ← (p)) + Quelle est la loi limite de √ √ n 1 (Fn (F ← (p)) − p) = oP (1) . f (p) n (Fn← (p) − F ← (p)) ? Exercice 10 La loi de Cauchy admet comme densité sur R p(x) = 1 1 . π 1 + x2 On considère le modèle des translatées définies par pθ (x) = p(x − θ) pour x, θ ∈ R . 1. L’estimateur au maximum de vraisemblance est il bien défini dans ce modèle ? Est-il unique ? Est il calculable (pour toute taille d’échantillon) ? 2. Cacluler l’information de Fisher dans ce modèle. 3. Quelle est la médiane de la loi de densité pθ ? 4. La médiane empirique dans un échantillon de taille 2n + 1 est elle un estimateur sans biais de la médiane ? 5. La médiane empirique définit elle une suite consistante d’estimateurs de la médiane ? (justifier...) 6. La médiane empirique définit elle une suite consistante asymptotiquement normale d’estimateurs de la médiane ? 7. Proposez un intervalle de niveau de confiance asymptotique α ∈]0, 1[ pour θ. Exercice 11 Mêmes questions mais pour le modèle localisation/échelle où x−θ pθ,σ (x) = p pour x, θ ∈ R, σ ∈]0, ∞) . σ — Proposez un estimateur pour θ, σ. — Proposez un intervalle de niveau de confiance asymptotique α ∈]0, 1[ pour θ. — Proposez un intervalle de niveau de confiance asymptotique α ∈]0, 1[ pour σ. Exercice 12 À l’aide du logiciel de votre choix, et pour les valeurs des paramètres de votre choix, effectuez une simulation numérique pour étudier le comportement des estimateurs obtenus dans l’exercice précédent, pour des valeurs de n entre 3 et 10 000. Étudiez également le comportement de la moyenne empirique et de l’écart-type empirique d’un échantillon suivant la loi de Cauchy. Commentez. Note : En Statistique, on utilise souvent le logiciel R (www.r-project.org), par exemple avec l’IDE RStudio (www.rstudio.org). La commande rcauchy() pourra alors être utile. 3