Devoir 1 - Stephane Boucheron

publicité
École Normale Supérieure
FIMFA — Statistique 2014–2015
Devoir 1
Les statistiques d’ordre X1:n ≤ X2:n ≤ Xn:n d’un n-échantillon X1 , . . . , Xn d’observations
indépendantes identiquement distribuées sont formées par le réarrangement croissant
(convention) de l’échantillon. Quand n est clair d’après le contexte on peut les noter
X(1) ≤ . . . ≤ X(n) .
Exercice 1
Vérifier que la loi jointe des statistiques d’ordre est absolument continue par rapport à la loi
de l’échantillon.
On suppose que X est une variable aléatoire réelle, absolument continue de densité
continue. Montrer que l’échantillon est presque sûrement formé de valeurs deux à deux
distinctes. Donner la densité de la loi jointe des statistiques d’ordre.
Exercice 2
Si la loi des Xi définie par sa fonction de répartition F , admet une densité f , quelle est la
denisté de la loi de Xk:n pour 1 ≤ k ≤ n ?
Exercice 3
Montrer que conditionnellement à Xk:n = x, la suite
(Xi:n − Xk:n )i=k+1,...,n
est distribuée comme les statistiques d’ordre d’un k − 1 échantillon de la loi d’excès au
dessus de x (fonction de survie F (x + ·)/F (x)) avec la convention F = 1 − F ).
Exercice 4
Si X1 , . . . , Xn est un échantillon i.i.d. de la loi exponentielle d’espérance 1 (densité
Ix>0 e−x ), et Xn:n ≥ Xn−1:n ≥ . . . ≥ X1:n les statistiques d’ordre associées, montrer que :
— avec la convention X0:n = 0, les écarts (Xi:n − Xi−1:n )1≤i≤n (spacings) forment
une collection de variables aléatoires indépendantes ;
— Xi:n − Xi−1:n est distribuée selon une loi exponentielle d’espérance 1i .
Exercice 5
Dans cet exercice, X1 , . . . , Xn est un échantillon i.i.d. de la loi exponentielle d’espérance 1
(densité Ix>0 e−x ), et Xn:n ≥ Xn−1:n ≥ . . . ≥ X1:n les statistiques d’ordre associées, et (kn )n
1
est une suite croissante d’entiers qui tend vers l’inifini, telle que kn /n tende vers une limite
finie (éventuellement nulle).
Xkn :n −EXkn :n
Montrer que √
converge en loi vers une Gaussienne centrée réduite.
var(Xkn :n )
Exercice 6
Si f est une fonction croissante sur [a, b], on définit son inverse généralisée f ← par
f ← (y) = inf{x : x ∈ [a, b], f (x) ≥ y}
pour y ∈ [f (a), f (b)] .
Montrer que si (fn )n est une suite de fonctions croissantes sur [a, b] ⊂ R qui converge
simplement vers f une autre fonction croissante sur [a, b] en tout point de continuité de f ,
alors la suite (fn← (y)) converge simplement vers f ← (y) en tout y ∈ [f (a), f (b)] où f ← est
continue.
Exercice 7
Soit F une fonction de répartition, on définit la fonction quantile associée F ← par
F ← (p) = inf{x : F (x) ≥ p}
pour p ∈]0, 1[ .
Vérifier que si deux fonctions de répartitions ont même fonction quantiles alors elles sont
égales.
Dans cette définition F est une fonction de répartition, F ← la fonction quantile associée.
Montrer que pour tout x ∈ R, p ∈]0, 1[,
1. F ← (p) ≤ x ⇔ p ≤ F (x).
2. F ◦ F ← (p) ≥ p avec égalité si et seulement si il existe x tel que F (x) = p.
Si F ◦ F ← (p) > p alors F ← est discontinue en p.
3. F ← ◦ F (x) ≤ x.
Si F ← ◦ F (x) < x, alors il existe > 0 tel que F (x − ) = F (x).
4. (F ◦ G)← = G← ◦ F ←
Comment la convergence en distribution se traduit elle sur les fonctions quantiles ?
Exercice 8
Si Y1:n ≤ Y2:n ≤ . . . ≤ Yn:n forme les statistiques d’ordre d’un n-échantillon de la loi
exponentielle d’espérance 1, et si X1:n ≤ X2:n ≤ . . . ≤ Xn:n désigne les statistiques d’ordre
d’un n-échantillon d’une loi de fonction de répartition F qui admet une densité partout
positive, montrer que
(X1:n , X2:n , . . . , Xn:n ) ∼ (F ← (1 − exp(−Y1:n )), . . . , F ← (1 − exp(−Yn:n ))) .
Exercice 9
La fonction quantile empirique Fn← est la fonction quantile associée à la fonction de
répartition empirique Fn . Si les points de l’échantillon sont deux à deux distincts
Fn← (p) = Xk:n
pour
2
k
k−1
<p≤ .
n
n
Soit F une fonction de répartition qui est dérivable en F ← (p) de dérivée non nulle notée
f (p) pour une valeur p ∈]0, 1[. Montrer que
√
n (Fn← (p) − F ← (p)) +
Quelle est la loi limite de
√
√
n
1
(Fn (F ← (p)) − p) = oP (1) .
f (p)
n (Fn← (p) − F ← (p)) ?
Exercice 10
La loi de Cauchy admet comme densité sur R
p(x) =
1 1
.
π 1 + x2
On considère le modèle des translatées définies par
pθ (x) = p(x − θ)
pour x, θ ∈ R .
1. L’estimateur au maximum de vraisemblance est il bien défini dans ce modèle ? Est-il
unique ? Est il calculable (pour toute taille d’échantillon) ?
2. Cacluler l’information de Fisher dans ce modèle.
3. Quelle est la médiane de la loi de densité pθ ?
4. La médiane empirique dans un échantillon de taille 2n + 1 est elle un estimateur sans
biais de la médiane ?
5. La médiane empirique définit elle une suite consistante d’estimateurs de la médiane ?
(justifier...)
6. La médiane empirique définit elle une suite consistante asymptotiquement normale
d’estimateurs de la médiane ?
7. Proposez un intervalle de niveau de confiance asymptotique α ∈]0, 1[ pour θ.
Exercice 11
Mêmes questions mais pour le modèle localisation/échelle où
x−θ
pθ,σ (x) = p
pour x, θ ∈ R, σ ∈]0, ∞) .
σ
— Proposez un estimateur pour θ, σ.
— Proposez un intervalle de niveau de confiance asymptotique α ∈]0, 1[ pour θ.
— Proposez un intervalle de niveau de confiance asymptotique α ∈]0, 1[ pour σ.
Exercice 12
À l’aide du logiciel de votre choix, et pour les valeurs des paramètres de votre choix,
effectuez une simulation numérique pour étudier le comportement des estimateurs obtenus
dans l’exercice précédent, pour des valeurs de n entre 3 et 10 000. Étudiez également le
comportement de la moyenne empirique et de l’écart-type empirique d’un échantillon
suivant la loi de Cauchy. Commentez.
Note : En Statistique, on utilise souvent le logiciel R (www.r-project.org), par exemple
avec l’IDE RStudio (www.rstudio.org). La commande rcauchy() pourra alors être utile.
3
Téléchargement