Université Paris-Dauphine Année 2008-2009
U.F.R. Mathématiques de la décision
L3 - Statistique Mathématique
Examen
Durée 2h00. Le barême est donné à titre indicatif.
Exercice 1 : (5 points) Soit (X1,...,Xn)un échantillon de va iid de même loi que X, où X
admet pour densité de probabilité f(x, θ)par rapport à la mesure Lebesgue, définie par :
f(x, θ) = kx(p+1) exp θ
x1x>0,
avec θ]0,+[un paramètre réel inconnu et p > 0un nombre connu.
1. On pose U=1
X. Montrer que UGamma(p, θ)et en déduire la constante k,EUet
Var U.
On applique la méthode du changement de variable. Soit gune fonction continue bornée
alors par changement de variable y= 1/x, on a
E(g(U)) = kZ
0
g(1/x)x(p+1) exp (θ/x)dx =kZ
0
g(y)yp1exp (θy)dy.
On reconnaît la densité d’une Gamma(p, θ)à la constante k=θp/Γ(p)près. On en
déduit EU=p/θ et Var U=p/θ2.
2. Déterminer une statistique exhaustive complète pour θ.
On est dans le cadre du modèle exponentiel à un paramètre avec
c(θ) = θp
Γ(p),
h(x) = x(p+1)1x>0,
α1(θ) = θ,
T1(x) = 1
x.
Etant donné que α1(Θ) = α1(]0; +[) =]0; +[, ouvert de dimension 1 et que T1est
affinement indépendante, on en déduit que
1
n
n
X
i=1
1
Xi
est une statistique exhaustive complète pour θ.
1
3. Déterminer b
θnl’estimateur du maximum de vraisemblance de θ.
On est dans le cadre d’un modèle régulier exponentiel où β(θ) = pln(θ)(notation de
la page 79 du polycopié). Or βes deux fois continûment dérivable de dérivée seconde
p/θ2<0donc l’EMV vérifie
β(b
θn) = 1
n
n
X
i=1
1
Xi
b
θn=np
Pn
i=1
1
Xi
4. A l’aide de la question 1, déterminer la loi de Z=
n
X
i=1
1
Xi
et montrer que :
Eb
θn=npθ
np 1,Var b
θn=(npθ)2
(np 1)2(np 2).
D’après la question 1, 1/Xiest une suite iid de va suivant la loi Gamma(p, θ)donc
ZGamma(np, θ). On en déduit que
E(b
θn) = npE1
Z=np Z
0
1
z
θnp
Γ(np)znp1exp(θz)dz =npθ
Γ(np)Z
0
unp11exp(u)du
en effectuant le changement de variable u=θz. On reconnaît la quantité Γ(np 1) et
la relation Γ(np) = (np 1)Γ(np 1) permet de conclure pour le calcul de l’espérance.
Reste à calculer E(1/Z2). Avec le même changement de variable que précédemment, on
obtient E(1/Z2) = θ2Γ(np 2)/Γ(np)d’où
Var b
θn= (np)2E(1/Z2)(npθ)2
(np 1)2= (npθ)21
(np 1)(np 2) 1
(np 1)2
et le résultat souhaité suit facilement.
5. L’estimateur b
θnest-il sans biais ? convergeant ? efficace ?
L’estimateur b
θnest biaisé d’après la question précédente. Il ne peut donc pas être efficace.
Il est toutefois convergeant car asymptotiquement sans biais et de variance tendat vers
0.
Exercice 2 :(5 points) Soit (X1,··· , Xn)un échantillon de va iid de densité par rapport à la
mesure de Lebesgue sur R+:
f(x, θ) = e(xθ)1xθ,
θRest inconnu.
1. Calculer l’EMV de θnoté b
θn.
On écrit la vraisemblance
Ln(θ) = ePn
i=1 Xi1min(X1,...,Xn)θ
qui est maximale lorsque b
θn= min(X1,...,Xn).
2. Déterminer la forme de la zone de rejet d’un test des hypothèses H0:θθ0contre
H1:θ > θ0utilisant l’EMV b
θn.
La zone de rejet sera de la forme
W={b
θn> k}
kest un seuil à calculer en fonction du seuil souhaité.
2
3. Déterminer la statistique b
Tdu test du rapport de vraisemblance pour les mêmes hypo-
thèses H0et H1. Qu’en déduire pour le test de la question 2 ?
La vraisemblance Ln(θ)vérifie le critère de factorisation pour l’EMV b
θnavec
h(x) = ePn
i=1 xiet g(θ, b
θn) = e1b
θnθ.
Donc l’EMV est une statistique exhaustive. De plus, pour tout θ0< θ1on a
Vθ01=eθ0θ11b
θnθ1
qui est une fonction croissante en b
θn. On est donc dans un modèle à RVM pour b
T=b
θnet
le test de la question 2 est UPP parmi tous les tests de niveau Pθ0(W)(Karlin-Rubin).
4. Déterminer la fonction de répartition de b
T.
On a
Pθ(b
Tx) = 1 Pθ(b
Tn> x) = 1
n
Y
i=1
Pθ(Xi> x),
par indépendance des Xi. Mais pour x > θ on a
Pθ(Xi> x) = Z
x
e(uθ)du = exp((xθ))
pour tout idonc
Pθ(b
Tx) = 1 (exp((xθ)))n= 1 exp(n(xθ))
pour x > θ et Pθ(b
Tx) = 0 autrement.
5. Expliciter la zone de rejet du test du rapport de vraisemblance pour les mêmes hypothèses
H0contre H1de niveau αfixé et déterminer sa fonction puissance. La suite de tests
associée est-elle consistante ?
Etant donné que W={b
T > k}on cherche k > θ0tel que
α=Pθ0(b
T > k) = exp(n(kθ0))
et on trouve
k=θ0+1
nln 1
α.
La fonction puissance vaut
β(θ) = Pθ(W) = Pθ(b
T > k) = Z
θk
e(uθ)dun
= 1 exp(n(θk))
= 1 αexp (n(θθ0))
en remplaçant kpar sa valeur pour tout θ > θ0.
Quand n→ ∞ et comme θθ0>0alors exp(n(θθ0)) → ∞ donc β(θ)1. La suite
de test est bien consistante.
Problème (10 points) Soit (X1,...,Xn)un échantillon de va iid de fonction de répartition F
supposée continue et strictement croissante. On note Fnla fonction de répartition empirique
Fn(x) = 1
n
n
X
j=1
1Xjx
3
La statistique de Cramer & Von Mises est définie par b
Tn=RR(Fn(x)F(x))2dF (x). La
présence de l’intégrale dans le terme précédent rend son utilisation ardue. En pratique, on
l’approche par la statistique
b
T
n=ZR
(Fn(x)F(x))2dFn(x) = 1
n
n
X
i=1
(Fn(Xi)F(Xi))2.
Le but de ce problème est de quantifier l’erreur d’approximation alors commise.
1. Montrez que F(Xi)est une variable aléatoire uniforme et en déduire que EF(Xi) = 1
2
et Var F(Xi) = 1
12.
Une fonction continue et strictement croissante est inversible. Soit F1son inverse allant
de [0; 1] dans R. Pour tout x[0,1] on a
P(F(Xi)x) = P(XiF1(x)) = F(F1(x)) = x.
Donc F(Xi)suit une loi uniforme sur [0,1] et on en déduit la valeur de son espérance et
de sa variance.
2. Montrez que nFn(x)B(n, F (x)) et en déduire l’espérance et la variance de nFn(x).
On a 1Xjxqui suit une loi de Bernoulli de paramètre F(x) = P(1Xjx= 1) donc
nFn(x) = Pn
i=1 1XjxB(n, F (x)) par indépendance des Xid’où E(nFn(x)) = nF (x)
et Var (nFn(x)) = nF (x)(1 F(x)).
3. En déduire que Eb
Tn=1
6n.
En appliquant Fubini, on obtient
Eb
Tn=ZR
E(Fn(x)F(x))2dF (x) = 1
nZR
F(x)(1 F(x)) dF (x)
=1
nZ1
0
t(1 t)dt =1
6n
4. Montrez que b
T
n=1
n
n
X
i=1 i
nF(X(i))2
.
On remarque que l’expression de b
T
nest indépendante de l’ordre dans lesquels les Xisont
sommés. Donc
b
T
n=1
n
n
X
i=1
(Fn(X(i))F(X(i)))2=1
n
n
X
i=1 i
nF(X(i))2
.
5. En admettant que
nb
Tn=1
12n+
n
X
k=1 2k1
2nF(X(k))2
montrer que
b
Tnb
T
n=1
2n1
6n2+1
n2
n
X
i=1
F(Xi).
4
On calcule
b
Tnb
T
n=1
12n2+1
n
n
X
i=1 i
nF(X(i))2
2i1
2nF(X(i))2!
=1
12n2+1
2n2
n
X
i=1 4i1
2n2F(X(i))
=1
12n2+1
2n2
n
X
i=1
4i1
2n1
n2
n
X
i=1
F(X(i))
=1
12n2+1
2n2
n
X
i=1
4i1
2n1
n2
n
X
i=1
F(Xi)
=1
2n+1
6n21
n2
n
X
i=1
F(Xi)
6. En déduire que limn→∞ n3/2E(b
T
nb
Tn) = 0 et que Var (b
T
nb
Tn) = 1
12n3.
Le fait qu’une variable uniforme comme F(Xi)ait pour moyenne 1/2et pour variance
1/12 implique que
b
Tnb
T
n=1
n2
n
X
i=1
(F(Xi)EF(Xi)) 1
6n2
d’où
E(b
T
nb
Tn) = 1
2n+1
6n21
2n=1
6n2et Var (b
T
nb
Tn) = 1
n3Var F(X1) = 1
12n3
7. Montrer aussi que n3/2(b
T
nb
Tn) N 0,1
12. Conclure.
L’identité précédente
b
Tnb
T
n=1
n2
n
X
i=1
(F(Xi)EF(Xi)) 1
6n2
et le théorème de limite centrale implique le résultat. On en déduit que l’erreur d’ap-
proximation est de l’ordre de n3/2.
8. (Facultatif) Montrer que
nb
Tn=1
12n+
n
X
k=1 2k1
2nF(X(k))2.
5
1 / 5 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !