Introduction à la Statistique et à l’Économétrie
2013
Exercices
Série 1
Exercice 1
On transmet un signal périodique f(t), t [0, T ]échantillonné à une certaine fréquence N.
Chaque donnée f(k/N),k= 1, . . . , NT , est corrompue lors de la transmission par une erreur ek,
de sorte que l’on capte
Yk=f(k/N) + ek, k = 1, . . . , NT.
On a n=NT observations. On postule que les erreurs sont indépendantes les unes des autres,
identiquement distribuées, nulles en moyenne, et de variance finie. On suppose pour simplifier
que la loi des ekadmet une densité bconnue par rapport à la mesure de Lebesgue. Le paramètre
inconnu est le signal fpris dans un ensemble de signaux F.
1. Décrire le modèle statistique engendré par cette observation.
2. Montrer que le modèle statistique engendré par cette observation est dominé et exhiber sa
vraisemblance.
Exercice 2
On cherche – en laboratoire – à tester la fiabilité d’un appareil industriel. On fait fonctionner en
parallèle nappareils jusqu’à ce qu’ils tombent tous en panne. On note
X1, . . . , Xn
les instants de panne observés. On dispose donc de nobservations. On suppose que les temps de
panne suivent une loi exponentielle de paramètre λ > 0.
1. Décrire l’observation associée à cette expérience et le modèle statistique engendré par cette
observation.
2. Montrer que le modèle statistique engendré par cette observation est identifiable, dominé
et exhiber sa vraisemblance.
3. Si les appareils sont fiables, ce qui est réaliste en pratique, la quantité maxi=1,...,n Xisera
souvent hors d’atteinte pour le statisticien. On stoppe l’expérience après un temps terminal
Tet on observe plutôt
X?
i= min{Xi, T }, i = 1, . . . n.
Reprendre les deux questions précédentes dans ce contexte.
Exercice 3 (Modèle probit et contre-exemple à l’identifiabilité)
Nous disposons d’une information relative au comportement de remboursement ou de non-
remboursement d’emprunteurs :
Y=1si l’emprunteur rembourse
0si l’emprunteur est défaillant
Afin de modéliser ce phénomène, on suppose l’existence d’une variable aléatoire Y?gaussienne,
d’espérance met de variance σ2, que l’on appellera « capacité de remboursement de l’individu »
de sorte que :
Y=1si Y?>0
0si Y?0
1
On note Φla fonction de répartition de la normale centrée réduite N(0,1).
1. Exprimer la loi de Yen fonction de Φ.
2. On observe un n-échantillon (Y1, . . . , Yn)de même loi que Y. Ecrire le modèle statistique
engendré par l’observation (Y1, . . . , Yn). Est-il identifiable ?
Exercice 4
Soit ε1, . . . , ε4quatre variables aléatoires indépendantes de loi N(0,1). On suppose que l’on
observe
Y1=µ1+σε1, Y2=µ2+σ
3ε2,
Y3=µ2+σε3, Y4=µ3+σ
2ε4,
σ > 0est connu. Ecrire la représentation linéaire du modèle, c’est-à-dire écrire l’observation
sous la forme Xθ +σε, oùε∼ N(0, IR4)et Xest une matrice – la matrice explicative – que l’on
déterminera.
1. Etudier l’estimateur ˆµ2:= 1
2(Y2+Y3).
2. Comparer ˆµ2à la famille d’estimateurs
ˆµ(α)
2:= αY2+ (1 α)Y3,0α1.
Exercice 5 (Loi normale et estimation de la variance)
Soient X1, . . . , Xndes échantillons i.i.d. de loi N(µ, σ2)avec µRet σ2R+
1. Déterminer la fonction de vraisemblance associée à cette expérience.
2. Calculer l’estimateur (bµ, c
σ2)du maximum de vraisemblance de (µ, σ2).
3. Quelle est le biais de c
σ2? En déduitre qu’il existe γnindépendant de µet σ2tel que
f
σ2=γnc
σ2soit sans biais.
4. Comparer ces deux estimateurs en terme de risque quadratique.
Exercice 6 (Théorème de Slutsky)
Soient (Xn),(Yn)deux suites de variables aléatoires vectorielles, Xet Ydes variables aléatoires
vectorielles, telles que
1. (Xn)converge en loi vers X
2. (Yn)converge en probabilité vers Y
3. Yest indépendante de (Xn)et X.
Montrer que le couple (Xn, Yn)converge en loi vers (X, Y ).
2
Introduction à la Statistique et à l’Économétrie
2013
Exercices
Série 2
Exercice 7 (Maximum de vraisemblance et loi uniforme)
On observe X1,··· , Xnindépendantes et de même loi uniforme sur [0, b]b > 0est le paramètre
d’intérêt. On note µl’espérance commune des Xi.
1. Ecrire le modèle statistique associé et calculer sa vraisemblance L(b, X1, . . . , Xn).
2. Déterminer l’estimateur b
b1du maximum de vraisemblance de b(c’est-à-dire la quantité
b
b1=b
b1(X1, . . . , Xn)qui maximise la fonction b L(b, X1, . . . , Xn).
3. Déterminer b
b2l’estimateur par méthode des moments de b, en se basant que le premier
moment.
4. On opère un changement de paramètre : désormais, le paramètre d’intérêt est µ. Déterminer
bµ1, l’estimateur du maximum de vraisemblance pour le paramètre µ. (On écrira au préalable
la vraisemblance du n-échantillon pour le paramètre µ).
5. Exprimer bµ2, l’estimateur plug-in de µ, obtenu par méthode de moment.
6. Calculer le risque quadratique de bµ2.
7. Etudier le risque quadratique de bµ1.
8. Comparer les estimateurs bµ1et bµ2: lequel est préférable ?
Exercice 8 (Marqueur d’une infection)
Nagents infectieux agressent simultanément un organisme, lequel est muni de Qagents de
défense. La réponse immunitaire est modélisée de la façon suivante : chaque agent de défense
choisit au hasard un agent infectieux (et un seul) parmi les Nagresseurs, indépendamment des
autres défenseurs. Un agent de défense a une probabilité ϑ(0,1) d’annihiler l’agent infectieux
choisi pour cible
Pour que l’organisme soit infecté, il suffit qu’un seul agent infectieux ait échappé au système
de défense de l’organisme.
1. Montrer que la probabilité qu’un agent infectieux donné contamine l’organisme est
pQ,N (ϑ) = 1ϑ
NQ.
On répète en laboratoire nscénarios indépendants d’aggression de l’organisme. Dans chaque
expérience, on marque un agent infectieux donné. Pour l’expérience i, on note Xi= 1 si l’agent
infectieux a contaminé l’organisme et 0sinon.
2. On considère l’observation de (X1, . . . , Xn), où ϑest le paramètre inconnu et Qet Nsont
connus. Montrer que la vraisemblance s’écrit
ϑ pQ,N (ϑ)Pn
i=1 Xi1pQ,N (ϑ)nPn
i=1 Xi.
3. Montrer que l’estimateur du maximum de vraisemblance de ϑest bien défini, qu’il est
asymptotiquement normal et calculer sa variance limite. (On pourra commencer par mon-
trer que c’est le cas pour l’estimateur de pQ,N (ϑ).)
3
4. En déduire un intervalle de confiance asymptotiquement de niveau α(0,1) pour ϑ.
On suppose désormais les paramètres Net Qinconnus, et on se place dans la limite N+
en supposant Q=QNκN pour un κ > 0(donc inconnu).
5. En passant à la limite en Ndans le modèle précédent, montrer que l’observation de
(X1, . . . , Xn)permet d’estimer le paramètre e
ϑ=κϑ et calculer l’estimateur du maximum
de vraisemblance de e
ϑ.
Exercice 9 (Régression (introduction))
Une quantité aléatoire Yest en relation avec une quantité fixée xselon le modèle
Y=a+bx +ξ
aet bsont deux nombre réels inconnus et ξest une variable aléatoire réelle, centrée de variance
σ2(inconnue).
On observe nfois de manière indépendante et dans les mêmes conditions expérimentales
(c’est-à-dire supposées non-évolutives selon l’indice i) des réalisation du même phénomène
(Yi=a+bxi+ξi, xi)pour i= 1,··· , n
pour des conditions xifixées.
1. Décrire le modèle statistique, de manière matricielle, en précisant lorsque c’est possible les
espérances et les matrices de covariance de chacun des vecteurs aléatoires ainsi exprimés.
Préciser si le modèle est paramétrique, semi-paramétrique ou non-paramétrique.
2. On supposera dans la suite que les ξisont gaussiennes (donc centrées et de varaince σ2).
3. Déterminer la vraisemblance de l’échantillon pour le paramètre ϑ= (a, b, σ2).
4. Calculer les estimateurs ba, b
b, c
σ2du maximum de vraisemblance du modèle.
5. Ces estimateurs sont-ils sans biais ?
6. Ces estimateurs sont-ils consistants ?
Exercice 10 (Mélange 1)
On observe les variables aléatoires Y1, . . . , Ynavec :
Yi=δiZ(1)
i+ (1 δi)Z(2)
i(1)
où les δisont connus, fixes et appartiennent à {0,1}, les Zj
isont tous indépendants et on a :
Z(1)
i∼ N(µ1,1) Z(2)
i∼ N(µ2,1)
1. Calculer l’espérance et la variance de Yi. Quelle est sa loi ?
2. Ecrire le modèle sous la forme d’un modèle linéaire, dans lequel on précisera la matrice M,
les paramètres βet σ2.
3. Sous quelles conditions ce modèle est-il identifiable ? En déduire dans ce cas une estimation
de β.
4. Proposer un intervalle de confiance de niveau α]0,1[ pour la quantité δ(θ) = µ1µ2.
4
Introduction à la Statistique et à l’Économétrie
2013
Exercices
Série 3
Exercice 11
Soit Xun vecteur gaussien sur Rdcentré, de matrice de covariance inversible K. Quelle est la
loi de d
X
i,j=1
(K1)ij XiXj?
(Indication : on pourra traiter d’abord le cas où Kest diagonale.)
Exercice 12
On considère le modèle de régression linéaire
Yi=b0+b1xi+εi, i = 1, . . . , n
où les εisont des variables aléatoires indépendantes N(0, σ2).b0, b1et σ2sont inconnus.
1. Quels sont les estimateurs des moindres carrés ordinaires ˆ
b0,ˆ
b1et ˆσ2de ces paramètres ?
Quelle est la loi du couple ((ˆ
b0,ˆ
b1),ˆσ2)?
2. On dispose d’une observation y0sur une unité statistique pour laquelle la valeur de x0de
la variable explicative est inconnue et on cherche un intervalle de confiance pour x0. On
suppose que y0est l’observation d’une variable Y0s’écrivant
Y0=b0+b1x0+η,
ηest une variable al’eatoire N(0, σ2)indépendante du vecteur (ε1, . . . , εn).
(a) Quelle est la loi de Y0ˆ
b0ˆ
b1x0?
(b) En utilisant l’estimateur ˆσde σ, déterminer un intervalle de confiance I1de niveau α
pour x0.
3. On dispose maintenant de mobservations y01, . . . , y0mcorrespondant à la valeur x0incon-
nue ; ce sont des observations de mvariables aléatoires telles que
Y0j=b0+b1x0+ηj,
(η1, . . . , ηm)et (ε1, . . . , εn)sont indépendantes, et ηjsuit la loi N(0, σ2).
(a) Montrer que
˜σ2=(n2)ˆσ2+Pm
j=1(Y0j¯
Y0)2
n+m3,
¯
Y0=1
mPm
j=1 Y0j, est un autre estimateur sans biais de σ2. Quelle est sa loi ?
(b) Quelle est la loi de ¯
Y0ˆ
b0ˆ
b1x0?
(c) A l’aide de ˜σ2et de ¯
Y0donner un intervalle de confiance I2pour x0de niveau α.
(d) Aurait-on pu construire un intervalle de confiance I3pour x0à l’aide de ˆσ2et de ¯
Y0?
5
1 / 10 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !