Introduction à la Statistique et à l`Économétrie 2013

Téléchargement

Introduction à la Statistique et à l’Économétrie

2013

Exercices

Série 1

Exercice 1

On transmet un signal périodique f(t), t ∈[0, T ]échantillonné à une certaine fréquence N.

Chaque donnée f(k/N),k= 1, . . . , NT , est corrompue lors de la transmission par une erreur ek,

de sorte que l’on capte

Yk=f(k/N) + ek, k = 1, . . . , NT.

On a n=NT observations. On postule que les erreurs sont indépendantes les unes des autres,

identiquement distribuées, nulles en moyenne, et de variance ﬁnie. On suppose pour simpliﬁer

que la loi des ekadmet une densité bconnue par rapport à la mesure de Lebesgue. Le paramètre

inconnu est le signal fpris dans un ensemble de signaux F.

1. Décrire le modèle statistique engendré par cette observation.

2. Montrer que le modèle statistique engendré par cette observation est dominé et exhiber sa

vraisemblance.

Exercice 2

On cherche – en laboratoire – à tester la ﬁabilité d’un appareil industriel. On fait fonctionner en

parallèle nappareils jusqu’à ce qu’ils tombent tous en panne. On note

X1, . . . , Xn

les instants de panne observés. On dispose donc de nobservations. On suppose que les temps de

panne suivent une loi exponentielle de paramètre λ > 0.

1. Décrire l’observation associée à cette expérience et le modèle statistique engendré par cette

observation.

2. Montrer que le modèle statistique engendré par cette observation est identiﬁable, dominé

et exhiber sa vraisemblance.

3. Si les appareils sont ﬁables, ce qui est réaliste en pratique, la quantité maxi=1,...,n Xisera

souvent hors d’atteinte pour le statisticien. On stoppe l’expérience après un temps terminal

Tet on observe plutôt

i= min{Xi, T }, i = 1, . . . n.

Reprendre les deux questions précédentes dans ce contexte.

Exercice 3 (Modèle probit et contre-exemple à l’identifiabilité)

Nous disposons d’une information relative au comportement de remboursement ou de non-

remboursement d’emprunteurs :

Y=1si l’emprunteur rembourse

0si l’emprunteur est défaillant

Aﬁn de modéliser ce phénomène, on suppose l’existence d’une variable aléatoire Y?gaussienne,

d’espérance met de variance σ2, que l’on appellera « capacité de remboursement de l’individu »

de sorte que :

Y=1si Y?>0

0si Y?≤0

On note Φla fonction de répartition de la normale centrée réduite N(0,1).

1. Exprimer la loi de Yen fonction de Φ.

2. On observe un n-échantillon (Y1, . . . , Yn)de même loi que Y. Ecrire le modèle statistique

engendré par l’observation (Y1, . . . , Yn). Est-il identiﬁable ?

Exercice 4

Soit ε1, . . . , ε4quatre variables aléatoires indépendantes de loi N(0,1). On suppose que l’on

observe

Y1=µ1+σε1, Y2=µ2+σ

√3ε2,

Y3=µ2+σε3, Y4=µ3+σ

√2ε4,

oùσ > 0est connu. Ecrire la représentation linéaire du modèle, c’est-à-dire écrire l’observation

sous la forme Xθ +σε, oùε∼ N(0, IR4)et Xest une matrice – la matrice explicative – que l’on

déterminera.

1. Etudier l’estimateur ˆµ2:= 1

2(Y2+Y3).

2. Comparer ˆµ2à la famille d’estimateurs

ˆµ(α)

2:= αY2+ (1 −α)Y3,0≤α≤1.

Exercice 5 (Loi normale et estimation de la variance)

Soient X1, . . . , Xndes échantillons i.i.d. de loi N(µ, σ2)avec µ∈Ret σ2∈R+

1. Déterminer la fonction de vraisemblance associée à cette expérience.

2. Calculer l’estimateur (bµ, c

σ2)du maximum de vraisemblance de (µ, σ2).

3. Quelle est le biais de c

σ2? En déduitre qu’il existe γnindépendant de µet σ2tel que

σ2=γnc

σ2soit sans biais.

4. Comparer ces deux estimateurs en terme de risque quadratique.

Exercice 6 (Théorème de Slutsky)

Soient (Xn),(Yn)deux suites de variables aléatoires vectorielles, Xet Ydes variables aléatoires

vectorielles, telles que

1. (Xn)converge en loi vers X

2. (Yn)converge en probabilité vers Y

3. Yest indépendante de (Xn)et X.

Montrer que le couple (Xn, Yn)converge en loi vers (X, Y ).

Introduction à la Statistique et à l’Économétrie

2013

Exercices

Série 2

Exercice 7 (Maximum de vraisemblance et loi uniforme)

On observe X1,··· , Xnindépendantes et de même loi uniforme sur [0, b]où b > 0est le paramètre

d’intérêt. On note µl’espérance commune des Xi.

1. Ecrire le modèle statistique associé et calculer sa vraisemblance L(b, X1, . . . , Xn).

2. Déterminer l’estimateur b

b1du maximum de vraisemblance de b(c’est-à-dire la quantité

b1=b

b1(X1, . . . , Xn)qui maximise la fonction b L(b, X1, . . . , Xn).

3. Déterminer b

b2l’estimateur par méthode des moments de b, en se basant que le premier

moment.

4. On opère un changement de paramètre : désormais, le paramètre d’intérêt est µ. Déterminer

bµ1, l’estimateur du maximum de vraisemblance pour le paramètre µ. (On écrira au préalable

la vraisemblance du n-échantillon pour le paramètre µ).

5. Exprimer bµ2, l’estimateur plug-in de µ, obtenu par méthode de moment.

6. Calculer le risque quadratique de bµ2.

7. Etudier le risque quadratique de bµ1.

8. Comparer les estimateurs bµ1et bµ2: lequel est préférable ?

Exercice 8 (Marqueur d’une infection)

Nagents infectieux agressent simultanément un organisme, lequel est muni de Qagents de

défense. La réponse immunitaire est modélisée de la façon suivante : chaque agent de défense

choisit au hasard un agent infectieux (et un seul) parmi les Nagresseurs, indépendamment des

autres défenseurs. Un agent de défense a une probabilité ϑ∈(0,1) d’annihiler l’agent infectieux

choisi pour cible

Pour que l’organisme soit infecté, il suﬃt qu’un seul agent infectieux ait échappé au système

de défense de l’organisme.

1. Montrer que la probabilité qu’un agent infectieux donné contamine l’organisme est

pQ,N (ϑ) = 1−ϑ

NQ.

On répète en laboratoire nscénarios indépendants d’aggression de l’organisme. Dans chaque

expérience, on marque un agent infectieux donné. Pour l’expérience i, on note Xi= 1 si l’agent

infectieux a contaminé l’organisme et 0sinon.

2. On considère l’observation de (X1, . . . , Xn), où ϑest le paramètre inconnu et Qet Nsont

connus. Montrer que la vraisemblance s’écrit

ϑ pQ,N (ϑ)Pn

i=1 Xi1−pQ,N (ϑ)n−Pn

i=1 Xi.

3. Montrer que l’estimateur du maximum de vraisemblance de ϑest bien déﬁni, qu’il est

asymptotiquement normal et calculer sa variance limite. (On pourra commencer par mon-

trer que c’est le cas pour l’estimateur de pQ,N (ϑ).)

4. En déduire un intervalle de conﬁance asymptotiquement de niveau α∈(0,1) pour ϑ.

On suppose désormais les paramètres Net Qinconnus, et on se place dans la limite N≈+∞

en supposant Q=QN∼κN pour un κ > 0(donc inconnu).

5. En passant à la limite en Ndans le modèle précédent, montrer que l’observation de

(X1, . . . , Xn)permet d’estimer le paramètre e

ϑ=κϑ et calculer l’estimateur du maximum

de vraisemblance de e

ϑ.

Exercice 9 (Régression (introduction))

Une quantité aléatoire Yest en relation avec une quantité ﬁxée xselon le modèle

Y=a+bx +ξ

où aet bsont deux nombre réels inconnus et ξest une variable aléatoire réelle, centrée de variance

σ2(inconnue).

On observe nfois de manière indépendante et dans les mêmes conditions expérimentales

(c’est-à-dire supposées non-évolutives selon l’indice i) des réalisation du même phénomène

(Yi=a+bxi+ξi, xi)pour i= 1,··· , n

pour des conditions xiﬁxées.

1. Décrire le modèle statistique, de manière matricielle, en précisant lorsque c’est possible les

espérances et les matrices de covariance de chacun des vecteurs aléatoires ainsi exprimés.

Préciser si le modèle est paramétrique, semi-paramétrique ou non-paramétrique.

2. On supposera dans la suite que les ξisont gaussiennes (donc centrées et de varaince σ2).

3. Déterminer la vraisemblance de l’échantillon pour le paramètre ϑ= (a, b, σ2).

4. Calculer les estimateurs ba, b

b, c

σ2du maximum de vraisemblance du modèle.

5. Ces estimateurs sont-ils sans biais ?

6. Ces estimateurs sont-ils consistants ?

Exercice 10 (Mélange 1)

On observe les variables aléatoires Y1, . . . , Ynavec :

Yi=δiZ(1)

i+ (1 −δi)Z(2)

i(1)

où les δisont connus, ﬁxes et appartiennent à {0,1}, les Zj

isont tous indépendants et on a :

Z(1)

i∼ N(µ1,1) Z(2)

i∼ N(µ2,1)

1. Calculer l’espérance et la variance de Yi. Quelle est sa loi ?

2. Ecrire le modèle sous la forme d’un modèle linéaire, dans lequel on précisera la matrice M,

les paramètres βet σ2.

3. Sous quelles conditions ce modèle est-il identiﬁable ? En déduire dans ce cas une estimation

de β.

4. Proposer un intervalle de conﬁance de niveau α∈]0,1[ pour la quantité δ(θ) = µ1−µ2.

Introduction à la Statistique et à l’Économétrie

2013

Exercices

Série 3

Exercice 11

Soit Xun vecteur gaussien sur Rdcentré, de matrice de covariance inversible K. Quelle est la

loi de d

i,j=1

(K−1)ij XiXj?

(Indication : on pourra traiter d’abord le cas où Kest diagonale.)

Exercice 12

On considère le modèle de régression linéaire

Yi=b0+b1xi+εi, i = 1, . . . , n

où les εisont des variables aléatoires indépendantes N(0, σ2).b0, b1et σ2sont inconnus.

1. Quels sont les estimateurs des moindres carrés ordinaires ˆ

b0,ˆ

b1et ˆσ2de ces paramètres ?

Quelle est la loi du couple ((ˆ

b0,ˆ

b1),ˆσ2)?

2. On dispose d’une observation y0sur une unité statistique pour laquelle la valeur de x0de

la variable explicative est inconnue et on cherche un intervalle de conﬁance pour x0. On

suppose que y0est l’observation d’une variable Y0s’écrivant

Y0=b0+b1x0+η,

où ηest une variable al’eatoire N(0, σ2)indépendante du vecteur (ε1, . . . , εn).

(a) Quelle est la loi de Y0−ˆ

b0−ˆ

b1x0?

(b) En utilisant l’estimateur ˆσde σ, déterminer un intervalle de conﬁance I1de niveau α

pour x0.

3. On dispose maintenant de mobservations y01, . . . , y0mcorrespondant à la valeur x0incon-

nue ; ce sont des observations de mvariables aléatoires telles que

Y0j=b0+b1x0+ηj,

où (η1, . . . , ηm)et (ε1, . . . , εn)sont indépendantes, et ηjsuit la loi N(0, σ2).

(a) Montrer que

˜σ2=(n−2)ˆσ2+Pm

j=1(Y0j−¯

Y0)2

n+m−3,

où ¯

Y0=1

mPm

j=1 Y0j, est un autre estimateur sans biais de σ2. Quelle est sa loi ?

(b) Quelle est la loi de ¯

Y0−ˆ

b0−ˆ

b1x0?

Y0donner un intervalle de conﬁance I2pour x0de niveau α.

(d) Aurait-on pu construire un intervalle de conﬁance I3pour x0à l’aide de ˆσ2et de ¯

Y0?

1 / 10 100%

Documents connexes

Devoir3

TD n 3 : Estimation par maximum de vraisemblance.

les notations

Devoir2

ExamHLMA406bis Fichier

TD Estimation Maximum de Vraisemblance - Maths Supérieures

Une loi (8 points) 1 Variables Gaussiennes (12 points)

Devoir1

1 Estimateurs (inspirés de [1]) 2 Estimateurs du maximum de

Premiers éléments de statistique I Introduction : le modèle statistique

Détermination d`une statistique exhaustive Estimateurs et

Exercices : Statistiques Paramétriques & Non Paramétriques

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Introduction à la Statistique et à l`Économétrie 2013

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Introduction à la Statistique et à l`Économétrie 2013

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib