TD n˚7 : Echantillonnage et estimation

publicité
Probabilités élémentaires – HLMA 311
TD n˚7 : Echantillonnage et estimation
Exercice 1. (**) Soit y1 , · · · , yn des réels.
Pour mesurer l’écart d’un réel x à l’ensemble des yi , on peut utiliser la distance
n
D(x) =
1X
f (yi − x)
n
i=1
où f est une fonction réelle.
1. Montrer que le réel qui minimise cette distance lorsque f (t) = t2 est la moyenne des yi .
2. On suppose maintenant que f (t) = |t|.
a) Etudier la fonction D(x) dans le cas où on a trois observations : y1 = 3, y2 = 5 et y3 = 6.
b) Idem en rajoutant y4 = 8.
c) Dans le cas général, montrer que le réel qui minimise la distance D(x) est la médiane des
(yi ). Pour cela, on considérera que y1 ≤ · · · ≤ yn et on réécrira D(x) sur l’intervalle [yj , yj+1 [.
On traitera ensuite le cas où n = 2p + 1, puis le cas où n = 2p.
Exercice 2. (*) Soit X1 , · · · , Xn un échantillon aléatoire de X, de moyenne µ et de variance σ 2 .
Lorsque la moyenne µ est connue et la variance σ 2 inconnue, on peut estimer cette dernière par
n
S̃ 2 =
1X
(Xi − µ)2 .
n
i=1
Quelles sont les qualités de cet estimateur ? Le comparer à S ∗2 .
Exercice 3. (*) Soit X1 , · · · , Xn un échantillon aléatoire de X, de moyenne µ et de variance σ 2 .
1. Montrer que X̄ 2 n’est pas un estimateur sans biais de µ2 .
2. Déterminer le réel k tel que X̄ 2 − kS 2 soit un estimateur sans biais de µ2 .
Exercice 4. (**) Soit deux variables aléatoires indépendantes X1 ∼ N (0, σ12 ) et X2 ∼ N (0, σ22 ).
1. Quelle est la loi de Y = X1 + X2 ?
2. Soit deux réels µ1 et a1 . Montrer que Z = a1 X1 + µ1 suit la loi normale N (µ1 , a21 σ12 ).
3. En déduire la loi d’une combinaison linéaire de n variables aléatoires gaussiennes indépendantes
de paramètres quelconques.
Exercice 5. (*) Soit X1 , · · · , Xn un échantillon aléatoire de X, de moyenne µ et de variance σ 2 .
On s’intéresse à l’estimateur S ∗2 de la variance.
1. Montrer que l’on a :
(n − 1)S
∗2
=
n
X
(Xi − µ)2 − n(X̄ − µ)2 .
i=1
2. En déduire que S ∗2 est un estimateur sans biais de la variance.
Exercice 6. (*) Soit X une variable aléatoire réelle de fonction de répartition FX et X1 , · · · , Xn
un échantillon aléatoire de X. La fonction de répartition empirique Fn de l’échantillon est définie,
pour tout x dans R, par
Fn (x) =
1
|{j ∈ {1, · · · , n} : xj ≤ x}|.
n
Soit x un réel fixé.
1. Quelle est la loi de nFn (x) ?
2. Montrer que Fn (x) est un estimateur sans biais et convergent de F (x).
1
Exercice 7. (**) Montrer que l’estimateur du maximum de vraisemblance du paramètre de la loi
géométrique est le même que l’estimateur des moments, vu en cours.
Exercice 8. (*) Soit X une variable aléatoire suivant la loi B(1, p) et X1 , · · · , Xn un échantillon
aléatoire de X. On désire estimer V(X) = p(1 − p) =P
θ et on propose d’utiliser θ̂ = p̂(1 − p̂), où p̂
est la proportion empirique dans l’échantillon : p̂ = n1 ni=1 Xi .
1. Calculer le biais de cet estimateur.
2. Donner un estimateur sans biais de θ.
Exercice 9. (**) Pour estimer la proportion p de fumeurs dans la population française, on tire un
échantillon aléatoire de n personnes et on note Xi = 1 si la ième personne fume, 0 sinon.
P
1. Un estimateur naturel de p est la proportion observée sur l’échantillon : p̂ = n1 ni=1 Xi .
Calculer son erreur quadratique moyenne EQM (p̂, p).
2. Un estimateur alternatif de p est donné par : p̃ =
moyenne EQM (p̃, p).
np̂+1
n+2 .
Calculer son erreur quadratique
3. Comparer EQM (p̂, p) et EQM (p̃, p) pour les valeurs de p suivantes : 0, 1/8, 1/4 et 1/2.
Exercice 10. (**) Une basketteuse s’entraîne au lancer franc. Elle réussit son premier panier au
bout de trois tentatives, son deuxième au bout de deux et son troisième au bout de quatre. Donner
une estimation de p, la probabilité qu’elle réussisse un lancer franc au hasard, en utilisant le modèle
géométrique, puis le modèle binomial.
Exercice 11. (**) Soit X1 , · · · , Xn un échantillon aléatoire de loi de Pareto de paramètre θ > 0 :
fθ (x) = θx−(1+θ) 11[1,+∞[ (x).
Quel est l’estimateur du maximum de vraisemblance de θ ?
Exercice 12. (*) Soit X1 , · · · , Xn un échantillon aléatoire de densité :
1
fθ (x) = (1 + θx)11[−1,1] (x),
2
où θ est un réel dont on précisera le domaine.
1. Calculer l’estimateur des moments θ̃ de θ.
2. Calculer l’erreur quadratique moyenne associée.
3. Lorsque n est grand, vers quoi tend la probabilité que θ̃ soit supérieur à θ ?
Exercice 13. (**) Soit X1 , · · · , Xn un échantillon aléatoire de densité :
fθ (x) = (1 + θ)xθ 11[0,1] (x),
où θ est un réel positif.
1. Calculer l’estimateur des moments θ̃ de θ.
2. Calculer l’estimateur du maximum de vraisemblance θ̂ de θ.
Exercice 14. (***) Soit X1 , · · · , Xn un échantillon aléatoire de loi uniforme U([a, b]), où a et b sont
des réels tels que a < b.
1. Calculer les estimateurs des moments ã et b̃ de a et b.
2. Calculer les estimateurs du maximum de vraisemblance â et b̂ de a et b.
Exercice 15. (**) Une usine qui produit des pièces électroniques a décidé de marquer chaque pièce
avec un numéro de série. Les numéros de série commencent à 1 et se terminent à N , le nombre
de pièces produites. Deux pièces sont tirées au hasard et leurs numéros de série sont 888 et 751
respectivement.
1. Quelle est l’estimation de N par la méthode des moments ?
2. Quelle est l’estimation de N par la méthode du maximum de vraisemblance ?
2
Téléchargement