Distribution d`échantillonnage de la moyenne

publicité
Distribution d’échantillonnage de la moyenne
(Corrigé)
/20
E3
Connaissances préalables :
Addition de variables aléatoires, additivité de la loi normale, théorème central
limite.
Buts spécifiques :
Approche de la distribution d’échantillonnage d’une moyenne.
Outils nécessaires:
Papier-crayon.
Consignes générales :
Justifiez avec précision vos affirmations.
On s’intéresse au nombre d’heures de sommeil paradoxal durant une nuit chez les individus d’ une population
donnée.
On note µ la moyenne et σ l’écart-type de la grandeur étudiée au sein de l’ensemble de la population. (Ces
paramètres sont inconnus).
On décide de procéder à un échantillonnage aléatoire simple d’effectif n parmi les sujets de la population (les
sujets sont choisis au hasard, avec replacement).
PREMIERE PARTIE: ESPERANCE ET VARIANCE DE LA MOYENNE - ECHANTILLON.
1. Appelons X i le nombre d’heures de sommeil paradoxal du
i ème
sujet qui sera choisi lors de
l’échantillonnage. X i est une variable aléatoire. Pourquoi ?
Réponse :
Parce que la valeur observée pour X i dépendra du i ème sujet choisi au hasard qui appartiendra
à l’échantillon.
/1
2. Que valent l’espérance et la variance de X i ?
Réponse :
Puisque le ième sujet de l’échantillon est choisi au hasard dans la population ( dans le cadre
d’une procédure d’échantillonnage aléatoire simple avec remise), la distribution de probabilité de
la variable X i est donnée par la distribution des valeurs de la variable “ nombre d’heures de
sommeil paradoxal” au sein de la population. L’espérance de X i coincide donc avec le nombre
moyen
µ
la variance
a donc:
d’heures de sommeil paradoxal dans la population, et la variance de X i coincide avec
σ2
de la variable “ nombre d’heures de sommeil paradoxal” dans la population. On
E( X i ) = µ
Var ( X i ) = σ 2 .
/2
E3/Corrigé
- 1 /4 -
3. Les variables aléatoires
X i (1 ≤ i ≤ n ) sont équidistribuées. Pourquoi ? En serait-il de même si
l’échantillonnage s’effectuait sans replacement ?
Réponse :
Lors de chaque choix d’un sujet, on répète exactement la même expérience aléatoire. Les
variables aléatoires X i (1 ≤ i ≤ n ) ont donc toutes la même distribution.
Si l’échantillonnage s’effectuait sans replacement, les paramètres de la population seraient
modifiés à chaque tirage et les variables ne seraient plus équidistribuées.
/2
n
4. Appelons
R = ∑ X i la somme des variables aléatoires X i (1 ≤ i ≤ n ) .
i =1
Que vaut l’espérance de R ?
Réponse :
n
E( ∑ X i ) =
i=1
n
∑ E( X i ) =
i=1
n
∑ µ = nµ
i=1
/1
5. Que vaut la variance de
R ? En serait-il de même si l’échantillonnage s’effectuait sans replacement ?
Réponse :
n
n
n
i =1
i =1
i =1
Var( ∑ X i ) = ∑ Var( X i ) = ∑ σ 2 = nσ 2
X i est égale à la somme des variances grâce au fait que
les variables X i sont indépendantes. Si le tirage s’effectuait sans replacement, les variables X i
La variance de la somme des variables
ne seraient plus indépendantes les unes des autres et cette propriété de la variance ne pourrait
plus être utilisée.
/2
E3/Corrigé
- 2 /4 -
6. Appelons X =
R
1 n
Xi =
la moyenne des variables aléatoires X i (1 ≤ i ≤ n ) (moyenne-échantillon). Il
∑
n i =1
n
s’agit donc du nombre moyen d’heures de sommeil paradoxal que l’on observera dans l’échantillon.
Que valent l’espérance et la variance de X ?
Réponse :
R
E( R ) nµ
E( X ) = E( ) =
=
=µ
n
n
n
R
Var( R ) nσ 2 σ 2
= 2 =
Var( X ) = Var( ) =
n
n2
n
n
/2
DEUXIEME PARTIE: DISTRIBUTION EXACTE DE LA MOYENNE-ECHANTILLON SOUS L’HYPOTHESE DE NORMALITE DE
LA VARIABLE AU SEIN DE LA POPULATION.
7. Supposons que le nombre d’heures de sommeil paradoxal soit distribué, dans la population, selon une loi
normale.
Dans ce cas, la variable Z =
X −µ
σ
se distribue suivant une loi normale N (0;1) . Pourquoi ?
n
Réponse :
Si le nombre d’heures de sommeil paradoxal se distribue au sein de la population suivant une loi
normale ( de moyenne
µ
et de variance
σ2
), chaque variable aléatoire X i (1 ≤ i
≤ n)
aura comme
distribution cette même loi normale ( X i ~ N ( µ , σ ), i = 1,.., n ).
2
Vu la propriété d’additivité de la loi normale et les relations établies au point 6, la variable
aléatoire X suit alors une loi normale de moyenne µ et de variance
donc la variable aléatoire Z =
X −µ
σ
σ2
n
( X ~ N (µ ,
σ2
n
) ) et
se distribue de façon exacte suivant une loi normale
n
centrée réduite ( Z ~ N (0;1) ).
/5
E3/Corrigé
- 3 /4 -
TROISIEME PARTIE. DISTRIBUTION APPROCHEE DE LA MOYENNE-ECHANTILLON.
8. Sans faire aucune hypothèse sur la forme de la distribution du nombre d’heures de sommeil paradoxal au sein
de la population, la variable
Z=
X −µ
σ
se distribue approximativement suivant une loi normale N (0;1) . Pourquoi ?
n
Réponse :
Cette propriété découle directement de l’application du théorème central limite.
En effet, les n variables aléatoires X i (1 ≤ i
µ et de variance
Dès lors, Z =
σ
2
X −µ
σ
≤ n)
sont équidistribuées, indépendantes, de moyenne
.
≈ N (0;1)
n
L’approximation sera d’autant meilleure que l’effectif n de l’échantillon est grand et que la
forme de la distribution du nombre d’heures de sommeil paradoxal dans la population est proche
d’une normale.
/5
E3/Corrigé
- 4 /4 -
Téléchargement