Distribution d’échantillonnage de la moyenne (Corrigé) /20 E3 Connaissances préalables : Addition de variables aléatoires, additivité de la loi normale, théorème central limite. Buts spécifiques : Approche de la distribution d’échantillonnage d’une moyenne. Outils nécessaires: Papier-crayon. Consignes générales : Justifiez avec précision vos affirmations. On s’intéresse au nombre d’heures de sommeil paradoxal durant une nuit chez les individus d’ une population donnée. On note µ la moyenne et σ l’écart-type de la grandeur étudiée au sein de l’ensemble de la population. (Ces paramètres sont inconnus). On décide de procéder à un échantillonnage aléatoire simple d’effectif n parmi les sujets de la population (les sujets sont choisis au hasard, avec replacement). PREMIERE PARTIE: ESPERANCE ET VARIANCE DE LA MOYENNE - ECHANTILLON. 1. Appelons X i le nombre d’heures de sommeil paradoxal du i ème sujet qui sera choisi lors de l’échantillonnage. X i est une variable aléatoire. Pourquoi ? Réponse : Parce que la valeur observée pour X i dépendra du i ème sujet choisi au hasard qui appartiendra à l’échantillon. /1 2. Que valent l’espérance et la variance de X i ? Réponse : Puisque le ième sujet de l’échantillon est choisi au hasard dans la population ( dans le cadre d’une procédure d’échantillonnage aléatoire simple avec remise), la distribution de probabilité de la variable X i est donnée par la distribution des valeurs de la variable “ nombre d’heures de sommeil paradoxal” au sein de la population. L’espérance de X i coincide donc avec le nombre moyen µ la variance a donc: d’heures de sommeil paradoxal dans la population, et la variance de X i coincide avec σ2 de la variable “ nombre d’heures de sommeil paradoxal” dans la population. On E( X i ) = µ Var ( X i ) = σ 2 . /2 E3/Corrigé - 1 /4 - 3. Les variables aléatoires X i (1 ≤ i ≤ n ) sont équidistribuées. Pourquoi ? En serait-il de même si l’échantillonnage s’effectuait sans replacement ? Réponse : Lors de chaque choix d’un sujet, on répète exactement la même expérience aléatoire. Les variables aléatoires X i (1 ≤ i ≤ n ) ont donc toutes la même distribution. Si l’échantillonnage s’effectuait sans replacement, les paramètres de la population seraient modifiés à chaque tirage et les variables ne seraient plus équidistribuées. /2 n 4. Appelons R = ∑ X i la somme des variables aléatoires X i (1 ≤ i ≤ n ) . i =1 Que vaut l’espérance de R ? Réponse : n E( ∑ X i ) = i=1 n ∑ E( X i ) = i=1 n ∑ µ = nµ i=1 /1 5. Que vaut la variance de R ? En serait-il de même si l’échantillonnage s’effectuait sans replacement ? Réponse : n n n i =1 i =1 i =1 Var( ∑ X i ) = ∑ Var( X i ) = ∑ σ 2 = nσ 2 X i est égale à la somme des variances grâce au fait que les variables X i sont indépendantes. Si le tirage s’effectuait sans replacement, les variables X i La variance de la somme des variables ne seraient plus indépendantes les unes des autres et cette propriété de la variance ne pourrait plus être utilisée. /2 E3/Corrigé - 2 /4 - 6. Appelons X = R 1 n Xi = la moyenne des variables aléatoires X i (1 ≤ i ≤ n ) (moyenne-échantillon). Il ∑ n i =1 n s’agit donc du nombre moyen d’heures de sommeil paradoxal que l’on observera dans l’échantillon. Que valent l’espérance et la variance de X ? Réponse : R E( R ) nµ E( X ) = E( ) = = =µ n n n R Var( R ) nσ 2 σ 2 = 2 = Var( X ) = Var( ) = n n2 n n /2 DEUXIEME PARTIE: DISTRIBUTION EXACTE DE LA MOYENNE-ECHANTILLON SOUS L’HYPOTHESE DE NORMALITE DE LA VARIABLE AU SEIN DE LA POPULATION. 7. Supposons que le nombre d’heures de sommeil paradoxal soit distribué, dans la population, selon une loi normale. Dans ce cas, la variable Z = X −µ σ se distribue suivant une loi normale N (0;1) . Pourquoi ? n Réponse : Si le nombre d’heures de sommeil paradoxal se distribue au sein de la population suivant une loi normale ( de moyenne µ et de variance σ2 ), chaque variable aléatoire X i (1 ≤ i ≤ n) aura comme distribution cette même loi normale ( X i ~ N ( µ , σ ), i = 1,.., n ). 2 Vu la propriété d’additivité de la loi normale et les relations établies au point 6, la variable aléatoire X suit alors une loi normale de moyenne µ et de variance donc la variable aléatoire Z = X −µ σ σ2 n ( X ~ N (µ , σ2 n ) ) et se distribue de façon exacte suivant une loi normale n centrée réduite ( Z ~ N (0;1) ). /5 E3/Corrigé - 3 /4 - TROISIEME PARTIE. DISTRIBUTION APPROCHEE DE LA MOYENNE-ECHANTILLON. 8. Sans faire aucune hypothèse sur la forme de la distribution du nombre d’heures de sommeil paradoxal au sein de la population, la variable Z= X −µ σ se distribue approximativement suivant une loi normale N (0;1) . Pourquoi ? n Réponse : Cette propriété découle directement de l’application du théorème central limite. En effet, les n variables aléatoires X i (1 ≤ i µ et de variance Dès lors, Z = σ 2 X −µ σ ≤ n) sont équidistribuées, indépendantes, de moyenne . ≈ N (0;1) n L’approximation sera d’autant meilleure que l’effectif n de l’échantillon est grand et que la forme de la distribution du nombre d’heures de sommeil paradoxal dans la population est proche d’une normale. /5 E3/Corrigé - 4 /4 -