50 CHAPITRE 11 La loi normale 1. Introduction à l’inférence statistique Dans ce chapitre, nous étudierons la façon de faire de l’inférence statistique, c’est-à-dire qu’à partir de la moyenne x̄ ou d’une proportion p d’un échantillon, nous serons en mesure d’estimer la moyenne µ ou la proportion π de la population. Naturellement, si nous approximons µ par x̄, nous commettrons une certaine erreur puisque l’échantillon n’est pas la population. Par contre, plus la taille de l’échantillon est grande, plus x̄ se rapprochera de la véritable moyenne de la population. Le même phénomène se produit avec les proportions. C’est ce que l’on appelle en mathématique la Loi de Grands Nombres. Comme nous l’avons mentionné, si l’on utilise x̄ pour approximer µ, on commet une certaine erreur. De plus, si nous prenons un autre échantillon de même taille, il nous donnera une autre moyenne. C’est pourquoi au lieu d’estimer la moyenne et la proportion d’une manière ponctuelle (comme nous venons de le faire), on utilisera plutôt une estimation par intervalle de confiance. Cela signifie que la moyenne µ se trouvera entre x̄ − ME et x̄ + ME, où ME est la marge d’erreur sur la moyenne. On note alors que µ ∈ [x̄ − ME, x̄ + ME]. Cependant, déterminer la valeur de cette marge d’erreur n’est pas simple, surtout qu’elle varie selon l’échantillon utilisé. Nous aurons besoin d’une théorie afin de pouvoir arriver à notre fin. Cette théorie est celle des probabilités et plus particulièrement de la Loi Normale. L’idée générale, nous y reviendrons plus en profondeur plus tard, a été développer par Quételet pour expliquer le tour de poitrine des soldats anglais. Le principe est que si l’on prend tous les échantillons de taille n possibles d’une population très grande, alors la distribution des moyennes de tous ces échantillons suit une loi normale de moyenne 51 52 11. LA LOI NORMALE √ µ et d’écart-type σ/ n. La figure 1 montre à quoi ressemble cette distribution. Les propriétés de cette distribution seront étudiées dans la prochaine section. Les propriétés de cette distribution seront étudiées µ Fig. 1. Courbe Normale. dans la prochaine section. Revenons à notre marge d’erreur ME. Grâce à la distribution normale des moyennes de tous les échantillons de taille n, nous serons en mesure de déterminer ME. Il suffira de décider ce que l’on appelle le Niveau de confiance que l’on désire. Celui-ci correspond à la probabilité que la véritable moyenne de la population (de même pour la proportion) se trouve dans l’intervalle de confiance. Habituellement, on prend un niveau de confiance soit de 95% ou de 99%. Ainsi, on sera en mesure de déterminer l’intervalle de confiance. Regardons un exemple que l’on recontre assez souvent est lors des élections. Exemple 11.1. Le parti Libéral obtiendrait 32% des voix, contre 28% pour le PQ et 26% pour l’ADQ. La marge de d’erreur de 2%, 19 fois sur 20. Cela signifie que les proportions de 19 échantillons sur 20 se trouvent dans la marge d’erreur de 2%. Donc, le niveau de confiance choisit est de 95%, car 19/20 = 95%. 2. LA LOI NORMALE 53 Les prochaines sections servent à détailler les calculs et à les justifier. 2. La loi normale 2.1. Introduction. La loi normale de moyenne µ et d’écart-type σ correspond à une courbe de Gauss d’équation (x−µ)2 1 f (x) = √ e− 2σ2 . σ 2π La loi normale possède quelques caractéristiques intéressantes. 1) Cette fonction est entièrement déterminée par µ et σ. 2) L’aire sous la courbe est 1 et ce, pour toutes les valeurs de µ et de σ. 3) La courbe est symétrique par rapport à x = µ, c’est-à-dire que l’aire à gauche de x = µ est la même qu’à droite. La deuxième propriété est sans doute la plus importante. C’est elle qui nous permettra de faire une estimation de moyennes ou de proportions à l’aide d’un intervalle. C’est également cette propriété qui nous permet de dire que la courbe normale est une fonction de densité de probabilité. Étudions maintenant une petite partie des probabilités afin d’être en mesure de faire de l’inférence statistique. Si une certaine variable X, dite variable aléatoire, obéit à une loi normale de moyenne µ et de variance σ 2 , on note X ∼ N(µ, σ 2 ). Ici, nous sommes intéressés par la probabilité que X soit comprise entre deux valeurs x1 et x2 . On note cette probabilité P (x1 < X < x2 ). La théorie des probabilités nous dit que P (x1 < X < x2 ) correspond à l’aire de la région sous la courbe normale délimitée par x1 et x2 . La figure 2 montre cette probabilité. 2.2. Loi normale centrée réduite. Il n’existe cependant pas de formules pour calculer l’aire sous la courbe. Nous devons utiliser une table où les aires y sont déjà déterminées. Par contre, cette table n’est valide que pour la loi normale de moyenne 0 et de variance 1, notée N(0, 1). On appelle cette loi, loi normale centrée réduite. Cette table est présentée à la page 56. Avant d’expliquer comment retrouver une loi normale centrée réduite à partir d’une loi normale quelconque, examinons la façon d’utiliser la table. 54 11. LA LOI NORMALE x1 µ x2 Fig. 2. Aire sous la courbe normale pour déterminer P (x1 < X < x2 ). important–important–important–important–important Il est à noter que P (0 < Z < z) = P (0 ≤ Z ≤ z). Cela signifie que l’inégalité stricte et l’inégalité correspond à la même valeur. Exemple 11.2. Si Z ∼ N(0, 1), trouvons a) P (0 < Z < 0.5) b) P (−1 < Z < 1) c) P (−0.5 < Z < 2) d) P (1.15 < Z < 3) a) Pour déterminer P (0 < Z < 0.5), il faut se servir de la table de loi normale. Celle-ci nous donne P (0 < Z < z). Dans cet exemple, z = 0.5. Ainsi, on n’a qu’à aller à la 6e ligne et à la première colonne. Les lignes représentent la valeur de z à la première décimale et les colonnes correspond à la valeur de la deuxième décimale. On obtient donc que P (0 < Z < 0.5) = 0.1915. b) Puisque la table de loi normale donne la valeur valeur pour P (0 ≤ Z ≤ z), nous n’avons pas accès directement à P (−1 < Z < 1). Il faut utiliser la propriété de symétrie de la courbe normale. Il est facile de voir à l’aide d’un dessin que P (−1 < Z < 1) = P (−1 < Z ≤ 0) + P (0 < Z < 1) Par la propriété de symétrie, on a que P (−1 < Z ≤ 0) = P (0 ≤ Z < 1). 2. LA LOI NORMALE 55 Ainsi, P (−1 < Z < 1) = P (−1 < Z ≤ 0) + P (0 < Z < 1) = P (0 ≤ Z < 1) + P (0 < Z < 1) = 2P (0 ≤ Z < 1) Dans la table, on trouve que P (0 ≤ Z < 1) = 0.3413. D’où, P (−1 < Z < 1) = 2 × 0.3413 = 0.6426. c) On utilise le même principe pour trouver P (−0.5 < Z < 2). Ainsi, P (−0.5 < Z < 2) = P (−0.5 < Z ≤ 0) + P (0 < Z < 2) = P (0 ≤ Z < 0.5) + P (0 < Z < 2) = 0.1915 + 0.4772 = 0.6687 par symétrie d) Pour ce cas, il faut user d’astuces. La figure 3 montre la technique. Ainsi, = 0 1.15 3 − 0 3 0 1.15 Fig. 3. Calcul de P (1.15 < Z < 3). P (1.15 < Z < 3) = P (0 ≤ Z < 3) − P (0 ≤ Z < 1.15) = 0.4987 − 0.3749 = 0.1238 56 11. LA LOI NORMALE La table donne l’aire sous la courbe normale centrée réduite ce qui correspond à P (0 ≤ Z ≤ z). z 0,00 0,01 0,02 0,00 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00 1,10 1,20 1,30 1,40 1,50 1,60 1,70 1,80 1,90 2,00 2,10 2,20 2,30 2,40 2,50 2,60 2,70 2,80 2,90 3,00 3,10 3,20 3,30 3,40 3,50 3,60 3,70 3,80 3,90 0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2257 0,2580 0,2881 0,3159 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713 0,4772 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981 0,4987 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000 0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2611 0,2910 0,3186 0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719 0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0,4975 0,4982 0,4987 0,4991 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000 0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212 0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726 0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4967 0,4976 0,4982 0,4987 0,4991 0,4994 0,4995 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 0,03 0 0,04 0,05 0,0120 0,0160 0,0199 0,0517 0,0557 0,0596 0,0910 0,0948 0,0987 0,1293 0,1331 0,1368 0,1664 0,1700 0,1736 0,2019 0,2054 0,2088 0,2357 0,2389 0,2422 0,2673 0,2704 0,2734 0,2967 0,2995 0,3023 0,3238 0,3264 0,3289 0,3485 0,3508 0,3531 0,3708 0,3729 0,3749 0,3907 0,3925 0,3944 0,4082 0,4099 0,4115 0,4236 0,4251 0,4265 0,4370 0,4382 0,4394 0,4484 0,4495 0,4505 0,4582 0,4591 0,4599 0,4664 0,4671 0,4678 0,4732 0,4738 0,4744 0,4788 0,4793 0,4798 0,4834 0,4838 0,4842 0,4871 0,4875 0,4878 0,4901 0,4904 0,4906 0,4925 0,4927 0,4929 0,4943 0,4945 0,4946 0,4957 0,4959 0,4960 0,4968 0,4969 0,4970 0,4977 0,4977 0,4978 0,4983 0,4984 0,4984 0,4988 0,4988 0,4989 0,4991 0,4992 0,4992 0,4994 0,4994 0,4994 0,4996 0,4996 0,4996 0,4997 0,4997 0,4997 0,4998 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,5000 0,5000 0,5000 Table de la loi normale. z 0,06 0,07 0,08 0,09 0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,3315 0,3554 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750 0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3078 0,3340 0,3577 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756 0,4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0,4985 0,4989 0,4992 0,4995 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2517 0,2823 0,3106 0,3365 0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761 0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986 0,4990 0,4993 0,4995 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 0,0359 0,0753 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389 0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4706 0,4767 0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4986 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,4999 0,5000 2. LA LOI NORMALE 57 On est parfois intéressé par P (Z ≤ c) ou P (c < Z). Regardons comment on fait pour déterminer ces probabilités. Exemple 11.3. Soit Z ∼ N(0, 1). Trouver a) P (Z ≤ 0.21) b) P (Z > 0.21) Regardons comment trouver ces probabilités. a) Réécrivons P (Z ≤ 0.21). P (Z ≤ 0.21) = P (Z ≤ 0) + P (0 < Z < 0.21). On a que P (Z ≤ 0) = 0.5, car elle correspond à la moitié de l’aire totale sous la courbe. Donc, P (Z ≤ 0.21) = 0.5 + P (0 < Z < 0.21) = 0.5 + 0.0832 = 0.5832. b) Ce cas est un peu différent. P (Z > 0.21) est l’aire à droite de z = 0.21. Puisque l’aire totale sous la courbe est 1, on a P (Z > 0.21) = 1 − P (Z ≤ 0.21) = 1 − 0.5832 = 0.4168 On peut également poser la question dans l’autre sens comme le montre l’exempe suivant : Exemple 11.4. Soit Z ∼ N(0, 1). Trouver c tel que P (−c ≤ Z ≤ c) = 0.9544 Puisque la courbe est symétrique, le problème revient à trouver c tel que P (0 ≤ Z ≤ c) = 0.9544/2 = 0.4772 On recherche 0.4772 dans la table et on obtient que c = 2. 2.3. La cote Z. Il est cependant rare qu’un phénomène suit une loi normale de moyenne 0 et de variance 1. Il faut tout même être en mesure de déterminer des probabilités avec seulement l’aide de la table de loi normale centrée réduite. Pour ce faire, nour devrons utiliser la cote Z d’une variable X. Définition 11.1. Soit une variable aléatoire X ∼ N(µ, σ 2 ). La cote Z est définie comme suit : X −µ Z= ∼ N(0, 1). σ 58 11. LA LOI NORMALE Puisque Z suit une loi normale N(0, 1), on peut déterminer des probabilités comme nous l’avons fait dans la section précédente. Exemple 11.5. Soit X ∼ N(12, 25). Trouvons a) P (7 < X < 17) b) P (X ≥ 13) Tout d’abord, il faut identifier µ et σ. Ici, µ = 12 et σ = la suite, on peut déterminer les probabilités. √ 25 = 5. Par a) On doit tout d’abord écrire la cote Z de X. Ainsi, 7 − µ X −µ 17 − µ < < P (7 < X < 17) = P σ σ σ 7 − X − 12 17 − 12 12 < < =P 5 5 5 = P (−1 < Z < 1) = 2P (0 ≤ Z < 1) = 0.6426 b) Nous devons effectuer le même processus pour déterminer P (X ≥ 13). X − µ 13 − µ ≥ P (X ≥ 13) = P X σ− 12 13σ− 12 ≥ =P 5 5 = P (Z ≥ 0.2) = 1 − P (Z < 0.2) = 1 − (0.5 + P (0 ≤ Z ≤ 0.2)) = 1 − (0.5 + 0.0793) = 1 − 0.5793 = 0.4207 Il est intéressant d’interpréter les résultats obtenus. Par exemple, on a trouvé que P (X ≥ 13) = 0.4207. Cela signifie que 42.07% des données de la distribution de X sont supérieures à 13. On a donc qu’environ 58% des données sont inférieures à 13. On peut donc dire que le rang centile de 13 est 58, c’est-à-dire R100 (13) = 58. 3. DISTRUBUTION DES MOYENNES DES ÉCHANTILLONS 59 3. Distrubution des moyennes des échantillons Nous sommes maintenant intéressés à étudier la distribution des moyennes de tous les échantillons de taille n d’une population de taille N. Cette théorie nécessite un peu de notation. C’est pourquoi nous vous référons à l’annexe A afin de bien comprendre chacun des symboles. Afin de bien comprendre le principe, nous l’expliquerons avec un exemple. Supposons que nous avons une population de taille 1000 et que nous cherchons à connaître la moyenne d’une certaine variable X. Alors, on choisit un échantillon au hasard de taille 100 que l’on note E1 . Cet échantillon nous donne une certaine moyenne X̄1 et un écart-type s1 . Nous recommençons le processus afin d’obtenir un deuxième échantillon E2 qui possède une moyenne X̄2 et un écart-type s2 . Ainsi de suite, nous effectuons ce procédé k fois. Regardons ce qui ce produit avec la distribution des X̄i . Ici, nous avons pris au hasard 1000 chiffres entre 0 et 1 (la population) et par la suite nous avons pris quelques échantillons de taille 100 au hasard et tracer l’histogramme de la fréquence des moyennes des échantillons. La figure 4 montre ces histogrammes. On remarque que lorsque nous augmentons le nombre de données, c’est-à-dire le nombre de moyennes de divers échantillons, la distribution semble suivre une certaine loi normale. C’est effectivement le cas. Le théorème suivant provient de la théorie des probabilités. On le tiendra pour acquis. Théorème 11.1. Soit X une variable aléatoire telle que dont la moyenne de la population est µ et l’écart-type est σ. On a que σ2 1) si X ∼ N(µ, σ ), alors X̄ ∼ N µ, , n 2 2) si X distribution quelconque et si n ≥ 30, alors X̄ ∼ est2d’une σ N µ, . n En d’autres termes, si la taille des échantillons choisis d’une manière aléatoire est plus grande que 30, on a que la distribution des moyennes de tous les échantillons √ suit une loi normale de moyenne µX̄ = µ et d’écart-type σX̄ = σ/ n. 60 11. LA LOI NORMALE 18 40 16 35 14 30 12 Fréquence Fréquence 25 10 8 20 15 6 10 4 5 2 0 0 0.2 0.4 0.6 0.8 0 1 0 0.2 0.4 Xb 0.6 0.8 1 0.8 1 Xb (a) Avec k = 100 (b) Avec k = 200 50 60 45 50 40 40 30 Fréquence Fréqucnce 35 25 20 30 20 15 10 10 5 0 0 0.2 0.4 0.6 0.8 1 0 0 0.2 Xb 0.4 0.6 Xb (c) Avec k = 300 (d) Avec k = 400 Fig. 4. Distribution des moyennes pour différents nombres d’échantillons. Vérifions ces dires avec l’exemple précédent. On a calculé la moyenne et l’écart-type de cette population. Ainsi, µ = 0.5021 σ = 0.2740. Étudions la suite des moyennes des échantillons pour différents k, c’està-dire différents nombres d’échantillons. On remarque que plus il y a k Moyenne écart-type 100 0.5077 0.0286 200 0.5036 0.0268 300 0.5033 0.0283 400 0.5026 0.0285 d’échantillons, plus la moyenne des moyennes se√rapproche de √ µ. Pour ce qui est de l’écart-type, on sait que σX̄ = σ/ n = 0.2740/ 100 = 3. DISTRUBUTION DES MOYENNES DES ÉCHANTILLONS 61 0.0274. On remarque également qu’on est autour. Pour obtenir exactement µX̄ et σX̄ , il faut faire les calculs pour tous les échantillons de taille 100 possible. Ceci est quasiment impossible. Le nombre de ces échantillons n’est même pas calculable avec mon ordinateur. Par exemple, si la population est 100 et que l’on prend des échantillons de taille 20, il y a 535983370403809590000 échantillons possible. ANNEXE A Notation Symboles Signification Exemples X Caractère étudié dans la population Moyenne du caractère étudié dans la population Écart-type du caractère étudié dans la population Moyenne d’un échantillon choisi dans la population Écart-type d’un échantillon choisi dans la population Moyenne échantillonnale du caractère étudié dans la population Moyenne des moyennes de tous les échantillons aléatoires de taille n. µX̄ = µ Écart-type des moyennes de tous les échantillons aléatoires de taille n. Proportion des individus de la population possédant une caractéristique Proportion des individus d’un échantillon possédant une caractéristique Proportion échantillonnale des individus ossédant une caractéristique Âge d’un étudiant µ σ x̄ s X̄ µX̄ σX̄ π p P µP Moyenne des proportions de tous les échantillons aléatoires possibles de taille n. µP = π σP Écart-type des proportions de tous les échantillons aléatoires possibles de taille n. 63 Âge moyen de tous les étudiants Écart-type de l’âge de tous les étudiants Âge moyen des étudiants de votre groupe Écart-type de l’âge des étudiants de votre groupe Âge moyen d’un échantillon aléatoire de taille 100 choisi parmi tous les étudiants Moyenne des moyennes des âges de tous les échantillons possibles de 100 étudiants. Écart-type des moyennes des âges de tous les échantillons possibles de 100 étudiants. Proportion de fumeurs parmi tous les étudiants Proportion de fumeurs parmi les étudiants de la classe Proportion de fumeurs d’un échantillon aléatoire de 100 étudiants Moyenne des proportions de fumeurs de tous les échantillons aléatoires possibles de 100 étudiants. Écart-type des proportions de fumeurs de tous les échantillons aléatoires possibles de 100 étudiants.