Chapitre11

publicité
50
CHAPITRE 11
La loi normale
1. Introduction à l’inférence statistique
Dans ce chapitre, nous étudierons la façon de faire de l’inférence
statistique, c’est-à-dire qu’à partir de la moyenne x̄ ou d’une proportion p d’un échantillon, nous serons en mesure d’estimer la moyenne µ
ou la proportion π de la population.
Naturellement, si nous approximons µ par x̄, nous commettrons une
certaine erreur puisque l’échantillon n’est pas la population. Par contre,
plus la taille de l’échantillon est grande, plus x̄ se rapprochera de la
véritable moyenne de la population. Le même phénomène se produit
avec les proportions. C’est ce que l’on appelle en mathématique la Loi
de Grands Nombres.
Comme nous l’avons mentionné, si l’on utilise x̄ pour approximer
µ, on commet une certaine erreur. De plus, si nous prenons un autre
échantillon de même taille, il nous donnera une autre moyenne. C’est
pourquoi au lieu d’estimer la moyenne et la proportion d’une manière
ponctuelle (comme nous venons de le faire), on utilisera plutôt une
estimation par intervalle de confiance. Cela signifie que la moyenne
µ se trouvera entre x̄ − ME et x̄ + ME, où ME est la marge d’erreur
sur la moyenne. On note alors que
µ ∈ [x̄ − ME, x̄ + ME].
Cependant, déterminer la valeur de cette marge d’erreur n’est pas
simple, surtout qu’elle varie selon l’échantillon utilisé. Nous aurons besoin d’une théorie afin de pouvoir arriver à notre fin. Cette théorie est
celle des probabilités et plus particulièrement de la Loi Normale.
L’idée générale, nous y reviendrons plus en profondeur plus tard,
a été développer par Quételet pour expliquer le tour de poitrine des
soldats anglais. Le principe est que si l’on prend tous les échantillons
de taille n possibles d’une population très grande, alors la distribution
des moyennes de tous ces échantillons suit une loi normale de moyenne
51
52
11. LA LOI NORMALE
√
µ et d’écart-type σ/ n. La figure 1 montre à quoi ressemble cette distribution. Les propriétés de cette distribution seront étudiées dans la
prochaine section. Les propriétés de cette distribution seront étudiées
µ
Fig. 1. Courbe Normale.
dans la prochaine section.
Revenons à notre marge d’erreur ME. Grâce à la distribution normale des moyennes de tous les échantillons de taille n, nous serons en
mesure de déterminer ME. Il suffira de décider ce que l’on appelle le
Niveau de confiance que l’on désire. Celui-ci correspond à la probabilité que la véritable moyenne de la population (de même pour la
proportion) se trouve dans l’intervalle de confiance. Habituellement, on
prend un niveau de confiance soit de 95% ou de 99%. Ainsi, on sera en
mesure de déterminer l’intervalle de confiance.
Regardons un exemple que l’on recontre assez souvent est lors des
élections.
Exemple 11.1. Le parti Libéral obtiendrait 32% des voix, contre
28% pour le PQ et 26% pour l’ADQ. La marge de d’erreur de 2%, 19
fois sur 20.
Cela signifie que les proportions de 19 échantillons sur 20 se trouvent
dans la marge d’erreur de 2%. Donc, le niveau de confiance choisit est
de 95%, car 19/20 = 95%.
2. LA LOI NORMALE
53
Les prochaines sections servent à détailler les calculs et à les justifier.
2. La loi normale
2.1. Introduction. La loi normale de moyenne µ et d’écart-type
σ correspond à une courbe de Gauss d’équation
(x−µ)2
1
f (x) = √ e− 2σ2 .
σ 2π
La loi normale possède quelques caractéristiques intéressantes.
1) Cette fonction est entièrement déterminée par µ et σ.
2) L’aire sous la courbe est 1 et ce, pour toutes les valeurs de µ et
de σ.
3) La courbe est symétrique par rapport à x = µ, c’est-à-dire que
l’aire à gauche de x = µ est la même qu’à droite.
La deuxième propriété est sans doute la plus importante. C’est elle qui
nous permettra de faire une estimation de moyennes ou de proportions
à l’aide d’un intervalle. C’est également cette propriété qui nous permet
de dire que la courbe normale est une fonction de densité de probabilité.
Étudions maintenant une petite partie des probabilités afin d’être
en mesure de faire de l’inférence statistique. Si une certaine variable
X, dite variable aléatoire, obéit à une loi normale de moyenne µ et de
variance σ 2 , on note
X ∼ N(µ, σ 2 ).
Ici, nous sommes intéressés par la probabilité que X soit comprise entre
deux valeurs x1 et x2 . On note cette probabilité P (x1 < X < x2 ). La
théorie des probabilités nous dit que P (x1 < X < x2 ) correspond à
l’aire de la région sous la courbe normale délimitée par x1 et x2 . La
figure 2 montre cette probabilité.
2.2. Loi normale centrée réduite. Il n’existe cependant pas de
formules pour calculer l’aire sous la courbe. Nous devons utiliser une
table où les aires y sont déjà déterminées. Par contre, cette table n’est
valide que pour la loi normale de moyenne 0 et de variance 1, notée
N(0, 1). On appelle cette loi, loi normale centrée réduite. Cette
table est présentée à la page 56. Avant d’expliquer comment retrouver
une loi normale centrée réduite à partir d’une loi normale quelconque,
examinons la façon d’utiliser la table.
54
11. LA LOI NORMALE
x1
µ
x2
Fig. 2. Aire sous la courbe normale pour déterminer
P (x1 < X < x2 ).
important–important–important–important–important
Il est à noter que P (0 < Z < z) = P (0 ≤ Z ≤ z). Cela signifie que
l’inégalité stricte et l’inégalité correspond à la même valeur.
Exemple 11.2. Si Z ∼ N(0, 1), trouvons
a) P (0 < Z < 0.5)
b) P (−1 < Z < 1)
c) P (−0.5 < Z < 2)
d) P (1.15 < Z < 3)
a) Pour déterminer P (0 < Z < 0.5), il faut se servir de la table
de loi normale. Celle-ci nous donne P (0 < Z < z). Dans cet
exemple, z = 0.5. Ainsi, on n’a qu’à aller à la 6e ligne et à
la première colonne. Les lignes représentent la valeur de z à la
première décimale et les colonnes correspond à la valeur de la
deuxième décimale. On obtient donc que
P (0 < Z < 0.5) = 0.1915.
b) Puisque la table de loi normale donne la valeur valeur pour
P (0 ≤ Z ≤ z), nous n’avons pas accès directement à P (−1 <
Z < 1). Il faut utiliser la propriété de symétrie de la courbe
normale. Il est facile de voir à l’aide d’un dessin que
P (−1 < Z < 1) = P (−1 < Z ≤ 0) + P (0 < Z < 1)
Par la propriété de symétrie, on a que
P (−1 < Z ≤ 0) = P (0 ≤ Z < 1).
2. LA LOI NORMALE
55
Ainsi,
P (−1 < Z < 1) = P (−1 < Z ≤ 0) + P (0 < Z < 1)
= P (0 ≤ Z < 1) + P (0 < Z < 1)
= 2P (0 ≤ Z < 1)
Dans la table, on trouve que P (0 ≤ Z < 1) = 0.3413. D’où,
P (−1 < Z < 1) = 2 × 0.3413 = 0.6426.
c) On utilise le même principe pour trouver P (−0.5 < Z < 2).
Ainsi,
P (−0.5 < Z < 2) = P (−0.5 < Z ≤ 0) + P (0 < Z < 2)
= P (0 ≤ Z < 0.5) + P (0 < Z < 2)
= 0.1915 + 0.4772
= 0.6687
par symétrie
d) Pour ce cas, il faut user d’astuces. La figure 3 montre la technique. Ainsi,
=
0 1.15 3
−
0
3
0 1.15
Fig. 3. Calcul de P (1.15 < Z < 3).
P (1.15 < Z < 3) = P (0 ≤ Z < 3) − P (0 ≤ Z < 1.15)
= 0.4987 − 0.3749
= 0.1238
56
11. LA LOI NORMALE
La table donne l’aire sous la
courbe normale centrée réduite ce qui correspond à
P (0 ≤ Z ≤ z).
z
0,00
0,01
0,02
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
1,00
1,10
1,20
1,30
1,40
1,50
1,60
1,70
1,80
1,90
2,00
2,10
2,20
2,30
2,40
2,50
2,60
2,70
2,80
2,90
3,00
3,10
3,20
3,30
3,40
3,50
3,60
3,70
3,80
3,90
0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032
0,4192
0,4332
0,4452
0,4554
0,4641
0,4713
0,4772
0,4821
0,4861
0,4893
0,4918
0,4938
0,4953
0,4965
0,4974
0,4981
0,4987
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000
0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049
0,4207
0,4345
0,4463
0,4564
0,4649
0,4719
0,4778
0,4826
0,4864
0,4896
0,4920
0,4940
0,4955
0,4966
0,4975
0,4982
0,4987
0,4991
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000
0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3686
0,3888
0,4066
0,4222
0,4357
0,4474
0,4573
0,4656
0,4726
0,4783
0,4830
0,4868
0,4898
0,4922
0,4941
0,4956
0,4967
0,4976
0,4982
0,4987
0,4991
0,4994
0,4995
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,03
0
0,04
0,05
0,0120 0,0160 0,0199
0,0517 0,0557 0,0596
0,0910 0,0948 0,0987
0,1293 0,1331 0,1368
0,1664 0,1700 0,1736
0,2019 0,2054 0,2088
0,2357 0,2389 0,2422
0,2673 0,2704 0,2734
0,2967 0,2995 0,3023
0,3238 0,3264 0,3289
0,3485 0,3508 0,3531
0,3708 0,3729 0,3749
0,3907 0,3925 0,3944
0,4082 0,4099 0,4115
0,4236 0,4251 0,4265
0,4370 0,4382 0,4394
0,4484 0,4495 0,4505
0,4582 0,4591 0,4599
0,4664 0,4671 0,4678
0,4732 0,4738 0,4744
0,4788 0,4793 0,4798
0,4834 0,4838 0,4842
0,4871 0,4875 0,4878
0,4901 0,4904 0,4906
0,4925 0,4927 0,4929
0,4943 0,4945 0,4946
0,4957 0,4959 0,4960
0,4968 0,4969 0,4970
0,4977 0,4977 0,4978
0,4983 0,4984 0,4984
0,4988 0,4988 0,4989
0,4991 0,4992 0,4992
0,4994 0,4994 0,4994
0,4996 0,4996 0,4996
0,4997 0,4997 0,4997
0,4998 0,4998 0,4998
0,4999 0,4999 0,4999
0,4999 0,4999 0,4999
0,4999 0,4999 0,4999
0,5000 0,5000 0,5000
Table de la loi normale.
z
0,06
0,07
0,08
0,09
0,0239
0,0636
0,1026
0,1406
0,1772
0,2123
0,2454
0,2764
0,3051
0,3315
0,3554
0,3770
0,3962
0,4131
0,4279
0,4406
0,4515
0,4608
0,4686
0,4750
0,4803
0,4846
0,4881
0,4909
0,4931
0,4948
0,4961
0,4971
0,4979
0,4985
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,0279
0,0675
0,1064
0,1443
0,1808
0,2157
0,2486
0,2794
0,3078
0,3340
0,3577
0,3790
0,3980
0,4147
0,4292
0,4418
0,4525
0,4616
0,4693
0,4756
0,4808
0,4850
0,4884
0,4911
0,4932
0,4949
0,4962
0,4972
0,4979
0,4985
0,4989
0,4992
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,0319
0,0714
0,1103
0,1480
0,1844
0,2190
0,2517
0,2823
0,3106
0,3365
0,3599
0,3810
0,3997
0,4162
0,4306
0,4429
0,4535
0,4625
0,4699
0,4761
0,4812
0,4854
0,4887
0,4913
0,4934
0,4951
0,4963
0,4973
0,4980
0,4986
0,4990
0,4993
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000
0,0359
0,0753
0,1141
0,1517
0,1879
0,2224
0,2549
0,2852
0,3133
0,3389
0,3621
0,3830
0,4015
0,4177
0,4319
0,4441
0,4545
0,4633
0,4706
0,4767
0,4817
0,4857
0,4890
0,4916
0,4936
0,4952
0,4964
0,4974
0,4981
0,4986
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,4999
0,5000
2. LA LOI NORMALE
57
On est parfois intéressé par P (Z ≤ c) ou P (c < Z). Regardons
comment on fait pour déterminer ces probabilités.
Exemple 11.3. Soit Z ∼ N(0, 1). Trouver
a) P (Z ≤ 0.21)
b) P (Z > 0.21)
Regardons comment trouver ces probabilités.
a) Réécrivons P (Z ≤ 0.21).
P (Z ≤ 0.21) = P (Z ≤ 0) + P (0 < Z < 0.21).
On a que P (Z ≤ 0) = 0.5, car elle correspond à la moitié de
l’aire totale sous la courbe. Donc,
P (Z ≤ 0.21) = 0.5 + P (0 < Z < 0.21)
= 0.5 + 0.0832
= 0.5832.
b) Ce cas est un peu différent. P (Z > 0.21) est l’aire à droite de
z = 0.21. Puisque l’aire totale sous la courbe est 1, on a
P (Z > 0.21) = 1 − P (Z ≤ 0.21)
= 1 − 0.5832
= 0.4168
On peut également poser la question dans l’autre sens comme le
montre l’exempe suivant :
Exemple 11.4. Soit Z ∼ N(0, 1). Trouver c tel que
P (−c ≤ Z ≤ c) = 0.9544
Puisque la courbe est symétrique, le problème revient à trouver c tel que
P (0 ≤ Z ≤ c) = 0.9544/2 = 0.4772
On recherche 0.4772 dans la table et on obtient que c = 2.
2.3. La cote Z. Il est cependant rare qu’un phénomène suit une
loi normale de moyenne 0 et de variance 1. Il faut tout même être en
mesure de déterminer des probabilités avec seulement l’aide de la table
de loi normale centrée réduite. Pour ce faire, nour devrons utiliser la
cote Z d’une variable X.
Définition 11.1. Soit une variable aléatoire X ∼ N(µ, σ 2 ). La
cote Z est définie comme suit :
X −µ
Z=
∼ N(0, 1).
σ
58
11. LA LOI NORMALE
Puisque Z suit une loi normale N(0, 1), on peut déterminer des
probabilités comme nous l’avons fait dans la section précédente.
Exemple 11.5. Soit X ∼ N(12, 25). Trouvons
a) P (7 < X < 17)
b) P (X ≥ 13)
Tout d’abord, il faut identifier µ et σ. Ici, µ = 12 et σ =
la suite, on peut déterminer les probabilités.
√
25 = 5. Par
a) On doit tout d’abord écrire la cote Z de X. Ainsi,
7 − µ
X −µ
17 − µ
<
<
P (7 < X < 17) = P
σ
σ
σ
7 −
X − 12
17 − 12
12
<
<
=P
5
5
5
= P (−1 < Z < 1)
= 2P (0 ≤ Z < 1)
= 0.6426
b) Nous devons effectuer le même processus pour déterminer P (X ≥
13).
X − µ
13 − µ
≥
P (X ≥ 13) = P
X σ− 12 13σ− 12 ≥
=P
5
5
= P (Z ≥ 0.2)
= 1 − P (Z < 0.2)
= 1 − (0.5 + P (0 ≤ Z ≤ 0.2))
= 1 − (0.5 + 0.0793)
= 1 − 0.5793
= 0.4207
Il est intéressant d’interpréter les résultats obtenus. Par exemple, on
a trouvé que P (X ≥ 13) = 0.4207. Cela signifie que 42.07% des données
de la distribution de X sont supérieures à 13. On a donc qu’environ
58% des données sont inférieures à 13. On peut donc dire que le rang
centile de 13 est 58, c’est-à-dire
R100 (13) = 58.
3. DISTRUBUTION DES MOYENNES DES ÉCHANTILLONS
59
3. Distrubution des moyennes des échantillons
Nous sommes maintenant intéressés à étudier la distribution des
moyennes de tous les échantillons de taille n d’une population de taille
N. Cette théorie nécessite un peu de notation. C’est pourquoi nous
vous référons à l’annexe A afin de bien comprendre chacun des symboles. Afin de bien comprendre le principe, nous l’expliquerons avec un
exemple.
Supposons que nous avons une population de taille 1000 et que nous
cherchons à connaître la moyenne d’une certaine variable X. Alors, on
choisit un échantillon au hasard de taille 100 que l’on note E1 . Cet
échantillon nous donne une certaine moyenne X̄1 et un écart-type s1 .
Nous recommençons le processus afin d’obtenir un deuxième échantillon E2 qui possède une moyenne X̄2 et un écart-type s2 . Ainsi de
suite, nous effectuons ce procédé k fois. Regardons ce qui ce produit
avec la distribution des X̄i .
Ici, nous avons pris au hasard 1000 chiffres entre 0 et 1 (la population) et par la suite nous avons pris quelques échantillons de taille 100
au hasard et tracer l’histogramme de la fréquence des moyennes des
échantillons. La figure 4 montre ces histogrammes. On remarque que
lorsque nous augmentons le nombre de données, c’est-à-dire le nombre
de moyennes de divers échantillons, la distribution semble suivre une
certaine loi normale. C’est effectivement le cas. Le théorème suivant
provient de la théorie des probabilités. On le tiendra pour acquis.
Théorème 11.1. Soit X une variable aléatoire telle que dont la
moyenne de la population est µ et l’écart-type est σ. On a que
‚
Œ
σ2
1) si X ∼ N(µ, σ ), alors X̄ ∼ N µ,
,
n
2
2) si X
distribution quelconque et si n ≥ 30, alors X̄ ∼
‚ est2d’une
Œ
σ
N µ,
.
n
En d’autres termes, si la taille des échantillons choisis d’une manière
aléatoire est plus grande que 30, on a que la distribution des moyennes
de tous les échantillons
√ suit une loi normale de moyenne µX̄ = µ et
d’écart-type σX̄ = σ/ n.
60
11. LA LOI NORMALE
18
40
16
35
14
30
12
Fréquence
Fréquence
25
10
8
20
15
6
10
4
5
2
0
0
0.2
0.4
0.6
0.8
0
1
0
0.2
0.4
Xb
0.6
0.8
1
0.8
1
Xb
(a) Avec k = 100
(b) Avec k = 200
50
60
45
50
40
40
30
Fréquence
Fréqucnce
35
25
20
30
20
15
10
10
5
0
0
0.2
0.4
0.6
0.8
1
0
0
0.2
Xb
0.4
0.6
Xb
(c) Avec k = 300
(d) Avec k = 400
Fig. 4. Distribution des moyennes pour différents
nombres d’échantillons.
Vérifions ces dires avec l’exemple précédent. On a calculé la moyenne
et l’écart-type de cette population. Ainsi,
µ = 0.5021
σ = 0.2740.
Étudions la suite des moyennes des échantillons pour différents k, c’està-dire différents nombres d’échantillons. On remarque que plus il y a
k Moyenne écart-type
100 0.5077
0.0286
200 0.5036
0.0268
300 0.5033
0.0283
400 0.5026
0.0285
d’échantillons, plus la moyenne des moyennes se√rapproche de √
µ. Pour
ce qui est de l’écart-type, on sait que σX̄ = σ/ n = 0.2740/ 100 =
3. DISTRUBUTION DES MOYENNES DES ÉCHANTILLONS
61
0.0274. On remarque également qu’on est autour. Pour obtenir exactement µX̄ et σX̄ , il faut faire les calculs pour tous les échantillons
de taille 100 possible. Ceci est quasiment impossible. Le nombre de
ces échantillons n’est même pas calculable avec mon ordinateur. Par
exemple, si la population est 100 et que l’on prend des échantillons de
taille 20, il y a 535983370403809590000 échantillons possible.
ANNEXE A
Notation
Symboles
Signification
Exemples
X
Caractère étudié dans la population
Moyenne du caractère étudié dans la population
Écart-type du caractère étudié dans la population
Moyenne d’un échantillon choisi dans la population
Écart-type d’un échantillon choisi dans la population
Moyenne échantillonnale du caractère étudié
dans la population
Moyenne
des
moyennes
de tous les échantillons aléatoires de taille
n. µX̄ = µ
Écart-type
des
moyennes
de tous les échantillons aléatoires de taille
n.
Proportion des individus de la population possédant une caractéristique
Proportion des individus d’un échantillon possédant une caractéristique
Proportion échantillonnale des individus ossédant une caractéristique
Âge d’un étudiant
µ
σ
x̄
s
X̄
µX̄
σX̄
π
p
P
µP
Moyenne des proportions de tous les échantillons aléatoires possibles de taille n. µP = π
σP
Écart-type des proportions de tous les échantillons aléatoires possibles de taille n.
63
Âge moyen de tous les étudiants
Écart-type de l’âge de tous les étudiants
Âge moyen des étudiants de votre groupe
Écart-type de l’âge des étudiants de votre
groupe
Âge moyen d’un échantillon aléatoire de taille
100 choisi parmi tous les étudiants
Moyenne des moyennes des âges de tous les
échantillons possibles de 100 étudiants.
Écart-type des moyennes des âges de tous les
échantillons possibles de 100 étudiants.
Proportion de fumeurs parmi tous les étudiants
Proportion de fumeurs parmi les étudiants de
la classe
Proportion de fumeurs d’un échantillon aléatoire de 100 étudiants
Moyenne des proportions de fumeurs de tous
les échantillons aléatoires possibles de 100 étudiants.
Écart-type des proportions de fumeurs de tous
les échantillons aléatoires possibles de 100 étudiants.
Téléchargement