50
CHAPITRE 11
La loi normale
1. Introduction à l’inférence statistique
Dans ce chapitre, nous étudierons la façon de faire de l’inférence
statistique, c’est-à-dire qu’à partir de la moyenne ¯xou d’une propor-
tion pd’un échantillon, nous serons en mesure d’estimer la moyenne µ
ou la proportion πde la population.
Naturellement, si nous approximons µpar ¯x, nous commettrons une
certaine erreur puisque l’échantillon n’est pas la population. Par contre,
plus la taille de l’échantillon est grande, plus ¯xse rapprochera de la
véritable moyenne de la population. Le même phénomène se produit
avec les proportions. C’est ce que l’on appelle en mathématique la Loi
de Grands Nombres.
Comme nous l’avons mentionné, si l’on utilise ¯xpour approximer
µ, on commet une certaine erreur. De plus, si nous prenons un autre
échantillon de même taille, il nous donnera une autre moyenne. C’est
pourquoi au lieu d’estimer la moyenne et la proportion d’une manière
ponctuelle (comme nous venons de le faire), on utilisera plutôt une
estimation par intervalle de confiance. Cela signifie que la moyenne
µse trouvera entre ¯xME et ¯x+ME, où ME est la marge d’erreur
sur la moyenne. On note alors que
µ[¯xME, ¯x+ME].
Cependant, déterminer la valeur de cette marge d’erreur n’est pas
simple, surtout qu’elle varie selon l’échantillon utilisé. Nous aurons be-
soin d’une théorie afin de pouvoir arriver à notre fin. Cette théorie est
celle des probabilités et plus particulièrement de la Loi Normale.
L’idée générale, nous y reviendrons plus en profondeur plus tard,
a été développer par Quételet pour expliquer le tour de poitrine des
soldats anglais. Le principe est que si l’on prend tous les échantillons
de taille npossibles d’une population très grande, alors la distribution
des moyennes de tous ces échantillons suit une loi normale de moyenne
51
52 11. LA LOI NORMALE
µet d’écart-type σ/n. La figure 1 montre à quoi ressemble cette dis-
tribution. Les propriétés de cette distribution seront étudiées dans la
prochaine section. Les propriétés de cette distribution seront étudiées
µ
Fig. 1. Courbe Normale.
dans la prochaine section.
Revenons à notre marge d’erreur ME. Grâce à la distribution nor-
male des moyennes de tous les échantillons de taille n, nous serons en
mesure de déterminer ME. Il suffira de décider ce que l’on appelle le
Niveau de confiance que l’on désire. Celui-ci correspond à la pro-
babilité que la véritable moyenne de la population (de même pour la
proportion) se trouve dans l’intervalle de confiance. Habituellement, on
prend un niveau de confiance soit de 95% ou de 99%. Ainsi, on sera en
mesure de déterminer l’intervalle de confiance.
Regardons un exemple que l’on recontre assez souvent est lors des
élections.
Exemple 11.1.Le parti Libéral obtiendrait 32% des voix, contre
28% pour le PQ et 26% pour l’ADQ. La marge de d’erreur de 2%,19
fois sur 20.
Cela signifie que les proportions de 19 échantillons sur 20 se trouvent
dans la marge d’erreur de 2%. Donc, le niveau de confiance choisit est
de 95%, car 19/20 = 95%.
2. LA LOI NORMALE 53
Les prochaines sections servent à détailler les calculs et à les justi-
fier.
2. La loi normale
2.1. Introduction. La loi normale de moyenne µet d’écart-type
σcorrespond à une courbe de Gauss d’équation
f(x) = 1
σ2πe
(xµ)2
2σ2.
La loi normale possède quelques caractéristiques intéressantes.
1) Cette fonction est entièrement déterminée par µet σ.
2) L’aire sous la courbe est 1et ce, pour toutes les valeurs de µet
de σ.
3) La courbe est symétrique par rapport à x=µ, c’est-à-dire que
l’aire à gauche de x=µest la même qu’à droite.
La deuxième propriété est sans doute la plus importante. C’est elle qui
nous permettra de faire une estimation de moyennes ou de proportions
à l’aide d’un intervalle. C’est également cette propriété qui nous permet
de dire que la courbe normale est une fonction de densité de probabilité.
Étudions maintenant une petite partie des probabilités afin d’être
en mesure de faire de l’inférence statistique. Si une certaine variable
X, dite variable aléatoire, obéit à une loi normale de moyenne µet de
variance σ2, on note
XN(µ, σ2).
Ici, nous sommes intéressés par la probabilité que Xsoit comprise entre
deux valeurs x1et x2. On note cette probabilité P(x1< X < x2). La
théorie des probabilités nous dit que P(x1< X < x2)correspond à
l’aire de la région sous la courbe normale délimitée par x1et x2. La
figure 2 montre cette probabilité.
2.2. Loi normale centrée réduite. Il n’existe cependant pas de
formules pour calculer l’aire sous la courbe. Nous devons utiliser une
table où les aires y sont déjà déterminées. Par contre, cette table n’est
valide que pour la loi normale de moyenne 0et de variance 1, notée
N(0,1). On appelle cette loi, loi normale centrée réduite. Cette
table est présentée à la page 56. Avant d’expliquer comment retrouver
une loi normale centrée réduite à partir d’une loi normale quelconque,
examinons la façon d’utiliser la table.
54 11. LA LOI NORMALE
µ
x1x2
Fig. 2. Aire sous la courbe normale pour déterminer
P(x1< X < x2).
important–important–important–important–important
Il est à noter que P(0 < Z < z) = P(0 Zz). Cela signifie que
l’inégalité stricte et l’inégalité correspond à la même valeur.
Exemple 11.2.Si ZN(0,1), trouvons
a) P(0 < Z < 0.5)
b) P(1< Z < 1)
c) P(0.5< Z < 2)
d) P(1.15 < Z < 3)
a) Pour déterminer P(0 < Z < 0.5), il faut se servir de la table
de loi normale. Celle-ci nous donne P(0 < Z < z). Dans cet
exemple, z= 0.5. Ainsi, on n’a qu’à aller à la 6eligne et à
la première colonne. Les lignes représentent la valeur de zà la
première décimale et les colonnes correspond à la valeur de la
deuxième décimale. On obtient donc que
P(0 < Z < 0.5) = 0.1915.
b) Puisque la table de loi normale donne la valeur valeur pour
P(0 Zz), nous n’avons pas accès directement à P(1<
Z < 1). Il faut utiliser la propriété de symétrie de la courbe
normale. Il est facile de voir à l’aide d’un dessin que
P(1< Z < 1) = P(1< Z 0) + P(0 < Z < 1)
Par la propriété de symétrie, on a que
P(1< Z 0) = P(0 Z < 1).
1 / 14 100%