1) Dire que X est distribuée suivant une loi Normale ),(n
Nσ
µ est équivalent à dire que : la
variable centrée et réduite
n
xσ
est distribuée suivant une loi N(0,1). (1’)
2) Si X n’est pas distribuée dans la population suivant une loi Normale, alors le résultat n’est
qu’asymptotiquement vrai (c.-à-d. quand n ?
) où µ et s sont la moyenne et l’écart-type
de la distribution inconnue.
3) Lorsque la distribution de X dans la population est normale, la distribution
échantillonnée de la moyenne
dépend de s la variance de la variable X dans la
population. Dans ce cas, de deux choses l’une : soit s est connu : et le résultat (1) est
directement exploitable, soit s est inconnu et nous devons remplacer s par son
estimation ; dans ce cas le résultat (1) ou (1’) doit être aménagé. Au lieu d’avoir (1’),
nous avons :
La variable centrée et réduite
n
s
x
est distribuée suivant une loi de « Student » t
n-1
où n est le nombre d’observations dans l’échantillon (2)
La loi de Student « ressemble » à la loi Normale N(0,1) ; elle dépend du nombre de degrés
de liberté (n-1) (cfr. cours de BA2). Lorsque n > 60, la loi de Student (t60) se confond
presque avec la loi Normale N(0,1).
a) Intervalles de confiance
Lorsque l’on peut spécifier la distribution d’échantillonnage (exacte ou asymptotique) d’un
paramètre (ce qui est le cas ici pour la moyenne échantillon), nous pouvons préciser, à
partir de l’estimation que nous avons faite, une région dans laquelle il y a beaucoup de
chance de trouver la vraie valeur du paramètre inconnu de la distribution de X. Cette
région est appelée zone de confiance ou intervalle de confiance.
L’interprétation probabiliste de l’intervalle de confiance est la suivante : quel que soit le
paramètre t de la distribution de X, la probabilité que l’intervalle aléatoire (bi,bs) recouvre la
vraie valeur de t vaut (1 – a) ; en d’autres termes, si, ayant calculé b
i, et b
s à partir des
données de l’échantillon x
1, x2, … xn, on affirme que la vraie valeur de t est située entre a et
b, on émet une proposition qui sera vraie dans (1 – a)100 cas sur cent.
Les résultats - (1’) et (2) - permettent d’introduire la notion d’intervalle de confiance sur
une moyenne. Nous pouvons écrire lorsque s² est connue :
α
σµαα −=
<
−
<− −− 1
2
1
2
1z
n
X
zP (3)
où
2
1α
−
zest le quantile d’ordre 2
1α
−de la loi Normale N(0,1). Si a = 5 % alors
2
1α
−
z=1,96…
Si la variance s² est inconnue, alors nous devons utiliser la relation (2) pour obtenir :
α
µαα −=
<
−
<− −−−− 1
2
1;1
2
1;1nn t
n
s
X
tP (4)