Test Z et test T de Student

publicité
Test Z et test T de Student
Comparer une moyenne observée à une moyenne de référence
Un échantillon, une variable numérique, une moyenne de référence
Situation
On souhaite comparer la moyenne d’une variable numérique observée sur un échantillon, à
une référence : la moyenne de cette variable sur une population.
Exemple
Une épreuve chronométrée de dénombrement a été proposée à un groupe d’enfants de 6
ans dyspraxiques. La durée normale pour répondre aux items de l’épreuve est de 3min 30s
c'est-à-dire 210s. Dans le groupe étudié, les relevés conduisent à une moyenne de 234s. Le
chercheur se demande si l’écart est significatif ou non.
Méthode statistique
Principe de la méthode
La méthode statistique consiste à poser la question suivante : en supposant (hypothèse
nulle) que l’échantillon étudié soit un échantillon aléatoire de la population de référence,
l’écart entre la moyenne observée et la moyenne théorique est-il important ou non ?
Pour répondre à cette question, il faut d’abord mesurer la différence entre la moyenne
observée (mobs) et la moyenne de référence (mref). La mesure choisie relativise la différence
entre les moyennes, à la fois à l’écart type de référence (σ) et à la taille de l’échantillon (n) :
d (mobs ; mref ) =
mobs − mref
σ2
n
Avec cette formule, la distance entre la moyenne observée et la moyenne théorique est
d’autant plus grande que la taille de l’échantillon est importante et que l’écart-type de la
moyenne théorique est faible.
Pour évaluer cette mesure, on calcule la probabilité p d’en obtenir une aussi grande sous
l’hypothèse nulle. La loi de probabilité de la mesure dépend de la taille n de l’échantillon.
C’est la loi de Laplace-Gauss (normale centrée réduite, notée z) si la taille est au moins égale
à 30. Dans le cas contraire, et à la condition que la distribution des valeurs observées soit ellemême approximativement normale, la loi de probabilité est la loi de Student (notée t) à n – 1
degrés de liberté.
Ensuite, la méthode se déroule comme celle du test du khi-2. Si la probabilité p est
inférieure à un seuil α choisi a priori (5% par exemple), alors l’hypothèse nulle est rejetée et
on conclut que la différence des moyennes est significative (au seuil α avec un degré de
signification p). Sinon on conclut que la différence des moyennes n’est pas significative au
seuil α.
Dit autrement dit : grâce à la loi de probabilité, une distance « théorique » est associée au seuil α, c’est la
distance au-delà de laquelle la mesure de la différence sera jugée significative. La distance théorique est notée
zthéorique ou tthéorique suivant la taille de l’échantillon étudié, de même la mesure observée (fonction discriminante)
est notée zobs ou tobs, et alors la différence sera jugée significative si en valeur absolue zobs est supérieure à zthéorique
(ou tobs supérieure à tthéorique).
Mise en œuvre de la méthode : test Z ou test T
Pour mettre en œuvre la méthode, on doit avoir à sa disposition : la moyenne observée et la
taille de l’échantillon ainsi que la moyenne de référence et son écart-type ou, si cet écart-type
n’est pas connu, l’écart-type de la moyenne observée sur l’échantillon.
Suivant la taille de l’échantillon, pour comparer les deux moyennes, on utilise l’un ou
l’autre de deux tests dont la mise en œuvre est analogue : le test Z ou le test T.
Mise en œuvre du Test Z
Complétons les données : la taille l’échantillon est 36 et l’écart type observé est 60. Avec
une moyenne théorique de 210 alors que la moyenne observée est 234, la mesure de la
différence entre les moyennes est zobs = 2,4. Cette valeur est-elle grande ? Est-elle trop grande
pour laisser supposer que l’échantillon soit issu aléatoirement de la population de référence ?
Ou est-elle suffisamment faible pour qu’on ne puisse rejeter cette hypothèse ?
Pour répondre (sans machine), il faut penser à la courbe de la loi normale centrée réduite :
] –0,994 ; +0,994[
Fréquence = 68%
]–1,96 ; +1,96[
Fréquence = 95%
]–2,58 ; +2,58[
Fréquence = 99%
0
0
0
1
2
3
À chaque pourcentage correspond une zone de « normalité », zone d’autant plus grande
que le pourcentage est grand. Par exemple, si l’on admet une zone de normalité comprenant
95% de la population, les valeurs « normales » sont celles de l’intervalle ]–1,96 ; +1,96[.
Autrement dit, la zone « d’anormalité » qui comporte 5% des valeurs est constituée des
valeurs inférieures à –1,96 et des valeurs supérieures à +1,96. Dans la pratique des tests, la
zone « d’anormalité » est la zone de rejet de l’hypothèse nulle ; elle est déterminée par le seuil
de signification choisi a priori.
Dans le cas qui nous occupe, la valeur zobs = 2,4 est située à l’extérieur de l’intervalle
]–1,96 ; +1,96[ dont la probabilité est 95%, on peut donc en déduire que la probabilité
d’obtenir une différence aussi grande (au sens de la mesure choisie) est inférieure à 5%.
La valeur de zobs étant dans la zone de rejet de l’hypothèse nulle au seuil de 5%, on conclut
que la durée moyenne de réalisation de l’épreuve de dénombrement par les enfants du groupe
étudié est significativement différente au seuil de 5% de la moyenne de référence.
Remarque : dans la pratique, le logiciel calcule exactement la probabilité p que la valeur de
la fonction discriminante z soit à l’extérieur de l’intervalle ]–2,4 ; +2,4[ : p = 1,64%.
Mise en œuvre du Test T
Supposons que le nombre d’enfants du groupe étudié ne soit plus 36 mais seulement 25,
avec la même moyenne 234 et le même écart type 60. Supposons aussi que la durée de
réalisation de l’épreuve de dénombrement suive approximativement une loi normale (dans la
pratique, il faudrait le prouver à partir des données recueillies).
La fonction discriminante t suit alors la loi T de Student à 24 degrés de liberté. La mise en
œuvre du test est ensuite analogue à celle du test Z.
Test unilatéral ou bilatéral ?
Revenons aux conditions précédentes de mise en œuvre du test Z où la mesure de la
différence était de 2,4 et où p = 1,64%. Au seuil de 1%, on ne pouvait donc pas conclure à une
différence significative entre la moyenne observée chez les enfants dyspraxiques âgés de
6 ans et la moyenne de référence.
Une valeur qui suit la loi normale a, en effet, une probabilité de 99% de se situer dans
l’intervalle ]–2,58 ; +2,58[. Au seuil de 1%, cet intervalle est la zone de normalité, et il lui
correspond une zone de rejet composée des deux intervalles ]–∞ ; –2,58[ et ]+2,58 ; +∞[,
intervalles pour chacun desquels la probabilité est de 0,5%.
Le test Z que nous avons effectué est un test bilatéral. On l’appelle ainsi car nous avons
considéré les deux « côtés » autour de la zone de normalité pour déterminer la zone de rejet de
l’hypothèse nulle. Il serait pourtant légitime d’affirmer que les enfants dyspraxiques ne
peuvent pas réussir significativement mieux que les enfants normaux. Cela conduit à
considérer autrement la zone de rejet : comme une valeur qui suit la loi normale a une
probabilité de 1% de se situer dans l’intervalle ]+2,32 ; +∞[, c’est cet intervalle qui sera
considéré comme zone de rejet au seuil de 1%. On dit qu’on effectue un test unilatéral
lorsqu’on définit une zone de rejet non plus situé de part et d’autre de la zone de normalité,
mais située d’un seul côté de la zone de normalité.
Cela change complètement les conclusions dans le cas qui nous intéresse ici. Avec un test
bilatéral au seuil de 1%, on ne peut pas conclure que la moyenne observée chez les enfants
dyspraxique est, de manière significative, différente de la moyenne de référence. Mais avec
un test unilatéral au seuil de 1%, on peut conclure que la moyenne observée chez les enfants
dyspraxique est, de manière significative, supérieure à la moyenne de référence.
Avec la feuille de calcul
L’utilisateur indique la moyenne de référence et son écart-type, si cette valeur est connue.
Il choisit ensuite le seuil, un test bilatéral ou unilatéral, de rentrer les valeurs observées une
par une ou directement l’effectif, la moyenne observée et l’écart type sur l’échantillon. En
fonction l’effectif de l’échantillon, le test Z ou le test T est mis en œuvre (l’utilisateur doit
dans ce dernier cas vérifier par ailleurs que la distribution est approximativement normale…)
Téléchargement