Test Z et test T de Student

Téléchargement

Comparer une moyenne observée à une moyenne de référence

Un échantillon, une variable numérique, une moyenne de référence

Situation

On souhaite comparer la moyenne d’une variable numérique observée sur un échantillon, à

une référence : la moyenne de cette variable sur une population.

Exemple

Une épreuve chronométrée de dénombrement a été proposée à un groupe d’enfants de 6

ans dyspraxiques. La durée normale pour répondre aux items de l’épreuve est de 3min 30s

c'est-à-dire 210s. Dans le groupe étudié, les relevés conduisent à une moyenne de 234s. Le

chercheur se demande si l’écart est significatif ou non.

Méthode statistique

Principe de la méthode

La méthode statistique consiste à poser la question suivante : en supposant (hypothèse

nulle) que l’échantillon étudié soit un échantillon aléatoire de la population de référence,

l’écart entre la moyenne observée et la moyenne théorique est-il important ou non ?

Pour répondre à cette question, il faut d’abord mesurer la différence entre la moyenne

observée (mobs) et la moyenne de référence (mref). La mesure choisie relativise la différence

entre les moyennes, à la fois à l’écart type de référence (σ) et à la taille de l’échantillon (n) :

(;)obs ref

obs ref

dm m

−

Avec cette formule, la distance entre la moyenne observée et la moyenne théorique est

d’autant plus grande que la taille de l’échantillon est importante et que l’écart-type de la

moyenne théorique est faible.

Pour évaluer cette mesure, on calcule la probabilité p d’en obtenir une aussi grande sous

l’hypothèse nulle. La loi de probabilité de la mesure dépend de la taille n de l’échantillon.

C’est la loi de Laplace-Gauss (normale centrée réduite, notée z) si la taille est au moins égale

à 30. Dans le cas contraire, et à la condition que la distribution des valeurs observées soit elle-

même approximativement normale, la loi de probabilité est la loi de Student (notée t) à n – 1

degrés de liberté.

Ensuite, la méthode se déroule comme celle du test du khi-2. Si la probabilité p est

inférieure à un seuil α choisi a priori (5% par exemple), alors l’hypothèse nulle est rejetée et

on conclut que la différence des moyennes est significative (au seuil α avec un degré de

signification p). Sinon on conclut que la différence des moyennes n’est pas significative au

seuil α.

Dit autrement dit : grâce à la loi de probabilité, une distance « théorique » est associée au seuil α, c’est la

distance au-delà de laquelle la mesure de la différence sera jugée significative. La distance théorique est notée

zthéorique ou tthéorique suivant la taille de l’échantillon étudié, de même la mesure observée (fonction discriminante)

est notée zobs ou tobs, et alors la différence sera jugée significative si en valeur absolue zobs est supérieure à zthéorique

(ou tobs supérieure à tthéorique).

Mise en œuvre de la méthode : test Z ou test T

Pour mettre en œuvre la méthode, on doit avoir à sa disposition : la moyenne observée et la

taille de l’échantillon ainsi que la moyenne de référence et son écart-type ou, si cet écart-type

n’est pas connu, l’écart-type de la moyenne observée sur l’échantillon.

Suivant la taille de l’échantillon, pour comparer les deux moyennes, on utilise l’un ou

l’autre de deux tests dont la mise en œuvre est analogue : le test Z ou le test T.

Mise en œuvre du Test Z

Complétons les données : la taille l’échantillon est 36 et l’écart type observé est 60. Avec

une moyenne théorique de 210 alors que la moyenne observée est 234, la mesure de la

différence entre les moyennes est zobs = 2,4. Cette valeur est-elle grande ? Est-elle trop grande

pour laisser supposer que l’échantillon soit issu aléatoirement de la population de référence ?

Ou est-elle suffisamment faible pour qu’on ne puisse rejeter cette hypothèse ?

Pour répondre (sans machine), il faut penser à la courbe de la loi normale centrée réduite :

] –0,994 ; +0,994[ ]–1,96 ; +1,96[ ]–2,58 ; +2,58[

Fréquence = 68% Fréquence = 95% Fréquence = 99%

À chaque pourcentage correspond une zone de « normalité », zone d’autant plus grande

que le pourcentage est grand. Par exemple, si l’on admet une zone de normalité comprenant

95% de la population, les valeurs « normales » sont celles de l’intervalle ]–1,96 ; +1,96[.

Autrement dit, la zone « d’anormalité » qui comporte 5% des valeurs est constituée des

valeurs inférieures à –1,96 et des valeurs supérieures à +1,96. Dans la pratique des tests, la

zone « d’anormalité » est la zone de rejet de l’hypothèse nulle ; elle est déterminée par le seuil

de signification choisi a priori.

Dans le cas qui nous occupe, la valeur zobs = 2,4 est située à l’extérieur de l’intervalle

]–1,96 ; +1,96[ dont la probabilité est 95%, on peut donc en déduire que la probabilité

d’obtenir une différence aussi grande (au sens de la mesure choisie) est inférieure à 5%.

La valeur de zobs étant dans la zone de rejet de l’hypothèse nulle au seuil de 5%, on conclut

que la durée moyenne de réalisation de l’épreuve de dénombrement par les enfants du groupe

étudié est significativement différente au seuil de 5% de la moyenne de référence.

Remarque : dans la pratique, le logiciel calcule exactement la probabilité p que la valeur de

la fonction discriminante z soit à l’extérieur de l’intervalle ]–2,4 ; +2,4[ : p = 1,64%.

Mise en œuvre du Test T

Supposons que le nombre d’enfants du groupe étudié ne soit plus 36 mais seulement 25,

avec la même moyenne 234 et le même écart type 60. Supposons aussi que la durée de

réalisation de l’épreuve de dénombrement suive approximativement une loi normale (dans la

pratique, il faudrait le prouver à partir des données recueillies).

La fonction discriminante t suit alors la loi T de Student à 24 degrés de liberté. La mise en

œuvre du test est ensuite analogue à celle du test Z.

0 0 0

Test unilatéral ou bilatéral ?

Revenons aux conditions précédentes de mise en œuvre du test Z où la mesure de la

différence était de 2,4 et où p = 1,64%. Au seuil de 1%, on ne pouvait donc pas conclure à une

différence significative entre la moyenne observée chez les enfants dyspraxiques âgés de

6 ans et la moyenne de référence.

Une valeur qui suit la loi normale a, en effet, une probabilité de 99% de se situer dans

l’intervalle ]–2,58 ; +2,58[. Au seuil de 1%, cet intervalle est la zone de normalité, et il lui

correspond une zone de rejet composée des deux intervalles ]–∞ ; –2,58[ et ]+2,58 ; +∞[,

intervalles pour chacun desquels la probabilité est de 0,5%.

Le test Z que nous avons effectué est un test bilatéral. On l’appelle ainsi car nous avons

considéré les deux « côtés » autour de la zone de normalité pour déterminer la zone de rejet de

l’hypothèse nulle. Il serait pourtant légitime d’affirmer que les enfants dyspraxiques ne

peuvent pas réussir significativement mieux que les enfants normaux. Cela conduit à

considérer autrement la zone de rejet : comme une valeur qui suit la loi normale a une

probabilité de 1% de se situer dans l’intervalle ]+2,32 ; +∞[, c’est cet intervalle qui sera

considéré comme zone de rejet au seuil de 1%. On dit qu’on effectue un test unilatéral

lorsqu’on définit une zone de rejet non plus situé de part et d’autre de la zone de normalité,

mais située d’un seul côté de la zone de normalité.

Cela change complètement les conclusions dans le cas qui nous intéresse ici. Avec un test

bilatéral au seuil de 1%, on ne peut pas conclure que la moyenne observée chez les enfants

dyspraxique est, de manière significative, différente de la moyenne de référence. Mais avec

un test unilatéral au seuil de 1%, on peut conclure que la moyenne observée chez les enfants

dyspraxique est, de manière significative, supérieure à la moyenne de référence.

Avec la feuille de calcul

L’utilisateur indique la moyenne de référence et son écart-type, si cette valeur est connue.

Il choisit ensuite le seuil, un test bilatéral ou unilatéral, de rentrer les valeurs observées une

par une ou directement l’effectif, la moyenne observée et l’écart type sur l’échantillon. En

fonction l’effectif de l’échantillon, le test Z ou le test T est mis en œuvre (l’utilisateur doit

dans ce dernier cas vérifier par ailleurs que la distribution est approximativement normale…)

1 / 3 100%

Documents connexes

Math 9 – Numerical Methods Assessment Record

Solutions du chapitre I

Seconde 7 – 2008/2009

N.B : Le Seul Document Autorisé est la Table de la loi normale

Document

Tableau 1

Solutions chapitre 3

TERMINALE S Chapitre: PROBABILITÉ 3/3 Exemple

Série 2 - Faculté des Sciences Juridiques, Economiques et Sociales

Enoncé - Probabilités - e1045 Quatre amateurs d`astrologie se

Résumé de cours: Tests statistiques - Biostatistiques UE4

3 - stgcfe.fr

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Test Z et test T de Student

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Test Z et test T de Student

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib