Echantillonnage M3
EchMod3 1/42
MODULE 3 : Construction d’un test d’hypothèses
Unité 1 : aspects méthodologiques
L’utilisation des intervalles de confiance comme moyen de décision est possible ; toutefois le
décideur, tout en connaissant l’existence des erreurs qu’il peut commettre, n’est pas en mesure
dévaluer les risques qui leur sont associés avant la prise de sa décision. La théorie des tests,
en ramenant cette dernière au choix entre deux hypothèses antagonistes, notées
0
H
et
1
H
,
rend la démarche plus rigoureuse.
L’hypothèse
0
H
est privilégiée dans le sens où l’observateur souhaite la retenir tant qu’elle
n’est pas infirmée par l’expérience. Dès lors, le test a pour but de mesurer l’adéquation de cette
hypothèse à la réalité observable, c’est-à-dire aux résultats fournis par un échantillon.
La démarche consiste tout d’abord à exprimer les erreurs en termes d’hypothèses « décider à
tort » devient « décider de retenir une hypothèse alors que l’autre est vraie ». Ainsi, il devient
possible de définir deux risques d’erreur et de calculer les probabilités qui leur correspondent,
les probabilités étant liées au caractère aléatoire de tous les échantillons susceptibles d’être
retenus.
Dans une deuxième étape, il s’agit de construire le test, c’est-à-dire de mettre au point
l’instrument de mesure de l’adéquation recherchée. A cette fin, et dans une formulation ex ante,
sont conjointement proposées une statistique d’échantillonage adéquate (appelée
conventionnellement fonction discriminante) et une zone de rejet de l’hypothèse
0
H
(ou région
critique) pour un risque d’erreur raisonnable. Une règle de décision est ensuite formulée, mais
la décision proprement dite n’est prise qu’ultérieurement au vu de la valeur particulière retenue
dans un échantillon particulier.
Comme pour tout instrument de mesure, il sera exigé d’un test d’hypothèse d’être performant.
La puissance d’un test, c’est-à-dire la probabilité de refuser l’hypothèse
0
H
quand elle est
fausse, est définie pour jouer ce rôle. Ainsi compte tenu de la diversité des situations concrètes
envisageables, le critère de choix entre différents tests possibles sera celui correspondant à la
puissance la plus élevée.
1. Risque d’erreur
Deux grands « cas » se présentent :
-
xFX
loi inconnue (1)
-
,xFX
F connue, mais θ inconnu (2)
Les hypothèses à tester sont :
-
xFX:H
0
(1)
-
00
:H
(2)
Soit on conservera l’hypothèse
0
H
, soit on la rejettera.
Les risques d’erreurs encourus par l’observateur peuvent alors être définis par :
• α : risque de première espèce : décider à tort que
0
H
est fausse. Sa probabilité s’écrit :
α = Prob[décider que
1
H
est vraie /
0
H
vraie] ou
α = Prob[rejeter
0
H
/
0
H
vraie]
α est fixé, souvent à 5%.