où µ=µ0= 10mm si la ligne de production est bien réglée. Pour vérifier que ces réglages sont
bons, l’industriel prélève nboulons au hasard et mesure leur diamètre X1,··· , Xn. Son hypothèse
nulle, H0, est que tout va bien : "µ=µ0". Son hypothèse alternative est qu’il y a un problème :
"µ=µ16=µ0".
2.3 Risques d’erreurs
Un test d’hypothèses (ou simplement un test) est une procédure consistant, au vu d’un échantillon,
à rejeter ou non H0. On rejette H0(au profit de H1) si les données mettent en doute H0. Ce faisant,
on peut se tromper de deux façons :
– Rejeter H0alors que H0est vraie : c’est l’erreur de première espèce.
– Ne pas rejeter H0alors que H0est fausse : c’est l’erreur de seconde espèce.
La probabilité de commettre ces erreurs s’appelle le risque. Il y 2 risques :
– Le risque de première espèce = probabilité de commettre une erreur de 1ère espèce.
– Le risque de seconde espèce = probabilité de commettre une erreur de 2ème espèce.
Un bon test d’hypothèses doit minimiser ces 2 risques. Malheureusement, les risques de première
et de seconde espèce sont antagonistes : on ne peut pas les minimiser simultanément. La stratégie
consiste alors à fixer une borne supérieure α, appelée le niveau, au risque de première espèce (souvent
le plus lourd de conséquences), puis à minimiser le risque de seconde espèce, noté β. De manière
équivalente, on cherchera à maximiser la puissance du test, 1−β.
Un test est de niveau αsi la procédure qui le définit assure que la probabilité de rejeter H0alors
que H0est vraie (risque de première espèce) ne dépasse pas α. Cette stratégie offre parfois une façon
de poser en pratique H0et H1puisque rejeter H0à tort est l’erreur dont on veut contrôler le risque.
Le risque de seconde espèce (= probabilité que le test ne rejette pas H0alors que H0est fausse) est
une quantité souvent plus complexe à calculer (et dont les conséquences sont souvent moindres que
le risque de première espèce).
Exemple : Reprenons l’exemple précédent. L’industriel n’a aucune raison a priori de supposer que
sa ligne de production est mal réglée. De plus, s’il arrête la production alors que sa machine est bien
réglée, cela lui coûtera beaucoup d’argent. Il veut donc limiter le risque que cela arrive à une valeur
très faible, par exemple α= 1%.
Pour décider de rejeter ou non H0, on va se baser sur une statistique de test Wqui dépend bien
sûr de l’échantillon X1,··· , Xn. La règle de décision est la suivante : si la valeur observée de W
appartient à la zone de rejet, qui dépend de α, on rejettera H0.
2.4 Tests concernant l’espérance
2.4.1 Variance connue
On rappelle que si ¯
Xest la moyenne d’un échantillon de nv.a. {X1,··· , Xn}indépendantes de loi
N(µ, σ2)alors
¯
X∼ N(µ, σ2/n)et Z=√n¯
X−µ
σ∼ N(0,1).
Considérons le problème de tester au niveau αl’hypothèse H0:µ=µ0contre l’hypothèse H1:µ6=
µ0. Pour construire le test, on raisonne comme suit : si H0est vraie, ¯
Xa pour espérance µ0et on
serait surpris d’observer une valeur ¯xtrès différente de µ0. On choisit donc comme statistique de
test
W=√n¯
X−µ0
σ
qui, sous l’hypothèse H0suit une loi N(0,1). L’échantillon met en doute H0si w=√n¯x−µ0
σ<−c
ou w > c, où cest une borne à déterminer. En prenant c=N1−α/2, on définit un test de niveau α.
En effet, si H0est vraie,
P(rejeter H0à tort) = P(Z < −N1−α/2ou Z > N1−α/2)
=P(Z < −N1−α/2) + P(Z > N1−α/2) = α/2 + α/2 = α.
5