Tests d’hypothèse
Capacités attendues
XDéterminer la région de rejet de l’hypothèse nulle et énoncer la règle de décision.
XUtiliser les tests bilatéraux et unilatéraux relatifs à une proportion ou à une moyenne ainsi qu’à la
comparaison de deux proportions ou de deux moyennes.
XAnalyser les risques d’erreur de première et de seconde espèce associés à la prise de décision.
Exemple introductif
Le ministre du travail a affirmé après calcul que « le salaire moyen des français est de 1000 euros par mois ».
Un statisticien est chargé de vérifier ces dires au vu d’un échantillon de la population.
Il procède donc à un prélèvement d’un échantillon aléatoire de taille 100 et calcule le salaire moyen xde
l’échantillon. Plusieurs cas peuvent se produire :
si par exemple x=500 euros, il semble évident de rejeter l’hypothèse du ministre que la véritable
moyenne mest de 1000, étant donné l’écart important existant entre xet la valeur hypothétique de m.
si x=1001, il semble en revanche raisonnable d’accepter l’hypothèse du ministre ;
mais si x=970 ou x=1020, la moyenne sur l’échantillon n’est ni très grande ni très petite par rapport à
la valeur hypothétique, de telle sorte que la décision ne s’impose pas d’elle-même.
De plus, il reste toujours la possibilité d’avoir prélevé un échantillon ayant très peu de chances de se réaliser.
Comment être sur de prendre la « bonne » décision à partir d’un échantillon ? La réponse est : jamais.
Il semble toutefois raisonnable de rejeter les cas les plus improbables.
Conception d’un test d’hypothèse
Un test d’hypothèse est un procédé permettant de contrôler (rejeter ou non) la validité d’une hypothèse relative
à une population. Le principe consiste à poser une hypothèse de travail et à en prédire les conséquences pour
l’échantillon. On compare ces prédictions avec les observations et l’on conclut en rejetant ou non l’hypothèse
de travail à partir de règles de décisions objectives.
Lhypothèse nulle, notée H0, est l’hypothèse que l’on désire contrôler : cette hypothèse est formulée dans le but
d’être rejetée. Elle devient une hypothèse de travail et permet de prédire des conséquences pour l’échantillon.
Lhypothèse alternative, notée H1, est la négation de H0: elle est équivalente à dire « H0est fausse ».
Le seuil de probabilité α, ou risque, est la probabilité de rejeter H0alors qu’elle est vraie : ce seuil est fixé à
l’avance, en général à 5% ou à 1%.
En supposant que H0est vraie, on définit alors la zone critique au seuil de risque donné.
On calcule enfin les caractéristiques (moyenne, proportion) d’un échantillon et on peut alors prendre une
décision concernant l’hypothèse posée.
Règle de décision
On prélève un échantillon dans la population et l’on observe une valeur (moyenne ou fréquence).
Sous l’hypothèse nulle et pour un risque α(en général 5%) fixé :
si la valeur observée est située dans la zone critique, on rejette H0et on accepte H1;
sinon, on ne peut pas rejeter H0.
Attention, ne pas rejeter l’hypothèse nulle ne veut pas dire l’accepter : cela veut seulement dire que la
valeur observée n’est pas en contradiction flagrante avec l’hypothèse nulle.
TS Opticien Lunetier – 2016 / 2017 1 Lycée Fresnel - Paris
1 – Test bilatéral relatif à une moyenne
Problème
Une machine produit des pièces dont l’épaisseur est une variable aléatoire Xd’écart type 0, 3 mm. La machine
a été réglée pour obtenir des épaisseurs de 5 mm. Un contrôle portant sur un échantillon de 100 pièces a donné
5, 07 mm comme moyenne des épaisseurs de ces 100 pièces.
Peut-on affirmer que la machine est bien réglée au seuil de risque de 5% ?
Choix de la variable aléatoire
Soit ml’espérance mathématique de X, c’est-à-dire la moyenne des épaisseurs de toutes les pièces produites
par la machine ainsi réglée. Considérons la variable aléatoire Xqui, à chaque échantillon de taille 100, associe
la moyenne des épaisseurs de ces pièces. La taille des échantillons étant suffisamment grande, on considère
que Xsuit la loi normale de moyenne met d’écart type 0,3
100.
Choix des hypothèses
On estime que la machine est bien réglée si la moyenne de toutes les pièces produites par la machine est 5 mm.
L’hypothèse nulle H0s’écrit donc : « m=5 ». L’hypothèse alternative est H1: « m6=5 ».
Zone critique
Dons le cas où l’hypothèse H0est vraie, la variable aléatoire Xsuit la loi normale de moyenne 5 et d’écart type
0,3
100 . On détermine alors un intervalle de fluctuation de Xau seuil de 95%.
Cet intervalle s’obtient par le calcul :
51, 96 ×0, 3
100 ; 5 +1, 96 ×0, 3
100.
Avec 1, 96 ×0,3
100 =1, 96 ×0,3
100 0, 06, l’intervalle de fluctuation de Xau seuil de 95% est : [4, 94 ; 5, 06].
L’ensemble des valeurs extérieures à cet intervalle forme la zone critique.
4, 94 5 5, 06
Zone critique
H0est rejetée
H1est acceptée
Zone critique
H0est rejetée
H1est acceptée
H0n’est pas rejetée
Utilisation du test
La valeur observée dans l’échantillon (5,07 mm) est située dans la zone critique : on rejette donc H0et on
accepte H1. Au seuil de risque de 5%, on peut donc affirmer que la machine n’est pas bien réglée.
TS Opticien Lunetier – 2016 / 2017 2 Lycée Fresnel - Paris
2 – Test unilatéral relatif à une moyenne
Problème
La durée de vie (en heures) des ampoules électriques produites par une usine est une variable aléatoire X
d’écart type 120. Le fabricant annonce qu’en moyenne, les ampoules ont une durée de vie de 1120 heures. On
demande de rédiger une règle de décision pour vérifier l’affirmation du fabriquant, au seuil de risque de 5%,
en testant un échantillon de 36 ampoules.
Choix de la variable aléatoire
Soit ml’espérance mathématique de X, c’est-à-dire la durée de vie moyenne de toutes les ampoules produites
par l’usine. Considérons la variable aléatoire Xqui, à chaque échantillon de 36 ampoules associe la de durée
de vie moyenne des 36 ampoules. La taille des échantillons étant suffisamment grande, on considère que X
suit la loi normale de moyenne met d’écart type 120
36 =20.
Choix des hypothèses
On choisit pour hypothèse nulle H0: « m=1120 » (l’affirmation du fabricant est vraie).
L’acheteur ne se plaindra que si la durée de vie des ampoules est inférieure à 1120 heures; dans le cas où la
moyenne mest supérieure à 1120, l’hypothèse du fabricant se trouve immédiatement confirmée.
L’hypothèse alternative Hlest donc m<1120 (l’affirmation du fabricant est fausse).
Zone critique
La zone critique se trouve donc d’un seul côté de la moyenne. On dit alors que le test est unilatéral par
opposition au test bilatéral effectué au paragraphe précédent.
Dans le cas où hypothèse H0est vraie, la variable aléatoire Xsuit la loi normale de moyenne 1120 et d’écart
type 20.
On cherche alors le nombre réel dtel que P(X<1120 d) = 0, 05.
À l’aide de la calculatrice, on trouve d=1, 645 ×20 33.
11201087
Zone critique
H0est rejetée
H1est acceptée
H0n’est pas rejetée
Règle de décision
On prélève un échantillon de 36 ampoules.
Si la moyenne de l’échantillon observée est inférieure à 1087, on rejette l’hypothèse H0et on accepte l’hypothèse
alternative H1(l’affirmation du fabricant est fausse). Si la moyenne de l’échantillon observé est supérieure à
1087, on ne rejette pas l’hypothèse H0.
TS Opticien Lunetier – 2016 / 2017 3 Lycée Fresnel - Paris
3 – Test unilatéral relatif à une proportion
Problème
Un joueur qui doit choisir au hasard une carte dans un jeu de 32 cartes obtient certains avantages s’il découvre
un roi. On constate qu’il a retour 134 fois un roi sur 800 essais.
Peut-on présumer, au seuil de risque de 1%, que ce joueur est un tricheur ?
Choix de la variable aléatoire
Soit pla fréquence de rois que le joueur découvrirait s’il jouait une infinité de fois. Soit Fla variable aléatoire
qui, à chaque échantillon de 800 essais, associe la fréquence d’apparition du roi. La taille des échantillons étant
suffisamment grande, on considère que Fsuit la loi normale de moyenne pet d’écart type qp(1p)
800 .
Choix des hypothèses
Si le joueur n’est pas un tricheur, la valeur de pest 4
32 =0, 125. L’hypothèse nulle H0est donc : « p=0, 125 ».
Si p<0, 125, on considérera que le joueur n’est pas un tricheur non plus donc l’hypothèse alternative H1est :
«p>0, 125 » (le joueur est un tricheur).
Zone critique
Dans le cas où l’hypothèse H0est vraie, la variable aléatoire Fsuit la loi normale de moyenne p=0, 125 et
d’écart type égal à :
rp(1p)
800 =r0, 125(10, 125)
800 0, 0117 .
On cherche alors le nombre réel dtel que P(X>0, 125 +d) = 0, 01.
À l’aide de la calculatrice, on trouve d=0, 027.
0, 125 0, 152
Zone critique
H0est rejetée
H1est acceptée
H0n’est pas rejetée
Utilisation du test
L’échantillon observé a une fréquence égale à 134
800 =0, 1675. D’après la règle de décision, puisque 0, 1675 est
dans la zone critique (car 0, 1675 >0, 152), on rejette l’hypothèse H0et on accepte l’hypothèse H1: on décide
que le joueur est un tricheur.
TS Opticien Lunetier – 2016 / 2017 4 Lycée Fresnel - Paris
4 – Test de comparaison de deux moyennes
Problème
Une entreprise fabrique des sacs en plastique pour déchets. Afin de surveiller la production, elle effectue des
contrôles réguliers portant sur le poids maximum que les sacs peuvent supporter.
À une première date t1, le contrôle de 100 sacs a donné une moyenne de 58 kg et un écart type de 3 kg.
À la seconde date t2, le contrôle de 144 sacs a donné une moyenne de 56 kg et un écart type de 5 kg.
Peut-on considérer, au risque de 5%, que la qualité des sacs a évolué entre les deux dates?
Choix de la variable aléatoire
Appelons E1(resp. E2) l’ensemble de tous les sacs produits par l’entreprise à la date t1(resp. t2).
Soit M1la variable aléatoire qui, à chaque échantillon de 100 sacs issus de la population E1, associe sa
moyenne. Une estimation ponctuelle de la moyenne et de l’écart-type à la date t1est : m1=58 et σ1=3.
La taille des échantillons étant suffisamment grande, M1suit la loi Nm1;σ1
100=N(58 ; 0, 3).
Soit M2la variable aléatoire qui, à chaque échantillon de 150 sacs issus de la population E2, associe sa
moyenne. Une estimation ponctuelle de la moyenne et de l’écart-type à la date t2est : m2=56 et σ2=5.
La taille des échantillons étant suffisamment grande, M2suit la loi Nm2;σ2
144=N(56 ; 0, 5).
La variable aléatoire D=M1M2est la variable aléatoire de décision. Elle suit une loi normale de
paramètres µD=µ1µ2=m1m2et σD=qσ2
1+σ2
2=0, 32+0, 520, 53.
Choix des hypothèses
L’hypothèse nulle H0est m1=m2(la qualité n’a pas évolué).
L’hypothèse alternative H1est m16=m2(la qualité a évolué).
Zone critique.
Supposons que l’hypothèse H0soit vraie, on a alors m1m2=0 ; alors Dsuit la loi normale N(0 ; 0, 53).
On cherche alors le réel dtel que P(d6D6d) = 0, 95. On trouve d=1, 96 ×σDsoit d1, 14.
1, 14 0 1, 14
Zone critique
H0est rejetée
H1est acceptée
Zone critique
H0est rejetée
H1est acceptée
H0n’est pas rejetée
Règle de décision.
Si la différence des moyennes des deux échantillons est inférieure à 1, 14 ou supérieure à 1, 14, alors on rejette
H0et on accepte H1.
Si la différence des moyennes des deux échantillons est comprise entre 1, 14 et 1, 14, on ne rejette pas H0.
Utilisation du test
La différence des moyennes des deux échantillons est 58 56 =2.
D’après la règle de décision, on rejette H0et on décide que la qualité des sacs a évolué entre les dates t1et t2.
TS Opticien Lunetier – 2016 / 2017 5 Lycée Fresnel - Paris
1 / 9 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !