Tests
Chapitre 2
Table des matières
1 Principe d’un test 1
1.1 Dénitions................................................... 2
1.2 Méthodegénérale............................................... 3
2 Test de conformité à un paramètre 3
2.1 Testdeconformitéàunemoyenne ..................................... 3
2.2 Test de conformité à une proportion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3 Test d’homogénéité faible entre deux paramètres 4
3.1 Test de comparaison entre deux moyennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.2 Test de comparaison entre deux proportions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4 Test d’adéquation à une loi 5
4.1 Cas particulier d’une variable aléatoire prenant un nombre fini de valeurs . . . . . . . . . . . . . . . 5
4.2 Extension aux variables aléatoires continues ou à valeurs dans un ensemble dénombrable . . . . . . . 6
1 Principe d’un test
But : accepter ou refuser, au vue d’un échantillon, une hypothèse faite sur un ou plusieurs paramètres (inconnus).
Par exemple :
Une usine fabrique des pièces cylindriques et précise que leur diamètre moyen est de 25mm. Pour vérifier
si la fabrication est bien conforme, on prélève au hasard 100 pièces de la production et on constate que la
moyenne de leurs diamètres est de 25.1mm. On souhaite savoir si, au vue de cet échantillon, il est raisonnable
de penser que l’usine fabrique effectivement des pièces dont le diamètre, en moyenne, est bien de 25mm.
Afin de tester une solution toxique, on fait des injections à un groupe de 80 souris. On admet que l’injection
est mortelle dans 90% des cas. Sur les 80 souris, 7 ont survécu. Est-il raisonnable de penser que la solution
toxique est bien mortelle dans 90% des cas ?
Plus formellement, un test est une procédure permettant de rejeter ou non une hypothèse avec un certain risque
d’erreur. L’hypothèse en question est dite nulle et est notée H0. Elle est testée contre une seconde hypothèse dite
alternative notée H1. Le choix de l’hypothèse alternative dépend de ce qu’on cherche à savoir.
Dans le cas des pièces cylindriques, on a H0="le diamètre moyen est 25mm". Pour l’hypothèse alternative,
on peut prendre H1="la diamètre moyen est différent de 25mm".
Dans le cas des souris, on a H0="la solution est mortelle dans 90 des cas". Pour l’hypothèse alternative, on
peut prendre H1="la solution est mortelle dans moins de 90% des cas".
Remarque. 1. L’hypothèse H1est souvent la négation de H0mais pas nécessairement : un a priori peut conduire
à un ensemble d’alternatives plus réduit.
2. En pratique, l’hypothèse nulle est souvent une égalité entre deux quantités d’un modèle.
1
Lorsque l’hypothèse alternative postule une différence de ces quantités, on parle de test bilatéral.
Lorsque l’hypothèse alternative postule une inégalité entre les quantités, on parle de test unilatéral.
1.1 Définitions
Définition 1. On appelle :
1. risque (ou erreur) de première espèce αla probabilité de rejeter, au vue de l’échantillon, l’hypothèse alors
qu’elle est vraie ;
2. risque (ou erreur) de seconde espèce βla probabilité d’accepter, au vue de l’échantillon, l’hypothèse alors
qu’elle est fausse ;
On a donc le tableau suivant :
H0vraie H0fausse
H0acceptée 1α β
H0refusée α1β
Table 1 – Risques de première et seconde espèce
Remarque. 1. En pratique, le risque αest fixé par celui qui effectue le test. On prend en général α= 5% ou
α= 1%.
2. Le risque de seconde espèce βdépend de la réalité et de l’hypothèse alternative.
3. Le nombre 1βs’appelle la puissance du test. Cette dernière est d’autant plus grande que la probabilité de
rejeter l’hypothèse, alors qu’elle est effectivement fausse, est grande.
4. L’intérêt d’un test est davantage de rejeter une hypothèse que le contraire (c’est pour cette raison que l’on
définit la puissance du test en fonction de βet non en fonction de α). En fait, "accepter une hypothèse" au
sens de la statistique ne signifie pas que l’on confirme que l’hypothèse est vraie mais qu’on "ne peut pas la
rejeter au vue de l’échantillon".
Définition 2. Soit α[0,1] et x1, . . . , xnun échantillon de valeurs issues de X1, . . . , Xn. Désignons par Z=
φ(X1, . . . , Xn)une statistique (dite discriminante) et posons z=φ(x1, . . . , xn). On appelle :
1. zone de rejet (au critère z) au risque αtout sous-ensemble Rα(x1, . . . , xn)Rtel que, sous l’hypothèse H0,
on a
P(ZRα(X1, . . . , Xn) ) = α;
2. zone d’acceptation (au critère z), le complémentaire de Rα(x1, . . . , xn).
Remarque. Contrairement au test où l’aléa ne portait que sur l’intervalle, deux quantités aléatoires (statistique
et intervalle) sont, en général, considérées pour les tests.
Règle de décision :
lorsque zappartient à Rα(x1, . . . , xn), on rejette l’hypothèse nulle au risque (de première espèce) α;
sinon, on ne rejette pas l’hypothèse nulle.
2
1.2 Méthode générale
1. Formulation des hypothèses nulle H0et alternative H1;
2. Choix de la statistique discriminante Z=φ(X1, . . . , Xn);
3. Détermination de Rα(X1, . . . , Xn);
4. Règle de décision :
Calcul de z;
Calcul de la zone de rejet Rα(x1, . . . , xn);
Décision (acceptation ou rejet).
Remarque. 1. Le résultat d’un test dépend du choix de l’hypothèse nulle H0et de la statistique Z.
2. En pratique, le choix de Zest fait de telle sorte que ce dernier, ainsi que la zone de rejet, soient faciles à
calculer.
2 Test de conformité à un paramètre
2.1 Test de conformité à une moyenne
But : étant donnée une variable aléatoire Xde moyenne µ, on souhaite tester l’hypothèse µ=µ0au vu d’un
échantillon de nvaleurs de X. On considère un échantillon X1, . . . , Xnde variables aléatoires (indépendantes) ayant
la même loi que X.
Hypothèse nulle H0= ”µ=µ0contre hypothèse alternative H1= ”µ6=µ0, pour un test bilatéral, ou
H1= ”µ < µ0(resp. H1= ”µ > µ0), pour un test unilatéral.
Statistique discriminante : Z=Xn.
Cas d’une loi normale Ici, on considère une variable aléatoire Xsuivant une loi normale N(µ, σ2)de moyenne
µnon connue.
Test bilatéral Dans le même esprit que pour l’estimation, on envisage divers cas selon que la variance de X
soit connue ou non.
Proposition 3. Les zones de rejet associés à un test bilatéral (symétrique), au risque α, de conformité à une
moyenne pour une loi normale sont données par :
1. cas où σ2est connue : Rα(x1, . . . , xn) = −∞, µ0u1α/2·qσ2
nµ0+u1α/2·qσ2
n,;
2. cas où σ2n’est pas connue : Rα(x1, . . . , xn) = −∞, µ0t1α/2;n1·qS2
n
n1µ0+t1α/2;n1·qS2
n
n1,.
Remarque. 1. Les zones de rejet ressemblent très fortement aux intervalles de confiance associés à l’estimation
de la moyenne pour une loi normale (cela vient du fait que ces deux ensembles reposent sur les mêmes égalités
en loi).
2. Pour le test, la moyenne hypothétique µ0apparaît dans les intervalles en question tandis que, pour l’estimation,
c’est la moyenne empirique ˆµ=xnqui intervient.
Exercice 1. Une entreprise agroalimentaire produit des yaourts allégés dont la valeur énergétique étiquetée est
de 60 kilocalories. La répression des fraudes souhaite vérifier la validité de ce chiffre. Elle prélève un échantillon
aléatoire de 13 yaourts dans la fabrication. On obtient les résultats suivants : 60.4, 62.2, 61.1, 59.6, 62, 60.1, 61.2,
59.4, 60.4, 58.9, 59.1, 61.3 et 61.1. On suppose que la variable aléatoire Xégale à la valeur énergétique, exprimée
en Kcal, d’un yaourt prélevé au hasard dans cette fabrication, est distribuée selon la loi normale de moyenne µet
d’écart-type σ(connu) égal à 1. Au vu de ces résultats, peut-on considérer que la valeur énergétique moyenne des
yaourts de cette fabrication est égale à 60 Kcal ?
3
Test unilatéral On se limite à l’hypothèse alternative H1= ”µ < µ0, le cas opposé se traitant de la même
façon.
Proposition 4. Les zones de rejet associées à un test unilatéral (d’hypothèse alternative H1= ”µ<µ0), au risque
α, de conformité à une moyenne pour une loi normale sont données par :
1. cas où σ2est connue : Rα(x1, . . . , xn) = −∞, µ0u1α·qσ2
n;
2. cas où σ2n’est pas connue : Rα(x1, . . . , xn) = −∞, µ0t1α;n1·qS2
n
n1.
Généralisation à une loi non normale Dans le même esprit que ci-dessus (mais en appliquant cette fois-ci le
théorème central limite), on peut, comme pour l’estimation, étendre les résultats précédents à des lois non normales
de variance connue ou non connue. Les zones de rejet obtenues sont alors asymptotiques et valables uniquement
lorsque n30.
2.2 Test de conformité à une proportion
But : étant donnée une variable aléatoire Xde Bernoulli de paramètre p, on souhaite tester l’hypothèse p=p0
au vu d’un échantillon de nvaleurs. On considère un échantillon X1, . . . , Xnde variables aléatoires (indépendantes)
ayant la même loi que X, avec n30.
Hypothèse nulle H0= ”p=p0contre hypothèse alternative H1= ”p6=p0, pour un test bilatéral, ou
H1= ”p<p0(resp. H1= ”p>p0), pour un test unilatéral.
Statistique discriminante : Z=Pn.
Test bilatéral
Proposition 5. La zone de rejet associée à un test bilatéral, au risque α, de conformité à une proportion est donnée
par : Rα(x1, . . . , xn) = −∞, p0u1α/2·qp0(1p0)
np0+u1α/2·qp0(1p0)
n,.
Exercice 2. Une entreprise fabrique des flacons destinés à contenir une substance particulière. Un flacon est dit
conforme s’il vérifie un ensemble de critères définis par l’entreprise. On appelle pla proportion de flacons conforme
dans l’ensemble de la production. Dans un échantillon de 200 flacons, on a trouvé 156 flacons conformes. Au vu de
cet échantillon, doit-on, au seuil de risque 5%, accepter ou refuser l’hypothèse p= 0.8?
Test unilatéral Comme pour la moyenne, on se limite à l’hypothèse alternative H1= ”p<p0.
Proposition 6. La zone de rejet associée à un test unilatéral (d’hypothèse alternative H1= ”p<p0), au risque
α, de conformité à une proportion est donnée par : Rα(x1, . . . , xn) = −∞, p0u1α·qp0(1p0)
n.
3 Test d’homogénéité faible entre deux paramètres
3.1 Test de comparaison entre deux moyennes
But : étant données deux variables aléatoires Xet X0de moyennes µet µ0, on veut tester l’hypothèse µ=µ0
au vu d’un échantillon de nvaleurs de Xet de n0valeurs de X0. On commence par traiter un cas particulier.
4
Test bilatéral pour deux lois normales à variance non connue et pour des échantillons de taille n1et
n2supérieures à 30 Par le théorème central limite, on sait que Xn' N (µ, σ2
n)et que X0
n0' N (µ0,σ02
n0). Un tel
fait permettra d’avoir la loi (asymptotique) de la statistique discriminante.
Hypothèse nulle H0= ”µ=µ0contre hypothèse alternative H1= ”µ6=µ0.
Statistique discriminante : Z=XnX0
n0' N (µµ0,σ2
n+σ02
n0).
Détermination de la zone de rejet : sous l’hypothèse H0, on a Z' N 0,S2
n
n1+S02
n0
n01.En particulier,
P
u1α/2Z
qS2
n
n1+S02
n0
n01
u1α/2
'Pu1α/2Uu1α/2= 1 α.
Ainsi la zone de rejet est donnée par :
Rα(x1, . . . , xn) =
−∞,u1α/2·sˆσ2
n1+ˆ
σ02
n0
n01
+u1α/2·sˆσ2
n1+ˆ
σ02
n0
n01,
Règle de décision : si z=xnx0
n0appartient à la zone de rejet, on refuse l’hypothèse ; sinon on l’accepte.
Extension des résultats On a supposé dans le paragraphe précédent que n1et n2soient suffisamment grands
(en l’occurrence supérieurs à 30). On peut également étendre l’étude au cas où n1et n2ne sont pas nécessairement
grands en faisant intervenir, cette fois-ci, des lois de Student.
Comme dans la section précédente, on peut également envisager divers cas selon que la (ou les les) loi(s) de X
et X0soi(en)t normale(s) ou non, de variance(s) connue(s) ou non et que le test soit bilatéral ou unilatéral.
3.2 Test de comparaison entre deux proportions
But : étant données deux proportions pet p0, on veut tester l’hypothèse p=p0au vu d’un échantillon de n
valeurs de Xet de n0valeurs de X0. En procédant comme dans le paragraphe précédent, on peut déterminer la zone
de rejet (pour un test bilatéral ou unilatéral). On tient cette fois-ci compte du fait que σ2=σ02=p(1 p)sous
l’hypothèse H0. Pour avoir une estimation de ˆp, on peut prendre
ˆp=nf +n0f0
n+n0,
fet f0sont les estimations classiques de pet p0.
4 Test d’adéquation à une loi
4.1 Cas particulier d’une variable aléatoire prenant un nombre fini de valeurs
But : étant donnée une variable aléatoire Xprenant un nombre fini de valeurs, notées y1, . . . , yk, on veut tester
l’hypothèse H0:p1=P(X=y1), . . . , pk=P(X=yk)au vu d’un échantillon de taille n50.
On désigne par x1, . . . , xnun échantillon de valeurs issues de X1, . . . , Xn.
Pour tout ik, on pose Ni=nombre de valeurs de l’échantillon égales à yiet on rappelle que (sous l’hypo-
thèse H0), on pose également pi=P(X=yi).
Statistique discriminante :
Z=
k
X
i=1
(Ninpi)2
npi
.
5
1 / 7 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !