pdf]

publicité
 soit
soit
H0 : a = 0
H1 : a > 0 .
aepter H0 si le minimum de l'éhantillon est inférieur
le dépasse on rejette H0 en faveur de H1.
si le minimum
et ensuite
s;
Un stratégie qui se dessine irrésistiblement serait de se xer un seuil
s
à
H
H
Quelle que soit la déision, elle peut omporter deux risques :
simultanément
Rejeter
0, alors qu'elle est vraie (risque de première espèe).
Aepter
, alors qu'elle est fausse (risque de deuxième espèe).
0
Il n'est pas possible de minimiser es deux risques
. La
H
2
la probabilité du rejet
méthode lassique onsiste à favoriser
0 en xant une borne à ne
pas dépasser pour l'erreur de première espèe :
H , lorsqu'elle vraie ne doit pas dépasser un ertain seuil .
0
Tests d'Hypothèses
La problématique des tests statistiques se distingue de elle de l'estimation par le fait qu'elle ne s'intéresse pas à la valeur exate du paramètre inonnu ; elle herhe à déterminer si le paramètre satisfait ou
pas ertaines hypothèses données. A titre d'exemple, on peut onsidérer le as d'un institut de sondage qui, disposant d'un éhantillon,
souhaite faire ertaines prévisions sur la probabilité qu'un andidat à
l'életion batte les autres sans se préouper dans un premier temps
X
une v.a. uniformément répartie dans l'intervalle
du hire exat de la te de sa popularité.
Soit
[a; 1℄, où a est inonnu, mais on sait que 0 a < 1. Disposant d'un
Exemple.
(x ; :::; x )
1
éhantillon
n , on souhaite d'établir une règle qui, en fontion
1
de elui-i, déide :
1.
2.
0 se réduit à un seul élément, l'hypothèse H0 est appelée
H0 : 2 0 et
H1 : 2 1 .
Lorsque
H
et le
dé-
C'est don une
risque de deuxième espèe se
fH ; H1g.
H1 .
test statistique dans e ontexte, est une stratégie assoiant à un
hypothèse nulle.
Un
(x ; :::; x )
risque de première espèe
une des hypothèse
ou
éhantillon
n
1
0
famille d'appliations de R n dans l'ensemble
0
Le
H
4
0 lorsqu'elle est vraie.
= 1 ,
e
seuil à ne pas franhir pour le premier risque est imposé ;
nissent, dans le as général, par les deux probabilités données idessus. Un
'est la probabilité maximale du rejet de
H
On peut, de façon tout à fait équivalente, onsidérer
est hoisie dans l'intervalle.
[0:01; 0:1℄.
H
qui est la probabilité d'aepter
0 , lorsqu'elle est vraie ; 'est don
le seuil de onane que l'on aorde à
0. Traditionnellement, la
valeur de
appelé
espae du paramètre. Il
Dénitions. Soit X une v.a. dont la loi dépend d'un paramètre
inonnu . Soit l'ensemble des valeurs possibles que peut prendre
R k ),
est divisé en deux sous-ensembles disjoints et non vides :
(en général un sous-ensemble de
= 0 [ 1 :
On assoie alors à es deux régions les hypothèses :
3
(1 s)n :
s = 1 1=n onvient.
On en déduit que le risque de première espèe est majoré par
Et pour ela le hoix de
Quelques Tests Standard
H
d'un test, respetant le seuil
,
par elle de
= 1 ,
,
si
appelé
est mesurée en termes
6
fa1; :::; akg. Nous vou-
Test du Khi-deux d'Ajustement
Nous n'entrons pas ii dans une théorie des tests statistiques, et nous
nous surons dans la suite de l'introdution de quelques tests ourants fréquemment solliités dans les inférenes statistiques. Les théorèmes, justiant leur appliation, sont admis sans démonstration.
X
puissane
Soit
une v.a. prenant valeur dans l'ensemble
lons tester l'hypothèse nulle :
La
de probabilité du rejet de
0, lorsqu'elle est fausse.
On peut remplaer la donnée de
niveaux de onane de H0.
s
Un test pour l'exemple préédent. Étant donné un seuil à ne pas
dépasser pour le risque de première espèe, herhons une frontière
s
pour le minimum de l'éhantillon. Rappelons que la stratégie onsis-
H
tait à retenir
et
0 si le minimum de l'éhantillon ne dépassait pas
la rejeter sinon. Calulons alors la probabilité de son rejet, lorsqu'elle
e qui vaut
(1 s)n.
5
n-éhantillon de v.a. uniformément répartie dans l'intervalle [0; 1℄,
s;
est vraie. Celle-i n'est que la probabilité pour que le minimum, dans
un
dépasse
p
fn
omme estimateur standard du
de distribution. Introduisons maintenant une mesure
Nous avons déjà utilisé le veteur
veteur de
i=1
2
k
= n X [p(i) p(if)n(i)℄ :
Khi-deux d'ajustement, par :
d'éart entre les fréquenes théoriques et les fréquenes observées,
appelée
n2 (p; fn)
Nous avons alors :
On a proédé à 120 laners d'un même dé. Les résultats
Théorème. Sous l'hypothèse nulle H0, la suite n2(p; fn) onverge en
n ! 1, vers une v.a. du Khi-deux à k 1 degrés de liberté.
loi, lorsque
Exemple.
i
8
est le veteur p = (p(1); :::; p(k))
sont donnés dans le tableau suivant :
H
0 : la distribution de probabilité
ontre l'alternative :
diérente du veteur p.
: elle est
H1
par :
Étant donné un éhantillon
j =1
Xn 1 (x );
fa g j
pour tout
i = 1; :::; k:
i = 1; :::; k:
par :
ai dans l'éhantillon. Dénissons,
pour tout
(x1; :::; xn), dénissons la fréquene observée de ai
N (i) =
N (i)
;
n
fréquene relative de ai
C'est la fréquene d'observations de
par ailleurs, la
fn(i) =
7
Remarque.
np(i) ne soient
Dans l'appliation du test d'ajustement du Khi-deux, il
faut veiller toutefois à e que les fréquenes théoriques
pas trop faibles, 5 étant onsidéré omme la limite inférieure traditionnelle. Si besoin est, on peut regrouper plusieurs valeurs dans une
seule lasse, an de réaliser ette exigene. Cette tehnique permet
l
Test du Khi-deux d'Indépendane
ensemble ni ou inni.
Y
k
fa ; :::; a g
d'appliquer e test à toutes les v.a. disrètes prenant valeurs dans un
X
fb ; :::; b g
1
14
2
16
3
28
4
30
5
18
6
14
10
Soient
et
deux v.a. prenant valeurs dans les ensembles
1
k
et
1
l respetivement, où et sont deux entiers positifs quelonques (distints ou égaux). En dehors de ette onrmation, rien
n'est onnu sur es v.a.
Fae
Fréquene
5=6 1
Ce dé est-il pipé ? (On donnera la réponse ave un niveau de onane
p
à
= 0:95).
Solution. Dans e problème, la v.a. prend valeurs dans f1; 2; 3; 4; 5; 6g
= p2 = ::: = p6 = 61 .
H
(p; fn) 12:8:
et l'hypothèse nulle 0 est elle de la distribution 1
On alule le Khi-deux d'ajustement :
2
n
2
degrés de liberté, on ne doit pas dépasser la valeur de 11.1 au niveau
Or, la table de la loi du Khi-deux indique que, pour le
9
de onane 0.95. On rejette don l'hypothèse d'uniformité du dé,
en retenant qu'il est pipé.
Ces fréquenes sont dites relatives lorsqu'on les divise par la taille n de
0 M 0 et L0 respetivement. Si l'on
l'éhantillon. Désignons-les par
i
j
Nij0 doit être prohe de Mi0:Lj0 .
Nij ;
retient l'hypothèse d'indépendane,
h
i2
Nij0 Mi0Lj0
:
Nij0
Khi-deux d'indépendane, en posant :
Introduisons maintenant une mesure d'éart entre les fréquenes ob-
i=1 j =1
k l
= nX X
servées et es produits, appelée
n2 (N 0; M 0L0)
Nous avons alors :
indépendantes
(k 1)(l 1) degrés de liberté.
Y
(X; Y ) :
12
Théorème. Sous l'hypothèse d'indépendane (H0), la suite n2(N 0; M 0L0),
n ! 1, vers une v.a. du
Khi-deux à
introduite i-dessus, onverge en loi, lorsque
X
Nous souhaitons tester l'hypothèse :
H
ne sont pas indépendantes
et
sont
0 :
ontre l'alternative :
H
((x1; y1); (x2; y2); :::; (xn; yn));
.
1 : elles
Disposant d'un éhantillon d'observations du ouple
l'éhantillon par :
(
)
( )
( )
)
du
on dénit les fréquenes observées onjointes et marginales dans
=P
(
=P
=P
11
n
Nij
h=1 1f(ai;bj )g xh; yh ; 'est la fréquene d'observations
ouple ai; bj .
n
h=1 1faig xh ; 'est la fréquene d'observations de ai.
n
h=1 1fbj g yh ; 'est la fréquene d'observations de bj .
Mi
Lj
Solution.
Il s'agit de tester l'indépendane de deux v.a. (l'âge et le
nombre d'aidents). Le théorème préédent s'applique ave k = l = 3.
2 (N 0; M 0L0 ) On alule alors le Khi-deux d'indépendane. Il vient n
16:51. Nous sommes don ramenés à rejeter l'hypothèse d'indépen-
H
0:05.
4 = (3 1) (3 1)
dane ( 0 ) au niveau de onane 0.95. En eet la table de la loi de
Khi-deux indique que, pour le 2 de
degrés de
liberté, on dépasse la valeur 9.48 ave une probabilité
Test de Student
Le problème de déider si l'espérane d'une v.a. normale, est égale
a.
normale d'espérane
toutes deux inonnues. On se donne une valeur
X
et de
ou pas à une grandeur donnée se pose souvent en statistique. Dans
,
la suite, nous onsidérons une v.a.
variane
14
Exemple (J. Istas). 300 onduteurs sont lassiés suivant leur âge
et le nombre d'aidents qu'ils ont subis pendant les deux dernières
0
8
21
71
1 ou 2
23
42
90
3 ou plus
14
12
19
années. Les résultats sont donnés dans le tableau suivant :
Age / Nombre d'aidents
21
[22; 26℄
27
L'âge des onduteurs et le nombre d'aidents subis sont-ils in-
= 0:95).
dépendants ? (On donnera la réponse ave un niveau de onane
13
Théorème
Student à
n
Sous l'hypothèse
H
n
1, on a
.
n
n
n
et
Zn
n
et
roît en
Zn. Soit
le seuil de
Zn
suit une loi de
p
p
Zn = n XS + n S a
n
Sous l'hypothèse H0, on a Zn = pn XS
1 degrés de liberté.
valeur absolue ave
On en déduit alors la règle de déision suivante. Soit
risque de première espèe à ne pas dépasser. Alors on alule
16
1) la valeur dont la probabilité de dépassement dans la loi de
n 1 degrés de liberté vaut =2. Alors :
H1 .
jZnj ne dépasse pas t=2(n 1), alors on hoisit H0.
Student à
t=2(n
1. Si
2. Sinon on hoisit
Nous voulons tester :
=a
H
6= a.
Zn
= pn X nSn a :
X n et Sn les estimateurs standard de et de respe-
0 :
ontre l'alternative :
H1 : Désignons par
tivement. Posons :
Nous avons alors :
15
Exemple (J. Istas).
Un fabriant de piles életriques arme que la
durée moyenne du matériel qu'il produit est de 170h. On prélève un
S = 30h
éhantillon de 30 piles et on observe une durée de vie moyenne de
2. Que peut-on penser de la
155h et une variane empirique
Soit
l'espérane de la durée de vie d'une pile. D'après
p X 30
S suit une loi de Student t(29). Un
2:74 à et éart. Or,
v.a. normale d'espérane et de variane inonnues) ?
onrmation du fabriant (en supposant que la durée de vie est une
Solution.
le théorème préédent,
alul simple donne la valeur approximative
= 0:02, t(29)
dépasser en valeur absolue 2.518. Il y a don une bonne
suivant une table de la loi de Student, pour un seuil
ne doit pas
18
n'est pas un test asymptotique et peut s'appli-
raison pour rejeter l'armation du fabriant.
Remarques
1. Le test préédent
quer aussi pour des valeurs relativement peu élevées de n.
n tend vers l'inni, la loi de Student à n degrés de liberté tend
vers une loi normale entrée-réduite. Traditionnellement, lorsque
2. Si
H : a
H0
sera :
ontre l'alternative
17
ontre l'alternative
H1 :
on remplae l'éart dans la loi de Student par elui dans
dans la loi normale.
n 30,
> a,
H0 : a
2 ℄ 1; a + t=2(n 1) pSnn ℄:
3. Si nous voulons tester
0
la région d'aeptation de
Xn
De façon similaire, on peut tester
H1 : < a.
20
19
21
22
23
24
Téléchargement