soit soit H0 : a = 0 H1 : a > 0 . aepter H0 si le minimum de l'éhantillon est inférieur le dépasse on rejette H0 en faveur de H1. si le minimum et ensuite s; Un stratégie qui se dessine irrésistiblement serait de se xer un seuil s à H H Quelle que soit la déision, elle peut omporter deux risques : simultanément Rejeter 0, alors qu'elle est vraie (risque de première espèe). Aepter , alors qu'elle est fausse (risque de deuxième espèe). 0 Il n'est pas possible de minimiser es deux risques . La H 2 la probabilité du rejet méthode lassique onsiste à favoriser 0 en xant une borne à ne pas dépasser pour l'erreur de première espèe : H , lorsqu'elle vraie ne doit pas dépasser un ertain seuil . 0 Tests d'Hypothèses La problématique des tests statistiques se distingue de elle de l'estimation par le fait qu'elle ne s'intéresse pas à la valeur exate du paramètre inonnu ; elle herhe à déterminer si le paramètre satisfait ou pas ertaines hypothèses données. A titre d'exemple, on peut onsidérer le as d'un institut de sondage qui, disposant d'un éhantillon, souhaite faire ertaines prévisions sur la probabilité qu'un andidat à l'életion batte les autres sans se préouper dans un premier temps X une v.a. uniformément répartie dans l'intervalle du hire exat de la te de sa popularité. Soit [a; 1℄, où a est inonnu, mais on sait que 0 a < 1. Disposant d'un Exemple. (x ; :::; x ) 1 éhantillon n , on souhaite d'établir une règle qui, en fontion 1 de elui-i, déide : 1. 2. 0 se réduit à un seul élément, l'hypothèse H0 est appelée H0 : 2 0 et H1 : 2 1 . Lorsque H et le dé- C'est don une risque de deuxième espèe se fH ; H1g. H1 . test statistique dans e ontexte, est une stratégie assoiant à un hypothèse nulle. Un (x ; :::; x ) risque de première espèe une des hypothèse ou éhantillon n 1 0 famille d'appliations de R n dans l'ensemble 0 Le H 4 0 lorsqu'elle est vraie. = 1 , e seuil à ne pas franhir pour le premier risque est imposé ; nissent, dans le as général, par les deux probabilités données idessus. Un 'est la probabilité maximale du rejet de H On peut, de façon tout à fait équivalente, onsidérer est hoisie dans l'intervalle. [0:01; 0:1℄. H qui est la probabilité d'aepter 0 , lorsqu'elle est vraie ; 'est don le seuil de onane que l'on aorde à 0. Traditionnellement, la valeur de appelé espae du paramètre. Il Dénitions. Soit X une v.a. dont la loi dépend d'un paramètre inonnu . Soit l'ensemble des valeurs possibles que peut prendre R k ), est divisé en deux sous-ensembles disjoints et non vides : (en général un sous-ensemble de = 0 [ 1 : On assoie alors à es deux régions les hypothèses : 3 (1 s)n : s = 1 1=n onvient. On en déduit que le risque de première espèe est majoré par Et pour ela le hoix de Quelques Tests Standard H d'un test, respetant le seuil , par elle de = 1 , , si appelé est mesurée en termes 6 fa1; :::; akg. Nous vou- Test du Khi-deux d'Ajustement Nous n'entrons pas ii dans une théorie des tests statistiques, et nous nous surons dans la suite de l'introdution de quelques tests ourants fréquemment solliités dans les inférenes statistiques. Les théorèmes, justiant leur appliation, sont admis sans démonstration. X puissane Soit une v.a. prenant valeur dans l'ensemble lons tester l'hypothèse nulle : La de probabilité du rejet de 0, lorsqu'elle est fausse. On peut remplaer la donnée de niveaux de onane de H0. s Un test pour l'exemple préédent. Étant donné un seuil à ne pas dépasser pour le risque de première espèe, herhons une frontière s pour le minimum de l'éhantillon. Rappelons que la stratégie onsis- H tait à retenir et 0 si le minimum de l'éhantillon ne dépassait pas la rejeter sinon. Calulons alors la probabilité de son rejet, lorsqu'elle e qui vaut (1 s)n. 5 n-éhantillon de v.a. uniformément répartie dans l'intervalle [0; 1℄, s; est vraie. Celle-i n'est que la probabilité pour que le minimum, dans un dépasse p fn omme estimateur standard du de distribution. Introduisons maintenant une mesure Nous avons déjà utilisé le veteur veteur de i=1 2 k = n X [p(i) p(if)n(i)℄ : Khi-deux d'ajustement, par : d'éart entre les fréquenes théoriques et les fréquenes observées, appelée n2 (p; fn) Nous avons alors : On a proédé à 120 laners d'un même dé. Les résultats Théorème. Sous l'hypothèse nulle H0, la suite n2(p; fn) onverge en n ! 1, vers une v.a. du Khi-deux à k 1 degrés de liberté. loi, lorsque Exemple. i 8 est le veteur p = (p(1); :::; p(k)) sont donnés dans le tableau suivant : H 0 : la distribution de probabilité ontre l'alternative : diérente du veteur p. : elle est H1 par : Étant donné un éhantillon j =1 Xn 1 (x ); fa g j pour tout i = 1; :::; k: i = 1; :::; k: par : ai dans l'éhantillon. Dénissons, pour tout (x1; :::; xn), dénissons la fréquene observée de ai N (i) = N (i) ; n fréquene relative de ai C'est la fréquene d'observations de par ailleurs, la fn(i) = 7 Remarque. np(i) ne soient Dans l'appliation du test d'ajustement du Khi-deux, il faut veiller toutefois à e que les fréquenes théoriques pas trop faibles, 5 étant onsidéré omme la limite inférieure traditionnelle. Si besoin est, on peut regrouper plusieurs valeurs dans une seule lasse, an de réaliser ette exigene. Cette tehnique permet l Test du Khi-deux d'Indépendane ensemble ni ou inni. Y k fa ; :::; a g d'appliquer e test à toutes les v.a. disrètes prenant valeurs dans un X fb ; :::; b g 1 14 2 16 3 28 4 30 5 18 6 14 10 Soient et deux v.a. prenant valeurs dans les ensembles 1 k et 1 l respetivement, où et sont deux entiers positifs quelonques (distints ou égaux). En dehors de ette onrmation, rien n'est onnu sur es v.a. Fae Fréquene 5=6 1 Ce dé est-il pipé ? (On donnera la réponse ave un niveau de onane p à = 0:95). Solution. Dans e problème, la v.a. prend valeurs dans f1; 2; 3; 4; 5; 6g = p2 = ::: = p6 = 61 . H (p; fn) 12:8: et l'hypothèse nulle 0 est elle de la distribution 1 On alule le Khi-deux d'ajustement : 2 n 2 degrés de liberté, on ne doit pas dépasser la valeur de 11.1 au niveau Or, la table de la loi du Khi-deux indique que, pour le 9 de onane 0.95. On rejette don l'hypothèse d'uniformité du dé, en retenant qu'il est pipé. Ces fréquenes sont dites relatives lorsqu'on les divise par la taille n de 0 M 0 et L0 respetivement. Si l'on l'éhantillon. Désignons-les par i j Nij0 doit être prohe de Mi0:Lj0 . Nij ; retient l'hypothèse d'indépendane, h i2 Nij0 Mi0Lj0 : Nij0 Khi-deux d'indépendane, en posant : Introduisons maintenant une mesure d'éart entre les fréquenes ob- i=1 j =1 k l = nX X servées et es produits, appelée n2 (N 0; M 0L0) Nous avons alors : indépendantes (k 1)(l 1) degrés de liberté. Y (X; Y ) : 12 Théorème. Sous l'hypothèse d'indépendane (H0), la suite n2(N 0; M 0L0), n ! 1, vers une v.a. du Khi-deux à introduite i-dessus, onverge en loi, lorsque X Nous souhaitons tester l'hypothèse : H ne sont pas indépendantes et sont 0 : ontre l'alternative : H ((x1; y1); (x2; y2); :::; (xn; yn)); . 1 : elles Disposant d'un éhantillon d'observations du ouple l'éhantillon par : ( ) ( ) ( ) ) du on dénit les fréquenes observées onjointes et marginales dans =P ( =P =P 11 n Nij h=1 1f(ai;bj )g xh; yh ; 'est la fréquene d'observations ouple ai; bj . n h=1 1faig xh ; 'est la fréquene d'observations de ai. n h=1 1fbj g yh ; 'est la fréquene d'observations de bj . Mi Lj Solution. Il s'agit de tester l'indépendane de deux v.a. (l'âge et le nombre d'aidents). Le théorème préédent s'applique ave k = l = 3. 2 (N 0; M 0L0 ) On alule alors le Khi-deux d'indépendane. Il vient n 16:51. Nous sommes don ramenés à rejeter l'hypothèse d'indépen- H 0:05. 4 = (3 1) (3 1) dane ( 0 ) au niveau de onane 0.95. En eet la table de la loi de Khi-deux indique que, pour le 2 de degrés de liberté, on dépasse la valeur 9.48 ave une probabilité Test de Student Le problème de déider si l'espérane d'une v.a. normale, est égale a. normale d'espérane toutes deux inonnues. On se donne une valeur X et de ou pas à une grandeur donnée se pose souvent en statistique. Dans , la suite, nous onsidérons une v.a. variane 14 Exemple (J. Istas). 300 onduteurs sont lassiés suivant leur âge et le nombre d'aidents qu'ils ont subis pendant les deux dernières 0 8 21 71 1 ou 2 23 42 90 3 ou plus 14 12 19 années. Les résultats sont donnés dans le tableau suivant : Age / Nombre d'aidents 21 [22; 26℄ 27 L'âge des onduteurs et le nombre d'aidents subis sont-ils in- = 0:95). dépendants ? (On donnera la réponse ave un niveau de onane 13 Théorème Student à n Sous l'hypothèse H n 1, on a . n n n et Zn n et roît en Zn. Soit le seuil de Zn suit une loi de p p Zn = n XS + n S a n Sous l'hypothèse H0, on a Zn = pn XS 1 degrés de liberté. valeur absolue ave On en déduit alors la règle de déision suivante. Soit risque de première espèe à ne pas dépasser. Alors on alule 16 1) la valeur dont la probabilité de dépassement dans la loi de n 1 degrés de liberté vaut =2. Alors : H1 . jZnj ne dépasse pas t=2(n 1), alors on hoisit H0. Student à t=2(n 1. Si 2. Sinon on hoisit Nous voulons tester : =a H 6= a. Zn = pn X nSn a : X n et Sn les estimateurs standard de et de respe- 0 : ontre l'alternative : H1 : Désignons par tivement. Posons : Nous avons alors : 15 Exemple (J. Istas). Un fabriant de piles életriques arme que la durée moyenne du matériel qu'il produit est de 170h. On prélève un S = 30h éhantillon de 30 piles et on observe une durée de vie moyenne de 2. Que peut-on penser de la 155h et une variane empirique Soit l'espérane de la durée de vie d'une pile. D'après p X 30 S suit une loi de Student t(29). Un 2:74 à et éart. Or, v.a. normale d'espérane et de variane inonnues) ? onrmation du fabriant (en supposant que la durée de vie est une Solution. le théorème préédent, alul simple donne la valeur approximative = 0:02, t(29) dépasser en valeur absolue 2.518. Il y a don une bonne suivant une table de la loi de Student, pour un seuil ne doit pas 18 n'est pas un test asymptotique et peut s'appli- raison pour rejeter l'armation du fabriant. Remarques 1. Le test préédent quer aussi pour des valeurs relativement peu élevées de n. n tend vers l'inni, la loi de Student à n degrés de liberté tend vers une loi normale entrée-réduite. Traditionnellement, lorsque 2. Si H : a H0 sera : ontre l'alternative 17 ontre l'alternative H1 : on remplae l'éart dans la loi de Student par elui dans dans la loi normale. n 30, > a, H0 : a 2 ℄ 1; a + t=2(n 1) pSnn ℄: 3. Si nous voulons tester 0 la région d'aeptation de Xn De façon similaire, on peut tester H1 : < a. 20 19 21 22 23 24