MAT1085 Chapitre 10 Tests du khi-deux Solutions 10.1 Voici la répartition, selon le mois, de 1 855 décès choisis au hasard parmi tous les décès qui ont eu lieu en Amérique du Nord en 1976. Mois Jan Fév. Mars Avril Mai Juin Juil. Août Sept. Oct. Nov. Déc. Total Effectif 157 142 158 152 156 153 158 159 153 157 152 158 1855 a) Peut-on attribuer les différences uniquement au hasard ? Dire que les différences sont attribuables entièrement au hasard c’est dire qu’en fait la probabilité qu’un décès ait lieu en un mois donné est 1/12 (à peu près, puisque les mois ne sont pas tous de même longueur) : Ho : p1 = p2 = … = p12 = 1/12 Sous cette hypothèse, les effectifs théoriques sont égaux : 157 142 158 152 156 153 158 159 153 157 152 158 obs 154,58 154,58 154,58 154,58 154,58 154,58 154,58 154,58 154,58 154,58 154,58 154,58 theo On obtient 2 = 1,58, ce qui n’est pas significatif. Le point critique à 11 degrés de liberté est 19,68. Donc on ne peut pas conclure qu’il y a des différences entre les mois quant à la fréquence des suicides. b) Supposons que ces données vous aient été fournies par un assistant en qui vous n’avez pas trop confiance. Les données ont-elles l’air d’avoir été manipulées? La conclusion ci-dessus a été justifiée par le fait que la valeur de χ2 n’est assez grande pour conclure que les fréquences des mois diffèrent de la fréquence théorique de 1/12. Mais en fait la valeur de 2 est si petite qu’elle est suspecte : la probabilité d’une valeur aussi petite est 0,0005. Remarque Nous avons exprimé l’hypothèse nulle en disant que les fréquences devraient être toutes égales à 1/12. En fait, pour être plus exact, si le mois n’a pas d’impact sur les suicides, la probabilité d’un décès en un mois donné devrait être proportionnelle à la longueur du mois : Ho : p1 = 31/365 ; p2 = 28/365 ; …. ; p12 = 31/365. Les effectifs théoriques seraient alors 157 142,0 158 152 156 153 158 159 153 157 152 158 obs 157,55 142,3 157,55 152,47 157,55 152,47 157,55 157,55 152,47 157,55 152,47 157,55 theo On aurait eu 2 = 0,04352251, encore plus petit, donc encore plus conforme à l’hypothèse qu’il n’y a pas d’effet de mois. 10.2 Dans une étude célèbre, des données ont été prélevées sur 6 587 suicides en France. Voici la distribution des suicides selon le jour de la semaine: Jour Lundi Mardi Mercredi Jeudi Vendredi Samedi Dimanche Total Effectif 1 001 1 035 982 1 033 905 737 894 6 587 a) Testez l’hypothèse que les suicides se répartissent uniformément sur les jours de la semaine. Les observations X = (X1 , ... , X7) sont une réalisation d’une variable (vectorielle) de loi (6587; p1, .. . , p7). Ho : les suicides se répartissent uniformément sur les jours de la semaine, ce qui se traduit par: Ho: p1 = 1/7 ... , p7 = 1/7. Les effectifs théoriques sont T1 = E(X1|p1= 1/7) = 6587(1/7) = 941, T7 = E(X7|p7 = 1/7) = 6587(1/7) = 941. La statistique est 2 = (1001 941) 2 941 +…+ (894 941)2 941 = 71,947; = 6; point critique: 12,59. Puisque 71,947 >> 12,59 (p 0), on peut certainement rejeter l’hypothèse d’uniformité: le tableau des effectifs observés est trop éloigné des effectifs auxquels on s’attend sous l’hypothèse nulle. On conclut avec confiance que les suicides ne sont pas aussi fréquents tous les jours de la semaine. b) Selon une certaine conjecture, les taux de suicides diminuent à l’approche d’un week-end. Plus précisément, le taux quotidien global pour l’ensemble des jours du vendredi au dimanche est inférieur au taux quotidien global pour l’ensemble des jours du lundi au jeudi. Les données appuient-elles cette conjecture? On effectue un test d’ajustement: Lundi à jeudi Vendredi à dimanche Total Observés 4051 2536 6587 Théoriques 3764 2823 6587 2 = 51,06; = 1; point critique: 3,84 (p 0). On rejette certainement l’hypothèse; on conclut que les suicides sont plus probables en semaine. c) Testez l’hypothèse que chacun des jours du lundi au jeudi a le même taux de suicides. On fait un test d’uniformité sur les effectifs observés suivants (l’effectif théorique est 1012,75): MAT1085 Chapitre 9 Tests du khi-deux 2 Lundi Mardi Mercredi Jeudi Total Observés 1001 1035 982 1033 4051 2 = 1,96; = 3; point critique: 7,82 (p = 0,58). On ne peut pas rejeter l’hypothèse que les quatre jours de la semaine ont la même probabilité de provoquer un suicide. d) Testez l’hypothèse que chacun des jours du vendredi au dimanche a le même taux de suicides. On fait un test d’uniformité sur les effectifs observés suivants (l’effectif théorique est 845,33): Vendredi Samedi Dimanche Total Observés 905 737 894 2536 2 = 20,9; = 2; point critique: 5,99 (p = 0,000029). On peut rejeter l’hypothèse que les trois jours du weekend ont la même probabilité de provoquer un suicide. e) Essayez de résumer en une phrase ou deux l’ensemble des conclusions tirées ci-dessus. Donc en définitive, on peut dire que les jours de la semaine provoquent plus de suicides que le week-end; que les jours de la semaine sont comparables entre eux; alors que les jours du week-end sont différents les uns des autres. 10.3 Un sociologue s’intéresse à la relation entre la couleur de la peau et la mobilité professionnelle. Il prélève un échantillon de 94 personnes de peau pâle, 175 personnes de peau moyenne, et 80 personnes de peau brune. Il construit une mesure de mobilité à l’aide de quoi il classifie ses sujets selon leur mobilité. Voici les résultats. Couleur de la peau Mobilité Pâle Moyenne Brune Total Grande 35 84 51 170 Faible 59 91 29 179 Total 94 175 80 349 Tester l’hypothèse qu’il n’y a aucune relation entre la couleur de la peau et la mobilité professionnelle avec 0,05. Le modèle est le suivant: nous observons 3 vecteurs aléatoires, X, Y et Z, les trois de loi multinomiale. Dans l’ordre dans lequel les observations sont disposées dans le tableau, ce sont: Grande X1 Y1 Z1 170 Faible X2 Y2 Z2 179 On que X ~ (170; p1, p2) Y ~(179; r1, r2) Z ~ (349; s1, s2) Ho : la couleur de la peau n’influence pas la mobilité professionnelle, et donc que p1 = r1 = s1; et p2 = r2 = s2 On estime ces deux probabilités communes par 170/349 = 0,4871 et 179/349 = 0,5129, respectivement. Ce qui donne, pour les 94 sujets de peau pâle, les effectifs théoriques (0,4871)(94) = 45,79; et (0,5129)(94) = 48,21. On obtient de cette manière, le tableau des effectifs théoriques suivants: Mobilité Pâle Moyenne Brune Total Grande 45,79 85,24 38,97 170 Faible 48,21 89,76 41,03 179 Total 94 175 80 349 Point critique: 5,99. 2 = 12,23; = 2. Puisque 12,23 > 5,99 (p = 0,0022), on rejette l’hypothèse que la couleur de la peau n’influence pas la mobilité professionnelle, pour conclure que la couleur de la peau a un lien avec la mobilité professionnelle. Pour avoir une idée du type de relation qu’il pourrait y avoir, on calcule les distributions conditionnelles: Pâle Moyenne Brune Total Grande 37,2% 48,0% 63,8% 48,7% Faible 62,8% 52,0% 36,3% 51,3% 100% 100% 100% 100% Il semble que plus la peau est foncée, plus la mobilité est grande. 10.4 Dans une étude sur l’absentéisme scolaire, une des causes d’absence est d’ordre non volontaire: décès, maladie, fatigue excessive, traitement médical. Parmi les 642 répondants à un questionnaire sur les motifs d’absence, 200 se classent dans cette catégorie. On a classifié ces 200 répondants selon le sexe et la cause. Décès Maladie Fatigue Traitement médical Garçons 4 39 25 18 Filles 7 56 32 19 Ces types de causes d’absence sont-ils liés au sexe? Le tableau suivant présente une notation des variables du modèle : MAT1085.10.Sols.A12 2 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 3 Décès Maladie Fatigue Trait, Total Garçons X1 X2 X3 X4 n1 Filles Y1 Y2 Y3 Y4 n2 X = (X1,X2,X3,X4) ~ (n1; p1, p2, p3,p4) et Y = (Y1,Y2,Y3,Y4) ~ (n2; r1,r2, r3,r4). L’hypothèse à tester est Ho : p1 = r1, p2 = r2, p3 = r3, p4 = r4. C’est un test d’indépendance. Les effectifs théoriques sont Décès Maladie Fatigue Trait, Total Garçons 4,73 40,85 24,51 15,91 86 Filles 6,27 54,15 32,49 21,09 114 11 95 57 37 200 2 = 0,84 à 3 degrés de liberté. Le point critique est 7,815 (p = 0,8399). On ne rejette pas l’hypothèse nulle : on n’a donc pas de raison de croire qu’il y a une différence entre filles et garçons dans les motifs d’absence. 10.5 Un sociologue a fait subir un test d’estime de soi à 3 750 américains de 3 religions différentes. Voici les résultats Religion Protestante Catholique Juive Total Estime Forte 1 191 988 435 2 614 de soi Faible 517 493 126 1 136 1 708 1 481 561 3 750 a) Calculez, pour chaque religion, le pourcentage des sujets qui ont une forte estime de soi. Voici les pourcentages de personnes avec une forte estime de soi, par religion: Protestants Catholiques Juifs 69,7% 66,7% 77,5% Assez semblables pour les Protestants et Catholiques. b) Les différences entre ces pourcentages sont-elles significatives? Il s’agit de faire un test d’indépendance. Voici les effectifs théoriques: Est de soi Protestants Catholiques Juifs Total Forte 1190,6 1032,4 391,0 2614 Faible 517,4 448,6 170,0 1136 Total 1708 1481 561 3750 On a 2 = 22.59373, ce qui est hautement significatif, car le point critique est 5,99 . (La p-valeur, ou niveau de signification, c’est-à-dire, la probabilité d’une valeur aussi extrême de 2 sous Ho, est 0,0000124). On conclut avec confiance que l’estime de soi diffère selon qu’on est Protestant, Catholique ou Juif, comme le montrent d’ailleurs les distributions conditionnelles. c) La différence entre les catholiques et les protestants est-elle significative? Voici le tableau des effectifs observés, avec seuls les Catholiques et les Protestants: Estime de soi Protestants Catholiques Total Forte 1191 988 2179 Faible 517 493 1010 Total 1708 1481 3189 Effectifs théoriques: Estime de soi Protestants Catholiques Total Forte 1167,05 1011,95 2179 Faible 540,95 469,05 1010 Total 1708 1481 3189 Point critique: 3,84. 2 = 3,34; = 1; p = 0,0676. On ne peut pas rejeter l’hypothèse nulle: on ne peut pas conclure qu’il y a une différence entre Protestants et Catholiques. d) En mettant les protestants et les catholiques ensemble, trouvez-vous ceux-ci différents des juifs? Voici les effectifs observés, Catholiques et Protestants réunis: Estime de soi Protestants et Catholiques Juifs Total Forte 2179 435 2614 Faible 1010 126 1136 Total 3189 561 3750 Effectifs théoriques: Estime de soi Protestants et Catholiques Juifs Total Forte 2222,9 391,05 2614 Faible 966,05 169,95 1136 Total 3189 561 3750 Point critique: 3,84. 2 = 19,17; = 1; p = 0,00001957. On rejette l’hypothèse nulle, et on conclut que les Juifs ont une estime de soi différente de celles des Catholiques ou Protestants. e) Résumez vos conclusions. MAT1085.10.Sols.A12 3 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 4 Il n’y a pas de différence entre Catholiques et Protestants. Mais il y a une entre Protestants et Catholiques d’une part, et Juifs d’autre part: une plus forte estime de soi parmi les derniers. 10.6 Les données du numéro précédent sont celles de la population générale. Les données dans le tableau suivant portent sur une souspopulation: ceux qui n’ont pas complété l’école secondaire. Religion Protestante Catholique Juive Total Estime Forte 330 234 89 653 de soi Faible 152 91 37 280 482 325 126 933 Les conclusions sont-elles les mêmes ici? Voici le tableau des effectifs théoriques : Esime de soi Protestants Catholiques Juive Total Forte 337,3 227,5 88,2 653 Faible 144,7 97,5 37,8 280 Total 482 325 126 933 La valeur de khi-deux est = 1,18, à 2 degrés de liberté, ce qui n’est nullement significatif, puisque le point critique est de 5,99 (et p = 0,5532). Donc il ne semble pas y avoir de différence entre les religions, contrairement aux résultats du numéro précédent, dans lequel la conclusion était que les Juifs avaient une estime de soi supérieure à celle des autres. On pourrait être tenté de conclure que cette supériorité s’estompe chez les Juifs peu scolarisés (ils ne s’aiment que s’ils sont instruits). Mais il faut se méfier de conclusions trop hâtives, car il faut se rappeler que les effectifs ici sont moins importants, ce qui rend plus difficile la détection des différences. En d’autres termes, il est possible que les Juifs aient quand même une plus forte estime de soi, mais que la différence n’est pas détectée. Cette conclusion est peu vraisemblable, cependant, à la lumière des fréquences conditionnelles, que voici : Esime de soi Protestants Catholiques Juive Total Forte 68,5% 72,0% 70,6% 70,0% Faible 31,5% 28,0% 29,4% 30,0% Total 100% 100% 100% 100% On voit dont que les Juifs ont une estime de soi qui se situe entre celle des Protestants et celle des Catholiques. 10.7 Une équipe de chercheurs dispose de données sur une population d’accidents: l’ensemble de tous les accidents qui ont eu lieu au Québec en l980 et qui ont entraîné des blessures corporelles. Pour la plupart des variables, il était aisé d’obtenir les données pour la population entière. Pour certaines autres variables, comme celles qui identifiaient la position exacte du véhicule lors de l’accident, il était difficile d’en déterminer les valeurs et on ne pouvait se permettre de le faire pour la population entière. Il a donc fallu prélever un échantillon pour étudier la distribution de ces variables là. On a prélevé un échantillon de 600 accidents. Malheureusement, l’échantillon n’a pas été prélevé de façon purement aléatoire, ce qui faisait douter de sa représentativité. Pour étudier la question de la représentativité, on a choisi une variable particulière, la variable "gravité de la blessure", dont on connaissait la distribution pour la population entière ainsi que pour l’échantillon. Formulez convenablement l’hypothèse que l’échantillon est représentatif et testez-la. Les distributions sont : Blessure mortelle très grave grave pas grave Total Fréquence dans la population 0,20 0,30 0,30 0,20 1 Fréquence dans l’échantillon 0,10 0,30 0,40 0,20 1 Nous observons un vecteur X = (X1, X2, X3, X4) de loi (600 ; p1, p2; p3; p4). Si les tirages ont été faits au hasard, alors les probabilités de sélection des différents types de blessure devraient être égales aux fréquences dans la population. Donc l’hypothèse nulle, que les tirages sont faits au hasard, est Ho :p1 = 0,20; p2 = 0,30; p3 = 0,30 ; p4 = 0,20. Les valeurs observées et théoriques sont : Blessure mortelle très grave grave pas grave total Observés 60 180 240 120 600 Théoriques 120 180 180 120 600 La valeur de khi-deux est 2 = 50 avec 3 degrés de liberté; c’est très significatif, puisque le point critique est 7,81(p = 7,99/1011). Les résultats sont loin de ce qu’ils devraient être sous la supposition que l’échantillon a été tiré au hasard. On est donc sûr qu’il y a un défaut dans le mode de tirage. 10.8 Déterminez s’il y a un lien entre le type de tumeur cérébrale, et son site. On distingue trois types de tumeurs A1 : tumeurs bénignes ; A2 : tumeurs malignes ; A3 : autres tumeurs et les sites sont B1 : lobes frontaux ; B2 : lobes temporaux ; B3 : autres régions cérébrales Les données sont présentées dans le tableau suivant : MAT1085.10.Sols.A12 4 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 5 B2 B3 B1 23 21 34 78 A1 9 4 24 37 A2 6 3 17 26 A3 38 28 75 141 10.9 [Données du tableau A.8] Faites un test permettant de confirmer ou d’infirmer l’affirmation suivante : il y a une relation entre le fait de croire en l’astrologie et le fait de croire en l’évolution. Il y a plusieurs façons de procéder. Vous devrez exprimer l’hypothèse nulle formellement. Vous pouvez décider de grouper les catégories, mais justifiez votre décision. Les données sont rassemblées de façon à obtenir des effectifs théoriques suffisants et nous avons aussi éliminés ceux qui refusent de répondre. La valeur « 1 » signifie une attitude négative face à l’astrologie (variable Astro) et favorable à la théorie de l’évolution (variable Singe.) Astro Singe 1 2 3 1 14 12 16 42 2 7 10 22 39 3 5 8 12 25 26 30 50 106 Distributions conditionnelles de la variable Astro étant donné Singe Astro Singe 1 2 3 1 0.333 0.286 0.381 1 2 0.179 0.256 0.564 1 3 0.200 0.320 0.480 1 Curieusement, il semble que ceux qui croient que l’astrologie est une ânerie ne sont pas ceux qui croient le plus fermement en la théorie de l’évolution. Effectifs théoriques 1 2 3 1 10.302 11.887 19.811 42 2 9.566 11.038 18.396 39 3 6.132 7.075 11.792 25 26.000 30.000 50.000 106 2 = 3,887 à 4 degrés de liberté. p = 0,421 On ne peut pas rejeter l’hypothèse d’indépendance. Les constatations faites ci-dessus sont peut-être fortuites. 10.10[Données du tableau A.8] Faites un test permettant de confirmer ou d’infirmer l’affirmation suivante : Il y a une relation entre le fai grouper les catégories, mais justifiez votre décision. Les données sont rassemblées de façon à obtenir des effectifs théoriques suffisants. On a aussi éliminé ceux qui refusent de répondre. La valeur « 1 » signifie une attitude négative face à l’astrologie (variable Astro) et favorable à l’idée que la ligne de vie est liée à la durée de vie (variable Paume.) Astro Paume 1 2 3 1 0 4 9 13 2 2 10 14 26 3 19 10 18 47 21 24 41 86 Distributions conditionelles de la variable Astro étant donné Paume Astro Paume 1 2 3 1 0.000 0.308 0.692 1 2 0.077 0.385 0.538 1 3 0.404 0.213 0.383 1 Généralement parlant, une croyance à la signification de la ligne de vie est accompagnée d’une plus grande tolérance de l’astrologie. Effectifs théoriques 1 2 3 1 3.174 3.628 6.198 13 2 6.349 7.256 12.395 26 3 11.477 13.116 22.407 47 21 24 41 86 2 = 15.24295, 4 degrés de liberté, p = 0,004 La relation est nettement significative. 10.11[Données du tableau A.8] Faites un test permettant de confirmer ou d’infirmer l’affirmation suivante : les gens qui pratiquent leur reli Les données sont rassemblées de façon à obtenir des effectifs théoriques suffisants. On a aussi éliminé ceux qui refusent de répondre. La valeur « 1 » signifie une attitude négative face au mariage avec une personne d’une autre religion (variable Religion) et une fréquentation active à l’église (variable Église.) MAT1085.10.Sols.A12 5 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 6 Église 1 2 3 5 2 21 28 5 2 10 17 9 11 47 67 19 15 78 112 Distributions conditionnelles de « Religion » étant donné « Église » Église Religion 1 2 3 1 0.263 0.133 0.269 2 0.263 0.133 0.128 3 0.474 0.733 0.603 1 1 1 Ceux dont les pratiques religieuses sont modérées sont ceux qui épouseraient le plus volontiers une personne d’une autre religion. Effectifs théoriques 1 2 3 1 4.750 3.750 19.500 28 2 2.884 2.277 11.839 17 3 11.366 8.973 46.661 67 19.000 15.000 78.000 112 2 = 3.77, 4 degrés de liberté, p = 0,438. Religion 1 2 3 10.12Un psychologue prétend pouvoir décider si un sujet est schizophrène ou pas en examinant son Électroencéphalogramme (EEG). Po correctement classifiés comme schizophrènes et 2 correctement classifiés comme normaux. Deux étudiants A et B se proposent de tester l’hypothèse que l’EEG ne fournit au psychologue aucune information sur la schizophrénie. A - L’étudiant A traite le nombre de diagnostics corrects comme une variable binomiale avec n 50 et teste l’hypothèse que p 1/2 (Ayant observé X 34 succès il rejette cette hypothèse et conclut que l’EEG est un bon indice de la schizophrénie) B- L’étudiant B dresse les tableaux suivants : Effectifs observés Effectifs théoriques Classification du Classification du psychologue psychologue État du État du Correcte Incorrecte Correcte Incorrecte patient patient Schizo. 32 8 40 Schizo. 27,2 12,8 40 Normal 2 8 10 Normal 6,8 3,2 10 34 16 50 34 16 50 Il fait ensuite le test d’indépendance classique. Dites pourquoi les deux étudiants se trompent et faites le test correctement. Voici une modélisation correcte . On observe deux variables : X= Nombre de sujets déclarés schizophrènes parmi les vrais schizophrènes Y= Nombre de sujets déclarés schizophrènes parmi les non schizophrènes X~(n1, ; p1) et Y ~ (n2 ; p2), où n1 = 40 et n2 = 10. L’hypothèse à tester est Ho : p1 = p2. C’est un test d’indépendance calculé à partir du tableau suivant : Le sujet est classé Schizophrène Non Schizophrène. Schizophrène. X = 32 n1 – X= 8 n1 = 40 Le sujet est Non schizophrène Y=8 n2 - Y = 2 n2 = 10 Les effectifs théoriques sont identiques aux effectifs observés, la valeur de 2 est 0, et évidemment on ne peut pas rejeter l’hypothèse d’indépendance : on accepte l’hypothèse que p1 = p2 et on conclut que le psychologue ne peut pas détecter la schizophrénie par l’EEG. L’étudiant A a observé le nombre Z de bonnes réponses parmi 50. Il a supposé que Z suit une loi binomiale, ce qui est déjà une erreur. Il y a 2 séries d’épreuves : une série de 40 épreuves avec des schizophrènes ; et une série de 10 épreuves avec des non schizophrènes. La probabilité de succès (un diagnostic correct) n’est pas nécessairement la même dans les deux séries. Et l’hypothèse que p = ½ n’est pas l’hypothèse qu’on veut tester, car il se peut que p > ½ sans que le psychologue ait la moindre capacité de détecter la schizophrénie. C’est bien le cas ici : il semble avoir une forte tendance à déclarer les gens schizophrènes, et ce qui explique son grand nombre de succès, c’est le grand nombre de schizophrènes dans l’échantillon. L’étudiant B, lui, fait un test correct, mais il ne teste pas la bonne hypothèse : il teste l’hypothèse que la probabilité de succès est la même, que le sujet soit schizophrène ou non. Il conclut que non, la probabilité n’est pas la même dans les deux cas : elle est plus forte chez les schizophrènes, ce qui reflète encore une fois le fait que le psychologue a tendance à conclure que les sujets sont schizophrènes. 10.13 On examine les deux premières questions d’un test psychologique en étudiant les résultats obtenus par 80 sujets sur ces deux questions. Parmi ces 80 sujets, 30 ont répondu correctement aux deux questions, 21 ont répondu incorrectement aux deux questions, 9 ont répondu correctement à la première et incorrectement à la deuxième, et 20 ont répondu incorrectement à la première et correctement à la deuxième. Trois hypothèses sont formulées ci-dessous. Pour chacune d’elles, dites si vous pouvez la tester avec les données à votre disposition. Si oui, testez-la, après l’avoir formulée correctement. Sinon, expliquez pourquoi les techniques que vous connaissez ne s’appliquent pas. MAT1085.10.Sols.A12 6 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 7 HA: La moitié de la population est capable de répondre à la question 1. Il s’agit d’un test d’ajustement sur la distribution suivante: Question 1 réussie Question 1 manquée Total Effectif observé 39 41 80 Effectif théorique 40 40 80 2 = 0,05; = 1; point critique: 3,84 (p = 0,823). Nous ne pouvons pas conclure que la proportion des gens qui sont capables de répondre à la première question est différente de 50%. HB: Les deux questions mesurent des choses différentes; elles n’ont rien à voir l’une avec l’autre; elles sont indépendantes; on peut être bon dans l’une et pas dans l’autre. Ho : la probabilité de réussir la question 2 ne dépend pas du résultat de la question 1. En d’autres termes, il s’agit de tester l’indépendance dans le tableau des effectifs observés suivant: Q2 réussie Q2 manquée Total Q1 réussie 30 9 39 Q1 manquée 20 21 41 Total 50 30 80 Les effectifs théoriques sont: Effectifs observés Q2 réussie Q2 manquée Total Q1 réussie 24,375 14,625 39 Q1 manquée 25,625 15,375 41 Total 50 30 80 2 = 6,75; = 1; point critique: 3,84 (p = 0,009). On rejette l’hypothèse que les deux questions sont indépendantes; on peut conclure que la réussite dans l’une entraîne une plus forte probabilité de réussite dans l’autre. Les distributions conditionnelles suivantes le montrent. Effectifs observés Q2 réussie Q2 manquée Total Q1 réussi 77% 23% 100% Q1 manquée 49% 51% 100% HC: Les deux questions sont de même difficulté. La théorie étudiée jusqu’ici ne permet pas de tester cette hypothèse. 10.14 Pour savoir si une certaine maladie est aussi fréquente chez les hommes que chez les femmes, un chercheur prélève un échantillon de 450 hommes et 450 femmes. Il trouve que 100 hommes et 85 femmes sont atteints de la maladie. Testez l’hypothèse que les hommes et les femmes sont également vulnérables à la maladie. Pour tester la même hypothèse, un autre chercheur procède différemment. Il prélève un échantillon de 900 personnes atteintes de la maladie. Parmi celles-ci, il trouve qu’il y a 420 femmes et 480 hommes. Testez l’hypothèse avec ces données. La deuxième expérience fournit moins d’information que la première. Comment se fait-il qu’on peut s’en tirer quand même? Voici les données sous forme de tableau : Malades Pas malades Total Hommes 100 350 450 Femmes 85 365 450 Total 185 715 900 Nous avons deux binomiales, X~(450; p1), le nombre de malades parmi les hommes, et Y ~ (450; p2), le nombre de malades parmi les femmes. L’hypothèse à tester est Ho : p1 = p2. C’est donc un test d’indépendance. Les effectifs théoriques sont : Malades Pas malades Total Hommes 92,5 357,5 450 Femmes 92,5 357,5 450 Total 185 715 900 On a 2 = 1,53, = 1 (p = 0,216). Le point critique étant 3,84, on ne rejette pas l’hypothèse nulle, et on ne peut pas conclure qu’il y une différence entre hommes et femmes quant à leur vulnérabilité à la maladie en question. Le deuxième chercheur observe Z, le nombre de femmes parmi 900 personnes atteintes de la maladie. Alors Z ~ (900 ; p). L’hypothèse que les femmes ne sont ni plus ni moins vulnérables que les hommes devrait signifier que parmi les malades on ne devrait trouver ni plus ni moins de femmes que dans la population générale. Faisant la supposition que dans la population générale, la proportion des femmes est d’environ ½ , il conclut que l’hypothèse à tester est Ho : p = ½. C’est donc un test d’uniformité : Femmes Hommes Observés 420 480 900 Théoriques 450 450 900 La valeurs de khi-deux est 2 = 4, ce qui, à 1 degré de liberté, est significatif, puisque le point critique est 3,84 (p = 0,0455). La seule raisons pour laquelle on a pu faire un test avec moins d’information, c’est qu’on utilisé une donnée supposée connue : qu’il y a 50% de femmes dans la population. 10.15 Pour savoir s’il y a de la discrimination contre les femmes, on prélève les données suivantes sur 1 200 demandes d’admission aux deux universités d’une ville. MAT1085.10.Sols.A12 7 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 8 Résultat de la demande Acceptée Refusée Total Sexe de Masculin 416 184 600 l’individu Féminin 184 416 600 Total 600 600 1 200 Peut-on conclure qu’il y a de la discrimination contre les femmes? Voici les données sur les mêmes 1 200 candidatures, réparties cette fois selon l’université à laquelle la demande est adressée. Université A Résultat de la demande Acceptée Refusée Total Sexe de Masculin 8 92 100 l’individu Féminin 92 408 500 Total 100 500 600 Sexe de l’individu Université B Résultat de la demande Acceptée Refusée 408 92 92 8 500 100 Masculin Féminin Total Total 500 100 600 Vos conclusions changent-elles? Voici les distribution conditionnelles: Masculin Féminin Total Acceptée 69% 31% 50% Refusée 31% 69% 50% Total 100% 100% 100% Masculin Féminin Total Acceptée 8% 18% 17% Refusée 92% 82% 83% Total 100% 100% Université A Université B Acceptée Refusée Total Masculin 82% 18% 100% Féminin 92% 8% 100% Total 83% 17% 100% Aux deux universités, le taux d’acceptation est meilleur chez les femmes; mais globalement, c’est chez le hommes que le taux d’acceptation est meilleur. C’est que les femmes sont très nombreuses à faire des demandes à l’université A, et celle-ci a un très bas taux d’acceptation. 10.16 On classifie 661 finissants d’une université d’après les secteurs d’emploi et la discipline. Voici les données: Grandes Fonction Enseignement P.M.E. corporation publique s Génie 25 40 10 80 155 Sciences physique 38 40 25 75 178 Sciences humaines 51 45 15 78 189 Lettres 65 50 4 20 139 Total 179 175 54 253 661 Y a-t-il une relation entre la discipline et le secteur d’emploi? C'est un test d'indépendance. Voici le tableau des effectifs théoriques: Fonction Grandes Enseignement P.M.E Total publique corporations Génie 41,974 41,036 12,663 59,327 155 Sciences physiques 48,203 47,126 14,542 68,130 178 Sciences humaines 51,182 50,038 15,440 72,340 189 Lettres 37,641 36,800 11,356 53,203 139 Total 179 175 54 253 661 MAT1085.10.Sols.A12 8 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 9 Le point critique à 5% et 9 degrés de liberté est 16,9190. Puisque 2 = 77,17 (p = 5,8710-13), on rejette certainement l'hypothèse que le secteur d'emploi et la discipline sont des variables indépendantes. 10.17 Le tableau ci-dessous donne, pour une population de 87 627 mariages qui ont eu lieu au Canada en 1974, la distribution de la religion de l’époux et de la religion de l’épouse. Religion de l’épouse Catholique Anglicane Baptiste Église Unie romaine Religion Anglicane 7504 701 4731 4 680 17 616 de Baptiste 710 2222 992 1 050 4 974 l’époux Catholique romaine 4589 914 26919 6 044 38 466 Église Unie 4247 932 6143 15 249 26 571 Total 17 050 4 769 38 785 27 023 87 627 a) Dressez un tableau qui expose clairement la forte dépendance entre ces deux variables. Voici un tableau qui présente les distributions conditionnelles: Anglican Baptistes Catholiques Église-Unie Anglican 42,6% 4,0% 26,9% 26,6% 100% Baptistes 14,3% 44,7% 19,9% 21,1% 100% Catholiques 11,9% 2,4% 70,0% 15,7% 100% Église-Unie 16,0% 3,5% 23,1% 57,4% 100% Total 19,5% 5,4% 44,3% 30,8% b) Testez l’hypothèse que 50% des femmes Baptistes épousent des coreligionnaires. Il s’agit de faire un test d’ajustement: Épousé un Pas épousé un Total coreligionnaire coreligionnaire Observés 2222 2547 4769 Théorique 2384,5 2384,5 4769 La valeur de 2 est 22,15, certainement significatif à 5% (p = 0,00000252). c) Testez l’hypothèse que 50% des mariages entre catholiques et baptistes sont des mariages entre un homme catholique et une femme baptiste. Ho : dans les mariages entre catholiques et baptistes, ceux où le mari est catholique sont aussi fréquents que ceux où la femme est catholique. Il faut faire un test d’ajustement: Homme catholique, femme Homme baptiste, femme Total baptiste catholique Observés 914 992 1906 Théorique 953 953 1906 La valeur de khi-deux est 3,19 à 1 degré de liberté (p = 0,074). Le point critique à 5% étant 3,84, on ne rejette pas l’hypothèse. d) Testez l’hypothèse que la probabilité qu’un homme épouse une coreligionnaire est la même pour les 4 religions représentées. Le test est basé sur le tableau suivant: Religion de A épousé une N’a pas épousé une Total l’époux coreligionnaire coreligionnaire Anglican 7504 10112 17616 Baptiste 2222 2752 4974 Catholique 26919 11547 38466 Église Unie 15249 11322 26571 Total 51894 35733 87627 Voici le tableau des effectifs théoriques: Religion de A épousé une N’a pas épousé une Total l’époux coreligionnaire coreligionnaire Anglican 10432,5 7183,5 17616 Baptiste 2945,7 2028,3 4974 Catholique 22780,1 15685,9 38466 Église Unie 15735,7 10835,3 26571 Total 51894 35733 87627 2 = 4332; = 3; point critique: 7,814 (p 0). La tendance à épouser une coreligionnaire dépend très certainement de la religion (elle varie d’une religion à l’autre). Les distributions conditionnelles (ci-dessous) montrent, entre autre, que le pourcentage de mariages à des coreligionnaires est beaucoup plus élevé chez les catholiques; particulièrement faible chez les Anglicans et les Baptistes. MAT1085.10.Sols.A12 9 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 10 A épousé une N’a pas épousé une Total coreligionnaire coreligionnaire Anglican 42,6% 57,4% 100,0% Baptiste 44,7% 55,3% 100,0% Catholique 70,0% 30,0% 100,0% Église Unie 57,4% 42,6% 100,0% Total 59,2% 40,8% 100,0% 10.18 La distribution suivante a été dressée par Haberman (1978) à partir de données fournies par le National Opinion Research Center de l’Université de Chicago. Les variables sont le nombre d’années de scolarité (X) et l’attitude face à l’avortement (Y). Attitude Pour Mixte Contre Religion de l’époux ≤8 31 23 56 110 9 — 12 171 89 177 437 > 12 116 39 74 229 Total 318 151 307 776 Testez l’hypothèse que la scolarité et l’attitude sont indépendantes. Voici les effectifs théoriques: Scolarité Pour Mixte Contre Total 45,077 21,405 43,518 110 8 9 à 12 179,080 85,035 172,885 437 >12 93,843 44,561 90,597 229 Total 318 151 307 776 2 = 17,71; = 4; point critique: 9,488 (p = 0,0014). On peut donc conclure que l’attitude face à l’avortement dépend de la scolarité. Voici les distributions conditionnelles. Elles montrent, essentiellement, que l’attitude face à l’avortement est plus tolérante à mesure que l’éducation augmente. Scolarité Pour Mixte Contre Total 28,2% 20,9% 50,9% 100% 8 9 à 12 39,1% 20,4% 40,5% 100% >12 50,7% 17,0% 32,3% 100% Total 41,0% 19,5% 39,6% 100% Les données ci-dessous portent sur deux groupes: des catholiques et des protestants du nord des États-Unis. Voici la distribution pour chaque groupe: Attitude: Catholiques Pour Mixte Contre ≤8 8 10 24 42 Scolarité 9 — 12 65 39 89 193 > 12 37 18 43 98 Total 110 67 156 333 Scolarité a) b) Pour 23 106 79 208 Attitude: Protestants Mixte Contre 13 32 50 88 21 31 84 151 ≤8 68 9 — 12 244 > 12 131 Total 443 La conclusion en (a) doit-elle être modifiée? Voici les effectifs théoriques pour les Catholiques: Scolarité Pour Mixte Contre Total 13,874 8,450 19,676 42 8 9 à 12 63,754 38,832 90,414 193 >12 32,372 19,718 45,910 98 Total 110 67 156 333 2 = 4,76; = 4; point critique: 9,488 (p = 0,3128). On ne peut pas rejeter l’hypothèse, c’est-à-dire, nous ne pouvons pas conclure que, pour les Catholiques, l’attitude face à l’avortement dépend de la scolarité. Voici les effectifs théoriques pour les Protestants: Scolarité MAT1085.10.Sols.A12 10 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 11 Scolarité Pour Mixte Contre Total 31,928 12,894 23,178 68 8 9 à 12 114,564 46,266 83,169 244 >12 61,508 24,840 44,652 131 Total 208 84 151 443 2 = 16,82; = 4; point critique: 9,488 (p = 0,0021). On peut rejeter l’hypothèse et conclure que, pour les Protestants, l’attitude face à l’avortement dépend de la scolarité. Voici le tableau des distributions conditionnelles . On observe le même phénomène que dans la population générale, mais encore plus marqué. Scolarité Pour Mixte Contre Total 33,8% 19,1% 47,1% 100% 8 9 à 12 43,4% 20,5% 36,1% 100% >12 60,3% 16,0% 23,7% 100% Total 47,0% 19,0% 34,1% 100% Il ne faut pas, cependant, conclure trop vite que chez les Catholiques, l’attitude et la scolarité sont indépendantes: il se peut que l’incapacité de rejeter l’hypothèse ne soit due qu’à un effectif total insuffisant. 10.19 Il y a quelques années, un comité fédéral de 5 personnes, chargé de prendre des décisions sur la télédiffusion, a statué sur une demande particulière en provenance de la Province de Québec. La décision prise par le comité était nettement défavorable au Québec. Les journalistes n’ont pas manqué de signaler que les deux membres francophones du comité s’étaient opposés à la décision, alors que les 3 membres anglophones l’avaient appuyée. Les journalistes insinuaient qu’il ne s’agissait pas là d’une simple coïncidence, mais bien de préjugés de la part des uns ou des autres. Ils faisaient donc un test d’hypothèse informel. Le but de cet exercice est de développer une façon plus formelle de le faire. Soit X1 le nombre de francophones qui voteraient en faveur de la proposition et X2 le nombre d’anglophones en faveur. Énoncez Ho et montrez que la distribution conditionnelle de X1 étant donnée X1 + X2 = m est une variables de loi (m; n1 + n2) sous Ho. Soit X le nombre de francophones qui ont voté "pour" parmi les 3 qui ont voté pour. Si la langue du commissaire est indépendante de sa façon de voter, on peut considérer que ce tout choix de 3 personnes pour est un échantillon aléatoire de taille 3 tiré d'une population de 5 personnes dont 2 sont francophones et 3 anglophones. On a donc X ~ (3 ; 2 ; 3). Puisqu'on a observé X = 0, on calcule P(X 0) = P(X = 0) = 2 0 3 3 5 3 = 0,10. Cette probabilité n'est pas vraiment très petite. On ne peut donc pas nécessairement conclure que la langue du commissaire influence sa décision. L'hypothèse que chaque choix de 3 personnes a même probabilité peut sembler un peu forte. Voici une modélisation plus facile à accepter. Soit X le nombre de francophones parmi deux qui sont favorables au projet; et Y le nombre d'anglophones parmi 3 qui le sont. Alors X ~ (2 ; p1) et Y ~ (3 ; p2), et l'hypothèse que les francophones ne sont a priori pas plus ni moins favorables à la proposition se traduit par Ho : p1 = p2 (= p, disons). Nous ferons un test dit "conditionnel", c'est-à-dire, nous allons baser le test sur la distribution conditionnelle de X étant donné que la somme X + Y = 3. Sous Ho, 2 px (1 p)2 x 33x p3 x (1 p)x = 2x 33x . P(X = x | X+Y=3) = P(X = x ; Y = 3 – x)/P(X+Y = 3) = x 53 p3 (1 p)2 53 Donc P(X = 0 | X+Y=3) = 2 0 3 3 5 3 = 0,1. 10.20 Il existe une méthode qu’on propose aux couples pour augmenter leurs chances d’avoir un enfant du sexe de leur choix. Voici les données sur 48 couples qui ont essayé la méthode. Les parents ont eu une fille un garçon Total Les parents une fille 19 3 22 voulaient un garçon 3 23 26 Total 22 26 48 La question posée est de savoir si la méthode en question est efficace. Certaines des approches décrites ci-dessous sont erronées car elles ne testent pas l’hypothèse qu’on veut vraiment tester. Dites ce que chacune des approches ci-dessous teste. Exprimez les hypothèses en termes des paramètres de la loi multinomiale (48 ; p1 ; p2 ; p3 ; p4) dont les quatre effectifs sont une réalisation. a) Première approche On se base sur le fait que la méthode « a réussi » pour 32 des 48 couples et on teste l’hypothèse que la probabilité de réussite est ½. b) Deuxième approche On effectue un test d’indépendance sur le tableau ci-dessus, tel quel. c) Troisième approche On teste l’hypothèse que la probabilité de succès pour un couple qui veut un garçon est ½ et que la probabilité de succès pour un couple qui veut une fille est ½—un test du khi-deux à deux degrés de liberté. d) Quatrième approche On effectue un test d’indépendance sur un tableau constitué comme ceci : MAT1085.10.Sols.A12 11 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 12 Les parents Ont eu ce qu’ils N’ont pas eu ce Total voulaient qu’ils voulaient Les parents une fille 19 3 22 voulaient un garçon 23 3 26 Total 42 6 48 Voici une modélisation possible . On observe deux variables : X= Nombre de filles parmi ceux qui voulaient une fille Y= Nombre de filles parmi ceux qui voulaient un garçon X~(n1, ; p1) et Y ~ (n2 ; p2), où n1 = 22 et n2 = 26. L’hypothèse à tester est que la méthode utilisée n’est pas efficace. Il y a plusieurs façons d’exprimer cette hypothèse mathématiquement : a) L’une est Ho : p1 = p2. C’est un test d’indépendance calculé à partir du tableau suivant : Les parents ont eu une fille un garçon une fille 19 3 22 Les parents voulaient un garçon 3 23 26 22 26 48 La valeur de 2 est de 26,9, à 1 degré de liberté, ce qui est hautement significatif : la probabilité d’avoir une fille est bien supérieure chez ceux qui veulent une fille. La méthode semble donc avoir un effet. b) Une autre façon de faire est de considérer le nombre de couples Z qui ont réussi à avoir ce qu’ils voulaient. Z ~ (n ; p), où n = 48 et p est la probabilité d’avoir un enfant du sexe qu’on veut. On trouve 2 = 27, très significatif, puisque et le point critique est p = 0,0000002)On rejette encore. Remarque En posant Z ~ (n ; p), on a fait la supposition comme partie du modèle que les 48 épreuves ont toutes la même probabilité de succès. Or Z est une somme de deux variables de loi binomiale : Z = X + (26-Y), de probabilités p1 et 1-p2, respectivement. Pour voir ce que ceci pourrait avoir pour conséquence, supposons que les données avaient été plutôt celles-ci : Les parents ont eu une fille un garçon une fille 19 3 22 Les parents voulaient un garçon 16 10 26 35 13 48 On aurai eu 2 = 2,08 et on n’aurait pas rejeté Ho. On aurait donc conclu que la méthode n’est pas efficace, ce qui cache une vérité importante : la méthode est très efficace pour ceux qui veulent une fille. Une meilleure approche aurait été celle-ci : on teste l’hypothèse que la probabilité de succès est ½ chez ceux qui veulent une fille : 19 succès sur 22, ce qui donne 2 = 11,6 on rejette l’hypothèse. De même pour ceux qui veulent un garçon : 10 succès sur 26, ce qui donne 2 = 1,4, et ne nous permet pas de conclure que la probabilité de succès est différente de ½ chez ceux qui veulent un garçon. Nous pouvons cependant tester les deux hypothèses simultanément en sommant les deux valeurs de 2 : 11,6 + 1,38 = 13,0. On compare cette somme au point critique d’une khi-deux à 2 degrés de liberté qui est 5,99, et on rejette l’hypothèse que les deux probabilités sont égales à ½. 10.21 Une usine fabrique des vis qu'elle met dans des boîtes de 100. Soit X le nombre de vis défectueuses dans une boîte. Supposons qu'une longue expérience du procédé de fabrication a permis de dresser la fonction de masse suivante: x 0 1 2 3 4 5 6 Total Fréquence 0,13 0,27 0,27 0,18 0,09 0,04 0,02 1 Un nouveau procédé est considéré, et pour le tester on l'emploie à la fabrication de 100 boîtes de vis. On obtient la distribution suivante: x 0 1 2 3 4 5 6 Total Fréquence 30 21 13 15 12 5 4 100 Le patron de l'usine demande à deux statisticiens de tester l'hypothèse nulle selon laquelle "le nouveau procédé est pareil à l'ancien". Le statisticien A fait un test basé sur la proportion p de vis défectueuses parmi les 10 000 de l'échantillon. Le statisticien B fait un test basé sur le nombre moyen X de vis défectueuses par boîte. Effectuez les deux tests et commentez. Statisticien A Avec l'ancien procédé, le nombre moyen de vis défectueuses par boîte dans la population est µ = (0)(0,13) + (1)(0,27) + … + (6)(0,02) = 2,03, et donc la proportion de vis défectueuses est 2,03/100 = 0,0203. Nous voulons donc tester Ho: p = 0,0203, pˆ po où p est la proportion de vis défectueuses avec le nouveau procédé. L'échantillon donne p̂ = 0,0189. Alors Z = = po (1 po ) / n MAT1085.10.Sols.A12 12 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 13 0,0189 0,0203 = -0,9927, ce qui n'est pas significatif. On ne peut pas conclure que le nouveau procédé est (0,0203)(1 0,0203) /10000 différent de l'ancien. Statisticien B Avec l'ancien procédé, le nombre moyen de vis défectueuses par boîte dans la population est µ = (0)(0,13) + (1)(0,27) + … + (6)(0,02) = 2,03. Donc nous voulons tester Ho : µX = 2,03, où X est le nombre de vis défectueuses dans une boîte de x x 2,03 100 fabriquées selon le nouveau procédé. L'échantillon donne x = 1,89 et s = 1,774653. Donc t = = =1,774653/ 100 s/ n 0,78889, ce qui n'est encore pas significatif. Autre approche Finalement, on peut faire un test d'ajustement. Observées 13 27 27 18 9 4 2 Théoriques Point critique 2 6;0,05 30 21 13 15 12 5 4 = 12,59. = 34,57336 (p = 0,0000052) : certainement significatif. On rejette l'hypothèse que le nouveau 2 procédé est semblable à l'ancien. Commentaires La première approche est basée sur l'hypothèse que le nombre de vis défectueuses dans l'échantillon est une variable de loi binomiale avec n = 10 000. Mais la loi binomiale ne s'appliquerait que si les 10 000 épreuves étaient indépendantes, et dans ce cas-ci, cette hypothèse est discutable: il pourrait y avoir des dépendances entre les vis d'une même boîte. Ces dépendances tendent à augmenter la variance et donc la formule Var( p̂ ) = p(1-p)/n n'est plus valide. À titre d'exemple, considérons la distribution échantillonnale suivante: x 0 1 2 3 4 5 6 Effectif 40 20 9 Dans ce cas on a x = 1,7, s = 1,93, p̂ = 0,017. Alors Z = 9 12 pˆ po po (1 po ) / n 3 = -2,34 et t = 7 x s/ n 100 = - 1,71. Dans ce cas, le statisticien A rejetterait (à tort) Ho alors que B ne la rejetterait pas. L'approche du statisticien B et celle proposée ici sont correctes mais ne donnent pas le même résultat. Il n'y a pas nécessairement de contradiction. Le test d'ajustement est un test de l'hypothèse que la nouvelle distribution du nombre de défectuosités est identique à l’ancienne ; le statisticien B a simplement testé l'hypothèse que les moyennes sont égales. 10.22 Pour comparer deux marques de bière, on fait une expérience avec 100 amateurs de chaque marque. Chaque groupe affirme connaître la différence entre les deux et préférer nettement la leur. On demande à chaque sujet d’identifier sa préférence, après avoir goûté les deux. Voici les résultats : Habituellement boivent A B Total Ont préféré A 65 45 110 B 35 55 90 Total 100 100 200 a) Il n’y a pas de différence discernable entre les deux bières b) Les buveurs de la bière B ne peuvent pas distinguer entre les deux bières c) Les fidèles de la bière A discriminent mieux entre les deux marques que ceux de la bière B. Nous commençons par nommer les variables observées et les paramètres. Habituellement boivent A B Ont préféré A X1 ~ (100 ; p1) Y1 ~ (100 ; r1) B X2 ~ (100; p2) Y2 ~ (100 ; r2) 100 100 Notons que p2 = 1-p1 et que r2 = 1-r1. a) Une façon d’exprimer l’hypothèse nulle: la probabilité que les sujets choisissent leur propre bière (le succès) est ½. Soit Z = X1 + Y2 le nombre de succès pour les deux groupes. Sous l’hypothèse nulle, Z ~ (200 ; ½). Nous allons donc supposer que Z ~(200 ; p) et tester l’hypothèse que p = ½. Il s’agit d’un test d’uniformité avec les effectifs observés suivants : On choisi leur propre bière Ont choisi l’autre 120 80 La valeur de khi-deux est 2 = 8, ce qui dépasse de loin le point critique de 3,84 (p = 0,0047). Donc on rejette l’hypothèse que la probabilité qu’un sujet choisisse sa propre bière est ½. Elle est donc supérieure à ½, ce qui veut nécessairement dire qu’il y a une différence entre les deux bières. MAT1085.10.Sols.A12 13 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 14 b) c) Autre solution Remarquez l’énoncé du modèle : Z ~ (200 ; p). Un modèle doit décrire le contexte le plus fidèlement possible, avec un minimum de suppositions. Or ici, en supposant que Z suit une loi binomiale, nous supposons déjà que les deux groupes ont même probabilité de succès, ce qui n’est pas évident. Il est préférable de ne pas faire une telle supposition. Nous commençons donc avec le modèle stipulé dans le tableau ci-dessus. X1 ~ (100 ; p1) et Y2 ~ (100 ; r2). L’hypothèse que nous avons à tester est que p1 = ½ et que r2 = ½. Évidemment, on peut tester chacune des hypothèses séparément. Lorsqu’on teste l’hypothèse que p1 = ½, on a 2 = 9 (p = 0,002), ce qui est hautement significatif; lorsqu’on teste l’hypothèse r2 = ½, on a 2 = 1, ce qui n’est pas du tout significatif (p = 0,317). Nous avons deux réponses alors que nous n’avions qu’une question. Comment réunir les deux réponses? Il est permis d’additionner les deux valeurs de khi-deux et de comparer la somme à un point critique associé à 2 degrés de liberté. Ici, la somme est 10, le point critique est 5,99 (p = 0,0067). Donc on rejette l’hypothèse. Notre question porte sur la réussite du deuxième groupe. On observe donc Y2 ~ (100 ; r2), et on teste l’hypothèse que r2 = ½. La valeur de khi-deux est 2 = 1, ce qui n’est nullement significatif. On accepte l’hypothèse que les buveurs de la bière B ne peuvent pas distinguer l’une de l’autre. Nous voulons comparer le taux de succès des deux groupes. On a X1 ~ (100 ; p1), le nombre de succès dans le groupe A; et Y2 ~ (100 ; r2), le nombre de succès dans le groupe B. L’hypothèse à tester est p1 = r2. Il s’agit d’un test d’indépendance (attention à la construction du tableau). La valeur de khi-deux est 2 = 2,08, ce qui n’est pas supérieur au point critique de 3,84. 10.23 Pour comparer l’aptitude en mathématiques des Orientaux à celle des Américains de race blanche, Tsang [ The Mathematics Education of Asian Americans, Journal for Research in Mathematics Education 15, No. 2, 115-122] a examiné les résultats de 10 097 étudiants orientaux au test de mathématiques du SAT [Scholastic Aptitude Test]. La distribution des scores est donnée dans le tableau suivant, qui présente également la distribution, en fréquences, des scores des Américains de race blanche. Score Orientaux (effectif) Américains blancs (fréquence) 700 – 800 601 0,045 600 - 690 2001 0,172 500 – 590 3190 0,314 400 – 490 2788 0,301 300 – 390 1309 0,148 200 - 290 208 0,020 10 097 1 Y a-t-il une différence significative entre les Orientaux et les Américains de race blanche ? Effectifs observés et théoriques 700-800 600-690 500-590 400-490 300-390 Observés 601 2001 3190 2788 1309 Théoriques 454,365 1736,684 3170,458 3039,197 1494,356 2 = 131.06 ; p = pratiquement 0. On rejette l’hypothèse que la distribution des résultats est la même chez les orientaux et les blancs. Il est utile de remarquer que la différence est minime. Les graphiques suivants le confirment : 200-290 208 201,94 0,3500 0,3000 0,2500 0,2000 Asiatiques 0,1500 Blancs 0,1000 0,0500 250 350 450 550 650 750 Ce qui rend le résultat fortement significatif, c’est la grande taille de l’échantillon. La conclusion est non pas que la différence est énorme, mais qu’on est sûr qu’il y a bien une différence. 10.24 Au numéro précédent, les fréquences concernant les Américains de race blanche sont présentées comme si elles étaient fixes et connues pour la population entière, ce qui n’est pas en fait le cas. Elles sont basées sur un échantillon de 502 990 étudiants dont les effectifs, dans l’ordre des lignes du tableau ci-dessus, sont : 22 564 ; 86 521 ; 158 049 ; MAT1085.10.Sols.A12 14 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 15 151 466 ; 74 498 ; 9892. Utilisez ces données pour répondre à nouveau à la question posée au numéro précédent. Une discussion s’impose sur la relation entre les deux tests : Effectifs théoriques 700-800 600-690 Asiatiques 456 1742 Blancs 22709 86780 Tous 23165 88522 2 = 130.386 à 5 degrés de liberté ; p = pratiquement 0 500-590 3173 158066 161239 400-490 3036 151218 154254 300-390 1492 74315 75807 200-290 199 9901 10100 Tous 10097 502990 513087 a) Est-ce qu’on teste exactement la même chose dans les deux cas ? Non, on ne teste pas tout à fait la même chose. En a) on teste l’hypothèse que les fréquences sont 0,045 ; 0,172 ; 0,314 ; 0,301 ; 0,148 ; 0,020. Or cette hypothèse n’est intéressante que dans la mesure où elles correspondent à celle des blancs, ce qui est à peu près le cas, mais pas tout à fait : ce ne sont que des estimations des fréquences des blancs. b) Aurait-on pu prévoir que la conclusion n’aurait pas changé. Oui, on aurait pu le prévoir, les estimations des fréquences des blancs sont très sûres. c) Pourquoi la différence entre les valeurs de khi-deux calculées ici et au numéro précédent est-elle si minuscule ? 10.25 Aux deux numéros précédents, on aurait pu traiter les scores comme des variables quantitatives. Voici, approximativement, la moyenne et l’écart-type des scores pour les deux groupes : Groupe Moyenne Écart-type Orientaux SY = 115,7 X = 522,0 Américains blancs Sx = 112,5 Y = 510,5 a) Testez l’hypothèse que les moyennes des populations respectives sont égales. X Y Z= = 9,9, une différence très certainement significative. S / 10097 S / 502990 2 2 X Y b) Considérez que les résultats obtenus par les Orientaux proviennent d’une population de moyenne et testez l’hypothèse que = 510,5 (la moyenne des blancs). Ici on voit peut-être mieux que dans les problèmes précédents pourquoi cette approche est fautive. T X 510, 5 115, 7 / c) = 9,98, bien sûr encore fortement significatif. 10097 Confirmez, cependant, que la différence entre les tests en a) et b) est minuscule et expliquez pourquoi. Numériquement, d’abord : on voit que la quantité S / 502990 au dénominateur est minuscule, étant donnée l’importance de cet effectif, ce qui 2 Y fait que les deux quantités sont presque identiques. Il n’y a presque pas de différence entre tester que μ 1 = μ2 et tester μ1 = 510,5 parce que μ2 est presque certainement tout près de 510,2. Exercices théoriques 10.26Après avoir administré un test d’aptitude à un groupe de 100 sujets, on se propose de tester l’hypothèse que les questions 1 et 2 sont de Question 2 Correcte Incorrecte Total Correcte 22 35 57 Question 1 Incorrecte 11 32 43 Total 33 67 100 Les taux de succès aux questions 1 et 2 sont, respectivement, de 57% et de 33%. On ne peut pas faire un test d’égalité de proportions pour vérifier si la différence est significative, car il ne s’agit pas de deux échantillons indépendants : ce sont les mêmes sujets qui ont répondu aux deux questions. Désignons les 4 observations par X11 X12 X1. X21 X22 X2. n X.1 X.2 Ces quatre variables aléatoires suivent conjointement une loi (n ; p11, p12, p21, p22). a) Montrez que la distribution conditionnelle de X12 étant donné X12 + X22 = m est (m ; p12/(p12+ p21)). b) Formulez l’hypothèse nulle en fonction des paramètres de la distribution conditionnelle de X12 c) Effectuez le test à partir de la distribution conditionnelle de X12. 10.27L’objectif de cet exercice est montrer l’équivalence entre un certain test d’ajustement et un test sur une proportion. Considérons les do MAT1085.10.Sols.A12 15 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 16 Date du suicide 1 décembre – 31 mars 1 avril — 30 novembre Effectif 50 70 L’hypothèse nulle est que les suicides ne sont pas affectés par la saison. Soit X le nombre de suicides parmi 120 qui ont eu lieu entre le 1er décembre et le 31 mars. Alors X ~ (120 ; p), et l’hypothèse à tester est Ho : p 1/3 contre l’alternative H1 : p ≠ 1/3. Le test peut être basé sur la statistique Z = X n/3 n(1/ 3)(2 / 3) qui suit, sous Ho, une loi (0 ; 1). La région critique est |Z| > z/2. Mais le test peut aussi bien être basé sur Z2, et puisque Z2 ~ 2, on a aussi la région critique Z 2 > 12 . a) Vérifier numériquement que les deux tests sont équivalents. b) Vérifiez numériquement que Z 2 = c) 2 (Oi i 1 Ti )2 , la statistique utilisée dans ce chapitre pour faire un test Ti d’ajustement. Vérifiez en général que pour tester l'hypothèse H0 : p po, les région critiques |Z| > 1,96 avec Z X npo . npo (1 po ) et i1 2 (Oi Ti )2 2 > 1; Ti sont équivalents. 10.28 Supposons qu’on dispose de données provenant de 3 études indépendantes sur les suicides. La première étude, basée sur 120 cas de suicide, rapporte que 50 de ces suicides ont lieu entre le 1 er décembre et le 31 mars. La deuxième étude, basée sur 80 cas, rapporte que 15 de ceux-ci ont eu lieu entre le 1er janvier et la fin février. La troisième étude enfin, basée sur 90 cas, rapporte que 27 ont eu lieu entre 1er janvier et le 31 mars. Vous voulez savoir si la saison froide à un effet sur le taux de suicide. Faites un test avec 0,01, en employant l’ensemble des données à votre disposition que vous pouvez disposer comme suit Nombre de suicides en hiver ... ... sur un total de 1ère étude 50 120 2e étude 15 80 3e étude 27 90 L’hypothèse qu’on veut tester est l’hypothèse que les suicides ne sont pas affectés par la saison. a) En un premier temps, testez cette hypothèse trois fois, une fois dans le cadre de chaque étude. b) Maintenant montrez qu’on peut tester l’hypothèse globalement, en mettant ensemble les ressources des trois études. Il s’agit d’effectuer un test basé sur la somme des trois khi-deux calculés séparément: quelle est la région critique? Justifiez votre procédure. X1~ (120; p1), X2~ (80; p2), X3~ (90; p3) Ho: p1 1/3, p2 1/6, p3 1/4. ( pˆ i pio )2 (50 /120 1/ 3) 2 (27 / 90 1/ 4) 2 (15/80 1/ 6) 2 2 2 = = + + = 5,2. 3;0,01 = 11,3397. pio (1 pio ) / ni (1/ 4)(3/ 4) (1/ 3)(2 / 3) (1/ 6)(5/ 6) 90 120 80 On « accepte » Ho. On n'a pas de raison de croire que les suicides sont plus fréquents ou moins fréquents en hiver. 10.29 Montrez que dans un tableau 2 2, la statistique pour tester l'indépendance est égale à Z2, où pˆ1 pˆ 2 Z= 1 1 pˆ (1 pˆ ) n1 n2 La notation est définie ci-dessous : MAT1085.10.Sols.A12 16 21 octobre 2012 MAT1085 Chapitre 9 Tests du khi-deux 17 X1 X2 n p̂ n 1 - X1 n 2 - X2 n(1- p̂ ) n1 n2 n X1 X 2 , n n1 n2 . n 10.30 De très nombreuses études ont été effectuées dans le but de démontrer que les premiers-nés d’une famille sont d’un caractère distinct, plus conservateurs que la norme. L’une de ces études est basée sur le fait que lors de la condamnation de Louis XVI, les députés de la Convention nationale qui étaient en faveur de l’exécution étaient beaucoup plus souvent premiers-nés que les autres. Voici les données : En faveur de la guillotine Contre la guillotine Premiers-nés 182 67 249 Non premiers-nés 179 293 472 361 360 721 a) Montrez qu’un test du khi-deux (ou autre test) rejette effectivement l’hypothèse Ho qu’il n’y pas de relation entre l’ordre de naissance et l’attitude face au traitement à accorder à Louis XVI. b) Maintenant on vous propose de montrer que cette dépendance pourrait n’être qu’un artifice, dû, par exemple, au fait que les gens susceptibles de favoriser la guillotine auraient en moyenne moins d’enfants (bien qu’on serait mal pris s’il fallait expliquer pourquoi ce serait le cas). Supposons les distributions suivantes : Personnes en faveur de la guillotine (on traite les enfants uniques comme des premiers-nés) : 1 2 3 4 Nombre d’enfants 0,3 0,1 0,1 0,5 1 Proportion Personnes contre la guillotine : 4 5 6 Nombre d’enfants 0,1 0,4 0,5 1 Proportion Déterminer les effectifs théoriques. Pourquoi est-ce que ceux-ci contredisent la conclusion en a) ? 10.31 Le numéro précédent n’est qu’un exemple des nombreuses études destinées à tester H o. Puisqu’à chaque étude il y a une probabilité de rejeter Ho à tort, il n’est pas certain que le rejet observé dans l’exemple n’est pas un de ces rejets erronés. Il faut donc analyser l’ensemble des études du genre pour en arriver à un bilan global (on appelle cela une « méta-analyse »). C’est ce qu’a fait un chercheur, à partir d’un grand nombre d’études. Parmi les 196 études qu’il a examinées, il y en avait 72 qui rejetaient Ho (donc confirmaient l’existence d’un lien). Supposez que toutes les études ont été faites à un niveau = 0,05 et dites si l’ensemble des études permet de rejeter Ho. 10.32 Au numéro précédent, supposons qu’on ait retenu la valeur p de chacun des 196 tests, donc 196 nombres compris dans l’intervalle [0 ; 1], et que leur moyenne est de 0,07 avec leur écart type de 0,04. Sachant que sous H o ces nombres sont de loi uniforme sur [0 ; 1], testez Ho. 10.33 Une usine fabrique des vis qu’elle met dans des boîtes de 100. Soit X le nombre de vis défectueuses dans une boîte. Pour comparer deux procédés de fabrication, P 1 et P2, on les emploie à la fabrication de 100 boîtes chacun. Voici la distribution des X pour chacun des deux procédés : x 0 1 2 3 4 5 6 Total Effectif, procédé P1 13 27 27 18 9 4 2 100 Effectif, procédé P2 30 21 13 15 12 5 4 100 Le patron de l’usine demande à trois statisticiens de tester l’hypothèse, formulée vaguement comme « les deux procédés sont pareils ». Le statisticien A effectue un test d’indépendance à partir du tableau ci-dessus, tel quel. Le statisticien B considère qu’il a deux échantillons de 10 000 vis chacun et fait un test d’égalité de proportions. Le statisticien C, enfin, fait un test basé sur le nombre moyen de vis défectueuses par boîte. Effectuez les trois tests et commentez. Sont-ils tous valides ? pˆ1 X1 / n1, pˆ 2 X 2 / n2 , pˆ MAT1085.10.Sols.A12 17 21 octobre 2012