Réponses aux problèmes du chapitre 10

publicité
MAT1085
Chapitre 10 Tests du khi-deux
Solutions
10.1 Voici la répartition, selon le mois, de 1 855 décès choisis au hasard parmi tous les décès qui ont eu lieu en Amérique du Nord en
1976.
Mois
Jan
Fév. Mars Avril Mai
Juin
Juil. Août Sept. Oct. Nov. Déc. Total
Effectif
157
142
158
152
156
153
158
159
153
157
152
158
1855
a) Peut-on attribuer les différences uniquement au hasard ?
Dire que les différences sont attribuables entièrement au hasard c’est dire qu’en fait la probabilité qu’un décès ait lieu en un mois
donné est 1/12 (à peu près, puisque les mois ne sont pas tous de même longueur) :
Ho : p1 = p2 = … = p12 = 1/12
Sous cette hypothèse, les effectifs théoriques sont égaux :
157
142
158
152
156
153
158
159
153
157
152
158
obs
154,58
154,58
154,58
154,58
154,58
154,58
154,58
154,58
154,58
154,58
154,58
154,58
theo
On obtient 2 = 1,58, ce qui n’est pas significatif. Le point critique à 11 degrés de liberté est 19,68. Donc on ne peut pas
conclure qu’il y a des différences entre les mois quant à la fréquence des suicides.
b) Supposons que ces données vous aient été fournies par un assistant en qui vous n’avez pas trop confiance. Les données ont-elles
l’air d’avoir été manipulées?
La conclusion ci-dessus a été justifiée par le fait que la valeur de χ2 n’est assez grande pour conclure que les fréquences des mois
diffèrent de la fréquence théorique de 1/12. Mais en fait la valeur de 2 est si petite qu’elle est suspecte : la probabilité d’une
valeur aussi petite est 0,0005.
Remarque Nous avons exprimé l’hypothèse nulle en disant que les fréquences devraient être toutes égales à 1/12. En fait, pour
être plus exact, si le mois n’a pas d’impact sur les suicides, la probabilité d’un décès en un mois donné devrait être
proportionnelle à la longueur du mois :
Ho : p1 = 31/365 ; p2 = 28/365 ; …. ; p12 = 31/365.
Les effectifs théoriques seraient alors
157
142,0
158
152
156
153
158
159
153
157
152
158
obs
157,55 142,3
157,55 152,47 157,55 152,47 157,55 157,55 152,47 157,55 152,47 157,55
theo
On aurait eu 2 = 0,04352251, encore plus petit, donc encore plus conforme à l’hypothèse qu’il n’y a pas d’effet de mois.
10.2 Dans une étude célèbre, des données ont été prélevées sur 6 587 suicides en France. Voici la distribution des suicides selon le jour de
la semaine:
Jour
Lundi
Mardi
Mercredi
Jeudi
Vendredi
Samedi
Dimanche
Total
Effectif
1 001
1 035
982
1 033
905
737
894
6 587
a) Testez l’hypothèse que les suicides se répartissent uniformément sur les jours de la semaine.
Les observations X = (X1 , ... , X7) sont une réalisation d’une variable (vectorielle) de loi (6587; p1, .. . , p7). Ho : les suicides
se répartissent uniformément sur les jours de la semaine, ce qui se traduit par:
Ho: p1 = 1/7 ... , p7 = 1/7.
Les effectifs théoriques sont
T1 = E(X1|p1= 1/7) = 6587(1/7) = 941,

T7 = E(X7|p7 = 1/7) = 6587(1/7) = 941.
La statistique est
2 =
(1001  941) 2
941
+…+
(894  941)2
941
= 71,947;
 = 6; point critique: 12,59. Puisque 71,947 >> 12,59 (p  0), on peut certainement rejeter l’hypothèse d’uniformité: le
tableau des effectifs observés est trop éloigné des effectifs auxquels on s’attend sous l’hypothèse nulle. On conclut avec confiance que les suicides ne sont pas aussi fréquents tous les jours de la semaine.
b) Selon une certaine conjecture, les taux de suicides diminuent à l’approche d’un week-end. Plus précisément, le taux quotidien
global pour l’ensemble des jours du vendredi au dimanche est inférieur au taux quotidien global pour l’ensemble des jours du
lundi au jeudi. Les données appuient-elles cette conjecture?
On effectue un test d’ajustement:
Lundi à jeudi
Vendredi à dimanche
Total
Observés
4051
2536
6587
Théoriques
3764
2823
6587

2 = 51,06;  = 1; point critique: 3,84 (p  0). On rejette certainement l’hypothèse; on conclut que les suicides sont plus
probables en semaine.
c) Testez l’hypothèse que chacun des jours du lundi au jeudi a le même taux de suicides.
On fait un test d’uniformité sur les effectifs observés suivants (l’effectif théorique est 1012,75):
MAT1085 Chapitre 9 Tests du khi-deux 2
Lundi
Mardi
Mercredi
Jeudi
Total
Observés
1001
1035
982
1033
4051

2 = 1,96;  = 3; point critique: 7,82 (p = 0,58). On ne peut pas rejeter l’hypothèse que les quatre jours de la semaine ont la
même probabilité de provoquer un suicide.
d) Testez l’hypothèse que chacun des jours du vendredi au dimanche a le même taux de suicides.
On fait un test d’uniformité sur les effectifs observés suivants (l’effectif théorique est 845,33):
Vendredi
Samedi
Dimanche
Total
Observés
905
737
894
2536

2 = 20,9;  = 2; point critique: 5,99 (p = 0,000029). On peut rejeter l’hypothèse que les trois jours du weekend ont la même
probabilité de provoquer un suicide.
e) Essayez de résumer en une phrase ou deux l’ensemble des conclusions tirées ci-dessus.
Donc en définitive, on peut dire que les jours de la semaine provoquent plus de suicides que le week-end; que les jours de la
semaine sont comparables entre eux; alors que les jours du week-end sont différents les uns des autres.
10.3 Un sociologue s’intéresse à la relation entre la couleur de la peau et la mobilité professionnelle. Il prélève un échantillon de 94
personnes de peau pâle, 175 personnes de peau moyenne, et 80 personnes de peau brune. Il construit une mesure de mobilité à l’aide
de quoi il classifie ses sujets selon leur mobilité. Voici les résultats.
Couleur de la peau
Mobilité
Pâle
Moyenne
Brune
Total
Grande
35
84
51
170
Faible
59
91
29
179
Total
94
175
80
349
Tester l’hypothèse qu’il n’y a aucune relation entre la couleur de la peau et la mobilité professionnelle avec   0,05.
Le modèle est le suivant: nous observons 3 vecteurs aléatoires, X, Y et Z, les trois de loi multinomiale. Dans l’ordre dans lequel les
observations sont disposées dans le tableau, ce sont:
Grande
X1
Y1
Z1
170
Faible
X2
Y2
Z2
179
On que
X ~ (170; p1, p2)
Y ~(179; r1, r2)
Z ~ (349; s1, s2)
Ho : la couleur de la peau n’influence pas la mobilité professionnelle, et donc que
p1 = r1 = s1; et p2 = r2 = s2
On estime ces deux probabilités communes par 170/349 = 0,4871 et 179/349 = 0,5129, respectivement. Ce qui donne, pour les 94
sujets de peau pâle, les effectifs théoriques (0,4871)(94) = 45,79; et (0,5129)(94) = 48,21. On obtient de cette manière, le tableau
des effectifs théoriques suivants:
Mobilité
Pâle
Moyenne
Brune
Total
Grande
45,79
85,24
38,97
170
Faible
48,21
89,76
41,03
179
Total
94
175
80
349
Point critique: 5,99. 2 = 12,23;  = 2. Puisque 12,23 > 5,99 (p = 0,0022), on rejette l’hypothèse que la couleur de la peau n’influence pas la mobilité professionnelle, pour conclure que la couleur de la peau a un lien avec la mobilité professionnelle.
Pour avoir une idée du type de relation qu’il pourrait y avoir, on calcule les distributions conditionnelles:
Pâle
Moyenne
Brune
Total
Grande
37,2%
48,0%
63,8%
48,7%
Faible
62,8%
52,0%
36,3%
51,3%
100%
100%
100%
100%
Il semble que plus la peau est foncée, plus la mobilité est grande.
10.4 Dans une étude sur l’absentéisme scolaire, une des causes d’absence est d’ordre non volontaire: décès, maladie, fatigue excessive,
traitement médical. Parmi les 642 répondants à un questionnaire sur les motifs d’absence, 200 se classent dans cette catégorie. On a
classifié ces 200 répondants selon le sexe et la cause.
Décès
Maladie
Fatigue
Traitement médical
Garçons
4
39
25
18
Filles
7
56
32
19
Ces types de causes d’absence sont-ils liés au sexe?
Le tableau suivant présente une notation des variables du modèle :
MAT1085.10.Sols.A12
2
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 3
Décès
Maladie
Fatigue
Trait,
Total
Garçons
X1
X2
X3
X4
n1
Filles
Y1
Y2
Y3
Y4
n2
X = (X1,X2,X3,X4) ~ (n1; p1, p2, p3,p4) et Y = (Y1,Y2,Y3,Y4) ~ (n2; r1,r2, r3,r4). L’hypothèse à tester est Ho : p1 = r1, p2 = r2, p3 = r3,
p4 = r4. C’est un test d’indépendance. Les effectifs théoriques sont
Décès
Maladie
Fatigue
Trait,
Total
Garçons
4,73
40,85
24,51
15,91
86
Filles
6,27
54,15
32,49
21,09
114
11
95
57
37
200
2 = 0,84 à 3 degrés de liberté. Le point critique est 7,815 (p = 0,8399). On ne rejette pas l’hypothèse nulle : on n’a donc pas de
raison de croire qu’il y a une différence entre filles et garçons dans les motifs d’absence.
10.5 Un sociologue a fait subir un test d’estime de soi à 3 750 américains de 3 religions différentes. Voici les résultats
Religion
Protestante
Catholique
Juive
Total
Estime
Forte
1 191
988
435
2 614
de soi
Faible
517
493
126
1 136
1 708
1 481
561
3 750
a) Calculez, pour chaque religion, le pourcentage des sujets qui ont une forte estime de soi.
Voici les pourcentages de personnes avec une forte estime de soi, par religion:
Protestants Catholiques
Juifs
69,7%
66,7%
77,5%
Assez semblables pour les Protestants et Catholiques.
b) Les différences entre ces pourcentages sont-elles significatives?
Il s’agit de faire un test d’indépendance. Voici les effectifs théoriques:
Est de soi Protestants Catholiques
Juifs
Total
Forte
1190,6
1032,4
391,0
2614
Faible
517,4
448,6
170,0
1136
Total
1708
1481
561
3750
On a 2 = 22.59373, ce qui est hautement significatif, car le point critique est 5,99 . (La p-valeur, ou niveau de signification,
c’est-à-dire, la probabilité d’une valeur aussi extrême de 2 sous Ho, est 0,0000124). On conclut avec confiance que l’estime de
soi diffère selon qu’on est Protestant, Catholique ou Juif, comme le montrent d’ailleurs les distributions conditionnelles.
c) La différence entre les catholiques et les protestants est-elle significative?
Voici le tableau des effectifs observés, avec seuls les Catholiques et les Protestants:
Estime de soi
Protestants
Catholiques
Total
Forte
1191
988
2179
Faible
517
493
1010
Total
1708
1481
3189
Effectifs théoriques:
Estime de soi
Protestants
Catholiques
Total
Forte
1167,05
1011,95
2179
Faible
540,95
469,05
1010
Total
1708
1481
3189
Point critique: 3,84. 2 = 3,34;  = 1; p = 0,0676. On ne peut pas rejeter l’hypothèse nulle: on ne peut pas conclure qu’il y a
une différence entre Protestants et Catholiques.
d) En mettant les protestants et les catholiques ensemble, trouvez-vous ceux-ci différents des juifs?
Voici les effectifs observés, Catholiques et Protestants réunis:
Estime de soi
Protestants et Catholiques
Juifs
Total
Forte
2179
435
2614
Faible
1010
126
1136
Total
3189
561
3750
Effectifs théoriques:
Estime de soi
Protestants et Catholiques
Juifs
Total
Forte
2222,9
391,05
2614
Faible
966,05
169,95
1136
Total
3189
561
3750
Point critique: 3,84. 2 = 19,17;  = 1; p = 0,00001957.
On rejette l’hypothèse nulle, et on conclut que les Juifs ont une estime de soi différente de celles des Catholiques ou Protestants.
e) Résumez vos conclusions.
MAT1085.10.Sols.A12
3
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 4
Il n’y a pas de différence entre Catholiques et Protestants. Mais il y a une entre Protestants et Catholiques d’une part, et Juifs
d’autre part: une plus forte estime de soi parmi les derniers.
10.6 Les données du numéro précédent sont celles de la population générale. Les données dans le tableau suivant portent sur une souspopulation: ceux qui n’ont pas complété l’école secondaire.
Religion
Protestante
Catholique
Juive
Total
Estime
Forte
330
234
89
653
de soi
Faible
152
91
37
280
482
325
126
933
Les conclusions sont-elles les mêmes ici?
Voici le tableau des effectifs théoriques :
Esime de soi
Protestants
Catholiques
Juive
Total
Forte
337,3
227,5
88,2
653
Faible
144,7
97,5
37,8
280
Total
482
325
126
933
La valeur de khi-deux est  = 1,18, à 2 degrés de liberté, ce qui n’est nullement significatif, puisque le point critique est de 5,99 (et
p = 0,5532). Donc il ne semble pas y avoir de différence entre les religions, contrairement aux résultats du numéro précédent, dans
lequel la conclusion était que les Juifs avaient une estime de soi supérieure à celle des autres. On pourrait être tenté de conclure que
cette supériorité s’estompe chez les Juifs peu scolarisés (ils ne s’aiment que s’ils sont instruits). Mais il faut se méfier de conclusions trop hâtives, car il faut se rappeler que les effectifs ici sont moins importants, ce qui rend plus difficile la détection des
différences. En d’autres termes, il est possible que les Juifs aient quand même une plus forte estime de soi, mais que la différence
n’est pas détectée. Cette conclusion est peu vraisemblable, cependant, à la lumière des fréquences conditionnelles, que voici :
Esime de soi
Protestants
Catholiques
Juive
Total
Forte
68,5%
72,0%
70,6%
70,0%
Faible
31,5%
28,0%
29,4%
30,0%
Total
100%
100%
100%
100%
On voit dont que les Juifs ont une estime de soi qui se situe entre celle des Protestants et celle des Catholiques.
10.7 Une équipe de chercheurs dispose de données sur une population d’accidents: l’ensemble de tous les accidents qui ont eu lieu au
Québec en l980 et qui ont entraîné des blessures corporelles. Pour la plupart des variables, il était aisé d’obtenir les données pour la
population entière. Pour certaines autres variables, comme celles qui identifiaient la position exacte du véhicule lors de l’accident, il
était difficile d’en déterminer les valeurs et on ne pouvait se permettre de le faire pour la population entière. Il a donc fallu prélever
un échantillon pour étudier la distribution de ces variables là. On a prélevé un échantillon de 600 accidents. Malheureusement,
l’échantillon n’a pas été prélevé de façon purement aléatoire, ce qui faisait douter de sa représentativité. Pour étudier la question de la
représentativité, on a choisi une variable particulière, la variable "gravité de la blessure", dont on connaissait la distribution pour la
population entière ainsi que pour l’échantillon. Formulez convenablement l’hypothèse que l’échantillon est représentatif et testez-la.
Les distributions sont :
Blessure
mortelle
très grave
grave
pas grave
Total
Fréquence dans la population
0,20
0,30
0,30
0,20
1
Fréquence dans l’échantillon
0,10
0,30
0,40
0,20
1
Nous observons un vecteur X = (X1, X2, X3, X4) de loi (600 ; p1, p2; p3; p4). Si les tirages ont été faits au hasard, alors les
probabilités de sélection des différents types de blessure devraient être égales aux fréquences dans la population. Donc l’hypothèse
nulle, que les tirages sont faits au hasard, est Ho :p1 = 0,20; p2 = 0,30; p3 = 0,30 ; p4 = 0,20. Les valeurs observées et théoriques
sont :
Blessure
mortelle
très grave
grave
pas grave
total
Observés
60
180
240
120
600
Théoriques
120
180
180
120
600
La valeur de khi-deux est 2 = 50 avec 3 degrés de liberté; c’est très significatif, puisque le point critique est 7,81(p = 7,99/1011).
Les résultats sont loin de ce qu’ils devraient être sous la supposition que l’échantillon a été tiré au hasard. On est donc sûr qu’il y a
un défaut dans le mode de tirage.
10.8 Déterminez s’il y a un lien entre le type de tumeur cérébrale, et son site. On distingue trois types de tumeurs
A1 : tumeurs bénignes ; A2 : tumeurs malignes ; A3 : autres tumeurs
et les sites sont
B1 : lobes frontaux ; B2 : lobes temporaux ; B3 : autres régions cérébrales
Les données sont présentées dans le tableau suivant :
MAT1085.10.Sols.A12
4
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 5
B2
B3
B1
23
21
34
78
A1
9
4
24
37
A2
6
3
17
26
A3
38
28
75
141
10.9 [Données du tableau A.8] Faites un test permettant de confirmer ou d’infirmer l’affirmation suivante : il y a une
relation entre le fait de croire en l’astrologie et le fait de croire en l’évolution. Il y a plusieurs façons de procéder. Vous
devrez exprimer l’hypothèse nulle formellement. Vous pouvez décider de grouper les catégories, mais justifiez votre
décision.
Les données sont rassemblées de façon à obtenir des effectifs théoriques suffisants et nous avons aussi éliminés ceux qui refusent de répondre. La
valeur « 1 » signifie une attitude négative face à l’astrologie (variable Astro) et favorable à la théorie de l’évolution (variable Singe.)
Astro
Singe 1 2 3
1
14 12 16 42
2
7 10 22 39
3
5 8 12 25
26 30 50 106
Distributions conditionnelles de la variable Astro étant donné Singe
Astro
Singe
1
2
3
1 0.333 0.286 0.381 1
2 0.179 0.256 0.564 1
3 0.200 0.320 0.480 1
Curieusement, il semble que ceux qui croient que l’astrologie est une ânerie ne sont pas ceux qui croient le plus fermement en la théorie de
l’évolution.
Effectifs théoriques
1
2
3
1 10.302 11.887 19.811 42
2 9.566 11.038 18.396 39
3 6.132 7.075 11.792 25
26.000 30.000 50.000 106
2 = 3,887 à 4 degrés de liberté. p = 0,421
On ne peut pas rejeter l’hypothèse d’indépendance. Les constatations faites ci-dessus sont peut-être fortuites.
10.10[Données du tableau A.8] Faites un test permettant de confirmer ou d’infirmer l’affirmation suivante : Il y a une relation entre le fai
grouper les catégories, mais justifiez votre décision.
Les données sont rassemblées de façon à obtenir des effectifs théoriques suffisants. On a aussi éliminé ceux qui refusent de répondre. La valeur « 1 »
signifie une attitude négative face à l’astrologie (variable Astro) et favorable à l’idée que la ligne de vie est liée à la durée de vie (variable Paume.)
Astro
Paume 1 2 3
1 0 4 9 13
2 2 10 14 26
3 19 10 18 47
21 24 41 86
Distributions conditionelles de la variable Astro étant donné Paume
Astro
Paume
1
2
3
1 0.000 0.308 0.692 1
2 0.077 0.385 0.538 1
3 0.404 0.213 0.383 1
Généralement parlant, une croyance à la signification de la ligne de vie est accompagnée d’une plus grande tolérance de l’astrologie.
Effectifs théoriques
1
2
3
1 3.174 3.628 6.198 13
2 6.349 7.256 12.395 26
3 11.477 13.116 22.407 47
21
24
41
86
2 = 15.24295, 4 degrés de liberté, p = 0,004
La relation est nettement significative.
10.11[Données du tableau A.8] Faites un test permettant de confirmer ou d’infirmer l’affirmation suivante : les gens qui pratiquent leur reli
Les données sont rassemblées de façon à obtenir des effectifs théoriques suffisants. On a aussi éliminé ceux qui refusent de répondre. La valeur « 1 »
signifie une attitude négative face au mariage avec une personne d’une autre religion (variable Religion) et une fréquentation active à l’église
(variable Église.)
MAT1085.10.Sols.A12
5
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 6
Église
1 2 3
5 2 21 28
5 2 10 17
9 11 47 67
19 15 78 112
Distributions conditionnelles de « Religion » étant donné « Église »
Église
Religion
1
2
3
1 0.263 0.133 0.269
2 0.263 0.133 0.128
3 0.474 0.733 0.603
1
1
1
Ceux dont les pratiques religieuses sont modérées sont ceux qui épouseraient le plus volontiers une personne d’une autre religion.
Effectifs théoriques
1
2
3
1 4.750 3.750 19.500 28
2 2.884 2.277 11.839 17
3 11.366 8.973 46.661 67
19.000 15.000 78.000 112
2 = 3.77, 4 degrés de liberté, p = 0,438.
Religion
1
2
3
10.12Un psychologue prétend pouvoir décider si un sujet est schizophrène ou pas en examinant son Électroencéphalogramme (EEG). Po
correctement classifiés comme schizophrènes et 2 correctement classifiés comme normaux. Deux étudiants A et B se
proposent de tester l’hypothèse que l’EEG ne fournit au psychologue aucune information sur la schizophrénie.
A - L’étudiant A traite le nombre de diagnostics corrects comme une variable binomiale avec n  50 et teste
l’hypothèse que p  1/2 (Ayant observé X  34 succès il rejette cette hypothèse et conclut que l’EEG est un bon
indice de la schizophrénie)
B- L’étudiant B dresse les tableaux suivants :
Effectifs observés
Effectifs théoriques
Classification du
Classification du
psychologue
psychologue
État du
État du
Correcte
Incorrecte
Correcte Incorrecte
patient
patient
Schizo.
32
8
40
Schizo.
27,2
12,8
40
Normal
2
8
10
Normal
6,8
3,2
10
34
16
50
34
16
50
Il fait ensuite le test d’indépendance classique. Dites pourquoi les deux étudiants se trompent et faites le test
correctement.
Voici une modélisation correcte . On observe deux variables :
X= Nombre de sujets déclarés schizophrènes parmi les vrais schizophrènes
Y= Nombre de sujets déclarés schizophrènes parmi les non schizophrènes
X~(n1, ; p1) et Y ~ (n2 ; p2), où n1 = 40 et n2 = 10. L’hypothèse à tester est Ho : p1 = p2. C’est un test d’indépendance calculé à partir du tableau
suivant :
Le sujet est classé
Schizophrène
Non Schizophrène.
Schizophrène.
X = 32
n1 – X= 8
n1 = 40
Le sujet est
Non schizophrène
Y=8
n2 - Y = 2
n2 = 10
Les effectifs théoriques sont identiques aux effectifs observés, la valeur de 2 est 0, et évidemment on ne peut pas rejeter l’hypothèse
d’indépendance : on accepte l’hypothèse que p1 = p2 et on conclut que le psychologue ne peut pas détecter la schizophrénie par l’EEG.
L’étudiant A a observé le nombre Z de bonnes réponses parmi 50. Il a supposé que Z suit une loi binomiale, ce qui est déjà une erreur. Il y a 2 séries
d’épreuves : une série de 40 épreuves avec des schizophrènes ; et une série de 10 épreuves avec des non schizophrènes. La probabilité de succès (un
diagnostic correct) n’est pas nécessairement la même dans les deux séries. Et l’hypothèse que p = ½ n’est pas l’hypothèse qu’on veut tester, car il se
peut que p > ½ sans que le psychologue ait la moindre capacité de détecter la schizophrénie. C’est bien le cas ici : il semble avoir une forte tendance à
déclarer les gens schizophrènes, et ce qui explique son grand nombre de succès, c’est le grand nombre de schizophrènes dans l’échantillon.
L’étudiant B, lui, fait un test correct, mais il ne teste pas la bonne hypothèse : il teste l’hypothèse que la probabilité de succès est la même, que le sujet
soit schizophrène ou non. Il conclut que non, la probabilité n’est pas la même dans les deux cas : elle est plus forte chez les schizophrènes, ce qui
reflète encore une fois le fait que le psychologue a tendance à conclure que les sujets sont schizophrènes.
10.13 On examine les deux premières questions d’un test psychologique en étudiant les résultats obtenus par 80 sujets sur ces deux
questions. Parmi ces 80 sujets, 30 ont répondu correctement aux deux questions, 21 ont répondu incorrectement aux deux questions,
9 ont répondu correctement à la première et incorrectement à la deuxième, et 20 ont répondu incorrectement à la première et
correctement à la deuxième. Trois hypothèses sont formulées ci-dessous. Pour chacune d’elles, dites si vous pouvez la tester avec les
données à votre disposition. Si oui, testez-la, après l’avoir formulée correctement. Sinon, expliquez pourquoi les techniques que
vous connaissez ne s’appliquent pas.
MAT1085.10.Sols.A12
6
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 7
HA: La moitié de la population est capable de répondre à la question 1.
Il s’agit d’un test d’ajustement sur la distribution suivante:
Question 1 réussie
Question 1 manquée
Total
Effectif observé
39
41
80
Effectif théorique
40
40
80
2 = 0,05;  = 1; point critique: 3,84 (p = 0,823). Nous ne pouvons pas conclure que la proportion des gens qui sont capables de
répondre à la première question est différente de 50%.
HB: Les deux questions mesurent des choses différentes; elles n’ont rien à voir l’une avec l’autre; elles sont
indépendantes; on peut être bon dans l’une et pas dans l’autre.
Ho : la probabilité de réussir la question 2 ne dépend pas du résultat de la question 1. En d’autres termes, il s’agit de tester
l’indépendance dans le tableau des effectifs observés suivant:
Q2 réussie
Q2 manquée
Total
Q1 réussie
30
9
39
Q1 manquée
20
21
41
Total
50
30
80
Les effectifs théoriques sont:
Effectifs observés
Q2 réussie
Q2 manquée
Total
Q1 réussie
24,375
14,625
39
Q1 manquée
25,625
15,375
41
Total
50
30
80
2 = 6,75;  = 1; point critique: 3,84 (p = 0,009). On rejette l’hypothèse que les deux questions sont indépendantes; on peut
conclure que la réussite dans l’une entraîne une plus forte probabilité de réussite dans l’autre. Les distributions conditionnelles suivantes le montrent.
Effectifs observés
Q2 réussie
Q2 manquée
Total
Q1 réussi
77%
23%
100%
Q1 manquée
49%
51%
100%
HC: Les deux questions sont de même difficulté.
La théorie étudiée jusqu’ici ne permet pas de tester cette hypothèse.
10.14 Pour savoir si une certaine maladie est aussi fréquente chez les hommes que chez les femmes, un chercheur prélève un échantillon de
450 hommes et 450 femmes. Il trouve que 100 hommes et 85 femmes sont atteints de la maladie. Testez l’hypothèse que les
hommes et les femmes sont également vulnérables à la maladie.
Pour tester la même hypothèse, un autre chercheur procède différemment. Il prélève un échantillon de 900 personnes atteintes de la
maladie. Parmi celles-ci, il trouve qu’il y a 420 femmes et 480 hommes. Testez l’hypothèse avec ces données.
La deuxième expérience fournit moins d’information que la première. Comment se fait-il qu’on peut s’en tirer quand même?
Voici les données sous forme de tableau :
Malades
Pas malades
Total
Hommes
100
350
450
Femmes
85
365
450
Total
185
715
900
Nous avons deux binomiales, X~(450; p1), le nombre de malades parmi les hommes, et Y ~ (450; p2), le nombre de malades
parmi les femmes. L’hypothèse à tester est Ho : p1 = p2. C’est donc un test d’indépendance. Les effectifs théoriques sont :
Malades
Pas malades
Total
Hommes
92,5
357,5
450
Femmes
92,5
357,5
450
Total
185
715
900
On a 2 = 1,53,  = 1 (p = 0,216). Le point critique étant 3,84, on ne rejette pas l’hypothèse nulle, et on ne peut pas conclure qu’il y
une différence entre hommes et femmes quant à leur vulnérabilité à la maladie en question.
Le deuxième chercheur observe Z, le nombre de femmes parmi 900 personnes atteintes de la maladie. Alors Z ~ (900 ; p).
L’hypothèse que les femmes ne sont ni plus ni moins vulnérables que les hommes devrait signifier que parmi les malades on ne
devrait trouver ni plus ni moins de femmes que dans la population générale. Faisant la supposition que dans la population générale,
la proportion des femmes est d’environ ½ , il conclut que l’hypothèse à tester est Ho : p = ½. C’est donc un test d’uniformité :
Femmes
Hommes
Observés
420
480
900
Théoriques
450
450
900
La valeurs de khi-deux est 2 = 4, ce qui, à 1 degré de liberté, est significatif, puisque le point critique est 3,84 (p = 0,0455).
La seule raisons pour laquelle on a pu faire un test avec moins d’information, c’est qu’on utilisé une donnée supposée connue
: qu’il y a 50% de femmes dans la population.
10.15 Pour savoir s’il y a de la discrimination contre les femmes, on prélève les données suivantes sur 1 200 demandes d’admission aux
deux universités d’une ville.
MAT1085.10.Sols.A12
7
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 8
Résultat de la demande
Acceptée
Refusée
Total
Sexe de
Masculin
416
184
600
l’individu
Féminin
184
416
600
Total
600
600
1 200
Peut-on conclure qu’il y a de la discrimination contre les femmes? Voici les données sur les mêmes 1 200 candidatures, réparties
cette fois selon l’université à laquelle la demande est adressée.
Université A
Résultat de la demande
Acceptée
Refusée
Total
Sexe de
Masculin
8
92
100
l’individu
Féminin
92
408
500
Total
100
500
600
Sexe de
l’individu
Université B
Résultat de la demande
Acceptée
Refusée
408
92
92
8
500
100
Masculin
Féminin
Total
Total
500
100
600
Vos conclusions changent-elles?
Voici les distribution conditionnelles:
Masculin
Féminin
Total
Acceptée
69%
31%
50%
Refusée
31%
69%
50%
Total
100%
100%
100%
Masculin
Féminin
Total
Acceptée
8%
18%
17%
Refusée
92%
82%
83%
Total
100%
100%
Université A
Université B
Acceptée
Refusée
Total
Masculin
82%
18%
100%
Féminin
92%
8%
100%
Total
83%
17%
100%
Aux deux universités, le taux d’acceptation est meilleur chez les femmes; mais globalement, c’est chez le hommes que le taux d’acceptation est meilleur. C’est que les femmes sont très nombreuses à faire des demandes à l’université A, et celle-ci a un très bas taux
d’acceptation.
10.16 On classifie 661 finissants d’une université d’après les secteurs d’emploi et la discipline. Voici les données:
Grandes
Fonction
Enseignement
P.M.E.
corporation
publique
s
Génie
25
40
10
80
155
Sciences physique
38
40
25
75
178
Sciences humaines
51
45
15
78
189
Lettres
65
50
4
20
139
Total
179
175
54
253
661
Y a-t-il une relation entre la discipline et le secteur d’emploi?
C'est un test d'indépendance. Voici le tableau des effectifs théoriques:
Fonction
Grandes
Enseignement
P.M.E
Total
publique
corporations
Génie
41,974
41,036
12,663
59,327
155
Sciences physiques
48,203
47,126
14,542
68,130
178
Sciences humaines
51,182
50,038
15,440
72,340
189
Lettres
37,641
36,800
11,356
53,203
139
Total
179
175
54
253
661
MAT1085.10.Sols.A12
8
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 9
Le point critique à 5% et 9 degrés de liberté est 16,9190. Puisque 2 = 77,17 (p = 5,8710-13), on rejette certainement l'hypothèse
que le secteur d'emploi et la discipline sont des variables indépendantes.
10.17 Le tableau ci-dessous donne, pour une population de 87 627 mariages qui ont eu lieu au Canada en 1974, la distribution de la religion
de l’époux et de la religion de l’épouse.
Religion de l’épouse
Catholique
Anglicane
Baptiste
Église Unie
romaine
Religion Anglicane
7504
701
4731
4 680
17 616
de
Baptiste
710
2222
992
1 050
4 974
l’époux
Catholique romaine
4589
914
26919
6 044
38 466
Église Unie
4247
932
6143
15 249
26 571
Total
17 050
4 769
38 785
27 023
87 627
a) Dressez un tableau qui expose clairement la forte dépendance entre ces deux variables.
Voici un tableau qui présente les distributions conditionnelles:
Anglican
Baptistes
Catholiques
Église-Unie
Anglican
42,6%
4,0%
26,9%
26,6%
100%
Baptistes
14,3%
44,7%
19,9%
21,1%
100%
Catholiques
11,9%
2,4%
70,0%
15,7%
100%
Église-Unie
16,0%
3,5%
23,1%
57,4%
100%
Total
19,5%
5,4%
44,3%
30,8%
b) Testez l’hypothèse que 50% des femmes Baptistes épousent des coreligionnaires.
Il s’agit de faire un test d’ajustement:
Épousé un
Pas épousé un
Total
coreligionnaire
coreligionnaire
Observés
2222
2547
4769
Théorique
2384,5
2384,5
4769
La valeur de 2 est 22,15, certainement significatif à 5% (p = 0,00000252).
c)
Testez l’hypothèse que 50% des mariages entre catholiques et baptistes sont des mariages entre un homme catholique et une
femme baptiste.
Ho : dans les mariages entre catholiques et baptistes, ceux où le mari est catholique sont aussi fréquents que ceux où la femme
est catholique. Il faut faire un test d’ajustement:
Homme catholique, femme
Homme baptiste, femme
Total
baptiste
catholique
Observés
914
992
1906
Théorique
953
953
1906
La valeur de khi-deux est 3,19 à 1 degré de liberté (p = 0,074). Le point critique à 5% étant 3,84, on ne rejette pas
l’hypothèse.
d) Testez l’hypothèse que la probabilité qu’un homme épouse une coreligionnaire est la même pour les 4 religions représentées.
Le test est basé sur le tableau suivant:
Religion de
A épousé une
N’a pas épousé une
Total
l’époux
coreligionnaire
coreligionnaire
Anglican
7504
10112
17616
Baptiste
2222
2752
4974
Catholique
26919
11547
38466
Église Unie
15249
11322
26571
Total
51894
35733
87627
Voici le tableau des effectifs théoriques:
Religion de
A épousé une
N’a pas épousé une
Total
l’époux
coreligionnaire
coreligionnaire
Anglican
10432,5
7183,5
17616
Baptiste
2945,7
2028,3
4974
Catholique
22780,1
15685,9
38466
Église Unie
15735,7
10835,3
26571
Total
51894
35733
87627
2 = 4332;  = 3; point critique: 7,814 (p  0). La tendance à épouser une coreligionnaire dépend très certainement de la
religion (elle varie d’une religion à l’autre). Les distributions conditionnelles (ci-dessous) montrent, entre autre, que le
pourcentage de mariages à des coreligionnaires est beaucoup plus élevé chez les catholiques; particulièrement faible chez les
Anglicans et les Baptistes.
MAT1085.10.Sols.A12
9
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 10
A épousé une
N’a pas épousé une
Total
coreligionnaire
coreligionnaire
Anglican
42,6%
57,4%
100,0%
Baptiste
44,7%
55,3%
100,0%
Catholique
70,0%
30,0%
100,0%
Église Unie
57,4%
42,6%
100,0%
Total
59,2%
40,8%
100,0%
10.18 La distribution suivante a été dressée par Haberman (1978) à partir de données fournies par le National Opinion Research Center de
l’Université de Chicago. Les variables sont le nombre d’années de scolarité (X) et l’attitude face à l’avortement (Y).
Attitude
Pour
Mixte
Contre
Religion de l’époux
≤8
31
23
56
110
9 — 12
171
89
177
437
> 12
116
39
74
229
Total
318
151
307
776
Testez l’hypothèse que la scolarité et l’attitude sont indépendantes.
Voici les effectifs théoriques:
Scolarité
Pour
Mixte
Contre
Total
45,077
21,405
43,518
110
8
9 à 12
179,080
85,035
172,885
437
>12
93,843
44,561
90,597
229
Total
318
151
307
776
2 = 17,71;  = 4; point critique: 9,488 (p = 0,0014). On peut donc conclure que l’attitude face à l’avortement dépend de la
scolarité. Voici les distributions conditionnelles. Elles montrent, essentiellement, que l’attitude face à l’avortement est plus
tolérante à mesure que l’éducation augmente.
Scolarité
Pour
Mixte
Contre
Total
28,2%
20,9%
50,9%
100%
8
9 à 12
39,1%
20,4%
40,5%
100%
>12
50,7%
17,0%
32,3%
100%
Total
41,0%
19,5%
39,6%
100%
Les données ci-dessous portent sur deux groupes: des catholiques et des protestants du nord des États-Unis. Voici la distribution
pour chaque groupe:
Attitude: Catholiques
Pour
Mixte
Contre
≤8
8
10
24
42
Scolarité
9 — 12
65
39
89
193
> 12
37
18
43
98
Total
110
67
156
333
Scolarité
a)
b)
Pour
23
106
79
208
Attitude: Protestants
Mixte
Contre
13
32
50
88
21
31
84
151
≤8
68
9 — 12
244
> 12
131
Total
443
La conclusion en (a) doit-elle être modifiée?
Voici les effectifs théoriques pour les Catholiques:
Scolarité
Pour
Mixte
Contre
Total
13,874
8,450
19,676
42
8
9 à 12
63,754
38,832
90,414
193
>12
32,372
19,718
45,910
98
Total
110
67
156
333
2 = 4,76;  = 4; point critique: 9,488 (p = 0,3128). On ne peut pas rejeter l’hypothèse, c’est-à-dire, nous ne pouvons pas
conclure que, pour les Catholiques, l’attitude face à l’avortement dépend de la scolarité.
Voici les effectifs théoriques pour les Protestants:
Scolarité
MAT1085.10.Sols.A12
10
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 11
Scolarité
Pour
Mixte
Contre
Total
31,928
12,894
23,178
68
8
9 à 12
114,564
46,266
83,169
244
>12
61,508
24,840
44,652
131
Total
208
84
151
443
2 = 16,82;  = 4; point critique: 9,488 (p = 0,0021). On peut rejeter l’hypothèse et conclure que, pour les Protestants,
l’attitude face à l’avortement dépend de la scolarité. Voici le tableau des distributions conditionnelles . On observe le même
phénomène que dans la population générale, mais encore plus marqué.
Scolarité
Pour
Mixte
Contre
Total
33,8%
19,1%
47,1%
100%
8
9 à 12
43,4%
20,5%
36,1%
100%
>12
60,3%
16,0%
23,7%
100%
Total
47,0%
19,0%
34,1%
100%
Il ne faut pas, cependant, conclure trop vite que chez les Catholiques, l’attitude et la scolarité sont indépendantes: il se peut
que l’incapacité de rejeter l’hypothèse ne soit due qu’à un effectif total insuffisant.
10.19 Il y a quelques années, un comité fédéral de 5 personnes, chargé de prendre des décisions sur la télédiffusion, a statué sur une
demande particulière en provenance de la Province de Québec. La décision prise par le comité était nettement défavorable au
Québec. Les journalistes n’ont pas manqué de signaler que les deux membres francophones du comité s’étaient opposés à la
décision, alors que les 3 membres anglophones l’avaient appuyée. Les journalistes insinuaient qu’il ne s’agissait pas là d’une simple
coïncidence, mais bien de préjugés de la part des uns ou des autres. Ils faisaient donc un test d’hypothèse informel. Le but de cet
exercice est de développer une façon plus formelle de le faire. Soit X1 le nombre de francophones qui voteraient en faveur de la proposition et X2 le nombre d’anglophones en faveur. Énoncez Ho et montrez que la distribution conditionnelle de X1 étant donnée X1 +
X2 = m est une variables de loi (m; n1 + n2) sous Ho.
Soit X le nombre de francophones qui ont voté "pour" parmi les 3 qui ont voté pour. Si la langue du commissaire est indépendante de
sa façon de voter, on peut considérer que ce tout choix de 3 personnes pour est un échantillon aléatoire de taille 3 tiré d'une
population de 5 personnes dont 2 sont francophones et 3 anglophones. On a donc X ~ (3 ; 2 ; 3). Puisqu'on a observé X = 0, on
calcule P(X  0) = P(X = 0) =
  

2
0
3
3
5
3
= 0,10. Cette probabilité n'est pas vraiment très petite. On ne peut donc pas nécessairement
conclure que la langue du commissaire influence sa décision.
L'hypothèse que chaque choix de 3 personnes a même probabilité peut sembler un peu forte. Voici une modélisation plus facile à
accepter. Soit X le nombre de francophones parmi deux qui sont favorables au projet; et Y le nombre d'anglophones parmi 3 qui le
sont. Alors X ~ (2 ; p1) et Y ~ (3 ; p2), et l'hypothèse que les francophones ne sont a priori pas plus ni moins favorables à la
proposition se traduit par Ho : p1 = p2 (= p, disons). Nous ferons un test dit "conditionnel", c'est-à-dire, nous allons baser le test sur
la distribution conditionnelle de X étant donné que la somme X + Y = 3.
Sous Ho,
 2  px (1  p)2 x  33x  p3 x (1  p)x =  2x  33x  .
P(X = x | X+Y=3) = P(X = x ; Y = 3 – x)/P(X+Y = 3) = x
 53  p3 (1  p)2
 53 
Donc P(X = 0 | X+Y=3) =
  

2
0
3
3
5
3
= 0,1.
10.20 Il existe une méthode qu’on propose aux couples pour augmenter leurs chances d’avoir un enfant du sexe de leur choix. Voici les
données sur 48 couples qui ont essayé la méthode.
Les parents ont eu
une fille
un garçon
Total
Les parents
une fille
19
3
22
voulaient
un garçon
3
23
26
Total
22
26
48
La question posée est de savoir si la méthode en question est efficace. Certaines des approches décrites ci-dessous sont erronées car
elles ne testent pas l’hypothèse qu’on veut vraiment tester. Dites ce que chacune des approches ci-dessous teste. Exprimez les
hypothèses en termes des paramètres de la loi multinomiale (48 ; p1 ; p2 ; p3 ; p4) dont les quatre effectifs sont une réalisation.
a) Première approche On se base sur le fait que la méthode « a réussi » pour 32 des 48 couples et on teste l’hypothèse que la
probabilité de réussite est ½.
b) Deuxième approche On effectue un test d’indépendance sur le tableau ci-dessus, tel quel.
c) Troisième approche On teste l’hypothèse que la probabilité de succès pour un couple qui veut un garçon est ½ et que la
probabilité de succès pour un couple qui veut une fille est ½—un test du khi-deux à deux degrés de liberté.
d) Quatrième approche On effectue un test d’indépendance sur un tableau constitué comme ceci :
MAT1085.10.Sols.A12
11
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 12
Les parents
Ont eu ce qu’ils
N’ont pas eu ce
Total
voulaient
qu’ils voulaient
Les parents
une fille
19
3
22
voulaient
un garçon
23
3
26
Total
42
6
48
Voici une modélisation possible . On observe deux variables :
X= Nombre de filles parmi ceux qui voulaient une fille
Y= Nombre de filles parmi ceux qui voulaient un garçon
X~(n1, ; p1) et Y ~ (n2 ; p2), où n1 = 22 et n2 = 26. L’hypothèse à tester est que la méthode utilisée n’est pas efficace. Il y a
plusieurs façons d’exprimer cette hypothèse mathématiquement :
a)
L’une est Ho : p1 = p2. C’est un test d’indépendance calculé à partir du tableau suivant :
Les parents ont eu
une fille
un garçon
une fille
19
3
22
Les parents
voulaient
un garçon
3
23
26
22
26
48
La valeur de 2 est de 26,9, à 1 degré de liberté, ce qui est hautement significatif : la probabilité d’avoir une fille est bien
supérieure chez ceux qui veulent une fille. La méthode semble donc avoir un effet.
b)
Une autre façon de faire est de considérer le nombre de couples Z qui ont réussi à avoir ce qu’ils voulaient. Z ~ (n ; p), où n
= 48 et p est la probabilité d’avoir un enfant du sexe qu’on veut. On trouve 2 = 27, très significatif, puisque et le point
critique est p = 0,0000002)On rejette encore.
Remarque En posant Z ~ (n ; p), on a fait la supposition  comme partie du modèle  que les 48 épreuves ont toutes la même
probabilité de succès. Or Z est une somme de deux variables de loi binomiale : Z = X + (26-Y), de probabilités p1 et 1-p2,
respectivement. Pour voir ce que ceci pourrait avoir pour conséquence, supposons que les données avaient été plutôt celles-ci :
Les parents ont eu
une fille
un garçon
une fille
19
3
22
Les parents
voulaient
un garçon
16
10
26
35
13
48
On aurai eu 2 = 2,08 et on n’aurait pas rejeté Ho. On aurait donc conclu que la méthode n’est pas efficace, ce qui cache une
vérité importante : la méthode est très efficace pour ceux qui veulent une fille. Une meilleure approche aurait été celle-ci : on
teste l’hypothèse que la probabilité de succès est ½ chez ceux qui veulent une fille : 19 succès sur 22, ce qui donne 2 = 11,6
 on rejette l’hypothèse. De même pour ceux qui veulent un garçon : 10 succès sur 26, ce qui donne 2 = 1,4, et ne nous
permet pas de conclure que la probabilité de succès est différente de ½ chez ceux qui veulent un garçon. Nous pouvons cependant tester les deux hypothèses simultanément en sommant les deux valeurs de 2 : 11,6 + 1,38 = 13,0. On compare cette
somme au point critique d’une khi-deux à 2 degrés de liberté qui est 5,99, et on rejette l’hypothèse que les deux probabilités
sont égales à ½.
10.21 Une usine fabrique des vis qu'elle met dans des boîtes de 100. Soit X le nombre de vis défectueuses dans une boîte. Supposons
qu'une longue expérience du procédé de fabrication a permis de dresser la fonction de masse suivante:
x
0
1
2
3
4
5
6
Total
Fréquence
0,13
0,27
0,27
0,18
0,09
0,04
0,02
1
Un nouveau procédé est considéré, et pour le tester on l'emploie à la fabrication de 100 boîtes de vis. On obtient la distribution
suivante:
x
0
1
2
3
4
5
6
Total
Fréquence
30
21
13
15
12
5
4
100
Le patron de l'usine demande à deux statisticiens de tester l'hypothèse nulle selon laquelle "le nouveau procédé est pareil à l'ancien".
Le statisticien A fait un test basé sur la proportion p de vis défectueuses parmi les 10 000 de l'échantillon. Le statisticien B fait un test
basé sur le nombre moyen X de vis défectueuses par boîte. Effectuez les deux tests et commentez.
Statisticien A Avec l'ancien procédé, le nombre moyen de vis défectueuses par boîte dans la population est µ = (0)(0,13) + (1)(0,27)
+ … + (6)(0,02) = 2,03, et donc la proportion de vis défectueuses est 2,03/100 = 0,0203. Nous voulons donc tester Ho: p = 0,0203,
pˆ  po
où p est la proportion de vis défectueuses avec le nouveau procédé. L'échantillon donne p̂ = 0,0189. Alors Z =
=
po (1  po ) / n
MAT1085.10.Sols.A12
12
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 13
0,0189  0,0203
= -0,9927, ce qui n'est pas significatif. On ne peut pas conclure que le nouveau procédé est
(0,0203)(1  0,0203) /10000
différent de l'ancien.
Statisticien B Avec l'ancien procédé, le nombre moyen de vis défectueuses par boîte dans la population est µ = (0)(0,13) +
(1)(0,27) + … + (6)(0,02) = 2,03. Donc nous voulons tester Ho : µX = 2,03, où X est le nombre de vis défectueuses dans une boîte de
x  
x  2,03
100 fabriquées selon le nouveau procédé. L'échantillon donne x = 1,89 et s = 1,774653. Donc t =
=
=1,774653/ 100
s/ n
0,78889, ce qui n'est encore pas significatif.
Autre approche Finalement, on peut faire un test d'ajustement.
Observées
13
27
27
18
9
4
2
Théoriques
Point critique 
2
6;0,05
30
21
13
15
12
5
4
= 12,59.  = 34,57336 (p = 0,0000052) : certainement significatif. On rejette l'hypothèse que le nouveau
2
procédé est semblable à l'ancien.
Commentaires La première approche est basée sur l'hypothèse que le nombre de vis défectueuses dans l'échantillon est une
variable de loi binomiale avec n = 10 000. Mais la loi binomiale ne s'appliquerait que si les 10 000 épreuves étaient indépendantes,
et dans ce cas-ci, cette hypothèse est discutable: il pourrait y avoir des dépendances entre les vis d'une même boîte. Ces dépendances
tendent à augmenter la variance et donc la formule Var( p̂ ) = p(1-p)/n n'est plus valide. À titre d'exemple, considérons la
distribution échantillonnale suivante:
x
0
1
2
3
4
5
6
Effectif
40
20
9
Dans ce cas on a x = 1,7, s = 1,93, p̂ = 0,017. Alors Z =
9
12
pˆ  po
po (1  po ) / n
3
= -2,34 et t =
7
x  
s/ n
100
= - 1,71. Dans ce cas, le statisticien
A rejetterait (à tort) Ho alors que B ne la rejetterait pas.
L'approche du statisticien B et celle proposée ici sont correctes mais ne donnent pas le même résultat. Il n'y a pas nécessairement de
contradiction. Le test d'ajustement est un test de l'hypothèse que la nouvelle distribution du nombre de défectuosités est identique à
l’ancienne ; le statisticien B a simplement testé l'hypothèse que les moyennes sont égales.
10.22 Pour comparer deux marques de bière, on fait une expérience avec 100 amateurs de chaque marque. Chaque groupe
affirme connaître la différence entre les deux et préférer nettement la leur. On demande à chaque sujet d’identifier sa
préférence, après avoir goûté les deux. Voici les résultats :
Habituellement boivent
A
B
Total
Ont préféré
A
65
45
110
B
35
55
90
Total
100
100
200
a) Il n’y a pas de différence discernable entre les deux bières
b) Les buveurs de la bière B ne peuvent pas distinguer entre les deux bières
c) Les fidèles de la bière A discriminent mieux entre les deux marques que ceux de la bière B.
Nous commençons par nommer les variables observées et les paramètres.
Habituellement boivent
A
B
Ont préféré
A
X1 ~ (100 ; p1)
Y1 ~  (100 ; r1)
B
X2 ~  (100; p2)
Y2 ~  (100 ; r2)
100
100
Notons que p2 = 1-p1 et que r2 = 1-r1.
a) Une façon d’exprimer l’hypothèse nulle: la probabilité que les sujets choisissent leur propre bière (le succès) est ½. Soit Z = X1
+ Y2 le nombre de succès pour les deux groupes. Sous l’hypothèse nulle, Z ~ (200 ; ½). Nous allons donc supposer que Z
~(200 ; p) et tester l’hypothèse que p = ½. Il s’agit d’un test d’uniformité avec les effectifs observés suivants :
On choisi leur propre bière
Ont choisi l’autre
120
80
La valeur de khi-deux est 2 = 8, ce qui dépasse de loin le point critique de 3,84 (p = 0,0047). Donc on rejette l’hypothèse que
la probabilité qu’un sujet choisisse sa propre bière est ½. Elle est donc supérieure à ½, ce qui veut nécessairement dire qu’il y a
une différence entre les deux bières.
MAT1085.10.Sols.A12
13
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 14
b)
c)
Autre solution Remarquez l’énoncé du modèle : Z ~ (200 ; p). Un modèle doit décrire le contexte le plus fidèlement possible,
avec un minimum de suppositions. Or ici, en supposant que Z suit une loi binomiale, nous supposons déjà que les deux groupes
ont même probabilité de succès, ce qui n’est pas évident. Il est préférable de ne pas faire une telle supposition. Nous
commençons donc avec le modèle stipulé dans le tableau ci-dessus. X1 ~ (100 ; p1) et Y2 ~ (100 ; r2). L’hypothèse que nous
avons à tester est que p1 = ½ et que r2 = ½. Évidemment, on peut tester chacune des hypothèses séparément. Lorsqu’on teste
l’hypothèse que p1 = ½, on a 2 = 9 (p = 0,002), ce qui est hautement significatif; lorsqu’on teste l’hypothèse r2 = ½, on a 2 = 1,
ce qui n’est pas du tout significatif (p = 0,317). Nous avons deux réponses alors que nous n’avions qu’une question. Comment
réunir les deux réponses? Il est permis d’additionner les deux valeurs de khi-deux et de comparer la somme à un point critique
associé à 2 degrés de liberté. Ici, la somme est 10, le point critique est 5,99 (p = 0,0067). Donc on rejette l’hypothèse.
Notre question porte sur la réussite du deuxième groupe. On observe donc Y2 ~ (100 ; r2), et on teste l’hypothèse que r2 = ½.
La valeur de khi-deux est 2 = 1, ce qui n’est nullement significatif. On accepte l’hypothèse que les buveurs de la bière B ne
peuvent pas distinguer l’une de l’autre.
Nous voulons comparer le taux de succès des deux groupes. On a X1 ~ (100 ; p1), le nombre de succès dans le groupe A; et Y2
~ (100 ; r2), le nombre de succès dans le groupe B. L’hypothèse à tester est p1 = r2. Il s’agit d’un test d’indépendance
(attention à la construction du tableau). La valeur de khi-deux est 2 = 2,08, ce qui n’est pas supérieur au point critique de 3,84.
10.23 Pour comparer l’aptitude en mathématiques des Orientaux à celle des Américains de race blanche, Tsang [ The
Mathematics Education of Asian Americans, Journal for Research in Mathematics Education 15, No. 2, 115-122] a examiné les
résultats de 10 097 étudiants orientaux au test de mathématiques du SAT [Scholastic Aptitude Test]. La distribution des
scores est donnée dans le tableau suivant, qui présente également la distribution, en fréquences, des scores des
Américains de race blanche.
Score
Orientaux (effectif)
Américains blancs (fréquence)
700 – 800
601
0,045
600 - 690
2001
0,172
500 – 590
3190
0,314
400 – 490
2788
0,301
300 – 390
1309
0,148
200 - 290
208
0,020
10 097
1
Y a-t-il une différence significative entre les Orientaux et les Américains de race blanche ?
Effectifs observés et théoriques
700-800
600-690
500-590
400-490
300-390
Observés
601
2001
3190
2788
1309
Théoriques
454,365
1736,684
3170,458
3039,197
1494,356
2 = 131.06 ; p = pratiquement 0.
On rejette l’hypothèse que la distribution des résultats est la même chez les orientaux et les blancs.
Il est utile de remarquer que la différence est minime. Les graphiques suivants le confirment :
200-290
208
201,94
0,3500
0,3000
0,2500
0,2000
Asiatiques
0,1500
Blancs
0,1000
0,0500
250
350
450
550
650
750
Ce qui rend le résultat fortement significatif, c’est la grande taille de l’échantillon. La conclusion est non pas que la différence est énorme, mais
qu’on est sûr qu’il y a bien une différence.
10.24 Au numéro précédent, les fréquences concernant les Américains de race blanche sont présentées comme si elles étaient
fixes et connues pour la population entière, ce qui n’est pas en fait le cas. Elles sont basées sur un échantillon de
502 990 étudiants dont les effectifs, dans l’ordre des lignes du tableau ci-dessus, sont : 22 564 ; 86 521 ; 158 049 ;
MAT1085.10.Sols.A12
14
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 15
151 466 ; 74 498 ; 9892. Utilisez ces données pour répondre à nouveau à la question posée au numéro précédent. Une
discussion s’impose sur la relation entre les deux tests :
Effectifs théoriques
700-800
600-690
Asiatiques
456
1742
Blancs
22709
86780
Tous
23165
88522
2 = 130.386 à 5 degrés de liberté ; p = pratiquement 0
500-590
3173
158066
161239
400-490
3036
151218
154254
300-390
1492
74315
75807
200-290
199
9901
10100
Tous
10097
502990
513087
a) Est-ce qu’on teste exactement la même chose dans les deux cas ?
Non, on ne teste pas tout à fait la même chose. En a) on teste l’hypothèse que les fréquences sont 0,045 ; 0,172 ; 0,314 ; 0,301 ; 0,148 ; 0,020. Or
cette hypothèse n’est intéressante que dans la mesure où elles correspondent à celle des blancs, ce qui est à peu près le cas, mais pas tout à fait : ce
ne sont que des estimations des fréquences des blancs.
b) Aurait-on pu prévoir que la conclusion n’aurait pas changé.
Oui, on aurait pu le prévoir, les estimations des fréquences des blancs sont très sûres.
c) Pourquoi la différence entre les valeurs de khi-deux calculées ici et au numéro précédent est-elle si minuscule ?
10.25 Aux deux numéros précédents, on aurait pu traiter les scores comme des variables quantitatives. Voici,
approximativement, la moyenne et l’écart-type des scores pour les deux groupes :
Groupe
Moyenne
Écart-type
Orientaux
SY = 115,7
X = 522,0
Américains blancs
Sx = 112,5
Y = 510,5
a) Testez l’hypothèse que les moyennes des populations respectives sont égales.
X Y
Z=
= 9,9, une différence très certainement significative.
S / 10097  S / 502990
2
2
X
Y
b) Considérez que les résultats obtenus par les Orientaux proviennent d’une population de moyenne  et testez
l’hypothèse que  = 510,5 (la moyenne des blancs). Ici on voit peut-être mieux que dans les problèmes précédents
pourquoi cette approche est fautive.
T 
X  510, 5
115, 7 /
c)
= 9,98, bien sûr encore fortement significatif.
10097
Confirmez, cependant, que la différence entre les tests en a) et b) est minuscule et expliquez pourquoi.
Numériquement, d’abord : on voit que la quantité S / 502990 au dénominateur est minuscule, étant donnée l’importance de cet effectif, ce qui
2
Y
fait que les deux quantités sont presque identiques. Il n’y a presque pas de différence entre tester que μ 1 = μ2 et tester μ1 = 510,5 parce que μ2 est
presque certainement tout près de 510,2.
Exercices théoriques
10.26Après avoir administré un test d’aptitude à un groupe de 100 sujets, on se propose de tester l’hypothèse que les questions 1 et 2 sont de
Question 2
Correcte
Incorrecte
Total
Correcte
22
35
57
Question 1 Incorrecte
11
32
43
Total
33
67
100
Les taux de succès aux questions 1 et 2 sont, respectivement, de 57% et de 33%. On ne peut pas faire un test d’égalité de
proportions pour vérifier si la différence est significative, car il ne s’agit pas de deux échantillons indépendants : ce sont
les mêmes sujets qui ont répondu aux deux questions. Désignons les 4 observations par
X11
X12
X1.
X21
X22
X2.
n
X.1
X.2
Ces quatre variables aléatoires suivent conjointement une loi (n ; p11, p12, p21, p22).
a) Montrez que la distribution conditionnelle de X12 étant donné X12 + X22 = m est (m ; p12/(p12+ p21)).
b) Formulez l’hypothèse nulle en fonction des paramètres de la distribution conditionnelle de X12
c) Effectuez le test à partir de la distribution conditionnelle de X12.
10.27L’objectif de cet exercice est montrer l’équivalence entre un certain test d’ajustement et un test sur une proportion. Considérons les do
MAT1085.10.Sols.A12
15
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 16
Date du suicide
1 décembre – 31 mars
1 avril — 30 novembre
Effectif
50
70
L’hypothèse nulle est que les suicides ne sont pas affectés par la saison. Soit X le nombre de suicides parmi 120 qui ont
eu lieu entre le 1er décembre et le 31 mars. Alors X ~ (120 ; p), et l’hypothèse à tester est Ho : p  1/3 contre
l’alternative H1 : p ≠ 1/3. Le test peut être basé sur la statistique Z =
X  n/3
n(1/ 3)(2 / 3)
qui suit, sous Ho, une loi (0 ; 1).
La région critique est |Z| > z/2. Mais le test peut aussi bien être basé sur Z2, et puisque Z2 ~ 2, on a aussi la région
critique Z 2 > 12 .
a)
Vérifier numériquement que les deux tests sont équivalents.
b) Vérifiez numériquement que Z 2 =
c)

2 (Oi
i 1
 Ti )2
, la statistique utilisée dans ce chapitre pour faire un test
Ti
d’ajustement.
Vérifiez en général que pour tester l'hypothèse H0 : p po, les région critiques
|Z| > 1,96 avec Z 
X  npo
.
npo (1  po )
et
i1
2
(Oi  Ti )2
2
> 1;
Ti
sont équivalents.
10.28 Supposons qu’on dispose de données provenant de 3 études indépendantes sur les suicides. La première étude, basée sur 120 cas de
suicide, rapporte que 50 de ces suicides ont lieu entre le 1 er décembre et le 31 mars. La deuxième étude, basée sur 80 cas, rapporte
que 15 de ceux-ci ont eu lieu entre le 1er janvier et la fin février. La troisième étude enfin, basée sur 90 cas, rapporte que 27 ont eu
lieu entre 1er janvier et le 31 mars. Vous voulez savoir si la saison froide à un effet sur le taux de suicide. Faites un test avec  
0,01, en employant l’ensemble des données à votre disposition que vous pouvez disposer comme suit
Nombre de suicides en hiver ...
... sur un total de
1ère étude
50
120
2e étude
15
80
3e étude
27
90
L’hypothèse qu’on veut tester est l’hypothèse que les suicides ne sont pas affectés par la saison.
a)
En un premier temps, testez cette hypothèse trois fois, une fois dans le cadre de chaque étude.
b)
Maintenant montrez qu’on peut tester l’hypothèse globalement, en mettant ensemble les ressources des trois études. Il s’agit
d’effectuer un test basé sur la somme des trois khi-deux calculés séparément: quelle est la région critique? Justifiez votre
procédure.
X1~ (120; p1), X2~ (80; p2), X3~ (90; p3)
Ho: p1  1/3, p2  1/6, p3  1/4.
( pˆ i  pio )2
(50 /120  1/ 3) 2
(27 / 90  1/ 4) 2
(15/80  1/ 6) 2
2
2 = 
=
+
+
= 5,2. 3;0,01
= 11,3397.
pio (1  pio ) / ni
(1/ 4)(3/ 4)
(1/ 3)(2 / 3)
(1/ 6)(5/ 6)
90
120
80
On « accepte » Ho. On n'a pas de raison de croire que les suicides sont plus fréquents ou moins fréquents en hiver.
10.29
Montrez que dans un tableau 2  2, la statistique pour tester l'indépendance est égale à Z2, où
pˆ1  pˆ 2
Z=
1 1
pˆ (1  pˆ )

n1 n2
La notation est définie ci-dessous :
MAT1085.10.Sols.A12
16
21 octobre 2012
MAT1085 Chapitre 9 Tests du khi-deux 17
X1
X2
n p̂
n 1 - X1
n 2 - X2
n(1- p̂ )
n1
n2
n
X1  X 2
, n  n1  n2 .
n
10.30 De très nombreuses études ont été effectuées dans le but de démontrer que les premiers-nés d’une famille sont d’un
caractère distinct, plus conservateurs que la norme. L’une de ces études est basée sur le fait que lors de la condamnation
de Louis XVI, les députés de la Convention nationale qui étaient en faveur de l’exécution étaient beaucoup plus souvent
premiers-nés que les autres. Voici les données :
En faveur de la guillotine
Contre la guillotine
Premiers-nés
182
67
249
Non premiers-nés
179
293
472
361
360
721
a) Montrez qu’un test du khi-deux (ou autre test) rejette effectivement l’hypothèse Ho qu’il n’y pas de relation entre
l’ordre de naissance et l’attitude face au traitement à accorder à Louis XVI.
b) Maintenant on vous propose de montrer que cette dépendance pourrait n’être qu’un artifice, dû, par exemple, au fait
que les gens susceptibles de favoriser la guillotine auraient en moyenne moins d’enfants (bien qu’on serait mal pris
s’il fallait expliquer pourquoi ce serait le cas). Supposons les distributions suivantes :
Personnes en faveur de la guillotine (on traite les enfants uniques comme des premiers-nés) :
1
2
3
4
Nombre d’enfants
0,3
0,1
0,1
0,5
1
Proportion
Personnes contre la guillotine :
4
5
6
Nombre d’enfants
0,1
0,4
0,5
1
Proportion
Déterminer les effectifs théoriques. Pourquoi est-ce que ceux-ci contredisent la conclusion en a) ?
10.31 Le numéro précédent n’est qu’un exemple des nombreuses études destinées à tester H o. Puisqu’à chaque étude il y a
une probabilité  de rejeter Ho à tort, il n’est pas certain que le rejet observé dans l’exemple n’est pas un de ces rejets
erronés. Il faut donc analyser l’ensemble des études du genre pour en arriver à un bilan global (on appelle cela une
« méta-analyse »). C’est ce qu’a fait un chercheur, à partir d’un grand nombre d’études. Parmi les 196 études qu’il a
examinées, il y en avait 72 qui rejetaient Ho (donc confirmaient l’existence d’un lien). Supposez que toutes les études
ont été faites à un niveau  = 0,05 et dites si l’ensemble des études permet de rejeter Ho.
10.32 Au numéro précédent, supposons qu’on ait retenu la valeur p de chacun des 196 tests, donc 196 nombres compris dans
l’intervalle [0 ; 1], et que leur moyenne est de 0,07 avec leur écart type de 0,04. Sachant que sous H o ces nombres sont
de loi uniforme sur [0 ; 1], testez Ho.
10.33 Une usine fabrique des vis qu’elle met dans des boîtes de 100. Soit X le nombre de vis défectueuses dans une boîte.
Pour comparer deux procédés de fabrication, P 1 et P2, on les emploie à la fabrication de 100 boîtes chacun. Voici la
distribution des X pour chacun des deux procédés :
x
0
1
2
3
4
5
6
Total
Effectif, procédé P1
13
27
27
18
9
4
2
100
Effectif, procédé P2
30
21
13
15
12
5
4
100
Le patron de l’usine demande à trois statisticiens de tester l’hypothèse, formulée vaguement comme « les deux procédés
sont pareils ». Le statisticien A effectue un test d’indépendance à partir du tableau ci-dessus, tel quel. Le statisticien B
considère qu’il a deux échantillons de 10 000 vis chacun et fait un test d’égalité de proportions. Le statisticien C, enfin,
fait un test basé sur le nombre moyen de vis défectueuses par boîte. Effectuez les trois tests et commentez. Sont-ils tous
valides ?
pˆ1  X1 / n1, pˆ 2  X 2 / n2 , pˆ 
MAT1085.10.Sols.A12
17
21 octobre 2012
Téléchargement