MAT1085
Chapitre 10 Tests du khi-deux
Solutions
10.1 Voici la répartition, selon le mois, de 1 855 décès choisis au hasard parmi tous les décès qui ont eu lieu en Amérique du Nord en
1976.
Mois
Jan
Fév.
Mars
Avril
Mai
Juin
Juil.
Août
Sept.
Oct.
Nov.
Déc.
Total
Effectif
157
142
158
152
156
153
158
159
153
157
152
158
1855
a) Peut-on attribuer les différences uniquement au hasard ?
Dire que les différences sont attribuables entièrement au hasard c’est dire qu’en fait la probabilité qu’un décès ait lieu en un mois
donné est 1/12 (à peu près, puisque les mois ne sont pas tous de même longueur) :
Ho : p1 = p2 = … = p12 = 1/12
Sous cette hypothèse, les effectifs théoriques sont égaux :
obs
142
158
152
156
153
158
159
153
152
theo
154,58
154,58
154,58
154,58
154,58
154,58
154,58
154,58
154,58
On obtient 2 = 1,58, ce qui n’est pas significatif. Le point critique à 11 degrés de liberté est 19,68. Donc on ne peut pas
conclure qu’il y a des différences entre les mois quant à la fréquence des suicides.
b) Supposons que ces données vous aient été fournies par un assistant en qui vous n’avez pas trop confiance. Les données ont-elles
l’air d’avoir été manipulées?
La conclusion ci-dessus a été justifiée par le fait que la valeur de χ2 n’est assez grande pour conclure que les fréquences des mois
diffèrent de la fréquence théorique de 1/12. Mais en fait la valeur de 2 est si petite qu’elle est suspecte : la probabilité d’une
valeur aussi petite est 0,0005.
Remarque Nous avons exprimé l’hypothèse nulle en disant que les fréquences devraient être toutes égales à 1/12. En fait, pour
être plus exact, si le mois n’a pas d’impact sur les suicides, la probabilité d’un décès en un mois donné devrait être
proportionnelle à la longueur du mois :
Ho : p1 = 31/365 ; p2 = 28/365 ; …. ; p12 = 31/365.
Les effectifs théoriques seraient alors
obs
157
142,0
158
152
156
153
158
159
153
157
152
158
theo
157,55
142,3
157,55
152,47
157,55
152,47
157,55
157,55
152,47
157,55
152,47
157,55
On aurait eu 2 = 0,04352251, encore plus petit, donc encore plus conforme à l’hypothèse qu’il n’y a pas d’effet de mois.
10.2 Dans une étude célèbre, des données ont été prélevées sur 6 587 suicides en France. Voici la distribution des suicides selon le jour de
la semaine:
Jour
Lundi
Mardi
Mercredi
Jeudi
Vendredi
Samedi
Dimanche
Total
Effectif
1 001
1 035
982
1 033
905
737
894
6 587
a) Testez l’hypothèse que les suicides se répartissent uniformément sur les jours de la semaine.
Les observations X = (X1 , ... , X7) sont une réalisation d’une variable (vectorielle) de loi (6587; p1, .. . , p7). Ho : les suicides
se répartissent uniformément sur les jours de la semaine, ce qui se traduit par:
Ho: p1 = 1/7 ... , p7 = 1/7.
Les effectifs théoriques sont
T1 = E(X1|p1= 1/7) = 6587(1/7) = 941,
T7 = E(X7|p7 = 1/7) = 6587(1/7) = 941.
La statistique est
2 =
2
(1001 941)
941
+ … +
2
(894 941)
941
= 71,947;
= 6; point critique: 12,59. Puisque 71,947 >> 12,59 (p 0), on peut certainement rejeter l’hypothèse d’uniformité: le
tableau des effectifs observés est trop éloigné des effectifs auxquels on s’attend sous l’hypothèse nulle. On conclut avec con-
fiance que les suicides ne sont pas aussi fréquents tous les jours de la semaine.
b) Selon une certaine conjecture, les taux de suicides diminuent à l’approche d’un week-end. Plus précisément, le taux quotidien
global pour l’ensemble des jours du vendredi au dimanche est inférieur au taux quotidien global pour l’ensemble des jours du
lundi au jeudi. Les données appuient-elles cette conjecture?
On effectue un test d’ajustement:
Lundi à jeudi
Vendredi à dimanche
Total
Observés
4051
2536
6587
Théoriques
3764
2823
6587
 2 = 51,06; = 1; point critique: 3,84 (p 0). On rejette certainement l’hypothèse; on conclut que les suicides sont plus
probables en semaine.
c) Testez l’hypothèse que chacun des jours du lundi au jeudi a le même taux de suicides.
On fait un test d’uniformité sur les effectifs observés suivants (l’effectif théorique est 1012,75):
MAT1085 Chapitre 9 Tests du khi-deux 2
MAT1085.10.Sols.A12 2 21 octobre 2012
Lundi
Mardi
Mercredi
Jeudi
Total
Observés
1001
1035
982
1033
4051
 2 = 1,96; = 3; point critique: 7,82 (p = 0,58). On ne peut pas rejeter l’hypothèse que les quatre jours de la semaine ont la
même probabilité de provoquer un suicide.
d) Testez l’hypothèse que chacun des jours du vendredi au dimanche a le même taux de suicides.
On fait un test d’uniformité sur les effectifs observés suivants (l’effectif théorique est 845,33):
Vendredi
Samedi
Dimanche
Total
Observés
905
737
894
2536
 2 = 20,9; = 2; point critique: 5,99 (p = 0,000029). On peut rejeter l’hypothèse que les trois jours du weekend ont la même
probabilité de provoquer un suicide.
e) Essayez de résumer en une phrase ou deux l’ensemble des conclusions tirées ci-dessus.
Donc en définitive, on peut dire que les jours de la semaine provoquent plus de suicides que le week-end; que les jours de la
semaine sont comparables entre eux; alors que les jours du week-end sont différents les uns des autres.
10.3 Un sociologue s’intéresse à la relation entre la couleur de la peau et la mobilité professionnelle. Il prélève un échantillon de 94
personnes de peau pâle, 175 personnes de peau moyenne, et 80 personnes de peau brune. Il construit une mesure de mobilité à l’aide
de quoi il classifie ses sujets selon leur mobilité. Voici les résultats.
Couleur de la peau
Mobilité
Pâle
Moyenne
Brune
Total
Grande
35
84
51
170
Faible
59
91
29
179
Total
94
175
80
349
Tester l’hypothèse qu’il n’y a aucune relation entre la couleur de la peau et la mobilité professionnelle avec 0,05.
Le modèle est le suivant: nous observons 3 vecteurs aléatoires, X, Y et Z, les trois de loi multinomiale. Dans l’ordre dans lequel les
observations sont disposées dans le tableau, ce sont:
Grande
X1
Y1
Z1
170
Faible
X2
Y2
Z2
179
On que X ~ (170; p1, p2)
Y ~(179; r1, r2)
Z ~ (349; s1, s2)
Ho : la couleur de la peau n’influence pas la mobilité professionnelle, et donc que
p1 = r1 = s1; et p2 = r2 = s2
On estime ces deux probabilités communes par 170/349 = 0,4871 et 179/349 = 0,5129, respectivement. Ce qui donne, pour les 94
sujets de peau pâle, les effectifs théoriques (0,4871)(94) = 45,79; et (0,5129)(94) = 48,21. On obtient de cette manière, le tableau
des effectifs théoriques suivants:
Mobilité
Pâle
Moyenne
Brune
Total
Grande
45,79
85,24
38,97
170
Faible
48,21
89,76
41,03
179
Total
94
175
80
349
Point critique: 5,99. 2 = 12,23; = 2. Puisque 12,23 > 5,99 (p = 0,0022), on rejette l’hypothèse que la couleur de la peau n’in-
fluence pas la mobilité professionnelle, pour conclure que la couleur de la peau a un lien avec la mobilité professionnelle.
Pour avoir une idée du type de relation qu’il pourrait y avoir, on calcule les distributions conditionnelles:
Pâle
Moyenne
Brune
Total
Grande
37,2%
48,0%
63,8%
48,7%
Faible
62,8%
52,0%
36,3%
51,3%
100%
100%
100%
100%
Il semble que plus la peau est foncée, plus la mobilité est grande.
10.4 Dans une étude sur l’absentéisme scolaire, une des causes d’absence est d’ordre non volontaire: décès, maladie, fatigue excessive,
traitement médical. Parmi les 642 répondants à un questionnaire sur les motifs d’absence, 200 se classent dans cette catégorie. On a
classifié ces 200 répondants selon le sexe et la cause.
Décès
Maladie
Fatigue
Traitement médical
Garçons
4
39
25
18
Filles
7
56
32
19
Ces types de causes d’absence sont-ils liés au sexe?
Le tableau suivant présente une notation des variables du modèle :
MAT1085 Chapitre 9 Tests du khi-deux 3
MAT1085.10.Sols.A12 3 21 octobre 2012
Décès
Maladie
Fatigue
Trait,
Total
Garçons
X1
X2
X3
X4
n1
Filles
Y1
Y2
Y3
Y4
n2
X = (X1,X2,X3,X4) ~ (n1; p1, p2, p3,p4) et Y = (Y1,Y2,Y3,Y4) ~ (n2; r1,r2, r3,r4). L’hypothèse à tester est Ho : p1 = r1, p2 = r2, p3 = r3,
p4 = r4. C’est un test d’indépendance. Les effectifs théoriques sont
Décès
Maladie
Fatigue
Trait,
Total
Garçons
4,73
40,85
24,51
15,91
86
Filles
6,27
54,15
32,49
21,09
114
11
95
57
37
200
2 = 0,84 à 3 degrés de liberté. Le point critique est 7,815 (p = 0,8399). On ne rejette pas l’hypothèse nulle : on n’a donc pas de
raison de croire qu’il y a une différence entre filles et garçons dans les motifs d’absence.
10.5 Un sociologue a fait subir un test d’estime de soi à 3 750 américains de 3 religions différentes. Voici les résultats
Religion
Protestante
Catholique
Juive
Total
Estime
Forte
1 191
988
435
2 614
de soi
Faible
517
493
126
1 136
1 708
1 481
561
3 750
a) Calculez, pour chaque religion, le pourcentage des sujets qui ont une forte estime de soi.
Voici les pourcentages de personnes avec une forte estime de soi, par religion:
Protestants
Catholiques
Juifs
69,7%
66,7%
77,5%
Assez semblables pour les Protestants et Catholiques.
b) Les différences entre ces pourcentages sont-elles significatives?
Il s’agit de faire un test d’indépendance. Voici les effectifs théoriques:
Est de soi
Protestants
Catholiques
Juifs
Total
Forte
1190,6
1032,4
391,0
2614
Faible
517,4
448,6
170,0
1136
Total
1708
1481
561
3750
On a 2 = 22.59373, ce qui est hautement significatif, car le point critique est 5,99 . (La p-valeur, ou niveau de signification,
c’est-à-dire, la probabilité d’une valeur aussi extrême de 2 sous Ho, est 0,0000124). On conclut avec confiance que l’estime de
soi diffère selon qu’on est Protestant, Catholique ou Juif, comme le montrent d’ailleurs les distributions conditionnelles.
c) La différence entre les catholiques et les protestants est-elle significative?
Voici le tableau des effectifs observés, avec seuls les Catholiques et les Protestants:
Estime de soi
Protestants
Catholiques
Total
Forte
1191
988
2179
Faible
517
493
1010
Total
1708
1481
3189
Effectifs théoriques:
Estime de soi
Protestants
Catholiques
Total
Forte
1167,05
1011,95
2179
Faible
540,95
469,05
1010
Total
1708
1481
3189
Point critique: 3,84. 2 = 3,34; = 1; p = 0,0676. On ne peut pas rejeter l’hypothèse nulle: on ne peut pas conclure qu’il y a
une différence entre Protestants et Catholiques.
d) En mettant les protestants et les catholiques ensemble, trouvez-vous ceux-ci différents des juifs?
Voici les effectifs observés, Catholiques et Protestants réunis:
Estime de soi
Protestants et Catholiques
Juifs
Total
Forte
2179
435
2614
Faible
1010
126
1136
Total
3189
561
3750
Effectifs théoriques:
Estime de soi
Protestants et Catholiques
Juifs
Total
Forte
2222,9
391,05
2614
Faible
966,05
169,95
1136
Total
3189
561
3750
Point critique: 3,84. 2 = 19,17; = 1; p = 0,00001957.
On rejette l’hypothèse nulle, et on conclut que les Juifs ont une estime de soi différente de celles des Catholiques ou Protestants.
e) Résumez vos conclusions.
MAT1085 Chapitre 9 Tests du khi-deux 4
MAT1085.10.Sols.A12 4 21 octobre 2012
Il n’y a pas de différence entre Catholiques et Protestants. Mais il y a une entre Protestants et Catholiques d’une part, et Juifs
d’autre part: une plus forte estime de soi parmi les derniers.
10.6 Les données du numéro précédent sont celles de la population générale. Les données dans le tableau suivant portent sur une sous-
population: ceux qui n’ont pas complété l’école secondaire.
Religion
Protestante
Catholique
Juive
Total
Estime
Forte
330
234
89
653
de soi
Faible
152
91
37
280
482
325
126
933
Les conclusions sont-elles les mêmes ici?
Voici le tableau des effectifs théoriques :
Esime de soi
Protestants
Catholiques
Juive
Total
Forte
337,3
227,5
88,2
653
Faible
144,7
97,5
37,8
280
Total
482
325
126
933
La valeur de khi-deux est = 1,18, à 2 degrés de liberté, ce qui n’est nullement significatif, puisque le point critique est de 5,99 (et
p = 0,5532). Donc il ne semble pas y avoir de différence entre les religions, contrairement aux résultats du numéro précédent, dans
lequel la conclusion était que les Juifs avaient une estime de soi supérieure à celle des autres. On pourrait être tenté de conclure que
cette supériorité s’estompe chez les Juifs peu scolarisés (ils ne s’aiment que s’ils sont instruits). Mais il faut se méfier de con-
clusions trop hâtives, car il faut se rappeler que les effectifs ici sont moins importants, ce qui rend plus difficile la détection des
différences. En d’autres termes, il est possible que les Juifs aient quand même une plus forte estime de soi, mais que la différence
n’est pas détectée. Cette conclusion est peu vraisemblable, cependant, à la lumière des fréquences conditionnelles, que voici :
Esime de soi
Protestants
Catholiques
Juive
Total
Forte
68,5%
72,0%
70,6%
70,0%
Faible
31,5%
28,0%
29,4%
30,0%
Total
100%
100%
100%
100%
On voit dont que les Juifs ont une estime de soi qui se situe entre celle des Protestants et celle des Catholiques.
10.7 Une équipe de chercheurs dispose de données sur une population d’accidents: l’ensemble de tous les accidents qui ont eu lieu au
Québec en l980 et qui ont entraîné des blessures corporelles. Pour la plupart des variables, il était aisé d’obtenir les données pour la
population entière. Pour certaines autres variables, comme celles qui identifiaient la position exacte du véhicule lors de l’accident, il
était difficile d’en déterminer les valeurs et on ne pouvait se permettre de le faire pour la population entière. Il a donc fallu prélever
un échantillon pour étudier la distribution de ces variables là. On a prélevé un échantillon de 600 accidents. Malheureusement,
l’échantillon n’a pas été prélevé de façon purement aléatoire, ce qui faisait douter de sa représentativité. Pour étudier la question de la
représentativité, on a choisi une variable particulière, la variable "gravité de la blessure", dont on connaissait la distribution pour la
population entière ainsi que pour l’échantillon. Formulez convenablement l’hypothèse que l’échantillon est représentatif et testez-la.
Les distributions sont :
Blessure
mortelle
très grave
grave
pas grave
Total
Fréquence dans la population
0,20
0,30
0,30
0,20
1
Fréquence dans l’échantillon
0,10
0,30
0,40
0,20
1
Nous observons un vecteur X = (X1, X2, X3, X4) de loi (600 ; p1, p2; p3; p4). Si les tirages ont été faits au hasard, alors les
probabilités de sélection des différents types de blessure devraient être égales aux fréquences dans la population. Donc l’hypothèse
nulle, que les tirages sont faits au hasard, est Ho :p1 = 0,20; p2 = 0,30; p3 = 0,30 ; p4 = 0,20. Les valeurs observées et théoriques
sont :
Blessure
mortelle
très grave
grave
pas grave
total
Observés
60
180
240
120
600
Théoriques
120
180
180
120
600
La valeur de khi-deux est 2 = 50 avec 3 degrés de liberté; c’est très significatif, puisque le point critique est 7,81(p = 7,99/1011).
Les résultats sont loin de ce qu’ils devraient être sous la supposition que l’échantillon a été tiré au hasard. On est donc sûr qu’il y a
un défaut dans le mode de tirage.
10.8 Déterminez s’il y a un lien entre le type de tumeur cérébrale, et son site. On distingue trois types de tumeurs
A1 : tumeurs bénignes ; A2 : tumeurs malignes ; A3 : autres tumeurs
et les sites sont
B1 : lobes frontaux ; B2 : lobes temporaux ; B3 : autres régions cérébrales
Les données sont présentées dans le tableau suivant :
MAT1085 Chapitre 9 Tests du khi-deux 5
MAT1085.10.Sols.A12 5 21 octobre 2012
B1
B2
B3
A1
23
21
34
78
A2
9
4
24
37
A3
6
3
17
26
38
28
75
141
10.9 [Données du tableau A.8] Faites un test permettant de confirmer ou d’infirmer l’affirmation suivante : il y a une
relation entre le fait de croire en l’astrologie et le fait de croire en l’évolution. Il y a plusieurs façons de procéder. Vous
devrez exprimer l’hypothèse nulle formellement. Vous pouvez décider de grouper les catégories, mais justifiez votre
décision.
Les données sont rassemblées de façon à obtenir des effectifs théoriques suffisants et nous avons aussi éliminés ceux qui refusent de répondre. La
valeur « 1 » signifie une attitude négative face à l’astrologie (variable Astro) et favorable à la théorie de l’évolution (variable Singe.)
Astro
Singe 1 2 3
1 14 12 16 42
2 7 10 22 39
3 5 8 12 25
26 30 50 106
Distributions conditionnelles de la variable Astro étant donné Singe
Astro
Singe 1 2 3
1 0.333 0.286 0.381 1
2 0.179 0.256 0.564 1
3 0.200 0.320 0.480 1
Curieusement, il semble que ceux qui croient que l’astrologie est une ânerie ne sont pas ceux qui croient le plus fermement en la théorie de
l’évolution.
Effectifs théoriques
1 2 3
1 10.302 11.887 19.811 42
2 9.566 11.038 18.396 39
3 6.132 7.075 11.792 25
26.000 30.000 50.000 106
2 = 3,887 à 4 degrés de liberté. p = 0,421
On ne peut pas rejeter l’hypothèse d’indépendance. Les constatations faites ci-dessus sont peut-être fortuites.
10.10[Données du tableau A.8] Faites un test permettant de confirmer ou d’infirmer l’affirmation suivante : Il y a une relation entre le fait de croire en l’astrologie et le fait de croire que la longueur de la ligne de vie sur la paume contient de l’information sur la durée de vie. Il y a plusieurs façons de procéder. Vous devrez exprimer l’hypothèse nulle formellement. Vous pouvez décider de
grouper les catégories, mais justifiez votre décision.
Les données sont rassemblées de façon à obtenir des effectifs théoriques suffisants. On a aussi éliminé ceux qui refusent de répondre. La valeur « 1 »
signifie une attitude négative face à l’astrologie (variable Astro) et favorable à l’idée que la ligne de vie est liée à la durée de vie (variable Paume.)
Astro
Paume 1 2 3
1 0 4 9 13
2 2 10 14 26
3 19 10 18 47
21 24 41 86
Distributions conditionelles de la variable Astro étant donné Paume
Astro
Paume 1 2 3
1 0.000 0.308 0.692 1
2 0.077 0.385 0.538 1
3 0.404 0.213 0.383 1
Généralement parlant, une croyance à la signification de la ligne de vie est accompagnée d’une plus grande tolérance de l’astrologie.
Effectifs théoriques
1 2 3
1 3.174 3.628 6.198 13
2 6.349 7.256 12.395 26
3 11.477 13.116 22.407 47
21 24 41 86
2 = 15.24295, 4 degrés de liberté, p = 0,004
La relation est nettement significative.
10.11[Données du tableau A.8] Faites un test permettant de confirmer ou d’infirmer l’affirmation suivante : les gens qui pratiquent leur religion préfèrent épouser des coreligionnaires. Il y a plusieurs façons de procéder. Vous devrez exprimer l’hypothèse nulle formellement. Vous pouvez décider de grouper les catégories, mais justifiez votre décision.
Les données sont rassemblées de façon à obtenir des effectifs théoriques suffisants. On a aussi éliminé ceux qui refusent de répondre. La valeur « 1 »
signifie une attitude négative face au mariage avec une personne d’une autre religion (variable Religion) et une fréquentation active à l’église
(variable Église.)
1 / 17 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !