MAT1085 Chapitre 9 Tests du khi-deux 4
MAT1085.10.Sols.A12 4 21 octobre 2012
Il n’y a pas de différence entre Catholiques et Protestants. Mais il y a une entre Protestants et Catholiques d’une part, et Juifs
d’autre part: une plus forte estime de soi parmi les derniers.
10.6 Les données du numéro précédent sont celles de la population générale. Les données dans le tableau suivant portent sur une sous-
population: ceux qui n’ont pas complété l’école secondaire.
Les conclusions sont-elles les mêmes ici?
Voici le tableau des effectifs théoriques :
La valeur de khi-deux est = 1,18, à 2 degrés de liberté, ce qui n’est nullement significatif, puisque le point critique est de 5,99 (et
p = 0,5532). Donc il ne semble pas y avoir de différence entre les religions, contrairement aux résultats du numéro précédent, dans
lequel la conclusion était que les Juifs avaient une estime de soi supérieure à celle des autres. On pourrait être tenté de conclure que
cette supériorité s’estompe chez les Juifs peu scolarisés (ils ne s’aiment que s’ils sont instruits). Mais il faut se méfier de con-
clusions trop hâtives, car il faut se rappeler que les effectifs ici sont moins importants, ce qui rend plus difficile la détection des
différences. En d’autres termes, il est possible que les Juifs aient quand même une plus forte estime de soi, mais que la différence
n’est pas détectée. Cette conclusion est peu vraisemblable, cependant, à la lumière des fréquences conditionnelles, que voici :
On voit dont que les Juifs ont une estime de soi qui se situe entre celle des Protestants et celle des Catholiques.
10.7 Une équipe de chercheurs dispose de données sur une population d’accidents: l’ensemble de tous les accidents qui ont eu lieu au
Québec en l980 et qui ont entraîné des blessures corporelles. Pour la plupart des variables, il était aisé d’obtenir les données pour la
population entière. Pour certaines autres variables, comme celles qui identifiaient la position exacte du véhicule lors de l’accident, il
était difficile d’en déterminer les valeurs et on ne pouvait se permettre de le faire pour la population entière. Il a donc fallu prélever
un échantillon pour étudier la distribution de ces variables là. On a prélevé un échantillon de 600 accidents. Malheureusement,
l’échantillon n’a pas été prélevé de façon purement aléatoire, ce qui faisait douter de sa représentativité. Pour étudier la question de la
représentativité, on a choisi une variable particulière, la variable "gravité de la blessure", dont on connaissait la distribution pour la
population entière ainsi que pour l’échantillon. Formulez convenablement l’hypothèse que l’échantillon est représentatif et testez-la.
Les distributions sont :
Fréquence dans la population
Fréquence dans l’échantillon
Nous observons un vecteur X = (X1, X2, X3, X4) de loi (600 ; p1, p2; p3; p4). Si les tirages ont été faits au hasard, alors les
probabilités de sélection des différents types de blessure devraient être égales aux fréquences dans la population. Donc l’hypothèse
nulle, que les tirages sont faits au hasard, est Ho :p1 = 0,20; p2 = 0,30; p3 = 0,30 ; p4 = 0,20. Les valeurs observées et théoriques
sont :
La valeur de khi-deux est 2 = 50 avec 3 degrés de liberté; c’est très significatif, puisque le point critique est 7,81(p = 7,99/1011).
Les résultats sont loin de ce qu’ils devraient être sous la supposition que l’échantillon a été tiré au hasard. On est donc sûr qu’il y a
un défaut dans le mode de tirage.
10.8 Déterminez s’il y a un lien entre le type de tumeur cérébrale, et son site. On distingue trois types de tumeurs
A1 : tumeurs bénignes ; A2 : tumeurs malignes ; A3 : autres tumeurs
et les sites sont
B1 : lobes frontaux ; B2 : lobes temporaux ; B3 : autres régions cérébrales
Les données sont présentées dans le tableau suivant :