ANALYSE DE PLUSIEURS TABLES 2 x 2
C LOPEZ
Institut de l'Elevage
Service Biométrie
Septembre 2000
ANALYSE DE PLUSIEURS TABLES 2 x 2
I- Exemples 1
II- Le test de Mantel-Haenszel 6
III- Le test de l'interaction entre facteurs 8
Le test de Breslow-day
8
Le test de Paul et Donner
9
IV- Analyse de l'enquête "cas-témoin" Alcool-Cancer de la vessie 10
V- Le code SAS 17
Bibliographie 20
Analyses de plusieurs tables 2 x 2
______________________________________________________________________________________
Carlos Lopez : Traitement statistique des données qualitatives avec SAS 1
Institut de l'Elevage – Service Biométrie Décembre 2000
ANALYSES DE PLUSIEURS TABLES 2x 2
L'analyse de la liaison entre une variable explicative X binaire que nous appellerons "Facteur de
risque" (aussi appelé "facteur d'exposition") et une variable réponse binaire Y (observation d'un
signe, d'une maladie, dépassement d'un seuil économiquement intéressant où à risque vis-à-vis
d'une certaine maladie,…) peut être biaisée si la variable explicative X est elle même "corrélée"
(au sens litral du terme) avec un second facteur Z ayant lui même une incidence sur la réponse
étudiée Y.
Examinons quelques exemples…
I- Exemples
1- Dans une enquête visant à mesurer le risque de cancer de la vessie chez des fumeurs suivant le
type de tabac [Clavel et al., 1989] le fait d'inhaler la fue ou pas (qui peut dépendre du type de
tabac consommé et qui est facteur de risque de cancer) peut surestimer un éventuel effet du
type de tabac ou a contrario le sous-estimer. C'est le cas si par exemple les consommateurs de
tabac brun inhalent plus la fumée que les autres, le risque global de cancer sera alors sous-estimé
si on ne tient pas compte du facteur "inhalation".
inhalation Tabac oui non Total
oui Brun 267 134 401
Blond ou mixte 32 39 71
Total 299 173 472
non Brun 86 119 205
Blond ou mixte 23 34 57
Total 109 153 262
Total 408 326 734
Cancer de la vessie
2- On s'intéresse, dans le cadre d'une enquête "cas-témoins" sur le risque de mammites chez des
vaches primipares [P. Roussel, 2000], au risque associé à une surveillance non satisfaisante des
animaux après la tétée des veaux ("Survtete"). La surveillance des animaux est très dépendante
de la surveillance des cases où sont logés les génisses ("Casesurv"). La non prise en compte de
cette variable peut là aussi biaiser l'estimation de l'effet du type de surveillance des primipares
sur le risque de mammite.
Analyses de plusieurs tables 2 x 2
______________________________________________________________________________________
Carlos Lopez : Traitement statistique des données qualitatives avec SAS 2
Institut de l'Elevage – Service Biométrie Décembre 2000
Casesurv Survtete Cas Témoin Total
mauvaise mauvaise 8 3 11
bonne 0 0 0
Total 8311
bonne mauvaise 10 7 17
bonne 9 19 28
Total 19 26 45
Total 27 29 56
Castem
Cas : vache ayant une mammite ; témoin : vache indemne de mammite
3- Dans le cadre d'une enquête épidémiologique rétrospective visant à étudier les facteurs de
risque de l'infarctus du myocarde 100 patients souffrant de problèmes cardiaques et 100
individus témoins ont été interrogés sur leurs consommations d'alcool et de tabac (données
fictives, J.J. Schlesselman).
Tabac Alcool oui non Total
fumeur oui 63 36 99
non 7 4 11
Total 70 40 110
non fumeur oui 8 16 24
non 22 44 66
Total 30 60 90
Total 100 100 200
Infarctus Myocarde
On veut estimer l'effet propre de l'alcool en contrôlant l'usage du tabac. L'estimation de la
liaison entre "alcool" et "infarctus" qui ne tiendrait pas compte du risque induit par la
consommation de tabac fournirait une estimation biaisée du risque associé à l'alcool, les buveurs
fumant plus que les non buveurs.
Le problème de la prise en compte d'un second facteur (Z) se pose également lorsque les valeurs
de celui-ci sont contrôlées a priori. Z n'est pas corrélé à X mais est facteur de risque de Y.
4- On veut tester l'effet d'un produit ("Test") sur des patients souffrant d'insuffisance
respiratoire. Deux centres hospitaliers participent à l'essai. Dans chaque centre 90 patients ont
été répartis par tirage au sort en deux groupes de 45 individus. Un groupe recevant le produit à
tester et un groupe recevant un placebo (données fictives).
Analyses de plusieurs tables 2 x 2
______________________________________________________________________________________
Carlos Lopez : Traitement statistique des données qualitatives avec SAS 3
Institut de l'Elevage – Service Biométrie Décembre 2000
Centre Traitement oui non Total
1Test 29 16 45
Placebo 14 31 45
Total 43 47 90
2Test 37 8 45
Placebo 24 21 45
Total 61 29 90
Total 104 76 180
Amélioration respiration
Ici aussi la non prise du centre hospitalier fournit généralement des estimations biaisée des
indices de liaison entre le "facteur de risque" (ici le traitement) et les problèmes respiratoires
(et ce bien que le la répartition des deux groupes de traitement soit la même dans les deux
centres puisque l'on contrôle le nombre de patients par centre et la répartition de ceux-ci entre
les deux groupes dans chaque centre).
5- Dans une étude sur l'effet de deux types d'accès à l'alimentation, accès à l'auge en continu ou
non, sur l'aptitude à faire du gras plus ou moins coloré sur des agneaux [N. Grenet, 1999] le type
de logement des animaux (en cases collectives ou individuelles) a été contrôlé dans le dispositif
expérimental car pouvant avoir une incidence sur le risque d'obtenir des gras plus colorés.
IDCASLOT IDACCES blanc rouge Total
0 0 10 10 20
151520
Total 15 25 40
1081220
141620
Total 12 28 40
Total 27 53 80
Couleur du gras
Il importe donc de tenir compte du type de logement des animaux pour l'étude de la liaison entre
le type d'accès à l'alimentation et le risque d'avoir du gras coloré.
Le biais généré si nous négligeons l'effet de la variable Z peut être suffisamment important pour
entraîner des conclusions fausses comme le montre l'analyse de l'exemple 3 ci-dessous.
1 / 22 100%