Situation au travail pour les femmes atteintes de cancer du sein

publicité
AUDREY LECLERC
Situation au travail pour les femmes atteintes de
cancer du sein
Mémoire présenté
à la Faculté des études supérieures de l’Université Laval
dans le cadre du programme de maı̂trise en économique
pour l’obtention du grade de Maı̂tre ès arts (M.A.)
FACULTÉ DES SCIENCES SOCIALES
UNIVERSITÉ LAVAL
QUÉBEC
AVRIL 2007
c
Audrey
Leclerc, 2007
Résumé
Le cancer du sein peut affecter de façon négative l’expérience de travail des femmes
atteintes. Des modifications négatives ou involontaires peuvent donc être observées
dans leur situation d’emploi. Dans leur étude, Maunsell et al (2004) ont étudié cette
problématique en comparant un échantillon de cancéreuses et un échantillon témoin
composé de femmes qui n’ont pas le cancer du sein. On appréhende l’effet du cancer en
comparant les moyennes relatives aux deux groupes de nombreuses variables reliées au
marché du travail. La principale conclusion est que les femmes cancéreuses ne sont pas
différentes des femmes témoins. Dans ce mémoire, on refait la même démarche en utilisant toutefois un échantillon témoin possiblement composé de femmes cancéreuses. Par
ailleurs, les comparaisons sont fondées sur la méthode de l’appariement (« matching » )
et non sur de simples moyennes. On remarque quelques petites différences dans les
résultats relatifs à chacun des groupes au niveau de certaines caractéristiques d’emploi.
Par contre, ces différences sont assez faibles. De façon générale, on peut conclure que les
échantillons de femmes témoins sont relativement semblables à l’échantillon de femmes
atteintes de cancer du sein.
Table des matières
Résumé
ii
Table des matières
iii
Liste des tableaux
iv
Table des figures
v
Introduction
1
1 Revue de la littérature
4
2 Le matching
2.1 Effet du traitement sur les traités et score de propension . . . . . . . .
2.2 Le modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
9
10
3 Les
3.1
3.2
3.3
13
13
23
28
Résultats
Statistiques descriptives . . . . . . . . . . . . . . . . . . . . . . . . . .
Régressions binomiales . . . . . . . . . . . . . . . . . . . . . . . . . . .
Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Conclusion
42
Bibliographie
44
Liste des tableaux
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.10
3.11
3.12
3.13
Conditions de travail,au départ, des femmes de tous les groupes témoin
et de celles de la population générale de la province de Québec entre
20-39 ans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Conditions de travail,au départ, des femmes de tous les groupes témoin
et de celles de la population générale de la province de Québec entre
40-49 ans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Conditions de travail,au départ, des femmes de tous les groupes témoin
et de celles de la population générale de la province de Québec entre
50-59 ans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Conditions de travail des femmes de tous les groupes témoin au moment
du diagnostique des femmes cancéreuses . . . . . . . . . . . . . . . . .
Conditions de travail des cancéreuses et des femmes du groupe témoin
au moment de l’entrevue et 3 ans après, parmi celles qui ont un emploi
à la fin (étude de Maunsell et al (2004) ) . . . . . . . . . . . . . . . . .
Conditions de travail des femmes des différents groupes contrôle tirés à
partir de l’EDTR au moment de l’entrevue et 3 ans après, parmi celles
qui ont un emploi à la fin . . . . . . . . . . . . . . . . . . . . . . . . . .
Risque relatif brut et ajusté de la situation des cancéreuses et des femmes
du groupe témoin 3 ans après le diagnostique (étude de Maunsell et al
(2004) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Risque relatif brut et ajusté de la situation des cancéreuses et des femmes
du groupe témoin de l’EDTR (SM,SA), 3 ans après le diagnostique . .
Risque relatif brut et ajusté de la situation des cancéreuses et des femmes
du groupe témoin de l’EDTR (SM,A), 3 ans après le diagnostique . . .
Risque relatif brut et ajusté de la situation des cancéreuses et des femmes
du groupe témoin de l’EDTR (M,SA), 3 ans après le diagnostique . . .
Risque relatif brut et ajusté de la situation des cancéreuses et des femmes
du groupe témoin de l’EDTR (S,A), 3 ans après le diagnostique . . . .
Résultats du probit selon les caractéristiques personnelles pour chaque
échantillon témoin . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Taille des échantillons respectant le support commun . . . . . . . . . .
15
16
17
20
22
22
25
25
26
26
27
30
37
Liste des tableaux
3.14 Résultats de matching pour tous les échantillons . . . . . . . . . . . . .
v
39
Table des figures
2.1
3.1
3.2
3.3
3.4
3.5
Exemple d’un support commun pour deux distributions de score de propension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
Densité
Densité
Densité
Densité
Densité
31
32
33
34
35
du score de propension pour l’échantillon de Maunsell et al
du score de propension pour l’échantillon (SM,SA) . . . .
du score de propension pour l’échantillon (SM,A) . . . . .
du score de propension pour l’échantillon de (M,SA) . . .
du score de propension pour l’échantillon (M,A) . . . . .
(2004)
. . .
. . .
. . .
. . .
Introduction
Le cancer du sein est le cancer le plus répandu chez les femmes et le deuxième
en importance au niveau des décès au Canada [Société Canadienne du Cancer (2005),
Fondation Québécoise du Cancer (2005)]. Les traumatismes psychologiques et physiologiques liés à son apparition se traduisent parfois par des retraits plus ou moins
prolongés du marché du travail. Les retraits sont parfois motivés par l’agressivité des
traitements médicaux, mais peuvent également être motivés par d’autres considérations
(économiques, psychologiques, etc).
La littérature économique montre sans équivoque que des retraits plus ou moins
prolongés du marché du travail se traduisent généralement par des baisses de salaires et de revenus éventuels d’environ 3% [Ruhm (1998)]. Ces baissent traduisent
soit une dépréciation du capital humain, soit un faible attachement au travail que sanctionne le marché (discrimination statistique). Or, ces conclusions portent généralement
sur des retraits pour cause de maternité. Les retraits occasionnés pour des motifs
« exogènes » comme la maladie ont été peu étudiés en raison d’un manque de données
pertinentes.
Au cours des dernières années, plusieurs études se sont intéressées aux effets occasionnés par le cancer du sein sur l’emploi et le revenu des femmes qui en sont victimes.
C’est le cas pour les nombreux travaux de Bradley et al. Ils portent sur une seule
banque de données issue d’une enquête effectuée à Détroit. L’échantillon est constitué
uniquement de femmes cancéreuses. L’analyse statistique consiste à comparer le statut socio-économique de ces femmes avec un échantillon de femmes tiré de l’enquête
Current Population Survey (CPS) nécessaire pour la construction du groupe témoin.
L’hypothèse de base des auteurs est que la présence potentielle de femmes cancéreuses
dans l’enquête CPS n’invalide pas les résultats de la modélisation économétrique. Les
travaux de Maunsell et al (2004), au contraire, sont basés sur un échantillon de femmes
québécoises cancéreuses et non cancéreuses. L’identification du statut médical a été effectuée à partir du Registre des tumeurs québécois (RTQ). L’avantage de l’échantillon
québécois au niveau de ses propriétés statistiques est amoindri par le coût énorme lié à
Introduction
2
la conception d’un groupe témoin « propre ». En fait, la constitution du groupe témoin
est aussi coûteuse que celle du groupe « traitement », ce qui fait en sorte que ce type
d’enquête est en moyenne deux fois plus cher que les enquêtes utilisées par Bradley et
al.
De façon générale, les travaux de Maunsell et al (2004) montrent que le cancer du
sein a peu d’effet à long terme sur l’emploi et le revenu des femmes cancéreuses. En
revanche, les travaux de Bradley et al montrent que les effets sont assez importants. Le
but de cette recherche est double ; (1) nous cherchons à établir dans quelle mesure les
résultats contradictoires sont dus à des problèmes d’échantillonnage ; (2) nous analysons
la sensibilité des résultats de Maunsell et al (2004) en ayant recours à des groupes de
contrôle tirés de l’Enquête sur la Dynamique du Travail et du Revenu (EDTR) et en
utilisant des outils statistiques puissants.
Grâce à la collaboration de l’équipe d’Elizabeth Maunsell du département de médecine
sociale et préventive de l’Université Laval, nous avons accès aux données d’enquête utilisées dans leurs travaux. Le groupe « traitement » de l’Enquête sur le Cancer du Sein
de Québec de Maunsell et al (2004), soit l’ECSQ1 , est composé de femmes québécoises
atteintes de cancer du sein qui étaient en emploi au moment du diagnostic (1997) et
qui étaient âgées entre 35 et 64 ans. Le groupe « témoin » , lui, est constitué de femmes
du même groupe d’âge et qui étaient en emploi durant l’année 1997. Un questionnaire
rétrospectif a été administré aux femmes des deux groupes durant l’année 2000 pour
connaı̂tre les activités reliées au marché du travail au cours de la période 1997-1999
inclusivement.
La première partie de notre travail consiste à tirer un échantillon de femmes de
l’ETDR sur la base des mêmes critères que ci-dessus. Le recours à l’ETDR est fondamental puisque nous devons reconstituer la chronologie des activités sur le marché du
travail en terme d’emploi et de revenus sur la période 1997-1999. Notre échantillon est
donc constitué d’un panel couvrant trois années. Ce groupe témoin est très semblable
à celui utilisé par Bradley et al et contient potentiellement des femmes cancéreuses. La
première partie du travail consiste à réestimer les effets du cancer du sein en utilisant
les mêmes outils statistiques que ceux utilisés par Maunsell et al (2004). L’hypothèse
nulle de départ postule que les groupes témoins de l’ECSQ et de l’ETDR démontrent
les mêmes propriétés statistiques. En conséquence, les effets mesurés devraient être
statistiquement les mêmes, indépendamment du groupe témoin utilisé.
Les effets du cancer mesurés dans les études de Maunsell et al (2004) et de Brad1
Cet acronyme sera dorénavant mentionné pour désigner les échantillons utilisés dans la recherche
de Maunsell et al (2004).
Introduction
3
ley et al (2002a, b) sont basés sur des tests statistiques univariés et des régressions
linéaires simples, considérant peu de variables et utilisant la totalité des échantillons.
Nous proposons plutôt d’asseoir notre analyse sur les méthodes d’appariement statistique (« matching estimators »). L’idée de base est que, conformément à la littérature
en épidémiologie, l’apparition du cancer peut être prédite à partir de certaines variables
(« prédicteurs ») conventionnelles (âge, état de santé, etc). En ce sens, le cancer n’est
pas totalement aléatoire [Bondy et Newman (2002)]. Mentionnons que cela implique
que les deux échantillons comparés n’ont pas à être identiques. C’est relativement à cet
aspect qu’il est pertinent d’expliquer le cancer.
Les deux échantillons témoins utilisés (EDTR et ECSQ) ont de fortes chances d’être
différents, considérant qu’ils sont fondés sur des critères de sélection des observations
distincts. Malgré le fait que les groupes témoin de l’ECSQ et de l’ETDR sont identiques au niveau de l’âge et de la situation de l’emploi, rien n’empêche que les autres
caractéristiques déterminantes soient distribuées différemment. Nous proposons d’utiliser la méthode d’appariement qui permet un meilleur arrimage des groupes témoin et
traitement. Celui-ci est basé sur un nombre élevé de variables et les procédures statistiques d’appariement imposent que les distributions des variables explicatives soient les
mêmes entre les deux groupes (« Balancing property tests »). Autrement dit, l’incapacité
de reproduire les résultats de Maunsell et al (2004) à l’aide des méthodes statistiques
utilisées dans leurs recherches pourrait être intrinsèque aux estimateurs et aux données
(ETDR) elles-mêmes. Le cas échéant, nous chercherons à déterminer si la méthode par
appariement parvient à compenser ces lacunes et donc que l’utilisation d’un échantillon
témoin de l’EDTR ou de l’ECSQ permet d’obtenir des résultats semblables.
Cette recherche a deux contributions majeures. La première est d’établir si les
échantillons de groupes témoins tirés d’enquêtes conventionnelles permettent de reproduire les résultats sur l’impact du cancer du sein utilisant un groupe contrôle spécifique.
Dans la négative, la deuxième contribution de la recherche permet d’établir si les
méthodes d’estimation sophistiquées telles les estimateurs par appariement permettent
de compenser les différences au niveau de la population utilisée pour la création des
groupes témoins. Dans l’étude de Maunsell et al, il n’y a pas de cancéreuses dans la
population de femmes témoin contrairement à celle de l’EDTR. Le cas échéant, cela
pourra avoir des conséquences importantes sur la conduite de la recherche. En effet, il
sera alors possible de consacrer davantage de ressources à la constitution de groupes
traitements, sachant que les enquêtes conventionnelles et les techniques statistiques
sophistiquées permettent d’établir des groupes contrôles convenables à faibles coûts.
Chapitre 1
Revue de la littérature
On estime à 21 600 les nouveaux cas de cancer du sein chez la femme au Canada
chaque année. En 2005, parmi toutes les femmes atteintes, 5 300 en sont décédées
[Société canadienne du cancer, (2005)]. Chaque année, plusieurs études analysent les
impacts de cette maladie sur la femme elle-même et sur son travail. Par ces recherches,
on tente aussi de déceler les éléments qui peuvent prédire ou avoir une certaine influence
sur l’incidence du cancer du sein, comme par exemple l’âge, l’activité physique ou
l’historique de la maladie dans la famille. Cette maladie touche énormément de femmes
partout dans le monde et en augmentant nos connaissances à l’aide de recherches, il est
possible d’accroı̂tre les chances de survie. Malheureusement, la plupart des recherches
sont faites à l’étranger, donc souvent peu représentative de la population québécoise.
Dans la plupart des études, sinon dans la totalité, on considère le cancer du sein
comme étant un phénomène parfaitement aléatoire [Bradley et al (2002a, b)]. On ne
possède généralement pas assez d’information sur le sujet et sur les variables qui peuvent
occasionner cette maladie. Par contre on sait que l’âge est un assez bon indicateur
[Fondation québécoise du cancer (2005)]. En fait, plus une femme vieillit, plus elle est
susceptible de souffrir du cancer du sein. Par exemple, une femme âgée entre 40-49 ans
a 1,3% de probabilité d’être atteinte. Pour celle âgée entre 50-59 ans, la probabilité est
de 2,5% alors que celle entre 60-69 ans a une probabilité de 3,1% [Fondation québécoise
du cancer (2005)]. Il est également important de noter que toutes ces femmes ont encore
la possibilité de se retrouver sur le marché du travail. Conséquemment, leur maladie
peut avoir un impact considérable sur leur emploi, leur revenu et nécessairement sur
le marché du travail en général. Avec le vieillissement de la population, il est probable
que les cas de cancer du sein augmentent. Mise à part l’âge, l’historique médical des
patientes peut également s’avérer un bon prédicateur. En fait, certaines femmes ayant
le cancer du sein proviennent de familles avec des antécédents concernant cette maladie
Chapitre 1. Revue de la littérature
5
[Fondation québécoise du cancer 2005].
Les études faites sur le cancer du sein ont chacune leurs particularités. Par exemple,
dans certaines d’entre elles, on utilise seulement le groupe de femmes ayant le cancer
du sein [Satariano et al (1996) ; Bloom et al (1998) ; Epping-Jordan et al (1999) ; Coile
(2004) ; Wong-Kim et Bloom (2004) ; Cancer Facts and Figure (2005)]. Dans ces études,
il est impossible d’isoler les variations du marché du travail qui sont « normales », c’està-dire qui font partie du cycle inhérent au marché. Par contre, lorsqu’on utilise un
groupe de contrôle qui est comparé à celui des cancéreuses, on peut isoler les variations
« normales » du marché avec celles qui sont causées par le cancer du sein [Bradley et
al (2002a, b, 2005) ; Maunsell et al (2004)].
Tel que mentionné ci-dessus, on sait que le cancer du sein a des répercussions sur le
marché du travail. Par exemple, un diagnostique du cancer du sein provoque plusieurs
changements dans la vie professionnelle, personnelle et familiale de la femme atteinte.
Le traitement peut engendrer un arrêt de travail temporaire ou permanent. Certaines
études corroborent ces hypothèses alors que d’autres les invalident. Selon Maunsell et
al (2004), il ne semble pas y avoir de différence significative entre un groupe témoin et
un groupe de femmes atteintes du cancer du sein 3 ans après le diagnostique. D’après
leurs résultats, la grande majorité des femmes travaillent après ce laps de temps. On
conclut également que les conditions de travail des deux groupes ne changent pas pour
la majorité des femmes en 3 ans. Il ne semble pas y avoir non plus d’incitatif pour
ces mêmes femmes à prendre leur retraite. La seule différence que l’on peut mentionner est que les femmes cancéreuses accordent moins d’importance à leur travail et y
mettent moins d’effort à la suite du diagnostique. Par contre, d’autres études [Bradley
et al (2004, 2005) ; Satariano et DeLorenze (1996) ; Coile (2004)] mentionnent que les
cancéreuses retournent en moins grand nombre sur le marché du travail par rapport
au groupe témoin. De plus, certaines études mentionnent que celles qui retournent sur
le marché du travail diminuent leur nombre d’heures travaillées par rapport à leur situation précédant le diagnostique. À l’inverse, d’autres recherches concluent que les
femmes qui retournent sur le marché du travail augmentent le nombre d’heures qu’elles
travaillent relativement à leur situation avant le diagnostique [Bradley et al (2002a,
b)]. Ce phénomène semble être plus important chez celles qui travaillent à temps partiel au moment du diagnostique. Ce résultat, qui est des plus surprenants, est assez
difficile à expliquer. La plupart des recherches n’appuient pas les hypothèses qui supposent que ces femmes attachent plus d’importance à leur travail, qu’elles ont un statut
socio-économique plus élevé ou qu’elles veulent conserver leur couverture d’assurance
santé auprès de leur employeur. On peut, par exemple, supposer que l’échantillon de
cancéreuses avant le diagnostique est différent de l’échantillon du groupe témoin au
même moment. On peut également supposer que la femme qui retourne au travail
Chapitre 1. Revue de la littérature
6
désire travailler plus d’heures pour combler la perte de revenu occasionnée par un arrêt
de travail durant les traitements.
Plusieurs éléments peuvent influencer le retour au travail des malades. Les caractéristiques de l’emploi et également la sévérité de la maladie en sont des exemples
[Satariano et al (1996)]. Plus la maladie devient sévère, plus les répercussions sur l’offre
de travail des femmes sont importantes [Satariano et al (1996) ; Bloom et al (1998) ;
Bradley et al (2002a, 2004, 2005) ; Coile (2004)]. Parmi les femmes diagnostiquées très
tôt, on remarque des caractéristiques très semblables à celles du groupe témoin de Bradley et al (2004, 2005). Le type de travail est aussi un élément important dans leur choix
de retourner au travail ou non. Un travail physique ou manuel est beaucoup plus exigeant pour le corps qu’un travail de bureau, par exemple. Plusieurs études notent que
parmi les femmes qui ne retournent pas sur le marché du travail, la majorité d’entre elles
ont un travail physique [Satariano et al (1996) ; Maunsell et al (2004)]. On mentionne
que 47% des cancéreuses qui ne travaillent pas indiquent que la nature de leur travail
en est la cause. Ce sont en majorité les traitements qui occasionnent ce problème : ils
rendent souvent les patientes incapables de travailler adéquatement, ce qui nécessite
un arrêt de travail [Satariano et al (1996)]. Par contre, selon Bradley et al (2004), ces
résultats ne sont pas vérifiables car ils ne sont pas significatifs.
L’état matrimonial de la femme touchée par la maladie et la source d’assurance
salaire peuvent aussi avoir un impact important. Selon Bradley et al (2005)(b), on
remarque une diminution de l’offre de travail plus importante chez les femmes qui sont
mariées et qui sont assurées par l’assurance de leur conjoint. Une femme qui s’absente
de son travail en raison de sa maladie a moins d’incitatifs à retourner au travail. Lorsque
l’assurance est supportée par la femme, elle doit retourner au travail le plus tôt possible
sinon, après un laps de temps déterminé, la patiente risque de perdre son assurance.
Si c’est l’employeur du conjoint qui procure l’assurance, la femme peut récupérer sans
craindre de perdre sa propre assurance. On observe aussi que ces femmes ont plus de
chances d’être en meilleure forme et davantage disposées à retourner au travail que
celles qui doivent retourner travailler pour une question d’assurance avant la fin de leur
convalescence. Selon cette même source, les femmes assurées avec leur propre employeur
vont même jusqu’à diminuer les traitements et les doses pour continuer à travailler le
plus possible.
Comparer deux échantillons (témoin et traitement) demeure malgré tout une opération
qui peut entraı̂ner certains biais dans les résultats. Pour effectuer une telle comparaison, on considère que les deux groupes sont équivalents sous plusieurs caractéristiques
comme l’âge et le statut d’emploi. La seule différence qui subsiste entre ces deux groupes
est le fait d’avoir ou non le cancer du sein. On suppose que la personne du groupe témoin
Chapitre 1. Revue de la littérature
7
est semblable à celle du groupe traitement si celle-ci n’avait pas le cancer. Par contre, la
femme qui a effectivement le cancer n’est pas observable dans l’état sans cancer (contrefactuel). Cela entraı̂ne un biais de sélection. Pour remédier à ce problème, on peut avoir
recours à la méthode dite de « matching ». Cette démarche nécessite la construction
d’une probabilité d’avoir le cancer pour les individus du groupe témoin et du groupe
traitement. Par contre, certaines femmes sont exclues des calculs par souci de respect
du support commun au niveau de ces probabilités entre le groupe de femmes témoins
et de cancéreuses. C’est donc ce premier volet que l’on va tenter d’ajouter à l’étude de
Maunsell et al (2004).
Chapitre 2
Le matching
Notre recherche se compose principalement de deux étapes. On réévalue d’abord
les travaux de Maunsell et al (2004) à l’aide du matching. Par la suite, on utilise un
échantillon témoin provenant de la banque de données de l’EDTR et on refait la même
démarche. On pourra observer si les deux échantillons témoins sont semblables et s’il
est vraiment indispensable de construire un échantillon témoin ne contenant aucun
sujet contaminé par le cancer du sein. Il y a deux différences entre le groupe témoin
de l’ECSQ et de l’EDTR. Premièrement, la population utilisée pour construire chacun
des groupes témoins est différente car dans un des cas (EDTR) elle peut contenir des
femmes atteintes de cancer du sein. Deuxièmement, les questionnaires utilisés pour
recueillir l’information des femmes témoins sont différents. Cela implique, par exemple,
que deux variables qui représentent l’expérience de travail pour chacun des groupes
contrôles, peuvent renfermer des distinctions dans leur définition qui sont difficilement
décelables. C’est le cas pour la variable de scolarité. La composition des échantillons
est donc la base de notre projet. Le matching est une méthode statistique qui permet
de construire des estimateurs pour évaluer les effets de l’intervention d’un traitement,
en comparant les résultats entre des individus traités et des individus similaires dans
un groupe de comparaison [Todd (1999)]. Cette méthode permet donc de raffiner les
estimations des différences entre des femmes cancéreuses avec les femmes appartenant
au groupe témoin.
Chapitre 2. Le matching
2.1
9
Effet du traitement sur les traités et score de
propension
Au départ, notre intérêt porte principalement sur les résultats concernant les femmes
cancéreuses en l’absence de cancer. On veut donc évaluer l’impact moyen du cancer sur
les cancéreuses :
∆D=1 (X) = E(Y1 − Y0 |X, D = 1),
(2.1)
où X représente un vecteur de caractéristiques individuelles. La variable Y indique les
résultats sans cancer (Y0 ) et avec cancer (Y1 ) et D indique l’absence ou la présence de la
maladie. En fait, nous observons les résultats moyens du groupe de cancéreuses sachant
qu’elles ont le cancer :
E(Y1 |X, D = 1),
(2.2)
mais pas les résultats moyens de ces dernières en l’absence de cancer (contrefactuel) :
E(Y0 |X, D = 1).
(2.3)
Devant cette difficulté, on considère que les résultats moyens en l’absence de cancer
sont égaux à ceux des femmes faisant partie d’un groupe témoin conditionnellement à
certaines caractéristiques propres à chacune d’entre elles :
E(Y0i |Xi , Di = 1) = E(Y0i |Xi , Di = 0).
(2.4)
On compare donc deux échantillons. Par contre dans plusieurs situations, il est tout à
fait inexact de considérer une telle correspondance entre le groupe témoin et traitement.
Cela peut entraı̂ner des biais au niveau des estimations. Par exemple, dans l’étude de
Maunsell et al (2004), on fait cette correspondance en s’assurant que l’âge et le statut
d’emploi au moment du diagnostique des femmes cancéreuses sont les mêmes que les
non cancéreuses. Dans notre recherche, nous utilisons plutôt un score de propension au
lieu de caractéristiques personnelles pour regrouper les femmes entre les échantillons.
Cet élément, qui est central au matching, indique la probabilité d’avoir le cancer du
sein conditionnellement à certaines caractéristiques observables, comme l’âge, le nombre
d’enfants, le statut matrimonial, etc. Ces dernières doivent influencer les individus avant
d’avoir le cancer ou être fixes à travers le temps. Ce sont des variables a priori à la
maladie. Le cancer n’a donc pas d’impact sur ces variables. Si des variables qui ne
sont pas a priori au cancer sont inclues dans le modèle, on introduit un biais dans
l’estimation.
On calcul ce score de propension autant pour les individus du groupe témoin que
pour ceux du groupe traitement. Cela permet de relier les deux échantillons par une
probabilité d’avoir le cancer du sein. On estime cette probabilité de façon paramétrique
Chapitre 2. Le matching
10
à partir d’un modèle économétrique de type probit. Comparer plusieurs caractéristiques
entres elles est un travail beaucoup plus ardu que de comparer des probabilités qui sont
des scalaires. Plus on a de variables dans le vecteur X, plus il est difficile de trouver deux
individus ayant exactement les mêmes caractéristiques. On doit éliminer les observations
qui ne trouvent pas de correspondance et un faible nombre de ces correspondances entre
elles peut causer des problèmes d’estimation. Au lieu de considérer un vecteur contenant
plusieurs caractéristiques pertinentes (X), on utilisera plutôt une probabilité d’avoir le
cancer du sein dans son ensemble. Rosenbaum et Rubin (1983) ont montré que si on
peut apparier sur les X, on peut aussi apparier sur P(X) :
P (X) ≡ P (D = 1|X)
(2.5)
0 < P (X) < 1.
(2.6)
Pour notre sujet d’étude, le P(X), qui est le score de propension, représente la probabilité
de se retrouver dans le groupe de cancéreuses. Rosenbaum et Rubin (1983) ont prouvé
que :
(Y0i ⊥Di )|Xi ⇒ (Y0i ⊥Di )|P (Xi ).
(2.7)
En fait, si les données justifient l’appariement sur les X, elles justifient aussi de matcher
sur P(X). Ça élimine le problème de dimensionnalité de X. Par la suite, cela nous amène
à l’égalité suivante :
E(Y0i |P (Xi ), Di = 1) = E(Y0i |P (Xi ), Di = 0),
(2.8)
soit que les résultats moyens sans cancer d’une femme ayant le cancer sont égaux aux
résultats moyens sans cancer d’une femme qui fait partie de l’échantillon témoin, conditionnellement à un score de propension « semblable ». En utilisant le score de propension, on peut conditionner les différences entre les groupes de femmes témoin et
cancéreuses qui sont, au départ, différents.
2.2
Le modèle
Dans notre recherche, la fonction de Kernel est utilisée pour créer un estimateur
lisse de notre quantité d’intérêt, soit :
Ê(Y0i |P (Xi ), Di = 0) =
n0
X
Wj (P (Xi ), P (Xj ))Y0j
(2.9)
j=1
où
(Xj))
K (P (Xi )−P
hn
Wj (P (Xi ), P (Xj )) = Pn
0
j=1
(Xj ))
K (P (Xi )−P
hn
(2.10)
Chapitre 2. Le matching
11
Pour un P (Xi ) donné d’une femme cancéreuse, on associe toutes les femmes témoins j
qui ont une probabilité semblable. La fonction de pondération (2.10) permet d’attribuer
un poids plus important aux femmes du groupe contrôle dont la valeur du score est
relativement près de la probabilité d’une cancéreuse quelconque. En fait, on prend
le score d’une cancéreuse donnée et on créé une fenêtre h de la forme P (Xi ) ± (h).
Tous les points inclus dans cette fenêtre se verront attribuer un poids représentant
leur proximité du point milieu, soit P (Xi ) de la femme cancéreuse en question. Tous les
points à l’extérieur de ces limites auront un poids nul. La somme de la fonction de poids
sur les j est de 1. Pour l’élaboration de calculs reliés au matching, une fenêtre de 0,06 est
utilisée. Dans le logiciel statistique Stata, lorsqu’on utilise une fonction Epanechnikov
pour faire du matching, la taille de la fenêtre par défaut est de 0,06.
Dans l’étude de Maunsell et al (2004), on utilise des régressions simples pour évaluer
les différences entre les deux groupes de femmes. En fait, on soustrait les moyennes des
femmes témoins de celles des femmes cancéreuses. Avec une telle démarche, on fait une
sélection sur les observables. C’est ce qui se produit lorsqu’on sélectionne les femmes des
groupes selon leur âge et leur statut d’emploi. Avec le matching, on peut aller un peu
plus loin dans notre analyse. On peut, encore une fois, sélectionner sur les observables
par l’utilisation du score de propension qui est formé de caractéristiques observables.
Par contre, on peut également sélectionner sur les non observables invariant dans le
temps en faisant du matching de différence-en-différence. Si on fait l’hypothèse que le
biais de sélection est constant dans le temps, ce dernier est éliminé avec l’estimateur
en différence. On peut donc corriger pour certains types de sélection sur ces non observables. Ce genre d’estimation compare les différences entre les deux échantillons dans le
temps, qui est donc une double comparaison. L’estimateur s’écrit de la façon suivante :
DD = [E(Y1t |P (X), D = 1) − E(Y1t0 |P (X), D = 0)]
− [E(Y0t |P (X), D = 1) − E(Y0t0 |P (X), D = 0)]
(2.11)
Les t et t’ représentent le temps après et avant le traitement respectivement.
La fonction de Kernel, que l’on retrouve dans notre fonction de poids Wj (P (Xi ), P (Xj )),
peut prendre plusieurs formes selon des caractéristiques précises. Dans le cadre de notre
analyse, nous utilisons une fonction Epanechnikov qui a la forme fonctionnelle suivante :
3
K(u) = (1 − u2 ) avec u ∈ [−1, 1]
(2.12)
4
Le score de propension est un élément essentiel si l’on désire utiliser le matching. Par
contre on doit trouver une correspondance entre les probabilités d’avoir le cancer du
sein entre une femme du témoin et cancéreuse. Chaque femme des deux groupes a son
propre score de propension. Il est donc probable que la concordance entre les probabilités des deux groupes s’avère impossible dans certaines situations. C’est pour cette
Chapitre 2. Le matching
12
raison que l’on ne considère que les femmes d’un groupe que l’on peut apparier avec
celle de l’autre groupe selon leur probabilité d’avoir le cancer du sein. L’effet traitement
estimé correspond donc à l’effet traitement pour les femmes cancéreuses que l’on a pu
apparier selon leur score de propension. Les autres femmes sont éliminées des calculs.
Dans la figure 2.1, on remarque que les deux distributions de probabilités de cet exemple
occasionnent un support commun très restreint, les femmes des deux groupes n’ayant
pas des probabilités semblables. En fait, les femmes des deux groupes n’ont pas beaucoup de probabilités communes. Le support commun représente donc la surface pour
laquelle les probabilités d’avoir le cancer du sein se chevauchent. Dans les calculs de
ce cas particulier, on ne considèrera que les femmes ayant une probabilité entre 0.15
et 0.75. En sélectionnant ainsi les femmes qui sont dans les calculs, on s’assure d’avoir
deux échantillons semblables au niveau des scores de propension. On calcule donc l’effet traitement pour les cancéreuses restantes. Conserver toutes les observations peut
occasionner un biais dans nos estimations.
Fig. 2.1 – Exemple d’un support commun pour deux distributions de score de propension
Dans l’étude de Maunsell et al (2004), plusieurs vérifications statistiques sont faites
pour analyser les composantes des échantillons de femmes cancéreuses et témoins afin
de les comparer. Après les quelques précisions apportées au niveau de la méthode de
matching, il est maintenant pertinent de comparer les échantillons témoin de l’ECSQ
et de l’EDTR en suivant ces mêmes vérifications statistiques. On pourra ainsi constater
si la présence possible de cancéreuses dans l’échantillon témoin amène des changements
marquants dans les statistiques descriptives.
Chapitre 3
Les Résultats
Dans leur recherche, Maunsell et al (2004) font plusieurs vérifications de niveau statistique pour analyser la composition de chacun de leur échantillon, autant témoin que
cancéreuses. Par la suite, ils effectuent des comparaisons de moyennes entre le groupe
de femmes des groupes témoin et cancéreuses pour vérifier s’il existe des différences
notables entre ces deux catégories de femmes. De notre côté, avant de comparer les
cancéreuses avec les femmes de l’EDTR, il est important de vérifier au préalable si
notre échantillon de l’EDTR est semblable à celui de l’ECSQ, qui est notre cas de base.
Pour ce faire, on doit isoler les mêmes caractéristiques descriptives que Maunsell et al
(2004).
3.1
Statistiques descriptives
Pour créer un échantillon semblable à celui de notre cas de base, il est important de
respecter la même procédure d’échantillonnage. Lors de la création de leur échantillon
témoin, Maunsell et al (2004) n’utilisent que les femmes qui ont un emploi durant
l’année de référence, soit l’année de diagnostique du cancer du sein pour les femmes du
groupe traitement. Par souci de simplicité, nous utilisons l’année 1997 comme base de
notre analyse. Deuxièmement, ils s’assurent que les femmes sont âgées entre 18 et 59
ans et que la distribution de l’âge est la même entre le groupe traitement et contrôle.
Notre point de départ consiste donc à créer un échantillon en respectant ces mêmes
critères.
À partir de l’EDTR, nous construisons quatre échantillons distincts. Chacun des
Chapitre 3. Les Résultats
14
échantillons comprend des femmes de la province de Québec, âgées entre 18 et 59 ans et
qui ont un emploi durant l’année de référence. Dans le premier échantillon, aucun ajustement n’est fait au niveau de la fréquence des groupes d’âges. De plus, les résidentes
de Montréal sont exclues pour respecter le groupe témoin de base. On tire un deuxième
échantillon, mais cette fois, en ajustant les groupes d’âges afin d’avoir les mêmes proportions que pour les cancéreuses selon les groupes d’âges suivants : 29-29 ans, 30-39
ans, 40-49 ans et 50-59 ans. Un troisième inclut la ville de Montréal, mais n’est pas
ajusté pour les fréquences reliées à l’âge et finalement, un dernier échantillon inclut la
ville de Montréal et est également ajusté au niveau de la fréquence des groupes d’âges.
Dans l’étude de Maunsell et al on inclut la ville de Montréal. Par ailleurs, la population de cette ville est beaucoup plus diversifiée au niveau des origines ethniques que
les autres régions de la province de Québec. Dans la population de départ de l’EDTR,
il est possible de trouver des femmes cancéreuses. Avec des échantillons qui incluent
ou non la ville de Montréal, on désire vérifier si les différences ethniques occasionnent
des modifications dans les résultats statistiques. Les différences pourraient provenir
de caractéristiques générales ou d’une plus forte présence du cancer à l’intérieur de
divers groupes etchniques. Avec ces quatre nouveaux groupes témoin, on peut maintenant vérifier leurs ressemblances avec l’échantillon de l’ECSQ. Cela nous permet donc
également de conclure sur la ressemblance de tous les échantillons entre eux, considérant
des populations d’échantillonnage différentes. Après de multiples vérifications au niveau
de ces statistiques descriptives, on pourra donc apporter une première conclusion quant
aux différences d’un échantillon possiblement contaminé par rapport à un échantillon
propre.
Dans les tableaux 3.1 à 3.3, on retrouve plusieurs statistiques concernant les conditions de travail des différents groupes témoins et ce, pour trois sous-groupes d’âges
différents. Il est à noter que le groupe témoin « Femmes Québec » représente les statistiques réellement observées dans la province de Québec dérivée selon des données
de Statistique Canada. Plusieurs observations peuvent être faites sur les échantillons
de Statistique Canada et de l’ECSQ. Premièrement, les femmes travaillent un nombre
relativement élevé d’heures, c’est-à-dire entre 33 et 35 heures par semaine dans chacun
des tableaux. De plus, entre 20% et 30% d’entre elles ont un travail à temps partiel. On
remarque aussi que près de la moitié des femmes sont syndiquées. Très peu possèdent un
deuxième emploi, soit 9% selon l’ECSQ et finalement, la majorité des femmes gagnent
un revenu inférieur à 20,000$ et ce, peu importe le groupe d’âge considéré.
Nous comparons maintenant les quatre échantillons de l’EDTR entre eux. Premièrement,
on remarque que les heures travaillées par semaine sont assez semblables entre les
quatre échantillons et ce, dans chacun des tableaux. Plus précisément, dans les tableaux représentant les groupes d’âges 20-39 ans et 40-49 ans, on remarque que le
Chapitre 3. Les Résultats
15
Tab. 3.1 – Conditions de travail,au départ, des femmes de tous les groupes témoin et
de celles de la population générale de la province de Québec entre 20-39 ans
Groupes
EDTR
Femmes ECSQ SM,SA SM,A M,SA
M,A
Québec
*
**
***
****
Conditions
n=30,798 n=217 n=429 n=102 n=529 n=126
de travail
%
%
%
%
%
%
33 ± 11
35 ± 13
28 ± 17
29 ± 13
28 ± 16
30 ± 19
26
24
31
22
31
25
60
22
16
2
52
25
22
1
44
39
17
0
20
54
26
0
44
39
17
0
25
46
29
0
Syndiquée
29
40
33
37
32
37
2ième emploi
4
9
9
-
10
6
Revenu (000)$
(personnel)
<20
20-29
30-39
≥40
48
28
15
9
35
27
22
16
54
26
10
10
43
30
17
10
53
25
12
10
38
27
19
16
Hrs travaillées
(parsemaine)
Tps partiel
(< 30hrs/sem)
Expérience
(années)
<5
5-14
15-24
25-45
*Aucun ajustement pour les fréquences d’âges et Montréal est exclue.
**Ajustement pour les fréquences d’âges, mais Montréal est exclue.
***Aucun ajustement pour les fréquences d’âges, mais Montréal est inclue.
****Ajustement pour les fréquences d’âges et Montréal est inclue.
Chapitre 3. Les Résultats
16
Tab. 3.2 – Conditions de travail,au départ, des femmes de tous les groupes témoin et
de celles de la population générale de la province de Québec entre 40-49 ans
Groupes
EDTR
Femmes ECSQ SM,SA SM,A M,SA
M,A
Québec
*
**
***
****
Conditions
n=17,401 n=362 n=247 n=148 n=309 n=188
de travail
%
%
%
%
%
%
34 ± 11
34 ± 11
30 ± 13
31 ± 13
30 ± 13
30 ± 12
21
24
26
23
25
27
32
21
25
21
33
32
17
18
13
23
44
20
12
22
40
26
11
23
44
22
9
26
44
21
Syndiquée
45
47
41
42
39
37
2ième emploi
3
10
5
5
4
6
Revenu(000$)
(personnel)
<20
20-29
30-39
≥40
34
30
18
18
32
33
16
20
38
24
19
19
37
22
22
20
37
23
19
21
37
24
19
20
Hrs travaillées
(parsemaine)
Tps partiel
(< 30hrs/semaine)
Expérience
(années)
<5
5-14
15-24
25-45
*Aucun ajustement pour les fréquences d’âges et Montréal est exclue.
**Ajustement pour les fréquences d’âges, mais Montréal est exclue.
***Aucun ajustement pour les fréquences d’âges, mais Montréal est inclue.
****Ajustement pour les fréquences d’âges et Montréal est inclue.
Chapitre 3. Les Résultats
17
Tab. 3.3 – Conditions de travail,au départ, des femmes de tous les groupes témoin et
de celles de la population générale de la province de Québec entre 50-59 ans
Groupes
EDTR
Femmes ECSQ SM,SA SM,A M,SA
M,A
Québec
*
**
***
****
Conditions
n=8,218 n=311 n=99
n=99 n=132 n=132
de travail
%
%
%
%
%
%
33 ± 12
33 ± 15
29 ± 11
29 ± 11
30 ± 11
30 ± 11
29
31
25
25
27
27
27
19
27
27
26
21
28
25
7
21
25
46
7
21
25
46
6
20
28
46
6
20
28
46
Syndiquée
43
49
45
45
46
46
2ième emploi
3
6
5
5
6
6
Revenu(000$)
(personnel)
<20
20-29
30-39
≥40
44
27
14
14
39
23
17
21
41
20
15
23
41
20
15
23
39
22
17
21
39
22
17
21
Hrs travaillées
(parsemaine)
Tps partiel
(< 30hrs/semaine)
Expérience
(années)
<5
5-14
15-24
25-45
*Aucun ajustement pour les fréquences d’âges et Montréal est exclue.
**Ajustement pour les fréquences d’âges, mais Montréal est exclue.
***Aucun ajustement pour les fréquences d’âges, mais Montréal est inclue.
****Ajustement pour les fréquences d’âges et Montréal est inclue.
Chapitre 3. Les Résultats
18
nombre d’heures se modifie à la hausse lorsqu’on ajuste pour les fréquences d’âges. Cet
ajustement a pour effet d’augmenter la moyenne d’âge du groupe de femmes. Si les
femmes plus âgées travaillent un nombre supérieur d’heures par semaine, il est tout
à fait logique d’observer une moyenne d’heures supérieure dans les échantillons où on
fait une telle modification. On est également tenté de croire que c’est aussi pour cette
raison qu’un moins grand nombre d’entres elles travaillent à temps partiel dans ces deux
groupes. Ce phénomène s’observe autant dans le tableau 3.1 que 3.2. On remarque la
même chose pour la variable représentant le nombre d’années d’expérience de la femme.
Plus les femmes sont âgées dans l’échantillon, plus elles ont d’années d’expérience. Un
plus grand nombre d’entres elles sont également syndiquées. Finalement, les femmes
des groupes ajustés pour l’âge gagnent un salaire supérieur à celles qui font partie
des groupes témoin non ajustés pour l’âge. Par contre, on ne semble pas observer de
différences entre les échantillons qui incluent la ville de Montréal par rapport à ceux
qui l’excluent. Cela amène donc à penser qu’inclure Montréal dans l’échantillon n’entraı̂ne pas de modifications importantes au niveau des résultats sur les caractéristiques
descriptives.
Les comparaisons des échantillons de l’EDTR avec ceux de l’ECSQ et de Statistique
Canada sont très révélatrices. Parmi les groupes témoins formés à l’aide de l’EDTR
on observe que le nombre d’heures travaillées par semaine est inférieur en comparaison
des résultats obtenus avec l’ECSQ et Statistique Canada. L’écart moyen se chiffre à
environ 4 heures par semaine. On remarque également certaines petites divergences pour
l’expérience de travail, mais rien de majeur, d’autant plus que cette variable est robuste
à travers les échantillons de l’EDTR. Malgré cette observation, on peut quand même
croire que les échantillons de l’EDTR sont relativement semblables à de l’échantillon
de base, malgré la présence possible de cancéreuses dans ces échantillons témoins. La
variable de temps partiel, tout comme celles indiquant un deuxième emploi, le revenu
personnel ou l’appartenance à un syndicat sont toutes représentées par des proportions
de population semblables entre les différents groupes. On ne remarque pas de différences
majeures entre les échantillons, que ce soit dans les tableaux 3.1, 3.2 ou 3.3.
La variable qui semble diverger au niveau de ses proportions entre les différents
groupes d’âges est celle qui indique le nombre d’années d’expérience. Les distributions
de cette dernière dans les échantillons de Statistique Canada et de l’ECSQ semblent
être beaucoup plus constantes à travers les tableaux descriptifs, plus particulièrement
dans les tableaux 3.2 et 3.3. Dans les groupes témoins obtenus à partir de l’EDTR, on
remarque que la variable change à travers les tableaux. Ainsi, les femmes âgées entre
20-39 ans ont, pour la majorité d’entre elles, un maximum de 5 années d’expérience
lorsque aucun ajustement pour l’âge n’est effectué, soit dans les échantillons (SM,SA)
et (M,SA). Par contre, on décèle un déplacement de masse vers la seconde catégorie,
Chapitre 3. Les Résultats
19
soit celle représentant 5 à 14 années d’expérience lorsque les échantillons sont ajustés
pour l’âge. Cela peut s’expliquer par une augmentation de la moyenne d’âge du groupe
témoin. On remarque également que dans les groupes de l’EDTR, l’expérience semble
augmenter avec l’âge, donc du tableau 3.1 au tableau 3.3. Ce phénomène est beaucoup
plus difficile à observer dans les groupes de Statistique Canada et de l’ECSQ. L’évolution
des proportions de cette même variable pour les groupes formés à partir de l’EDTR est
cohérente avec nos attentes. Plus une femmes avance en âge, plus elle est susceptible
d’avoir des années d’expérience de travail. Eu égard au revenu personnel, on remarque
que pour le tableau 3.1 la répartition des femmes dans les sous-groupes de revenu est
assez différente de ce qu’on observe dans l’échantillon de l’ECSQ. Cet écart est moins
important lorsqu’on ajuste pour l’âge et que les femmes sont plus âgées, soit dans les
tableaux 3.2 et 3.3.
Malgré les différences observées dans ces tableaux, la répartition des femmes est semblable dans les différents échantillons. Pour mettre encore une fois à l’épreuve la comparabilité de ces échantillons, regardons d’autres caractéristiques, cette fois démographiques,
qui peuvent nous renseigner davantage sur la composition des différents groupes témoin
disponibles. Dans le tableau 3.4, on remarque que certaines variables se répètent par
rapport aux trois tableaux précédents. Par contre, ici, les femmes ne sont pas séparées
selon des groupes d’âges. La première caractéristique analysée dans ce tableau est l’âge.
On remarque que dans les deux groupes de l’EDTR pour lesquels aucun ajustement
pour cette variable n’est fait, la moyenne de l’âge est inférieure de 8 ans par rapport à
celle que l’on observe dans le groupe cible. Un peu plus de la moitié d’entre elles appartiennent au groupe d’âges 18-39 ans. Lorsqu’on ajuste pour l’âge, la moyenne rejoint
celle de l’ECSQ par un déplacement de masse vers la deuxième catégorie d’âge du tableau. En poursuivant l’analyse descriptive, on peut faire la même conclusion que pour
les tableaux 3.1 à 3.3 pour la variable qui représente le nombre d’heures travaillées par
semaine. Le chiffre est davantage semblable entre l’EDTR et l’ECSQ lorsqu’un ajustement pour l’âge est fait.
La distribution de l’expérience de travail de l’échantillon de l’ECSQ du cas de base
est très différente de celle de l’EDTR. Encore une fois, on en tire les mêmes conclusions
que pour les tableaux précédents. En fait, dans l’échantillon avec une moyenne d’âge
plus faible, il est tout à fait normal de retrouver plus de femmes avec une expérience de
travail de plus faible. Lorsque la moyenne d’âge augmente, on remarque un déplacement
de femmes vers le groupe des 5-14 années d’expérience. Par ailleurs, on décèle certaines
différences dans le niveau de scolarité de ces femmes. Dans l’échantillon de l’ECSQ, on
remarque qu’il y a près de la moitié des femmes qui ont atteint, au maximum, un niveau
d’étude secondaire. Dans les groupes de l’EDTR, il y en a beaucoup plus qui ont atteint
Chapitre 3. Les Résultats
20
Tab. 3.4 – Conditions de travail des femmes de tous les groupes témoin au moment du
diagnostique des femmes cancéreuses
Groupes
EDTR
ECSQ SM,SA SM,A M,SA
M,A
Caractéristiques
n=890 n=775 n=349 n=970 n=446
démographiques
%
%
%
%
%
Âge (18 − 39)
(40 − 49)
(50 − 59)
moyenne ± SD
24
41
35
45 ± 8
55
32
13
37 ± 10
29
42
28
44 ± 8
54
32
14
37 ± 11
28
42
30
44 ± 8
Statut civil
M arriée
Séparée, divorcée, veuve
C élibataire
57
23
20
67
13
19
71
17
11
66
14
20
70
19
12
Niveau de scolarité
≤ Secondaire
Collégiale
≥ U niversitaire
44
28
28
31
55
13
42
49
9
30
56
13
36
53
11
Revenu(000$)personnel
<20
20-29
30-39
40-49
≥ 50
39
25
16
10
8
47
25
13
9
6
40
24
18
9
8
46
24
15
9
6
38
24
18
11
8
34 ± 13
27 ± 13
29 ± 13
27 ± 13
29 ± 12
27
29
23
28
26
78
39
21
9
73
37
14
7
75
42
15
4
75
36
14
8
76
40
16
6
35
40
24
29
32
39
13
31
56
28
31
40
13
30
57
Hrs travaillées
(parsemaine)
Tps partiel
(< 30hrs/semaine)
Cols blancs
Syndiquée
Supervision d’employés
2ième emploi
Expérience(années)
<5
5-14
15-45
Chapitre 3. Les Résultats
21
le niveau collégial et un moins grand nombre vont jusqu’à l’université. Il est possible
d’attribuer cette différence à une divergence au niveau de la définition de la variable de
scolarité des sujets, le Cégep n’étant présent que dans la province de Québec. Comme
l’EDTR est une étude qui s’effectue à travers tout le Canada, cette variable n’existe
pas directement et nous l’avons créé. Cette nouvelle variable peut être moins précise
que celle présente dans l’ECSQ.
On remarque une certaine continuité dans plusieurs variables entre le groupe cible et
ceux de l’EDTR. Ce phénomène s’observe autant parmi les groupes ajustés ou non pour
la variable d’âge ou pour lesquels on inclut ou non la ville de Montréal. Par exemple,
la caractéristique de statut civil présente les mêmes proportions à travers les différents
échantillons. En fait, la grande majorité des femmes sont mariées et environ les mêmes
proportions sont séparées, divorcées, veuves ou célibataires. On remarque une grande
ressemblance également dans la variable de revenu personnel, la majorité des femmes
ayant un revenu inférieur à 20,000$. On remarque également que dans le tableau 3.4, la
variable de revenu est davantage comparable entre tous les groupes que ce qu’on peut
observer dans les tableaux 3.1 à 3.3. Par ailleurs, environ 75% des femmes de chaque
échantillon ont un emploi de cols blancs. Les variables d’appartenance à un syndicat,
de supervision d’employés et de détention d’un second emploi, sont représentées de
façon semblable dans chacun des groupes. Cela démontre donc que l’EDTR présente
des caractéristiques intéressantes par rapport à l’ECSQ.
Finalement, nous analysons plusieurs statistiques des femmes du groupe témoin qui
possèdent un emploi, trois ans après le diagnostique de cancer du sein des cancéreuses.
Les résultats se retrouvent dans les tableaux 3.5 et 3.6. Les caractéristiques sont analysées au début et à la fin de la période.
Le tableau 3.5 montre les résultats obtenus par Maunsell et al (2004). Dans l’ensemble, l’échantillon témoin est assez semblable à celui des femmes cancéreuses tout
au long des trois années du suivi. On peut noter que le nombre de femmes ayant un
deuxième emploi parmi les cancéreuses augmente après trois ans, alors qu’il diminue
parmi les femmes du groupe témoin de l’ECSQ. De plus, le nombre d’heures travaillées
par semaine augmente au sein du groupe témoin, mais diminue pour les cancéreuses.
Nous analysons les conditions de travail des femmes appartenant aux quatre groupes
formés à partir de l’EDTR au tableau 3.6. Le nombre d’heures travaillées est supérieur
à la fin dans chacun des échantillons. Cet écart est cependant plus grand chez les deux
groupes sans ajustement pour l’âge. Cette variation est également observée dans le
groupe de l’ECSQ. Au niveau de la variable de temps partiel, les résultats sont en lien
Chapitre 3. Les Résultats
22
Tab. 3.5 – Conditions de travail des cancéreuses et des femmes du groupe témoin au
moment de l’entrevue et 3 ans après, parmi celles qui ont un emploi à la fin (étude de
Maunsell et al (2004) )
Cancéreuses
Contrôle
(507)
(759)
Début
Fin
Début
Fin
Conditions
%
%
%
%
de travail
Hrs/semaine
(moyenne ± SD)
Tps partiel
(< 30hrs/sem)
Col blanc
Syndiquée
Supervision
(d0 employés)
2ième emploi
Revenu/an
(≥ 30, 000$)
36 ±13 34±15
34 ±13 35 ±12
19
25
24
27
81
42
23
80
42
23
79
38
21
79
38
23
5
40
7
44
10
33
7
39
Tab. 3.6 – Conditions de travail des femmes des différents groupes contrôle tirés à partir
de l’EDTR au moment de l’entrevue et 3 ans après, parmi celles qui ont un emploi à la
fin
Conditions
de travail
Hrs/semaine
(moyenne ± SD)
Tps partiel
(< 30hrs/sem)
Col blanc
Syndiquée
Supervision
(d0 employés)
2ième emploi
Revenu/an
(≥ 30, 000$)
SM,SA
(667)
Début
Fin
%
%
SM,A
(307)
Début
Fin
%
%
M,SA
(856)
Début
Fin
%
%
M,A
(393)
Début
Fin
%
%
28 ±12
30±11
30 ±11
31±11
28 ±12
30±11
30 ±11
31 ±10
25
21
20
17
25
21
22
21
76
39
16
41
21
77
45
16
45
22
77
38
15
41
20
77
43
17
44
20
7
31
8
41
4
38
4
46
7
33
8
42
5
40
7
47
Chapitre 3. Les Résultats
23
avec ce qu’on a observé dans le tableau précédent. Ainsi, un nombre moindre de femmes
travaillent à temps partiel à la fin. Par contre, ce phénomène n’est pas présent dans
l’échantillon de l’ECSQ. Malgré tout, les proportions sont relativement proches, ce qui
permet encore de croire à la représentativité des échantillons. En moyenne, le même
nombre de femmes est syndiqué au début et à la fin autant dans l’EDTR que dans
l’ECSQ. On remarque dans tous les échantillons que la variable de revenu présente un
salaire supérieur pour les femmes après trois ans. Dans les groupes de l’Enquête sur la
Dynamique du Travail et du Revenu, on remarque qu’il y a un peu plus de femmes qui
occupent deux emplois à la fin, contrairement à ce que l’on observe dans l’ECSQ. Encore
une fois, les proportions sont très semblables dans tous les cas. En général, on remarque
que les groupes sans ajustement pour l’âge ont des variations qui sont différentes par
rapport aux autres groupes, mais ces différences ne sont pas énormes. On observe ce
phénomène pour certaines variables, plus particulièrement pour celles qui représentent
le nombre d’heures travaillées par semaine, un travail à temps partiel, l’appartenance
à un syndicat et l’occupation d’un deuxième emploi. Finalement, les femmes dans les
échantillons ajustés pour l’âge gagnent un revenu supérieur.
3.2
Régressions binomiales
L’analyse qui précède nous porte à croire que les échantillons tirés de l’EDTR sont
comparables à celui de Maunsell et al (2004). La grande majorité des distributions sont
comparables avec l’ECSQ et ce, pour les quatre échantillons considérés. Finalement,
après une première vue d’ensemble, on peut conclure que l’EDTR génère des groupes qui
s’apparentent à l’ECSQ. Il est donc envisageable, dans le futur, d’utiliser une enquête
publique telle l’EDTR pour générer un échantillon qui comprend les caractéristiques
désirées, malgré une possible contamination de cette population contrôle. Pour appuyer
davantage nos conclusions, il est préférable de reproduire d’autres résultats obtenu par
Maunsell et al (2004) à l’aide de l’analyse de régressions. Dans leur recherche, Maunsell
et al (2004) vérifient le risque relatif d’avoir le cancer. Une équation similaire permet de
trouver le risque relatif d’avoir un emploi différent après trois ans. Dans leurs régressions,
ils incluent l’âge et l’appartenance à un syndicat pour analyser la modification du risque
relatif.
Les régressions binomiales permettent d’estimer un risque relatif qui, dans notre
cas, représente le risque pour les cancéreuses divisé par le risque parmi les femmes du
groupe témoin de se retrouver soit sans emploi, soit d’avoir un emploi différent après
Chapitre 3. Les Résultats
24
trois ans. Le risque relatif de se retrouver sans emploi se calcule de la façon suivante :
0
Risque relatif d être sans emploi =
nbr cancéreuses sans emploi
nbr cancéreuses
nbr témoins sans emploi
nbr témoins
.
(3.1)
On inclut également dans les régressions l’âge et l’appartenance à un syndicat pour
vérifier l’impact de ces variables sur le risque relatif. Dans leur recherche, Maunsell
et al (2004) ont trouvé que les autres caractéristiques susceptibles d’être inclues dans
les régressions binomiales, comme le type d’emploi, le nombre d’heures travaillées par
semaine ou le revenu personnel, n’amènent pas réellement de modifications aux risques
relatifs. Leurs résultats sont rapportés au tableau 3.7. On remarque que les cancéreuses
sont plus susceptibles de se retrouver sans emploi trois ans après leur diagnostique de
cancer du sein selon les résultats bruts. Ce phénomène est plus important parmi celles
qui ont connu des récidives de la maladie. On remarque que chacun des résultats est
significatif. Avec l’ajout de l’âge et de l’appartenance à un syndicat à la régression
du risque relatif, on s’aperçoit que ce risque diminue pour tous les sous-groupes et
que les femmes sans récidive ne sont pas à risque d’être sans emploi trois ans après
le diagnostique. Le coefficient de ce groupe de femmes est non significatif. Par contre,
on peut en tirer les mêmes conclusions, soit que les cancéreuses avec récidive sont
plus à risque que les femmes du groupe témoin de se retrouver sans emploi. Après
trois ans, il est possible que le sujet se retrouve sans emploi, comme on le mentionne
précédemment, mais il peut également occuper un emploi qui est différent de celui du
départ. Les résultats bruts et ajustés de ces régressions binomiales démontrent qu’aucun
de ces groupes de femmes est plus à risque d’avoir un emploi différent trois ans après
le diagnostique. Aucun de ces coefficients n’est significatif. On peut donc conclure que
les femmes cancéreuses ne sont pas à risque d’avoir un emploi différent, que le risque
soit ajusté ou non. Par contre, elles sont plus à risque de se retrouver sans emploi. On
fait la même conclusion peu importe si la femme souffre d’une récidive ou non. Pour
l’échantillon de Maunsell et al (2004), on remarque donc de faibles différences entre les
deux groupes de femmes au niveau de ces risques relatifs.
Des calculs similaires à ceux rapportés dans le tableau 3.7 sont faits en utilisant
les quatre échantillons témoin tirés de l’EDTR. Les résultats se retrouvent dans les
tableaux 3.8 à 3.11, chaque tableau représentant un échantillon différent. En comparant
ces résultats avec ceux l’ECSQ, on remarque des ressemblances au niveau des risques
relatifs, que ce soit pour le cas sans emploi ou avec un emploi différent.
Premièrement, on constate que le risque de se retrouver sans emploi est toujours
supérieur pour les cancéreuses par rapport aux femmes du groupe témoin. C’est ce
qu’on observe avec un ajustement ou non du risque relatif. De plus, on observe que
les cancéreuses avec récidive sont beaucoup plus à risque que les autres cancéreuses de
se retrouver dans cette situation d’emploi. On remarque également que chaque risque
Chapitre 3. Les Résultats
25
Tab. 3.7 – Risque relatif brut et ajusté de la situation des cancéreuses et des femmes
du groupe témoin 3 ans après le diagnostique (étude de Maunsell et al (2004)
Maunsell
% RRbrut
Pvalue
RRajusté *
Pvalue
Sans emploi
Témoin (890)
Cancéreuses (646)
Sans récidive (567)
Avec Récidives (79)
15
22
20
33
1,00
1,46
1,35
2,24
Emploi différent
Témoin (890)
Cancéreuses (646)
Sans récidive (567)
Avec Récidives (79)
20
20
21
13
1,00
1,09
1,12
0,81
(Réf érence)
0,001
0,009
0,000
(Réf érence)
0,417
0,282
0,479
1,00
1,29
1,19
1,99
1,00
1,13
1,17
0,85
(Réf érence)
0,015
0,115
0,000
(Réf érence)
0,210
0,126
0,563
*Ajout des variables d’âge et d’appartenance à un syndicat à la régression.
Tab. 3.8 – Risque relatif brut et ajusté de la situation des cancéreuses et des femmes
du groupe témoin de l’EDTR (SM,SA), 3 ans après le diagnostique
EDTR SM, SA**
% RRbrut
Pvalue
RRajusté *
Pvalue
Sans emploi
Témoin (775)
Cancéreuses (646)
Sans récidive (567)
Avec Récidives (79)
10
22
20
33
1,00
2,14
1,98
3,27
Emploi différent
Témoin (775)
Cancéreuses (646)
Sans récidive (567)
Avec Récidives (79)
24
20
21
13
1,00
1,04
1,07
0,78
(Réf érence)
0,000
0,000
0,000
(Réf érence)
0,703
0,510
0,389
1,00
1,61
1,52
2,79
1,00
1,38
1,42
0,61***
(Réf érence)
0,001
0,006
0,000
(Réf érence)
0,005
0,003
0,091
*Ajusté avec la variable d’âge des femmes et si elles appartiennent à un syndicat.
**EDTR sans aucun ajustement.
***Ajout des variables d’âges et d’appartenance à un syndicat à la régression
(problème de colinéarité).
Chapitre 3. Les Résultats
26
Tab. 3.9 – Risque relatif brut et ajusté de la situation des cancéreuses et des femmes
du groupe témoin de l’EDTR (SM,A), 3 ans après le diagnostique
EDTR SM, A**
% RRbrut
Pvalue
RRajusté *
Pvalue
Sans emploi
Témoin (349)
Cancéreuses (646)
Sans récidive (567)
Avec Récidives (79)
9
22
20
33
1,00
2,42
2,24
3,71
Emploi différent
Témoin (349)
Cancéreuses (646)
Sans récidive (567)
Avec Récidives (79)
17
20
21
13
1,00
1,49
1,53
1,12
(Réf érence)
0,000
0,000
0,000
(Réf érence)
0,005
0,003
0,722
1,00
2,00
1,83
2,86
1,00
1,48
1,53
1,07
(Réf érence)
0,000
0,001
0,000
(Réf érence)
0,006
0,003
0,833
*Ajout des variables d’âge et d’appartenance à un syndicat à la régression.
**EDTR sans la ville de Montréal, mais avec ajustements pour la distribution
de l’âge.
Tab. 3.10 – Risque relatif brut et ajusté de la situation des cancéreuses et des femmes
du groupe témoin de l’EDTR (M,SA), 3 ans après le diagnostique
EDTR M, SA**
% RRbrut
Pvalue
RRajusté *
Pvalue
Sans emploi
Témoin (970)
Cancéreuses (646)
Sans récidive (567)
Avec Récidives (79)
9
22
20
33
1,00
2,27
2,10
3,47
Emploi différent
Témoin (970)
Cancéreuses (646)
Sans récidive (567)
Avec Récidives (79)
25
20
21
13
1,00
0,99
1,02
0,74
(Réf érence)
0,000
0,000
0,000
(Réf érence)
0,912
0,847
0,301
1,00
1,77
1,66
2,93
1,00
0,89***
0,91***
0,58***
(Réf érence)
0,000
0,000
0,000
(Réf érence)
0,209
0,335
0,056
*Ajout des variables d’âge et d’appartenance à un syndicat à la régression.
**EDTR avec la ville de Montréal, mais aucun ajustement pour les groupes d’âges.
***Ajout de la variable d’appartenance à un syndicat uniquement
(problème de colinéarité).
Chapitre 3. Les Résultats
27
Tab. 3.11 – Risque relatif brut et ajusté de la situation des cancéreuses et des femmes
du groupe témoin de l’EDTR (S,A), 3 ans après le diagnostique
EDTR M, A**
% RRbrut
Pvalue
RRajusté *
Pvalue
Sans emploi
Témoin (446)
Cancéreuses (646)
Sans récidive (567)
Avec Récidives (79)
9
22
20
33
1,00
2,34
2,17
3,58
Emploi différent
Témoin (446)
Cancéreuses (646)
Sans récidive (567)
Avec Récidives (79)
18
20
21
13
1,00
1,37
1,41
1,03
(Réf érence)
0,000
0,000
0,000
(Réf érence)
0,012
0,007
0,932
1,00
1,98
1,82
2,91
1,00
1,35
1,39
0,92
(Réf érence)
0,000
0,000
0,000
(Réf érence)
0,020
0,011
0,785
*Ajout des variables d’âge et d’appartenance à un syndicat à la régression.
**EDTR avec la ville de Montréal et ajustements pour les fréquences
des groupes d’âges.
relatif non ajusté est significatif dans tous les tableaux. Au niveau du risque ajusté,
les échantillons faits à partir de l’Enquête sur la Dynamique du Travail et du Revenu
ont des coefficients qui sont tous significatifs. Avec l’ECSQ, par contre, celui pour les
cancéreuses sans récidive ne l’est pas. C’est la seule distinction que l’on trouve entre
ces cinq échantillons pour la première situation d’emploi.
Au niveau des risques relatifs reliés à l’occupation d’un emploi différent, les coefficients sont, encore une fois, très similaires d’un groupe à l’autre. Malgré tout, on
décèle certaines différences. Dans un premier temps, on remarque que la significativité des coefficients des estimations basées sur les échantillons de l’EDTR n’est pas
la même que ceux de l’ECSQ. Le risque relatif brut des cancéreuses et de celles sans
récidive est significatif si l’échantillon de l’EDTR a subi une modification au niveau
de la distribution des groupes d’âges. Dans les deux autres échantillons, on retrouve
des niveaux de significativité semblables à ceux avec l’ECSQ. Le risque relatif ajusté
présente également certaines différences selon l’échantillon utilisé. Plusieurs risques relatifs sont significatifs parmi les échantillons de l’EDTR, alors que tous les risques sont
négligeables dans le cas de base, soit l’ECSQ. Malgré tout, dans cet échantillon aussi
les risques sont comparables parmi tous les échantillons. Les femmes atteintes de cancer
du sein ont un risque supérieur d’avoir un emploi différent et les cancéreuses victimes
de récidives sont moins à risque que les autres cancéreuses. Les seuls résultats qui ne
démontrent pas aussi clairement ces conclusions sont dans le tableau 3.10. En fait, avec
Chapitre 3. Les Résultats
28
les régressions ajustées, on observe un problème de colinéarité entre les cancéreuses et
la variable d’âge. Si l’on omet l’âge dans les régressions, les résultats sont inférieurs aux
autres cas de l’EDTR et à celui de notre cas de base. La significativité est également
affectée par cette modification. Néanmoins, on remarque la même tendance que dans
les autres tableaux parmi les femmes cancéreuses. Avec un échantillon de taille plus
importante, un tel problème ne serait vraisemblablement pas survenu.
Ces comparaisons nous permettent de constater que les résultats des quatre nouveaux échantillons mènent à des conclusions qui sont très similaires à celles faites à
partir de notre échantillon de l’ECSQ. Par les différences de significativité de certains
risques relatifs, certaines distinctions subsistent entre les échantillons. Par contre, de
manière générale, ces différents groupes sont comparables. On peut donc conclure que
l’EDTR nous procurent des échantillons comparables à celui de l’ECSQ selon plusieurs
caractéristiques descriptives et des risques relatifs divers. À ce stade, on constate que la
possible contamination de cette enquête de Statistique Canada ne semble pas avoir un
impact négatif sur la construction d’échantillons. Nous pouvons maintenant entamer la
dernière partie de notre recherche, le matching.
3.3
Matching
Le matching, comme nous l’avons expliqué précédemment, est une méthode plus
élaborée que la comparaison de moyennes. Avec cette méthode statistique, on considère
uniquement les femmes faisant partie du support commun établi selon le score de propension. La comparaison de moyennes, elle, utilise tous les individus à l’intérieur de ses
calculs. Mêmes les femmes ayant des probabilités très élevées ou très basses font partie
des calculs d’une telle méthode. C’est ce que nous tentons d’éviter avec l’utilisation du
matching. Cette dernière requiert également l’utilisation de plusieurs caractéristiques
personnelles pour compenser les différences entre les échantillons de femmes contrôles et
de cancéreuses. On fait des régressions de type probit et cela nous permet d’identifier les
différences entres les femmes cancéreuses et les femmes qui appartiennent à un groupe
témoin particulier. Après avoir effectué ces quelques étapes supplémentaires, on pourra
faire du matching. La méthode n’est en fait que des différences de moyennes, mais avec
des compensations pour les différences entre les deux échantillons que l’on compare et
la sélection d’individus qui trouvent leur équivalent au niveau du score de propension.
Avant de commencer à faire du matching pur et simple, on doit réaliser quelques étapes
supplémentaires. Tout d’abord, on doit identifier quelles variables sont a priori au traitement. En fait, ces variables sont fixes dans le temps ou indépendantes du groupe
de femmes dans lequel elles se retrouvent, soit le groupe témoin ou de cancéreuses.
Chapitre 3. Les Résultats
29
On trouve le score de propension de façon paramétrique en faisant un probit ayant
comme variable indépendante le groupe de femmes témoins en incluant toutes les caractéristiques personnelles dans la régression. En imposant la condition du support
commun sur les scores de propension, on peut appliquer la méthode statistique qui est
à la base de notre recherche, le matching. Dans les tableaux suivants, on retrouve les
variables qui font partie du probit et qui se retrouvent également dans le matching.
Dans le tableau 3.12, on retrouve les résultats des probits de tous les groupes témoin
pour lesquels on désire faire du matching. Dans l’échantillon de Maunsell et al (2004),
on observe que les caractéristiques ont majoritairement un coefficient qui est non significatif. En fait, il n’y a que les caractéristiques qui désignent que la femme est mariée,
qu’elle détient un deuxième emploi et son âge qui sont des éléments qui ont une influence significative sur les femmes faisant partie de cet échantillon. Toutes les autres
variables ne semblent différencier les femmes du groupe de cancéreuses et du groupe
contrôle. Pour les groupes de l’EDTR, la situation est tout autre. On remarque que
presque toutes les variables ont un impact significatif, sauf quelques exceptions. Dans le
premier cas, (SM, SA), on voit que les variables qui désignent si la femme a un deuxième
emploi, le nombre d’enfants de moins de 18 ans qui vivent dans la maison familiale et
finalement, la variable qui indique que la personne a atteint un niveau d’études secondaires comme scolarité, ont un coefficient non significatif. Le même scénario se répète
pour l’échantillon suivant. Pour le troisième échantillon provenant de l’EDTR, soit le
(M, SA), il n’y a qu’une seule variable qui semble avoir un impact non significatif, celle
qui indique une scolarité maximale de niveau secondaire. Dans le dernier échantillon,
le statut matrimonial de séparée, divorcée ou veuve, le fait d’avoir un emploi dans le
secteur des services ou bien dans les secteurs primaires/col bleu, sont les variables qui
n’ont pas d’impact significatif. Donc, dans les échantillons de l’EDTR, il y a beaucoup
plus de caractéristiques qui ont un impact significatif sur les personnes qui composent
l’échantillon témoin et de femmes cancéreuses par rapport à ce que l’on observe entre
les deux échantillons de la recherche de Maunsell et al (2004). D’après les résultats de
ces probits, on peut voir que, malgré la ressemblance des résultats des régressions binomiales et des statistiques descriptives, ils subsistent encore des différences notables entre
les échantillons. Les femmes des groupes témoin de l’EDTR sont davantage différentes
des cancéreuses que les femmes du groupe contrôle de Maunsell et al (2004). Dans
l’échantillon de Maunsell et al (2004), on remarque que l’âge et le fait d’avoir plus d’un
emploi ont encore un impact significatif sur l’échantillon, malgré certains ajustements
déjà faits sur la distribution de l’âge. Ces deux variables permettent donc de dire que les
cancéreuses et les non cancéreuses sont malgré tout des femmes différentes du point de
vue observationnel. Pour les autres échantillons de l’EDTR, plusieurs différences subsistent avec l’échantillon de cancéreuses malgré la modification de la distribution d’âge,
par exemple. Il demeure quand même des écarts au niveau de la valeur des coefficients
0.178
0.134
0.121
0.072
0.786
0.001
0.2225
0.2598
0.2718
-0.1668
-0.0282
-0.4501
-0.0869 0.381
0.1228 0.355
0.0530 0.234
0.0265
0.044
0.182
0.0896
-0.0007
0.000
0.027
0.167
0.317
0.000
-
0.000
0.000
-0.3958 0.002
-0.3216 0.026
0.2074 0.011
-0.0874 0.101
0.2590
-0.7600
-0.3118
-0.2793
-0.1059
-0.6017
-
0.2127
-0.0018
0.000
0.020
0.378
0.274
0.000
-
0.001
0.017
-0.5641 0.000
-0.3784 0.028
0.4619 0.000
-0.0557 0.000
-0.0607 0.361
0.2027
-0.7862
-0.3875
-0.2242
-0.1359
-0.5433
-
0.1819
-0.0015
**Nombre d’enfants qui ont au plus 18 ans et qui demeurent encore à la maison.
**Emploi classé dans le secteur primaire ou col bleu.
*La femme peut être séparée, divorcée ou veuve.
Age
Age2
Scolarité
Primaire
Secondaire
Cégep
Université
Statut matrimonial
Mariée
SDV*
2ième emploi
Type Emploi
Service
Primcolbleu**
Syndiquée
Expérience
Nbrcohab***
Pseudo R2
0.000
0.007
0.054
0.822
0.000
-
0.000
0.000
-0.4710 0.000
-0.3548 0.014
0.4715 0.000
-0.0579 0.000
-0.1046 0.045
0.3250
-0.7957
-0.3674
-0.3837
-0.0234
-0.4778
-
0.2825
-0.0023
-0.0900 0.505
0.0760 0.641
0.1754 0.044
-0.1731 0.003
0.1237
0.000
0.315
0.014
0.000
0.7549
-0.5427
-0.1487
-0.5057
0.006
0.016
0.075
-0.5306
0.1174
-0.0010
Tab. 3.12 – Résultats du probit selon les caractéristiques personnelles pour chaque échantillon témoin
EDTR
Maunsell
SM,SA
SM,A
M,SA
M,A
Caractéristiques
coeff Pvalue coeff Pvalue coeff Pvalue coeff Pvalue coeff Pvalue
Chapitre 3. Les Résultats
30
Chapitre 3. Les Résultats
31
0
1
2
Density
3
4
5
des caractéristiques entre les différents échantillons de l’EDTR. La dernière ligne du
tableau 3.12, le pseudo R2 , nous indique si les variables présentent dans le calcul du
probit permettent de bien expliquer la variabilité des échantillons. Pour l’échantillon de
Maunsell et al (2004), le R2 est de 0.0265. Un résultat aussi faible n’est pas surprenant,
sachant le nombre de variables non significatives dans le probit. Par ailleurs, comme
cette recherche s’apparente grandement à une expérience aléatoire, il est presque impossible de prédire quelle personne appartient au groupe de cancéreuses ou de femmes
témoins. Pour les échantillons de l’EDTR, les R2 sont plus élevés, entre autre pour
le groupe (M, SA). Des résultats de cet ordre ne sont pas mauvais, sachant que les
données sont en coupe transversale. On remarque donc que l’équipe de Maunsell réussi
à avoir un échantillon témoin beaucoup plus semblable à celui des cancéreuses que ce
qu’on peut faire avec l’EDTR. D’après les résultats du tableau 3.12 pour les échantillons
de l’EDTR, il y a de fortes chances que le cancer soit relié aux variables qui sont inclues dans le probit. En fait, ces déviations entre les différents groupes témoins peuvent
également s’observer à l’aide des distributions des scores de propension. Comme on
l’a mentionné précédemment, le score de propension représente la probabilité d’avoir
le cancer du sein chez une femme. Dans les graphiques suivants, qui représentent les
distributions de ces scores de propension, on a donc une distribution pour le groupe
témoin et une pour le groupe de femmes atteintes de cancer du sein.
.1
.2
.3
.4
Estimated propensity score
Groupe Témoin
.5
.6
Groupe Cancéreuses
fi
Fig. 3.1 – Densité du score de propension pour l’échantillon de Maunsell et al (2004)
Le premier graphique, qui représente les distributions des probabilités d’avoir le
Chapitre 3. Les Résultats
32
0
.5
Density
1
1.5
2
cancer du sein pour les groupes témoin et traitement de Maunsell et al (2004), est
composé de deux courbes qui sont très semblables. Le groupe de cancéreuses est composé
de femmes ayant une probabilité légèrement supérieure d’avoir le cancer du sein (0.44)
par rapport à celles formant le groupe témoin (0.41). Les scores s’étendent sur un
domaine de 0 à 0.65. De façon assez surprenante, on remarque que les femmes du
groupe témoin ont une forte probabilité d’avoir le cancer du sein, presque aussi élevée
que les cancéreuses. Cela démontre que les deux groupes de femmes de ce graphique se
ressemblent beaucoup par rapport au score, à la différence près qu’un des deux groupes
est formé de femmes réellement atteintes de cancer de sein.
0
.2
.4
.6
Estimated propensity score
Groupe Témoin (SM,SA)
.8
1
Groupe Cancéreuses
fi
Fig. 3.2 – Densité du score de propension pour l’échantillon (SM,SA)
Lorsqu’on regarde le graphique pour l’échantillon (SM, SA), on remarque que les
deux distributions sont plus distinctes l’une de l’autre, comparativement à ce qu’on
observe dans le cas précédent. Un grand nombre de femmes du groupe témoin ont une
faible probabilité d’avoir le cancer du sein par rapport aux femmes cancéreuses. La
probabilité moyenne du groupe témoin est de 0.29 et celle du groupe de cancéreuses
est de 0.59. On remarque également que les deux distributions s’étendent sur tout le
domaine possible des probabilités, soit entre 0 et 1. On peut donc dire que ces deux
groupes sont assez différents, selon ce qu’on observe de leur score de propension.
Le graphique du groupe ajusté pour l’âge, mais dans lequel la ville de Montréal
n’est pas inclut ressemble davantage à celui de Maunsell et al (2004). La distribution
33
0
.5
Density
1
1.5
2
Chapitre 3. Les Résultats
0
.2
.4
.6
Estimated propensity score
Groupe Témoin (SM,A)
.8
1
Groupe Cancéreuses
fi
Fig. 3.3 – Densité du score de propension pour l’échantillon (SM,A)
de probabilité des femmes du groupe témoin est plus rapprochée de celle du groupe de
femmes cancéreuses, contrairement à ce qu’on observe dans la figure 3.2. On remarque
que la distribution des scores de propension du groupe témoin, qui va de 0 à 1, s’est
déplacée légèrement vers la droite par rapport à la situation précédente. La moyenne de
la distribution est de 0.45. Le score moyen des femmes cancéreuses est plutôt de 0.71.
On peut donc supposer que les femmes plus âgées ont une probabilité supérieure d’avoir
le cancer du sein, ce qui est tout à fait plausible. Dans cet échantillon, on remarque que
les femmes du groupe témoin ont une probabilité inférieure d’être atteintes du cancer
du sein par rapport aux cancéreuses, quoique supérieure à ce qu’on a pu observer dans
le graphique précédent. Néanmoins, l’écart entre les deux moyennes demeure semblable
à ce qu’on a pu observer dans le graphique précédent.
Le graphique du groupe témoin (M, SA) ressemble davantage au premier groupe
de l’EDTR, soit celui sans modification. Les femmes de ce groupe témoin ont une
distribution du score de propension qui est à l’extrême gauche du graphique. Elles
ont donc de très faibles risque d’avoir le cancer du sein par rapport aux cancéreuses,
dont la majorité des femmes ont un score supérieur ou égale à 0.45. La moyenne de
la distribution pour les femmes témoin est de 0.45 et pour les cancéreuses, 0.71. Le
fait d’ajouter la ville de Montréal à l’échantillon ne change pas de façon importante la
probabilité d’avoir le cancer du sein pour un groupe témoin.
34
0
1
Density
2
3
Chapitre 3. Les Résultats
0
.2
.4
.6
Estimated propensity score
Groupe Témoin (M,SA)
.8
1
Groupe Cancéreuses
fi
Fig. 3.4 – Densité du score de propension pour l’échantillon de (M,SA)
Finalement, lorsqu’on ajuste pour l’âge et qu’on inclut la ville de Montréal à notre
échantillon témoin (figure 3.5) les distributions des scores de propension sont très semblables entre les deux groupes. La situation observée ressemble davantage à ce qu’on
retrouve dans le graphique pour les échantillons de Maunsell et al (2004) car les femmes
des deux groupes ont des probabilités semblables et assez élevées d’avoir le cancer du
sein. Les femmes du groupe témoin ont une distribution en forme de cloche centrée à
0.45, mais la courbe pour les cancéreuses est encore un peu décalée vers la droite. Leurs
moyennes respectives sont de 0.46 et 0.62. Les cancéreuses sont donc un peu plus à
risque d’avoir le cancer du sein que les femmes du groupe témoin selon leur score de
propension. Les femmes du groupe témoin sont plus âgées et ont donc une probabilité
supérieure d’avoir le cancer du sein. Ces quelques vérifications supplémentaires nous
ont donc permis de trouver certaines différences entres les échantillons de l’EDTR et de
Maunsell et al (2004) par rapport à leur score de propension. À partir de ces probabilités
calculées à l’aide de plusieurs caractéristiques personnelles, nous pouvons maintenant
faire des régressions de matching. On impose l’hypothèse du support commun pour les
distributions de scores et la pondération utilisée est de type Epanechnikov.
Le support commun élimine des femmes qui ne trouvent pas de correspondance au
niveau de leur probabilité d’avoir le cancer du sein, et ce, entre le groupe de femmes
témoins et de cancéreuses. Le domaine de femmes pour lesquelles on trouve l’effet
35
0
.5
Density
1
1.5
2
Chapitre 3. Les Résultats
0
.2
.4
.6
Estimated propensity score
Groupe Témoin (M,A)
.8
1
Groupe Cancéreuses
fi
Fig. 3.5 – Densité du score de propension pour l’échantillon (M,A)
traitement s’en trouve nécessairement réduit. Dans le tableau 3.13, on retrouve la taille
de chacun des échantillons de l’EDTR et de l’ECSQ qui sont utilisés dans les calculs de
matching après avoir imposé la contrainte du support commun. Pour les échantillons de
Maunsell et al, soit les deux premières colonnes, on remarque que les tailles d’échantillon
sont très similaires de variables en variables, autant pour le groupes de femmes témoin
que de cancéreuses. La taille du groupe de femmes cancéreuses se situe entre 494 et
506 et celle du groupe témoin, entre 736 et 758 femmes. Le support commun peut,
au maximum, entraı̂ner le rejet de 150 femmes dans chacun des deux échantillons.
Observons maintenant ce qui se passe pour les groupes de l’EDTR. Dans le pire scénario,
environ 230 cancéreuses ne feront pas partie des calculs relatifs au matching. Par contre,
tout comme pour les échantillons de Maunsell et al, les dimensions des groupes sont
relativement semblables entre les différentes caractéristiques. Dans la quatrième colonne,
soit l’échantillon témoin sans ajustement, on remarque qu’au maximum 150 femmes
seront exclues des calculs. Si on ajuste pour l’âge, on observe que la taille du groupe est
déjà faible et elle peut diminuer d’au plus 50 personnes. Lorsqu’on inclut Montréal dans
l’échantillon, la taille du groupe ne varie pas selon les caractéristiques pour lesquelles
on désire estimer un coefficient par matching. Les tailles d’échantillons diminuent donc
de 149 et 59 pour les colonnes 7 et 8 respectivement. Dans le tableau 3.13, on peut
donc spécifier que la contrainte du support commun diminue les dimensions de tous les
échantillons, mais permet tout de même de conserver des tailles d’échantillons encore
Chapitre 3. Les Résultats
36
raisonnables pour les estimations par matching.
Dans le tableau 3.14 on retrouve les résultats d’estimation de tous les échantillons
témoins utilisés dans notre recherche. Les variables dépendantes utilisées dans le matching sont des variables présentes dans les tableaux 3.5 et 3.6. Ces derniers contiennent
des caractéristiques descriptives de l’emploi que l’on observe au début et à la fin des
trois années sur lesquelles on fait l’étude. La différence avec la méthode de Maunsell et
al (2004) est que l’on utilise le score de propension et que certaines femmes sont exclues
des calculs avec l’utilisation du support commun. Celles ne trouvant pas d’équivalent
dans l’autre groupe par rapport à leur score de propension sont exclues de la démarche.
Dans le tableau 3.14, on présente les résultats des trois variables au début et à la fin pour
les cancéreuses et les femmes du groupe témoin. On pratique la méthode de matching
sur les variables d’heures travaillées par semaine, d’emploi à temps partiel et sur le revenu. On compare les deux groupes de femmes entre elles (première différence) et dans
le temps (deuxième différence) pour chaque échantillon témoin de l’EDTR et aussi pour
celui de l’ECSQ. Le premier cas étudié est celui de Maunsell et al (2004). La première
colonne contient les résultats de matching. La troisième colonne (∆) expose les résultats
obtenus par les différences de moyennes utilisée dans l’étude de Maunsell et al (2004).
La première variable représente le nombre d’heures travaillées par semaine. Les trois
premières lignes sont des cas différents de ce nombre d’heures. La première, « heures
début » , représente la différence entre le groupe traité et témoin au début. La deuxième,
« heures fin » , indique la différence entre le groupe traité et témoin à la fin des trois
ans, et finalement, « diff heures » est le coefficient de différence dans le temps des deux
premières variables. On observe le même détail pour les deux autres variables du tableau des résultats de matching. Pour cet échantillon, on remarque certaines différences
entre les résultats de matching (colonne 1) et de différence de moyennes (colonne 3).
Ces écarts proviennent principalement de la significativité des coefficients. Dans leurs
conclusions de recherche, Maunsell et al (2004) mentionnent que les cancéreuses ne sont
pas différentes des femmes du groupe témoin, car les moyennes des deux groupes sont
très semblables. Avec le matching, on observe le même genre de conclusion, mais de
façon un peu plus directe. Les coefficients de matching non significatifs indiquent qu’il
n’y a pas de réelle différence entre les deux groupes. On s’attend à une telle conclusion
selon les distributions très similaires des pscores des deux groupes dans la figure 3.1 et
les variables non significatives dans le probit du tableau 3.13. La principale conclusion
est que, comme les deux échantillons de Maunsell et al (2004) se ressemblent beaucoup,
il est tout à fait possible d’avoir des résultats similaires avec les deux méthodes statistiques. De façon plus précise, dans la colonne 1, on remarque que les femmes cancéreuses
ne travaillent pas un nombre différent d’heures des femmes témoins, car les coefficients
ne sont pas significatifs, autant au début qu’à la fin pour cette variable. Il n’y a que
501
506
501
501
506
501
497
496
494
heures** début
heures fin
diff heures
jobtp*** début
jobtp fin
diff jobtp
revenu30**** début
revenu30 fin
diff revenu30
739
740
736
755
758
755
755
758
755
890
414
415
413
418
421
418
418
421
418
646
626
626
628
626
622
626
626
622
626
775
SM,SA
Cancéreuses* Contrôle
*Dans tous les échantillons de l’EDTR, le nombre de cancéreuses est le même.
**Nombre d’heures travaillées par semaine.
***Emploi à temps partiel.
****Revenu ≥ 30000$.
646
Maunsell
Cancéreuses Contrôle
DÉPART
Caractéristiques
297
298
298
297
297
297
297
297
297
349
SM,A
Contrôle
821
821
821
821
821
821
821
821
821
970
M,SA
Contrôle
Tab. 3.13 – Taille des échantillons respectant le support commun
387
387
387
387
387
387
387
387
387
446
M,A
Contrôle
Chapitre 3. Les Résultats
37
Chapitre 3. Les Résultats
38
le coefficient de la double différence qui représente un impact négatif significatif. L’interprétation de ce coefficient est que les femmes cancéreuses travaillent moins d’heures
(-1.70 heures) que les femmes témoins après trois ans. Par contre, une différence de
deux heures par semaine n’est pas un impact très percutant. Les coefficients de double
différence de matching sont les plus intéressants à considérer de par leur construction.
Passons maintenant aux autres coefficients de variables estimés à l’aide du matching
pour l’échantillon de l’ECSQ. Selon les résultats du départ, les cancéreuses travaillent
à temps partiel dans des proportions inférieures par rapport aux femmes du groupe
témoin. Par contre, pour les deux autres coefficients, on ne remarque pas de différences
significatives entre les deux groupes. Encore une fois, il s’agit de différences de moins
de 5%, ce qui peut être considéré assez faible. Finalement, au départ, les cancéreuses
gagnent un revenu supérieur aux femmes du groupe témoin. Les résultats de Maunsell
et al (2004) démontrent donc que les différences entre les deux groupes étudiés sont
très faibles, au début ou la fin, car la majorité des coefficients de matching ne sont pas
significatifs. Ceux qui le sont ont une ampleur limitée. Les principales conclusions sont
que les cancéreuses travaillent moins d’heures à la fin, gagnent un revenu supérieur au
départ et travaillent également en moins grand nombre à temps partiel au départ. Ces
résultats de matching concordent avec les conclusions finales de Maunsell et al (2004).
Dans leur recherche, aucune différence majeure ne distingue les femmes atteintes de
cancer par rapport aux femmes du groupe témoin. Faisons maintenant le même genre
d’analyse, mais cette fois pour les quatre groupes formés à l’aide de l’EDTR.
Dans les groupes de l’EDTR, on peut observer si la possible contamination de
l’échantillon témoin amène des différences significatives au niveau des estimations des
coefficients. Le premier échantillon de l’EDTR dont on analyse les résultats de matching dans le tableau 3.14 est le (SM, SA). À titre indicatif, on insert également les
résultats obtenus pour chaque échantillon de l’EDTR avec la méthode de comparaisons
de moyennes que Maunsell et al (2004) utilise dans leur étude (colonne ∆). Analysons
maintenant les estimations des coefficients par la méthode de matching. Ces résultats
figurent dans la quatrième colonne et ceux obtenus par différences de moyennes sont
dans la sixième colonne. Pour les trois variables d’heures, les coefficients de matching
sont significatifs. On voit que les coefficients sont différents selon la méthode statistique
utilisée. Par contre, ici, il est question d’un nombre d’heures travaillées par semaine.
Les écarts ne sont donc pas de plus de dix heures par semaine, ce qui représente une
différence assez faible. On remarque que les cancéreuses travaillent plus d’heures par
semaine que les femmes du groupe témoin au début (4.63 heures) et à la fin (1.65
heures). En comparant les résultats de matching de l’ECSQ et de (SM, SA), colonnes 1
et 4, on constate des différences entre les coefficients et leur significativité. Par contre,
pour la variable « diff heures » , l’impact est similaire et significatif dans les deux situations. Considérons maintenant les variables relatives à un emploi à temps partiel.
-0.04
-0.01
0.03
0.06
0.03
-0.02
revenu30*** début
revenu30 fin
diff revenu30
0.07
0.04
-0.03
-0.04
-0.02
0.02
-0.01
-0.03
-0.01
-0.02
0.08
0.10
4.63
1.65
-3.00
-0.21
-0.79
-0.42
-0.82
3.06
2.65
6.29
2.14
-3.93
0.09
0.03
-0.06
-0.05
0.04
0.09
7.39
4.49
-2.90
∆
0.08
0.06
-0.01
-0.11
0.00
0.10
7.85
2.97
-4.92
1.59
1.05
-0.29
-1.57
-0.06
2.15
4.75
2.44
-4.46
SM,A
coeff
t
0.02
-0.02
-0.04
0.00
0.08
0.08
5.54
3.17
-2.37
∆
0.04
0.05
0.02
-0.16
-0.05
0.11
7.75
3.54
-4.24
0.87
1.22
0.45
-3.32
-1.00
1.95
6.95
3.57
-3.78
M,SA
coeff
t
*Nombre d’heures travaillées par semaine.
**Emploi à temps partiel.
***Revenu ≥ 30000$.
****Résultats obtenus par la méthode de Maunsell et al (2004) (la différence de moyenne) pour chaque cas.
2.26
1.01
-1.06
-1.70
-0.51
1.11
1.59
-0.29
-1.88
jobtp** début
jobtp fin
diff jobtp
1.58
-0.50
-2.34
1.18
-0.43
-1.70
heures* début
heures fin
diff heures
SM,SA
coeff
t
Tab. 3.14 – Résultats de matching pour tous les échantillons
Maunsell
coeff
t
∆****
Caractéristiques
0.07
0.02
-0.05
-0.05
0.04
0.09
7.26
4.34
-2.92
∆
-0.09
-0.08
0.02
-0.04
0.03
0.07
4.82
2.37
-2.49
coeff
-2.21
-1.62
0.49
-1.10
0.78
2.37
5.29
2.79
-3.15
M,A
t
0.00
-0.03
-0.03
-0.02
0.04
0.06
5.69
3.79
-1.9
∆
Chapitre 3. Les Résultats
39
Chapitre 3. Les Résultats
40
Pour (SM, SA), on remarque que les cancéreuses travaillent en plus grand nombre à
temps partiel à la fin, contrairement à ce qu’on observe avec l’ECSQ, car l’effet est
non significatif. Finalement, pour la variable de revenu personnel, on remarque que les
trois coefficients du groupe de l’EDTR ont un impact non significatif. Dans la première
colonne du tableau, le coefficient de « revenu30 départ » est significatif, mais de faible
amplitude. La différence entre ces deux échantillons témoins au niveau des estimations
n’est donc pas énorme. Finalement, on peut conclure qu’il y a certaines différences entre
l’échantillon de l’ECSQ et (SM, SA), principalement au niveau de l’ampleur des coefficients. Malgré tout, il ne semble pas y avoir de différences majeures observées. De plus,
On remarque que les résultats des deux méthodes (colonnes 4 et 6) ont certaines ressemblances lorsque les coefficients sont significatifs. Pour ce premier échantillon, on peut
donc mentionner que les cancéreuses ne semblent pas être très différentes des femmes
de ce premier groupe témoin de l’EDTR, malgré le fait qu’il y ait certaines différences
supplémentaires par rapport à ce qu’on observe avec l’ECSQ.
La septième colonne du tableau 3.14 contient les estimations pour l’échantillon dans
lequel la ville de Montréal est exclue, mais où les fréquences d’âge sont ajustées. Comme
pour l’échantillon précédent, on remarque une certaine similitude entre les résultats
obtenus par matching (septième colonne) et les différences de moyennes (neuvième
colonne). Pour les résultats du matching, on remarque que tous les coefficients relatifs
au nombre d’heures travaillées sont significatifs. Les femmes cancéreuses travaillent plus
d’heures au début et à la fin. Le coefficient de la variable en différence est significatif tout
comme celui pour l’échantillon de Maunsell et al (2004) (colonne 1). Par contre, l’impact
estimé est supérieur dans l’échantillon de l’EDTR. Pour le travail à temps partiel,
on remarque que seul le coefficient de différence est significatif pour cet échantillon.
Finalement, au niveau du revenu personnel, aucun coefficient n’est significatif. On note
encore des différences pour le coefficient de « revenu30 début » entre la première et la
septième colonne. Par contre, l’ampleur de la différence est faible. Encore une fois, on
peut mentionner que les différences entre les deux échantillons témoin, celui de l’ECSQ
et (SM, A) ne sont pas très importantes, plusieurs coefficients ayant un impact nul dans
les deux cas. La différence la plus importante est au niveau des heures travaillées par
semaine.
Passons maintenant à l’évaluation de l’échantillon (M, SA). On remarque encore
une fois la ressemblance qui persiste entre les résultats de matching (colonne10) et
de comparaisons de moyennes (colonne 12), sans toutefois donner des résultats totalement identiques. Cet échantillon est également caractérisé par une variation du nombre
d’heures travaillées qui est significative dans les trois coefficients, au début, à la fin et
en différence. Encore une fois, le coefficient du nombre d’heures travaillées en différence
est semblable entre les colonnes 1 et 10. Au niveau de l’emploi à temps partiel, on
Chapitre 3. Les Résultats
41
remarque que les cancéreuses sont moins nombreuses à occuper un emploi à temps
partiel au départ, tout comme dans l’ECSQ. L’estimation du coefficient en différence
est significative pour l’échantillon de l’EDTR, sans toutefois signaler une variation majeure. Finalement, pour le revenu personnel, aucun coefficient n’a d’impact significatif.
Les différences avec les résultats de la première colonne sont encore une fois de faible
importance. On remarque donc que les deux échantillons donnent des résultats relativement semblables.
Le dernier échantillon est celui où les modifications ont été faites pour l’âge et la
ville de Montréal. Comme dans les autres échantillons de l’EDTR, on remarque que les
estimations avec les différences de moyennes, soit la colonne 15, procurent des résultats
qui sont assez similaires à ceux obtenus par matching. Pour les estimations par matching
(colonne 13), on observe que les trois coefficients qui se rattachent au nombre d’heures
travaillées par semaine sont significatifs. Par contre, avec les résultats de la première
colonne, on remarque certaines différences pour les coefficients. Les estimations pour
les heures travaillées au début et à la fin avec l’ECSQ, soit la colonne 1, sont non
significatives. Par ailleurs, le coefficient en différence est très semblable entre les résultats
de l’ECSQ et (M, A) au niveau du matching. Pour la variable d’emploi à temps partiel,
seule la variable en différence a un coefficient significatif pour ce groupe de l’EDTR. Par
contre, l’impact est assez faible, tout comme celui de l’ECSQ qui est non significatif.
Finalement, on trouve que les cancéreuses gagnent un revenu inférieur aux femmes du
groupe témoin au départ et à la fin, bien que l’impact soit faible. Pour cet échantillon,
on peut donc signaler des différences principalement pour les heures travaillées. Encore
une fois, les différences sont inférieures à cinq heures par semaine. L’écart est donc assez
faible.
Après avoir examiné tous les résultats de matching des groupes de l’EDTR et les
avoir comparés avec les différences de moyennes et les résultats de matching de Maunsell et al (2004), on remarque certaines différences. D’un point de vu global, le matching donne des résultats qui sont assez semblables à ceux des différences de moyennes
représentés par le ∆. Par contre, lorsqu’on compare les estimations par matching de
Maunsell et al et des échantillons de l’EDTR, on observe certaines différences au niveau
de l’ampleur des coefficients. La principale différence entre le matching pour l’ECSQ
et l’EDTR se situe au niveau du nombre d’heures travaillées par semaine. On peut
déjà voir cette distinction dans les tableaux de statistiques descriptives. Au niveau du
revenu, les différences sont plutôt négligeables. Tous les échantillons de l’EDTR ont un
coefficient de « diff jobtp » significatif et positif, ce qui laisse croire que les cancéreuses
travaillent en plus grand nombre à temps partiel à la fin. Par contre, ces cancéreuses
ne sont pas très nombreuses.
Conclusion
En conclusion de cette recherche, plusieurs éléments peuvent être mentionnés. Tout
d’abord, en utilisant l’EDTR, quelques petits écarts subsistent entre les femmes qui
forment les échantillons témoins et les femmes cancéreuses. Dans les tableaux de statistiques descriptives précédents, les proportions étaient comparables entre les groupes
témoins (EDTR) et de cancéreuses. Par contre, en approfondissant nos méthodes de
vérifications, avec le probit par exemple, on s’aperçoit que plusieurs divergences demeurent à plusieurs niveaux, comparativement à ce qu’on a pu observer dans l’étude
faite par Maunsell et al (2004). Par ailleurs, d’après nos comparaisons entre les estimations de différences de moyenne, de matching et les ressemblances flagrantes entre
le groupe témoin et traitement de l’ECSQ, il était tout à fait légitime que le groupe de
Maunsell utilise la méthode sans matching. Leur travail se rapproche énormément d’une
expérience aléatoire. En utilisant l’EDTR, qui est un échantillon possiblement contaminé, davantage de divergences s’incrustent dans les groupes. Plusieurs caractéristiques
personnelles ont un impact significatif sur le groupe malgré un ajustement au niveau
de l’âge. Il persiste donc des différences entre le groupe traité et témoin. Dans un tel
cas, l’utilisation du matching est davantage conseillée pour compenser ces divergences
d’échantillons qui peuvent provenir de différences au niveau de la population dans laquelle on tire les échantillons témoins ou de différences au niveau du questionnaire
utilisé pour obtenir les statistiques descriptives.
Avec les estimations obtenues, on peut mentionner que notre conclusion s’apparente
à celle de Maunsell et al (2004) malgré les différences dans les échantillons témoins.
Dans leur étude, l’équipe de Maunsell mentionne que les femmes cancéreuses sont plus
susceptibles de ne pas travailler trois ans après le diagnostique par rapport aux femmes
du groupe témoin. De plus, selon leurs résultats, la majorité des cancéreuses travaillent
encore trois ans après le diagnostique et l’âge n’affecte pas leur situation de travail.
Finalement, une proportion plus grande de femmes travaillent à temps partiel ou ont un
deuxième emploi. En utilisant les échantillons de l’EDTR, on retrouve des résultats qui
sont relativement similaires à ceux de Maunsell et al (2004) en comparant les statistiques
descriptives. Avec les régressions binomiales sur les échantillons de l’EDTR, on observe
Conclusion
43
que les femmes cancéreuses sont plus susceptibles de se retrouver sans emploi. Dans les
deux groupes ajusté pour l’âge ((SM, A), (M, A)), on observe que les cancéreuses sont
plus à risque d’avoir un emploi différent trois ans après le diagnostique. Si on se reporte
maintenant aux résultats obtenus par matching, on observe que l’échantillon de l’ECSQ
n’est pas différent de façon significative par rapport à celui formé des cancéreuses. Dans
les différents échantillons de l’EDTR, certains coefficients sont significatifs. Par contre,
l’ampleur des coefficients demeure majoritairement assez faible. Les différences entre les
groupes de femmes témoins (EDTR) et de cancéreuses sont donc relativement faibles.
Bien qu’il existe certaines différences, on pourrait possiblement diminuer encore cet
écart en ajoutant plus de variables dans le probit. L’utilisation d’enquête publique pour
former un groupe témoin permet donc de trouver des résultats qui se rapprochent de
ceux de Maunsell et al (2004) en utilisant le matching comme méthode statistique,
malgré la présence probable de femmes ayant le cancer du sein ou l’ayant déjà eu. Cette
façon de faire est beaucoup moins coûteuse en temps et en argent. L’utilisation de telles
enquêtes combinée au matching permet d’obtenir une bonne alternative à la fabrication
d’échantillon comme l’ont fait Maunsell et al (2004).
Bibliographie
[1] Blundell, R., Costa, Dias M., Meghir, C., Reenen, J.V., (2002), « Evaluating the employment impact of a mandatory job search program »,
The institute for Fiscal Studies, WP01/20.
[2] Bloom, J.B., Stewart, S.L., Johnston, M., Banks, P., (1998), « Intrusiveness of illness and quality of life in young women with breast
cancer », Psycho-Oncology 7, 89-100.
[3] Bondy, M.L., Newman, L.A., (2002), « Breast cancer risk assessment
models », Cancer supplement,97(1), 230-235.
[4] Bradley, C., Bednarek, H., Neumark, D., (2002)(a), « Breast cancer
survival, work, and earnings », Journal of Health Economics, 21(5),
757-779.
[5] Bradley, C., Bednarek, H., Neumark, D., (2002)(b), « Breast cancer
and women’s labor supply », Health Services Research, 37(5), 13091328.
[6] Bradley, C.J., Neumark, D., Bednarek, H.L., Schenk, M.J., (2005)(a),
« Short-term effects of breast cancer on labor market attachment :
results from a longitudinal study », Journal of Health Economics,
24(1), 137-160.
[7] Bradley, C.J., Neumark, D., Luo, Z., Bednarek, H.L., (2005)(b),
« Employment-contingent health insurance, illness, and labor supply of women : Evidence from married women with breast cancer »,
National Bureau of Economic Research, Working paper no. 11304.
[8] Caliendo, M., Kopeinig, S., (2005), « Some practical guidance for the implementation of propensity score matching »,
The institute for the study of labor, Working paper no. 1588.
[9] Cancer facts and figures, (2005).
[10] Coile, C., (2004), « Health shocks and couples’ labor supply decisions », National Bureau of Economic Research, Working Paper Series #10810.
Bibliographie
45
[11] Epping-Jordan, J.E., Compas, B.E., Osowiecki, D.M., Oppedisano,
G., Gerhardt, C., Primo, K., Krag, D.N., (1999), « Psychological
adjustment in breast cancer : Processes of emotinoal distress »,
Health Psychology, 18(4), 315-326.
[12] Fondation Québécoise du Cancer, (2005).
[13] Lalonde, R.J., (1986), « Evaluating the econometric evaluations of training programs with experimental data »,
The American Economic Review, 76(4), 604-620.
[14] Maunsell, E., Drolet, M., Brisson, J., Brisson, C.,
Mâsse, B., Deschênes, L., (2004), « Work situation after
breast cancer : Results from a population-based study »,
Journal of the national cancer institute, 96(24), 1813-1822.
[15] Ruhm, C., (1998), « The economic consequences of
parental
leave
mandates
:
Lessons
from
Europe »,
The Quarterly Journal of Economics, 113(1), 285-317.
[16] Satariano, W.A., DeLorenze, G.N., (1996), « The likelihood of returning to work after breast cancer », Public Health Reports, 111(3),
236-241.
[17] Société Canadienne du Cancer, (2005).
[18] Turner, J., Kelly, B., Swanson, C., Allison, R., Wetzig, N., (2005),
« Psychosocial impact of newly diagnosed advanced breast cancer »,
Psycho-Oncology, 14, 396-407.
[19] Wong-Kim, E.C., Bloom, J.R., (2004), « Depression experienced by young women newly diagnosed with breast cancer »,
Psycho-Oncology.
Téléchargement