AUDREY LECLERC Situation au travail pour les femmes atteintes de cancer du sein Mémoire présenté à la Faculté des études supérieures de l’Université Laval dans le cadre du programme de maı̂trise en économique pour l’obtention du grade de Maı̂tre ès arts (M.A.) FACULTÉ DES SCIENCES SOCIALES UNIVERSITÉ LAVAL QUÉBEC AVRIL 2007 c Audrey Leclerc, 2007 Résumé Le cancer du sein peut affecter de façon négative l’expérience de travail des femmes atteintes. Des modifications négatives ou involontaires peuvent donc être observées dans leur situation d’emploi. Dans leur étude, Maunsell et al (2004) ont étudié cette problématique en comparant un échantillon de cancéreuses et un échantillon témoin composé de femmes qui n’ont pas le cancer du sein. On appréhende l’effet du cancer en comparant les moyennes relatives aux deux groupes de nombreuses variables reliées au marché du travail. La principale conclusion est que les femmes cancéreuses ne sont pas différentes des femmes témoins. Dans ce mémoire, on refait la même démarche en utilisant toutefois un échantillon témoin possiblement composé de femmes cancéreuses. Par ailleurs, les comparaisons sont fondées sur la méthode de l’appariement (« matching » ) et non sur de simples moyennes. On remarque quelques petites différences dans les résultats relatifs à chacun des groupes au niveau de certaines caractéristiques d’emploi. Par contre, ces différences sont assez faibles. De façon générale, on peut conclure que les échantillons de femmes témoins sont relativement semblables à l’échantillon de femmes atteintes de cancer du sein. Table des matières Résumé ii Table des matières iii Liste des tableaux iv Table des figures v Introduction 1 1 Revue de la littérature 4 2 Le matching 2.1 Effet du traitement sur les traités et score de propension . . . . . . . . 2.2 Le modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 9 10 3 Les 3.1 3.2 3.3 13 13 23 28 Résultats Statistiques descriptives . . . . . . . . . . . . . . . . . . . . . . . . . . Régressions binomiales . . . . . . . . . . . . . . . . . . . . . . . . . . . Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conclusion 42 Bibliographie 44 Liste des tableaux 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12 3.13 Conditions de travail,au départ, des femmes de tous les groupes témoin et de celles de la population générale de la province de Québec entre 20-39 ans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conditions de travail,au départ, des femmes de tous les groupes témoin et de celles de la population générale de la province de Québec entre 40-49 ans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conditions de travail,au départ, des femmes de tous les groupes témoin et de celles de la population générale de la province de Québec entre 50-59 ans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conditions de travail des femmes de tous les groupes témoin au moment du diagnostique des femmes cancéreuses . . . . . . . . . . . . . . . . . Conditions de travail des cancéreuses et des femmes du groupe témoin au moment de l’entrevue et 3 ans après, parmi celles qui ont un emploi à la fin (étude de Maunsell et al (2004) ) . . . . . . . . . . . . . . . . . Conditions de travail des femmes des différents groupes contrôle tirés à partir de l’EDTR au moment de l’entrevue et 3 ans après, parmi celles qui ont un emploi à la fin . . . . . . . . . . . . . . . . . . . . . . . . . . Risque relatif brut et ajusté de la situation des cancéreuses et des femmes du groupe témoin 3 ans après le diagnostique (étude de Maunsell et al (2004) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Risque relatif brut et ajusté de la situation des cancéreuses et des femmes du groupe témoin de l’EDTR (SM,SA), 3 ans après le diagnostique . . Risque relatif brut et ajusté de la situation des cancéreuses et des femmes du groupe témoin de l’EDTR (SM,A), 3 ans après le diagnostique . . . Risque relatif brut et ajusté de la situation des cancéreuses et des femmes du groupe témoin de l’EDTR (M,SA), 3 ans après le diagnostique . . . Risque relatif brut et ajusté de la situation des cancéreuses et des femmes du groupe témoin de l’EDTR (S,A), 3 ans après le diagnostique . . . . Résultats du probit selon les caractéristiques personnelles pour chaque échantillon témoin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Taille des échantillons respectant le support commun . . . . . . . . . . 15 16 17 20 22 22 25 25 26 26 27 30 37 Liste des tableaux 3.14 Résultats de matching pour tous les échantillons . . . . . . . . . . . . . v 39 Table des figures 2.1 3.1 3.2 3.3 3.4 3.5 Exemple d’un support commun pour deux distributions de score de propension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Densité Densité Densité Densité Densité 31 32 33 34 35 du score de propension pour l’échantillon de Maunsell et al du score de propension pour l’échantillon (SM,SA) . . . . du score de propension pour l’échantillon (SM,A) . . . . . du score de propension pour l’échantillon de (M,SA) . . . du score de propension pour l’échantillon (M,A) . . . . . (2004) . . . . . . . . . . . . Introduction Le cancer du sein est le cancer le plus répandu chez les femmes et le deuxième en importance au niveau des décès au Canada [Société Canadienne du Cancer (2005), Fondation Québécoise du Cancer (2005)]. Les traumatismes psychologiques et physiologiques liés à son apparition se traduisent parfois par des retraits plus ou moins prolongés du marché du travail. Les retraits sont parfois motivés par l’agressivité des traitements médicaux, mais peuvent également être motivés par d’autres considérations (économiques, psychologiques, etc). La littérature économique montre sans équivoque que des retraits plus ou moins prolongés du marché du travail se traduisent généralement par des baisses de salaires et de revenus éventuels d’environ 3% [Ruhm (1998)]. Ces baissent traduisent soit une dépréciation du capital humain, soit un faible attachement au travail que sanctionne le marché (discrimination statistique). Or, ces conclusions portent généralement sur des retraits pour cause de maternité. Les retraits occasionnés pour des motifs « exogènes » comme la maladie ont été peu étudiés en raison d’un manque de données pertinentes. Au cours des dernières années, plusieurs études se sont intéressées aux effets occasionnés par le cancer du sein sur l’emploi et le revenu des femmes qui en sont victimes. C’est le cas pour les nombreux travaux de Bradley et al. Ils portent sur une seule banque de données issue d’une enquête effectuée à Détroit. L’échantillon est constitué uniquement de femmes cancéreuses. L’analyse statistique consiste à comparer le statut socio-économique de ces femmes avec un échantillon de femmes tiré de l’enquête Current Population Survey (CPS) nécessaire pour la construction du groupe témoin. L’hypothèse de base des auteurs est que la présence potentielle de femmes cancéreuses dans l’enquête CPS n’invalide pas les résultats de la modélisation économétrique. Les travaux de Maunsell et al (2004), au contraire, sont basés sur un échantillon de femmes québécoises cancéreuses et non cancéreuses. L’identification du statut médical a été effectuée à partir du Registre des tumeurs québécois (RTQ). L’avantage de l’échantillon québécois au niveau de ses propriétés statistiques est amoindri par le coût énorme lié à Introduction 2 la conception d’un groupe témoin « propre ». En fait, la constitution du groupe témoin est aussi coûteuse que celle du groupe « traitement », ce qui fait en sorte que ce type d’enquête est en moyenne deux fois plus cher que les enquêtes utilisées par Bradley et al. De façon générale, les travaux de Maunsell et al (2004) montrent que le cancer du sein a peu d’effet à long terme sur l’emploi et le revenu des femmes cancéreuses. En revanche, les travaux de Bradley et al montrent que les effets sont assez importants. Le but de cette recherche est double ; (1) nous cherchons à établir dans quelle mesure les résultats contradictoires sont dus à des problèmes d’échantillonnage ; (2) nous analysons la sensibilité des résultats de Maunsell et al (2004) en ayant recours à des groupes de contrôle tirés de l’Enquête sur la Dynamique du Travail et du Revenu (EDTR) et en utilisant des outils statistiques puissants. Grâce à la collaboration de l’équipe d’Elizabeth Maunsell du département de médecine sociale et préventive de l’Université Laval, nous avons accès aux données d’enquête utilisées dans leurs travaux. Le groupe « traitement » de l’Enquête sur le Cancer du Sein de Québec de Maunsell et al (2004), soit l’ECSQ1 , est composé de femmes québécoises atteintes de cancer du sein qui étaient en emploi au moment du diagnostic (1997) et qui étaient âgées entre 35 et 64 ans. Le groupe « témoin » , lui, est constitué de femmes du même groupe d’âge et qui étaient en emploi durant l’année 1997. Un questionnaire rétrospectif a été administré aux femmes des deux groupes durant l’année 2000 pour connaı̂tre les activités reliées au marché du travail au cours de la période 1997-1999 inclusivement. La première partie de notre travail consiste à tirer un échantillon de femmes de l’ETDR sur la base des mêmes critères que ci-dessus. Le recours à l’ETDR est fondamental puisque nous devons reconstituer la chronologie des activités sur le marché du travail en terme d’emploi et de revenus sur la période 1997-1999. Notre échantillon est donc constitué d’un panel couvrant trois années. Ce groupe témoin est très semblable à celui utilisé par Bradley et al et contient potentiellement des femmes cancéreuses. La première partie du travail consiste à réestimer les effets du cancer du sein en utilisant les mêmes outils statistiques que ceux utilisés par Maunsell et al (2004). L’hypothèse nulle de départ postule que les groupes témoins de l’ECSQ et de l’ETDR démontrent les mêmes propriétés statistiques. En conséquence, les effets mesurés devraient être statistiquement les mêmes, indépendamment du groupe témoin utilisé. Les effets du cancer mesurés dans les études de Maunsell et al (2004) et de Brad1 Cet acronyme sera dorénavant mentionné pour désigner les échantillons utilisés dans la recherche de Maunsell et al (2004). Introduction 3 ley et al (2002a, b) sont basés sur des tests statistiques univariés et des régressions linéaires simples, considérant peu de variables et utilisant la totalité des échantillons. Nous proposons plutôt d’asseoir notre analyse sur les méthodes d’appariement statistique (« matching estimators »). L’idée de base est que, conformément à la littérature en épidémiologie, l’apparition du cancer peut être prédite à partir de certaines variables (« prédicteurs ») conventionnelles (âge, état de santé, etc). En ce sens, le cancer n’est pas totalement aléatoire [Bondy et Newman (2002)]. Mentionnons que cela implique que les deux échantillons comparés n’ont pas à être identiques. C’est relativement à cet aspect qu’il est pertinent d’expliquer le cancer. Les deux échantillons témoins utilisés (EDTR et ECSQ) ont de fortes chances d’être différents, considérant qu’ils sont fondés sur des critères de sélection des observations distincts. Malgré le fait que les groupes témoin de l’ECSQ et de l’ETDR sont identiques au niveau de l’âge et de la situation de l’emploi, rien n’empêche que les autres caractéristiques déterminantes soient distribuées différemment. Nous proposons d’utiliser la méthode d’appariement qui permet un meilleur arrimage des groupes témoin et traitement. Celui-ci est basé sur un nombre élevé de variables et les procédures statistiques d’appariement imposent que les distributions des variables explicatives soient les mêmes entre les deux groupes (« Balancing property tests »). Autrement dit, l’incapacité de reproduire les résultats de Maunsell et al (2004) à l’aide des méthodes statistiques utilisées dans leurs recherches pourrait être intrinsèque aux estimateurs et aux données (ETDR) elles-mêmes. Le cas échéant, nous chercherons à déterminer si la méthode par appariement parvient à compenser ces lacunes et donc que l’utilisation d’un échantillon témoin de l’EDTR ou de l’ECSQ permet d’obtenir des résultats semblables. Cette recherche a deux contributions majeures. La première est d’établir si les échantillons de groupes témoins tirés d’enquêtes conventionnelles permettent de reproduire les résultats sur l’impact du cancer du sein utilisant un groupe contrôle spécifique. Dans la négative, la deuxième contribution de la recherche permet d’établir si les méthodes d’estimation sophistiquées telles les estimateurs par appariement permettent de compenser les différences au niveau de la population utilisée pour la création des groupes témoins. Dans l’étude de Maunsell et al, il n’y a pas de cancéreuses dans la population de femmes témoin contrairement à celle de l’EDTR. Le cas échéant, cela pourra avoir des conséquences importantes sur la conduite de la recherche. En effet, il sera alors possible de consacrer davantage de ressources à la constitution de groupes traitements, sachant que les enquêtes conventionnelles et les techniques statistiques sophistiquées permettent d’établir des groupes contrôles convenables à faibles coûts. Chapitre 1 Revue de la littérature On estime à 21 600 les nouveaux cas de cancer du sein chez la femme au Canada chaque année. En 2005, parmi toutes les femmes atteintes, 5 300 en sont décédées [Société canadienne du cancer, (2005)]. Chaque année, plusieurs études analysent les impacts de cette maladie sur la femme elle-même et sur son travail. Par ces recherches, on tente aussi de déceler les éléments qui peuvent prédire ou avoir une certaine influence sur l’incidence du cancer du sein, comme par exemple l’âge, l’activité physique ou l’historique de la maladie dans la famille. Cette maladie touche énormément de femmes partout dans le monde et en augmentant nos connaissances à l’aide de recherches, il est possible d’accroı̂tre les chances de survie. Malheureusement, la plupart des recherches sont faites à l’étranger, donc souvent peu représentative de la population québécoise. Dans la plupart des études, sinon dans la totalité, on considère le cancer du sein comme étant un phénomène parfaitement aléatoire [Bradley et al (2002a, b)]. On ne possède généralement pas assez d’information sur le sujet et sur les variables qui peuvent occasionner cette maladie. Par contre on sait que l’âge est un assez bon indicateur [Fondation québécoise du cancer (2005)]. En fait, plus une femme vieillit, plus elle est susceptible de souffrir du cancer du sein. Par exemple, une femme âgée entre 40-49 ans a 1,3% de probabilité d’être atteinte. Pour celle âgée entre 50-59 ans, la probabilité est de 2,5% alors que celle entre 60-69 ans a une probabilité de 3,1% [Fondation québécoise du cancer (2005)]. Il est également important de noter que toutes ces femmes ont encore la possibilité de se retrouver sur le marché du travail. Conséquemment, leur maladie peut avoir un impact considérable sur leur emploi, leur revenu et nécessairement sur le marché du travail en général. Avec le vieillissement de la population, il est probable que les cas de cancer du sein augmentent. Mise à part l’âge, l’historique médical des patientes peut également s’avérer un bon prédicateur. En fait, certaines femmes ayant le cancer du sein proviennent de familles avec des antécédents concernant cette maladie Chapitre 1. Revue de la littérature 5 [Fondation québécoise du cancer 2005]. Les études faites sur le cancer du sein ont chacune leurs particularités. Par exemple, dans certaines d’entre elles, on utilise seulement le groupe de femmes ayant le cancer du sein [Satariano et al (1996) ; Bloom et al (1998) ; Epping-Jordan et al (1999) ; Coile (2004) ; Wong-Kim et Bloom (2004) ; Cancer Facts and Figure (2005)]. Dans ces études, il est impossible d’isoler les variations du marché du travail qui sont « normales », c’està-dire qui font partie du cycle inhérent au marché. Par contre, lorsqu’on utilise un groupe de contrôle qui est comparé à celui des cancéreuses, on peut isoler les variations « normales » du marché avec celles qui sont causées par le cancer du sein [Bradley et al (2002a, b, 2005) ; Maunsell et al (2004)]. Tel que mentionné ci-dessus, on sait que le cancer du sein a des répercussions sur le marché du travail. Par exemple, un diagnostique du cancer du sein provoque plusieurs changements dans la vie professionnelle, personnelle et familiale de la femme atteinte. Le traitement peut engendrer un arrêt de travail temporaire ou permanent. Certaines études corroborent ces hypothèses alors que d’autres les invalident. Selon Maunsell et al (2004), il ne semble pas y avoir de différence significative entre un groupe témoin et un groupe de femmes atteintes du cancer du sein 3 ans après le diagnostique. D’après leurs résultats, la grande majorité des femmes travaillent après ce laps de temps. On conclut également que les conditions de travail des deux groupes ne changent pas pour la majorité des femmes en 3 ans. Il ne semble pas y avoir non plus d’incitatif pour ces mêmes femmes à prendre leur retraite. La seule différence que l’on peut mentionner est que les femmes cancéreuses accordent moins d’importance à leur travail et y mettent moins d’effort à la suite du diagnostique. Par contre, d’autres études [Bradley et al (2004, 2005) ; Satariano et DeLorenze (1996) ; Coile (2004)] mentionnent que les cancéreuses retournent en moins grand nombre sur le marché du travail par rapport au groupe témoin. De plus, certaines études mentionnent que celles qui retournent sur le marché du travail diminuent leur nombre d’heures travaillées par rapport à leur situation précédant le diagnostique. À l’inverse, d’autres recherches concluent que les femmes qui retournent sur le marché du travail augmentent le nombre d’heures qu’elles travaillent relativement à leur situation avant le diagnostique [Bradley et al (2002a, b)]. Ce phénomène semble être plus important chez celles qui travaillent à temps partiel au moment du diagnostique. Ce résultat, qui est des plus surprenants, est assez difficile à expliquer. La plupart des recherches n’appuient pas les hypothèses qui supposent que ces femmes attachent plus d’importance à leur travail, qu’elles ont un statut socio-économique plus élevé ou qu’elles veulent conserver leur couverture d’assurance santé auprès de leur employeur. On peut, par exemple, supposer que l’échantillon de cancéreuses avant le diagnostique est différent de l’échantillon du groupe témoin au même moment. On peut également supposer que la femme qui retourne au travail Chapitre 1. Revue de la littérature 6 désire travailler plus d’heures pour combler la perte de revenu occasionnée par un arrêt de travail durant les traitements. Plusieurs éléments peuvent influencer le retour au travail des malades. Les caractéristiques de l’emploi et également la sévérité de la maladie en sont des exemples [Satariano et al (1996)]. Plus la maladie devient sévère, plus les répercussions sur l’offre de travail des femmes sont importantes [Satariano et al (1996) ; Bloom et al (1998) ; Bradley et al (2002a, 2004, 2005) ; Coile (2004)]. Parmi les femmes diagnostiquées très tôt, on remarque des caractéristiques très semblables à celles du groupe témoin de Bradley et al (2004, 2005). Le type de travail est aussi un élément important dans leur choix de retourner au travail ou non. Un travail physique ou manuel est beaucoup plus exigeant pour le corps qu’un travail de bureau, par exemple. Plusieurs études notent que parmi les femmes qui ne retournent pas sur le marché du travail, la majorité d’entre elles ont un travail physique [Satariano et al (1996) ; Maunsell et al (2004)]. On mentionne que 47% des cancéreuses qui ne travaillent pas indiquent que la nature de leur travail en est la cause. Ce sont en majorité les traitements qui occasionnent ce problème : ils rendent souvent les patientes incapables de travailler adéquatement, ce qui nécessite un arrêt de travail [Satariano et al (1996)]. Par contre, selon Bradley et al (2004), ces résultats ne sont pas vérifiables car ils ne sont pas significatifs. L’état matrimonial de la femme touchée par la maladie et la source d’assurance salaire peuvent aussi avoir un impact important. Selon Bradley et al (2005)(b), on remarque une diminution de l’offre de travail plus importante chez les femmes qui sont mariées et qui sont assurées par l’assurance de leur conjoint. Une femme qui s’absente de son travail en raison de sa maladie a moins d’incitatifs à retourner au travail. Lorsque l’assurance est supportée par la femme, elle doit retourner au travail le plus tôt possible sinon, après un laps de temps déterminé, la patiente risque de perdre son assurance. Si c’est l’employeur du conjoint qui procure l’assurance, la femme peut récupérer sans craindre de perdre sa propre assurance. On observe aussi que ces femmes ont plus de chances d’être en meilleure forme et davantage disposées à retourner au travail que celles qui doivent retourner travailler pour une question d’assurance avant la fin de leur convalescence. Selon cette même source, les femmes assurées avec leur propre employeur vont même jusqu’à diminuer les traitements et les doses pour continuer à travailler le plus possible. Comparer deux échantillons (témoin et traitement) demeure malgré tout une opération qui peut entraı̂ner certains biais dans les résultats. Pour effectuer une telle comparaison, on considère que les deux groupes sont équivalents sous plusieurs caractéristiques comme l’âge et le statut d’emploi. La seule différence qui subsiste entre ces deux groupes est le fait d’avoir ou non le cancer du sein. On suppose que la personne du groupe témoin Chapitre 1. Revue de la littérature 7 est semblable à celle du groupe traitement si celle-ci n’avait pas le cancer. Par contre, la femme qui a effectivement le cancer n’est pas observable dans l’état sans cancer (contrefactuel). Cela entraı̂ne un biais de sélection. Pour remédier à ce problème, on peut avoir recours à la méthode dite de « matching ». Cette démarche nécessite la construction d’une probabilité d’avoir le cancer pour les individus du groupe témoin et du groupe traitement. Par contre, certaines femmes sont exclues des calculs par souci de respect du support commun au niveau de ces probabilités entre le groupe de femmes témoins et de cancéreuses. C’est donc ce premier volet que l’on va tenter d’ajouter à l’étude de Maunsell et al (2004). Chapitre 2 Le matching Notre recherche se compose principalement de deux étapes. On réévalue d’abord les travaux de Maunsell et al (2004) à l’aide du matching. Par la suite, on utilise un échantillon témoin provenant de la banque de données de l’EDTR et on refait la même démarche. On pourra observer si les deux échantillons témoins sont semblables et s’il est vraiment indispensable de construire un échantillon témoin ne contenant aucun sujet contaminé par le cancer du sein. Il y a deux différences entre le groupe témoin de l’ECSQ et de l’EDTR. Premièrement, la population utilisée pour construire chacun des groupes témoins est différente car dans un des cas (EDTR) elle peut contenir des femmes atteintes de cancer du sein. Deuxièmement, les questionnaires utilisés pour recueillir l’information des femmes témoins sont différents. Cela implique, par exemple, que deux variables qui représentent l’expérience de travail pour chacun des groupes contrôles, peuvent renfermer des distinctions dans leur définition qui sont difficilement décelables. C’est le cas pour la variable de scolarité. La composition des échantillons est donc la base de notre projet. Le matching est une méthode statistique qui permet de construire des estimateurs pour évaluer les effets de l’intervention d’un traitement, en comparant les résultats entre des individus traités et des individus similaires dans un groupe de comparaison [Todd (1999)]. Cette méthode permet donc de raffiner les estimations des différences entre des femmes cancéreuses avec les femmes appartenant au groupe témoin. Chapitre 2. Le matching 2.1 9 Effet du traitement sur les traités et score de propension Au départ, notre intérêt porte principalement sur les résultats concernant les femmes cancéreuses en l’absence de cancer. On veut donc évaluer l’impact moyen du cancer sur les cancéreuses : ∆D=1 (X) = E(Y1 − Y0 |X, D = 1), (2.1) où X représente un vecteur de caractéristiques individuelles. La variable Y indique les résultats sans cancer (Y0 ) et avec cancer (Y1 ) et D indique l’absence ou la présence de la maladie. En fait, nous observons les résultats moyens du groupe de cancéreuses sachant qu’elles ont le cancer : E(Y1 |X, D = 1), (2.2) mais pas les résultats moyens de ces dernières en l’absence de cancer (contrefactuel) : E(Y0 |X, D = 1). (2.3) Devant cette difficulté, on considère que les résultats moyens en l’absence de cancer sont égaux à ceux des femmes faisant partie d’un groupe témoin conditionnellement à certaines caractéristiques propres à chacune d’entre elles : E(Y0i |Xi , Di = 1) = E(Y0i |Xi , Di = 0). (2.4) On compare donc deux échantillons. Par contre dans plusieurs situations, il est tout à fait inexact de considérer une telle correspondance entre le groupe témoin et traitement. Cela peut entraı̂ner des biais au niveau des estimations. Par exemple, dans l’étude de Maunsell et al (2004), on fait cette correspondance en s’assurant que l’âge et le statut d’emploi au moment du diagnostique des femmes cancéreuses sont les mêmes que les non cancéreuses. Dans notre recherche, nous utilisons plutôt un score de propension au lieu de caractéristiques personnelles pour regrouper les femmes entre les échantillons. Cet élément, qui est central au matching, indique la probabilité d’avoir le cancer du sein conditionnellement à certaines caractéristiques observables, comme l’âge, le nombre d’enfants, le statut matrimonial, etc. Ces dernières doivent influencer les individus avant d’avoir le cancer ou être fixes à travers le temps. Ce sont des variables a priori à la maladie. Le cancer n’a donc pas d’impact sur ces variables. Si des variables qui ne sont pas a priori au cancer sont inclues dans le modèle, on introduit un biais dans l’estimation. On calcul ce score de propension autant pour les individus du groupe témoin que pour ceux du groupe traitement. Cela permet de relier les deux échantillons par une probabilité d’avoir le cancer du sein. On estime cette probabilité de façon paramétrique Chapitre 2. Le matching 10 à partir d’un modèle économétrique de type probit. Comparer plusieurs caractéristiques entres elles est un travail beaucoup plus ardu que de comparer des probabilités qui sont des scalaires. Plus on a de variables dans le vecteur X, plus il est difficile de trouver deux individus ayant exactement les mêmes caractéristiques. On doit éliminer les observations qui ne trouvent pas de correspondance et un faible nombre de ces correspondances entre elles peut causer des problèmes d’estimation. Au lieu de considérer un vecteur contenant plusieurs caractéristiques pertinentes (X), on utilisera plutôt une probabilité d’avoir le cancer du sein dans son ensemble. Rosenbaum et Rubin (1983) ont montré que si on peut apparier sur les X, on peut aussi apparier sur P(X) : P (X) ≡ P (D = 1|X) (2.5) 0 < P (X) < 1. (2.6) Pour notre sujet d’étude, le P(X), qui est le score de propension, représente la probabilité de se retrouver dans le groupe de cancéreuses. Rosenbaum et Rubin (1983) ont prouvé que : (Y0i ⊥Di )|Xi ⇒ (Y0i ⊥Di )|P (Xi ). (2.7) En fait, si les données justifient l’appariement sur les X, elles justifient aussi de matcher sur P(X). Ça élimine le problème de dimensionnalité de X. Par la suite, cela nous amène à l’égalité suivante : E(Y0i |P (Xi ), Di = 1) = E(Y0i |P (Xi ), Di = 0), (2.8) soit que les résultats moyens sans cancer d’une femme ayant le cancer sont égaux aux résultats moyens sans cancer d’une femme qui fait partie de l’échantillon témoin, conditionnellement à un score de propension « semblable ». En utilisant le score de propension, on peut conditionner les différences entre les groupes de femmes témoin et cancéreuses qui sont, au départ, différents. 2.2 Le modèle Dans notre recherche, la fonction de Kernel est utilisée pour créer un estimateur lisse de notre quantité d’intérêt, soit : Ê(Y0i |P (Xi ), Di = 0) = n0 X Wj (P (Xi ), P (Xj ))Y0j (2.9) j=1 où (Xj)) K (P (Xi )−P hn Wj (P (Xi ), P (Xj )) = Pn 0 j=1 (Xj )) K (P (Xi )−P hn (2.10) Chapitre 2. Le matching 11 Pour un P (Xi ) donné d’une femme cancéreuse, on associe toutes les femmes témoins j qui ont une probabilité semblable. La fonction de pondération (2.10) permet d’attribuer un poids plus important aux femmes du groupe contrôle dont la valeur du score est relativement près de la probabilité d’une cancéreuse quelconque. En fait, on prend le score d’une cancéreuse donnée et on créé une fenêtre h de la forme P (Xi ) ± (h). Tous les points inclus dans cette fenêtre se verront attribuer un poids représentant leur proximité du point milieu, soit P (Xi ) de la femme cancéreuse en question. Tous les points à l’extérieur de ces limites auront un poids nul. La somme de la fonction de poids sur les j est de 1. Pour l’élaboration de calculs reliés au matching, une fenêtre de 0,06 est utilisée. Dans le logiciel statistique Stata, lorsqu’on utilise une fonction Epanechnikov pour faire du matching, la taille de la fenêtre par défaut est de 0,06. Dans l’étude de Maunsell et al (2004), on utilise des régressions simples pour évaluer les différences entre les deux groupes de femmes. En fait, on soustrait les moyennes des femmes témoins de celles des femmes cancéreuses. Avec une telle démarche, on fait une sélection sur les observables. C’est ce qui se produit lorsqu’on sélectionne les femmes des groupes selon leur âge et leur statut d’emploi. Avec le matching, on peut aller un peu plus loin dans notre analyse. On peut, encore une fois, sélectionner sur les observables par l’utilisation du score de propension qui est formé de caractéristiques observables. Par contre, on peut également sélectionner sur les non observables invariant dans le temps en faisant du matching de différence-en-différence. Si on fait l’hypothèse que le biais de sélection est constant dans le temps, ce dernier est éliminé avec l’estimateur en différence. On peut donc corriger pour certains types de sélection sur ces non observables. Ce genre d’estimation compare les différences entre les deux échantillons dans le temps, qui est donc une double comparaison. L’estimateur s’écrit de la façon suivante : DD = [E(Y1t |P (X), D = 1) − E(Y1t0 |P (X), D = 0)] − [E(Y0t |P (X), D = 1) − E(Y0t0 |P (X), D = 0)] (2.11) Les t et t’ représentent le temps après et avant le traitement respectivement. La fonction de Kernel, que l’on retrouve dans notre fonction de poids Wj (P (Xi ), P (Xj )), peut prendre plusieurs formes selon des caractéristiques précises. Dans le cadre de notre analyse, nous utilisons une fonction Epanechnikov qui a la forme fonctionnelle suivante : 3 K(u) = (1 − u2 ) avec u ∈ [−1, 1] (2.12) 4 Le score de propension est un élément essentiel si l’on désire utiliser le matching. Par contre on doit trouver une correspondance entre les probabilités d’avoir le cancer du sein entre une femme du témoin et cancéreuse. Chaque femme des deux groupes a son propre score de propension. Il est donc probable que la concordance entre les probabilités des deux groupes s’avère impossible dans certaines situations. C’est pour cette Chapitre 2. Le matching 12 raison que l’on ne considère que les femmes d’un groupe que l’on peut apparier avec celle de l’autre groupe selon leur probabilité d’avoir le cancer du sein. L’effet traitement estimé correspond donc à l’effet traitement pour les femmes cancéreuses que l’on a pu apparier selon leur score de propension. Les autres femmes sont éliminées des calculs. Dans la figure 2.1, on remarque que les deux distributions de probabilités de cet exemple occasionnent un support commun très restreint, les femmes des deux groupes n’ayant pas des probabilités semblables. En fait, les femmes des deux groupes n’ont pas beaucoup de probabilités communes. Le support commun représente donc la surface pour laquelle les probabilités d’avoir le cancer du sein se chevauchent. Dans les calculs de ce cas particulier, on ne considèrera que les femmes ayant une probabilité entre 0.15 et 0.75. En sélectionnant ainsi les femmes qui sont dans les calculs, on s’assure d’avoir deux échantillons semblables au niveau des scores de propension. On calcule donc l’effet traitement pour les cancéreuses restantes. Conserver toutes les observations peut occasionner un biais dans nos estimations. Fig. 2.1 – Exemple d’un support commun pour deux distributions de score de propension Dans l’étude de Maunsell et al (2004), plusieurs vérifications statistiques sont faites pour analyser les composantes des échantillons de femmes cancéreuses et témoins afin de les comparer. Après les quelques précisions apportées au niveau de la méthode de matching, il est maintenant pertinent de comparer les échantillons témoin de l’ECSQ et de l’EDTR en suivant ces mêmes vérifications statistiques. On pourra ainsi constater si la présence possible de cancéreuses dans l’échantillon témoin amène des changements marquants dans les statistiques descriptives. Chapitre 3 Les Résultats Dans leur recherche, Maunsell et al (2004) font plusieurs vérifications de niveau statistique pour analyser la composition de chacun de leur échantillon, autant témoin que cancéreuses. Par la suite, ils effectuent des comparaisons de moyennes entre le groupe de femmes des groupes témoin et cancéreuses pour vérifier s’il existe des différences notables entre ces deux catégories de femmes. De notre côté, avant de comparer les cancéreuses avec les femmes de l’EDTR, il est important de vérifier au préalable si notre échantillon de l’EDTR est semblable à celui de l’ECSQ, qui est notre cas de base. Pour ce faire, on doit isoler les mêmes caractéristiques descriptives que Maunsell et al (2004). 3.1 Statistiques descriptives Pour créer un échantillon semblable à celui de notre cas de base, il est important de respecter la même procédure d’échantillonnage. Lors de la création de leur échantillon témoin, Maunsell et al (2004) n’utilisent que les femmes qui ont un emploi durant l’année de référence, soit l’année de diagnostique du cancer du sein pour les femmes du groupe traitement. Par souci de simplicité, nous utilisons l’année 1997 comme base de notre analyse. Deuxièmement, ils s’assurent que les femmes sont âgées entre 18 et 59 ans et que la distribution de l’âge est la même entre le groupe traitement et contrôle. Notre point de départ consiste donc à créer un échantillon en respectant ces mêmes critères. À partir de l’EDTR, nous construisons quatre échantillons distincts. Chacun des Chapitre 3. Les Résultats 14 échantillons comprend des femmes de la province de Québec, âgées entre 18 et 59 ans et qui ont un emploi durant l’année de référence. Dans le premier échantillon, aucun ajustement n’est fait au niveau de la fréquence des groupes d’âges. De plus, les résidentes de Montréal sont exclues pour respecter le groupe témoin de base. On tire un deuxième échantillon, mais cette fois, en ajustant les groupes d’âges afin d’avoir les mêmes proportions que pour les cancéreuses selon les groupes d’âges suivants : 29-29 ans, 30-39 ans, 40-49 ans et 50-59 ans. Un troisième inclut la ville de Montréal, mais n’est pas ajusté pour les fréquences reliées à l’âge et finalement, un dernier échantillon inclut la ville de Montréal et est également ajusté au niveau de la fréquence des groupes d’âges. Dans l’étude de Maunsell et al on inclut la ville de Montréal. Par ailleurs, la population de cette ville est beaucoup plus diversifiée au niveau des origines ethniques que les autres régions de la province de Québec. Dans la population de départ de l’EDTR, il est possible de trouver des femmes cancéreuses. Avec des échantillons qui incluent ou non la ville de Montréal, on désire vérifier si les différences ethniques occasionnent des modifications dans les résultats statistiques. Les différences pourraient provenir de caractéristiques générales ou d’une plus forte présence du cancer à l’intérieur de divers groupes etchniques. Avec ces quatre nouveaux groupes témoin, on peut maintenant vérifier leurs ressemblances avec l’échantillon de l’ECSQ. Cela nous permet donc également de conclure sur la ressemblance de tous les échantillons entre eux, considérant des populations d’échantillonnage différentes. Après de multiples vérifications au niveau de ces statistiques descriptives, on pourra donc apporter une première conclusion quant aux différences d’un échantillon possiblement contaminé par rapport à un échantillon propre. Dans les tableaux 3.1 à 3.3, on retrouve plusieurs statistiques concernant les conditions de travail des différents groupes témoins et ce, pour trois sous-groupes d’âges différents. Il est à noter que le groupe témoin « Femmes Québec » représente les statistiques réellement observées dans la province de Québec dérivée selon des données de Statistique Canada. Plusieurs observations peuvent être faites sur les échantillons de Statistique Canada et de l’ECSQ. Premièrement, les femmes travaillent un nombre relativement élevé d’heures, c’est-à-dire entre 33 et 35 heures par semaine dans chacun des tableaux. De plus, entre 20% et 30% d’entre elles ont un travail à temps partiel. On remarque aussi que près de la moitié des femmes sont syndiquées. Très peu possèdent un deuxième emploi, soit 9% selon l’ECSQ et finalement, la majorité des femmes gagnent un revenu inférieur à 20,000$ et ce, peu importe le groupe d’âge considéré. Nous comparons maintenant les quatre échantillons de l’EDTR entre eux. Premièrement, on remarque que les heures travaillées par semaine sont assez semblables entre les quatre échantillons et ce, dans chacun des tableaux. Plus précisément, dans les tableaux représentant les groupes d’âges 20-39 ans et 40-49 ans, on remarque que le Chapitre 3. Les Résultats 15 Tab. 3.1 – Conditions de travail,au départ, des femmes de tous les groupes témoin et de celles de la population générale de la province de Québec entre 20-39 ans Groupes EDTR Femmes ECSQ SM,SA SM,A M,SA M,A Québec * ** *** **** Conditions n=30,798 n=217 n=429 n=102 n=529 n=126 de travail % % % % % % 33 ± 11 35 ± 13 28 ± 17 29 ± 13 28 ± 16 30 ± 19 26 24 31 22 31 25 60 22 16 2 52 25 22 1 44 39 17 0 20 54 26 0 44 39 17 0 25 46 29 0 Syndiquée 29 40 33 37 32 37 2ième emploi 4 9 9 - 10 6 Revenu (000)$ (personnel) <20 20-29 30-39 ≥40 48 28 15 9 35 27 22 16 54 26 10 10 43 30 17 10 53 25 12 10 38 27 19 16 Hrs travaillées (parsemaine) Tps partiel (< 30hrs/sem) Expérience (années) <5 5-14 15-24 25-45 *Aucun ajustement pour les fréquences d’âges et Montréal est exclue. **Ajustement pour les fréquences d’âges, mais Montréal est exclue. ***Aucun ajustement pour les fréquences d’âges, mais Montréal est inclue. ****Ajustement pour les fréquences d’âges et Montréal est inclue. Chapitre 3. Les Résultats 16 Tab. 3.2 – Conditions de travail,au départ, des femmes de tous les groupes témoin et de celles de la population générale de la province de Québec entre 40-49 ans Groupes EDTR Femmes ECSQ SM,SA SM,A M,SA M,A Québec * ** *** **** Conditions n=17,401 n=362 n=247 n=148 n=309 n=188 de travail % % % % % % 34 ± 11 34 ± 11 30 ± 13 31 ± 13 30 ± 13 30 ± 12 21 24 26 23 25 27 32 21 25 21 33 32 17 18 13 23 44 20 12 22 40 26 11 23 44 22 9 26 44 21 Syndiquée 45 47 41 42 39 37 2ième emploi 3 10 5 5 4 6 Revenu(000$) (personnel) <20 20-29 30-39 ≥40 34 30 18 18 32 33 16 20 38 24 19 19 37 22 22 20 37 23 19 21 37 24 19 20 Hrs travaillées (parsemaine) Tps partiel (< 30hrs/semaine) Expérience (années) <5 5-14 15-24 25-45 *Aucun ajustement pour les fréquences d’âges et Montréal est exclue. **Ajustement pour les fréquences d’âges, mais Montréal est exclue. ***Aucun ajustement pour les fréquences d’âges, mais Montréal est inclue. ****Ajustement pour les fréquences d’âges et Montréal est inclue. Chapitre 3. Les Résultats 17 Tab. 3.3 – Conditions de travail,au départ, des femmes de tous les groupes témoin et de celles de la population générale de la province de Québec entre 50-59 ans Groupes EDTR Femmes ECSQ SM,SA SM,A M,SA M,A Québec * ** *** **** Conditions n=8,218 n=311 n=99 n=99 n=132 n=132 de travail % % % % % % 33 ± 12 33 ± 15 29 ± 11 29 ± 11 30 ± 11 30 ± 11 29 31 25 25 27 27 27 19 27 27 26 21 28 25 7 21 25 46 7 21 25 46 6 20 28 46 6 20 28 46 Syndiquée 43 49 45 45 46 46 2ième emploi 3 6 5 5 6 6 Revenu(000$) (personnel) <20 20-29 30-39 ≥40 44 27 14 14 39 23 17 21 41 20 15 23 41 20 15 23 39 22 17 21 39 22 17 21 Hrs travaillées (parsemaine) Tps partiel (< 30hrs/semaine) Expérience (années) <5 5-14 15-24 25-45 *Aucun ajustement pour les fréquences d’âges et Montréal est exclue. **Ajustement pour les fréquences d’âges, mais Montréal est exclue. ***Aucun ajustement pour les fréquences d’âges, mais Montréal est inclue. ****Ajustement pour les fréquences d’âges et Montréal est inclue. Chapitre 3. Les Résultats 18 nombre d’heures se modifie à la hausse lorsqu’on ajuste pour les fréquences d’âges. Cet ajustement a pour effet d’augmenter la moyenne d’âge du groupe de femmes. Si les femmes plus âgées travaillent un nombre supérieur d’heures par semaine, il est tout à fait logique d’observer une moyenne d’heures supérieure dans les échantillons où on fait une telle modification. On est également tenté de croire que c’est aussi pour cette raison qu’un moins grand nombre d’entres elles travaillent à temps partiel dans ces deux groupes. Ce phénomène s’observe autant dans le tableau 3.1 que 3.2. On remarque la même chose pour la variable représentant le nombre d’années d’expérience de la femme. Plus les femmes sont âgées dans l’échantillon, plus elles ont d’années d’expérience. Un plus grand nombre d’entres elles sont également syndiquées. Finalement, les femmes des groupes ajustés pour l’âge gagnent un salaire supérieur à celles qui font partie des groupes témoin non ajustés pour l’âge. Par contre, on ne semble pas observer de différences entre les échantillons qui incluent la ville de Montréal par rapport à ceux qui l’excluent. Cela amène donc à penser qu’inclure Montréal dans l’échantillon n’entraı̂ne pas de modifications importantes au niveau des résultats sur les caractéristiques descriptives. Les comparaisons des échantillons de l’EDTR avec ceux de l’ECSQ et de Statistique Canada sont très révélatrices. Parmi les groupes témoins formés à l’aide de l’EDTR on observe que le nombre d’heures travaillées par semaine est inférieur en comparaison des résultats obtenus avec l’ECSQ et Statistique Canada. L’écart moyen se chiffre à environ 4 heures par semaine. On remarque également certaines petites divergences pour l’expérience de travail, mais rien de majeur, d’autant plus que cette variable est robuste à travers les échantillons de l’EDTR. Malgré cette observation, on peut quand même croire que les échantillons de l’EDTR sont relativement semblables à de l’échantillon de base, malgré la présence possible de cancéreuses dans ces échantillons témoins. La variable de temps partiel, tout comme celles indiquant un deuxième emploi, le revenu personnel ou l’appartenance à un syndicat sont toutes représentées par des proportions de population semblables entre les différents groupes. On ne remarque pas de différences majeures entre les échantillons, que ce soit dans les tableaux 3.1, 3.2 ou 3.3. La variable qui semble diverger au niveau de ses proportions entre les différents groupes d’âges est celle qui indique le nombre d’années d’expérience. Les distributions de cette dernière dans les échantillons de Statistique Canada et de l’ECSQ semblent être beaucoup plus constantes à travers les tableaux descriptifs, plus particulièrement dans les tableaux 3.2 et 3.3. Dans les groupes témoins obtenus à partir de l’EDTR, on remarque que la variable change à travers les tableaux. Ainsi, les femmes âgées entre 20-39 ans ont, pour la majorité d’entre elles, un maximum de 5 années d’expérience lorsque aucun ajustement pour l’âge n’est effectué, soit dans les échantillons (SM,SA) et (M,SA). Par contre, on décèle un déplacement de masse vers la seconde catégorie, Chapitre 3. Les Résultats 19 soit celle représentant 5 à 14 années d’expérience lorsque les échantillons sont ajustés pour l’âge. Cela peut s’expliquer par une augmentation de la moyenne d’âge du groupe témoin. On remarque également que dans les groupes de l’EDTR, l’expérience semble augmenter avec l’âge, donc du tableau 3.1 au tableau 3.3. Ce phénomène est beaucoup plus difficile à observer dans les groupes de Statistique Canada et de l’ECSQ. L’évolution des proportions de cette même variable pour les groupes formés à partir de l’EDTR est cohérente avec nos attentes. Plus une femmes avance en âge, plus elle est susceptible d’avoir des années d’expérience de travail. Eu égard au revenu personnel, on remarque que pour le tableau 3.1 la répartition des femmes dans les sous-groupes de revenu est assez différente de ce qu’on observe dans l’échantillon de l’ECSQ. Cet écart est moins important lorsqu’on ajuste pour l’âge et que les femmes sont plus âgées, soit dans les tableaux 3.2 et 3.3. Malgré les différences observées dans ces tableaux, la répartition des femmes est semblable dans les différents échantillons. Pour mettre encore une fois à l’épreuve la comparabilité de ces échantillons, regardons d’autres caractéristiques, cette fois démographiques, qui peuvent nous renseigner davantage sur la composition des différents groupes témoin disponibles. Dans le tableau 3.4, on remarque que certaines variables se répètent par rapport aux trois tableaux précédents. Par contre, ici, les femmes ne sont pas séparées selon des groupes d’âges. La première caractéristique analysée dans ce tableau est l’âge. On remarque que dans les deux groupes de l’EDTR pour lesquels aucun ajustement pour cette variable n’est fait, la moyenne de l’âge est inférieure de 8 ans par rapport à celle que l’on observe dans le groupe cible. Un peu plus de la moitié d’entre elles appartiennent au groupe d’âges 18-39 ans. Lorsqu’on ajuste pour l’âge, la moyenne rejoint celle de l’ECSQ par un déplacement de masse vers la deuxième catégorie d’âge du tableau. En poursuivant l’analyse descriptive, on peut faire la même conclusion que pour les tableaux 3.1 à 3.3 pour la variable qui représente le nombre d’heures travaillées par semaine. Le chiffre est davantage semblable entre l’EDTR et l’ECSQ lorsqu’un ajustement pour l’âge est fait. La distribution de l’expérience de travail de l’échantillon de l’ECSQ du cas de base est très différente de celle de l’EDTR. Encore une fois, on en tire les mêmes conclusions que pour les tableaux précédents. En fait, dans l’échantillon avec une moyenne d’âge plus faible, il est tout à fait normal de retrouver plus de femmes avec une expérience de travail de plus faible. Lorsque la moyenne d’âge augmente, on remarque un déplacement de femmes vers le groupe des 5-14 années d’expérience. Par ailleurs, on décèle certaines différences dans le niveau de scolarité de ces femmes. Dans l’échantillon de l’ECSQ, on remarque qu’il y a près de la moitié des femmes qui ont atteint, au maximum, un niveau d’étude secondaire. Dans les groupes de l’EDTR, il y en a beaucoup plus qui ont atteint Chapitre 3. Les Résultats 20 Tab. 3.4 – Conditions de travail des femmes de tous les groupes témoin au moment du diagnostique des femmes cancéreuses Groupes EDTR ECSQ SM,SA SM,A M,SA M,A Caractéristiques n=890 n=775 n=349 n=970 n=446 démographiques % % % % % Âge (18 − 39) (40 − 49) (50 − 59) moyenne ± SD 24 41 35 45 ± 8 55 32 13 37 ± 10 29 42 28 44 ± 8 54 32 14 37 ± 11 28 42 30 44 ± 8 Statut civil M arriée Séparée, divorcée, veuve C élibataire 57 23 20 67 13 19 71 17 11 66 14 20 70 19 12 Niveau de scolarité ≤ Secondaire Collégiale ≥ U niversitaire 44 28 28 31 55 13 42 49 9 30 56 13 36 53 11 Revenu(000$)personnel <20 20-29 30-39 40-49 ≥ 50 39 25 16 10 8 47 25 13 9 6 40 24 18 9 8 46 24 15 9 6 38 24 18 11 8 34 ± 13 27 ± 13 29 ± 13 27 ± 13 29 ± 12 27 29 23 28 26 78 39 21 9 73 37 14 7 75 42 15 4 75 36 14 8 76 40 16 6 35 40 24 29 32 39 13 31 56 28 31 40 13 30 57 Hrs travaillées (parsemaine) Tps partiel (< 30hrs/semaine) Cols blancs Syndiquée Supervision d’employés 2ième emploi Expérience(années) <5 5-14 15-45 Chapitre 3. Les Résultats 21 le niveau collégial et un moins grand nombre vont jusqu’à l’université. Il est possible d’attribuer cette différence à une divergence au niveau de la définition de la variable de scolarité des sujets, le Cégep n’étant présent que dans la province de Québec. Comme l’EDTR est une étude qui s’effectue à travers tout le Canada, cette variable n’existe pas directement et nous l’avons créé. Cette nouvelle variable peut être moins précise que celle présente dans l’ECSQ. On remarque une certaine continuité dans plusieurs variables entre le groupe cible et ceux de l’EDTR. Ce phénomène s’observe autant parmi les groupes ajustés ou non pour la variable d’âge ou pour lesquels on inclut ou non la ville de Montréal. Par exemple, la caractéristique de statut civil présente les mêmes proportions à travers les différents échantillons. En fait, la grande majorité des femmes sont mariées et environ les mêmes proportions sont séparées, divorcées, veuves ou célibataires. On remarque une grande ressemblance également dans la variable de revenu personnel, la majorité des femmes ayant un revenu inférieur à 20,000$. On remarque également que dans le tableau 3.4, la variable de revenu est davantage comparable entre tous les groupes que ce qu’on peut observer dans les tableaux 3.1 à 3.3. Par ailleurs, environ 75% des femmes de chaque échantillon ont un emploi de cols blancs. Les variables d’appartenance à un syndicat, de supervision d’employés et de détention d’un second emploi, sont représentées de façon semblable dans chacun des groupes. Cela démontre donc que l’EDTR présente des caractéristiques intéressantes par rapport à l’ECSQ. Finalement, nous analysons plusieurs statistiques des femmes du groupe témoin qui possèdent un emploi, trois ans après le diagnostique de cancer du sein des cancéreuses. Les résultats se retrouvent dans les tableaux 3.5 et 3.6. Les caractéristiques sont analysées au début et à la fin de la période. Le tableau 3.5 montre les résultats obtenus par Maunsell et al (2004). Dans l’ensemble, l’échantillon témoin est assez semblable à celui des femmes cancéreuses tout au long des trois années du suivi. On peut noter que le nombre de femmes ayant un deuxième emploi parmi les cancéreuses augmente après trois ans, alors qu’il diminue parmi les femmes du groupe témoin de l’ECSQ. De plus, le nombre d’heures travaillées par semaine augmente au sein du groupe témoin, mais diminue pour les cancéreuses. Nous analysons les conditions de travail des femmes appartenant aux quatre groupes formés à partir de l’EDTR au tableau 3.6. Le nombre d’heures travaillées est supérieur à la fin dans chacun des échantillons. Cet écart est cependant plus grand chez les deux groupes sans ajustement pour l’âge. Cette variation est également observée dans le groupe de l’ECSQ. Au niveau de la variable de temps partiel, les résultats sont en lien Chapitre 3. Les Résultats 22 Tab. 3.5 – Conditions de travail des cancéreuses et des femmes du groupe témoin au moment de l’entrevue et 3 ans après, parmi celles qui ont un emploi à la fin (étude de Maunsell et al (2004) ) Cancéreuses Contrôle (507) (759) Début Fin Début Fin Conditions % % % % de travail Hrs/semaine (moyenne ± SD) Tps partiel (< 30hrs/sem) Col blanc Syndiquée Supervision (d0 employés) 2ième emploi Revenu/an (≥ 30, 000$) 36 ±13 34±15 34 ±13 35 ±12 19 25 24 27 81 42 23 80 42 23 79 38 21 79 38 23 5 40 7 44 10 33 7 39 Tab. 3.6 – Conditions de travail des femmes des différents groupes contrôle tirés à partir de l’EDTR au moment de l’entrevue et 3 ans après, parmi celles qui ont un emploi à la fin Conditions de travail Hrs/semaine (moyenne ± SD) Tps partiel (< 30hrs/sem) Col blanc Syndiquée Supervision (d0 employés) 2ième emploi Revenu/an (≥ 30, 000$) SM,SA (667) Début Fin % % SM,A (307) Début Fin % % M,SA (856) Début Fin % % M,A (393) Début Fin % % 28 ±12 30±11 30 ±11 31±11 28 ±12 30±11 30 ±11 31 ±10 25 21 20 17 25 21 22 21 76 39 16 41 21 77 45 16 45 22 77 38 15 41 20 77 43 17 44 20 7 31 8 41 4 38 4 46 7 33 8 42 5 40 7 47 Chapitre 3. Les Résultats 23 avec ce qu’on a observé dans le tableau précédent. Ainsi, un nombre moindre de femmes travaillent à temps partiel à la fin. Par contre, ce phénomène n’est pas présent dans l’échantillon de l’ECSQ. Malgré tout, les proportions sont relativement proches, ce qui permet encore de croire à la représentativité des échantillons. En moyenne, le même nombre de femmes est syndiqué au début et à la fin autant dans l’EDTR que dans l’ECSQ. On remarque dans tous les échantillons que la variable de revenu présente un salaire supérieur pour les femmes après trois ans. Dans les groupes de l’Enquête sur la Dynamique du Travail et du Revenu, on remarque qu’il y a un peu plus de femmes qui occupent deux emplois à la fin, contrairement à ce que l’on observe dans l’ECSQ. Encore une fois, les proportions sont très semblables dans tous les cas. En général, on remarque que les groupes sans ajustement pour l’âge ont des variations qui sont différentes par rapport aux autres groupes, mais ces différences ne sont pas énormes. On observe ce phénomène pour certaines variables, plus particulièrement pour celles qui représentent le nombre d’heures travaillées par semaine, un travail à temps partiel, l’appartenance à un syndicat et l’occupation d’un deuxième emploi. Finalement, les femmes dans les échantillons ajustés pour l’âge gagnent un revenu supérieur. 3.2 Régressions binomiales L’analyse qui précède nous porte à croire que les échantillons tirés de l’EDTR sont comparables à celui de Maunsell et al (2004). La grande majorité des distributions sont comparables avec l’ECSQ et ce, pour les quatre échantillons considérés. Finalement, après une première vue d’ensemble, on peut conclure que l’EDTR génère des groupes qui s’apparentent à l’ECSQ. Il est donc envisageable, dans le futur, d’utiliser une enquête publique telle l’EDTR pour générer un échantillon qui comprend les caractéristiques désirées, malgré une possible contamination de cette population contrôle. Pour appuyer davantage nos conclusions, il est préférable de reproduire d’autres résultats obtenu par Maunsell et al (2004) à l’aide de l’analyse de régressions. Dans leur recherche, Maunsell et al (2004) vérifient le risque relatif d’avoir le cancer. Une équation similaire permet de trouver le risque relatif d’avoir un emploi différent après trois ans. Dans leurs régressions, ils incluent l’âge et l’appartenance à un syndicat pour analyser la modification du risque relatif. Les régressions binomiales permettent d’estimer un risque relatif qui, dans notre cas, représente le risque pour les cancéreuses divisé par le risque parmi les femmes du groupe témoin de se retrouver soit sans emploi, soit d’avoir un emploi différent après Chapitre 3. Les Résultats 24 trois ans. Le risque relatif de se retrouver sans emploi se calcule de la façon suivante : 0 Risque relatif d être sans emploi = nbr cancéreuses sans emploi nbr cancéreuses nbr témoins sans emploi nbr témoins . (3.1) On inclut également dans les régressions l’âge et l’appartenance à un syndicat pour vérifier l’impact de ces variables sur le risque relatif. Dans leur recherche, Maunsell et al (2004) ont trouvé que les autres caractéristiques susceptibles d’être inclues dans les régressions binomiales, comme le type d’emploi, le nombre d’heures travaillées par semaine ou le revenu personnel, n’amènent pas réellement de modifications aux risques relatifs. Leurs résultats sont rapportés au tableau 3.7. On remarque que les cancéreuses sont plus susceptibles de se retrouver sans emploi trois ans après leur diagnostique de cancer du sein selon les résultats bruts. Ce phénomène est plus important parmi celles qui ont connu des récidives de la maladie. On remarque que chacun des résultats est significatif. Avec l’ajout de l’âge et de l’appartenance à un syndicat à la régression du risque relatif, on s’aperçoit que ce risque diminue pour tous les sous-groupes et que les femmes sans récidive ne sont pas à risque d’être sans emploi trois ans après le diagnostique. Le coefficient de ce groupe de femmes est non significatif. Par contre, on peut en tirer les mêmes conclusions, soit que les cancéreuses avec récidive sont plus à risque que les femmes du groupe témoin de se retrouver sans emploi. Après trois ans, il est possible que le sujet se retrouve sans emploi, comme on le mentionne précédemment, mais il peut également occuper un emploi qui est différent de celui du départ. Les résultats bruts et ajustés de ces régressions binomiales démontrent qu’aucun de ces groupes de femmes est plus à risque d’avoir un emploi différent trois ans après le diagnostique. Aucun de ces coefficients n’est significatif. On peut donc conclure que les femmes cancéreuses ne sont pas à risque d’avoir un emploi différent, que le risque soit ajusté ou non. Par contre, elles sont plus à risque de se retrouver sans emploi. On fait la même conclusion peu importe si la femme souffre d’une récidive ou non. Pour l’échantillon de Maunsell et al (2004), on remarque donc de faibles différences entre les deux groupes de femmes au niveau de ces risques relatifs. Des calculs similaires à ceux rapportés dans le tableau 3.7 sont faits en utilisant les quatre échantillons témoin tirés de l’EDTR. Les résultats se retrouvent dans les tableaux 3.8 à 3.11, chaque tableau représentant un échantillon différent. En comparant ces résultats avec ceux l’ECSQ, on remarque des ressemblances au niveau des risques relatifs, que ce soit pour le cas sans emploi ou avec un emploi différent. Premièrement, on constate que le risque de se retrouver sans emploi est toujours supérieur pour les cancéreuses par rapport aux femmes du groupe témoin. C’est ce qu’on observe avec un ajustement ou non du risque relatif. De plus, on observe que les cancéreuses avec récidive sont beaucoup plus à risque que les autres cancéreuses de se retrouver dans cette situation d’emploi. On remarque également que chaque risque Chapitre 3. Les Résultats 25 Tab. 3.7 – Risque relatif brut et ajusté de la situation des cancéreuses et des femmes du groupe témoin 3 ans après le diagnostique (étude de Maunsell et al (2004) Maunsell % RRbrut Pvalue RRajusté * Pvalue Sans emploi Témoin (890) Cancéreuses (646) Sans récidive (567) Avec Récidives (79) 15 22 20 33 1,00 1,46 1,35 2,24 Emploi différent Témoin (890) Cancéreuses (646) Sans récidive (567) Avec Récidives (79) 20 20 21 13 1,00 1,09 1,12 0,81 (Réf érence) 0,001 0,009 0,000 (Réf érence) 0,417 0,282 0,479 1,00 1,29 1,19 1,99 1,00 1,13 1,17 0,85 (Réf érence) 0,015 0,115 0,000 (Réf érence) 0,210 0,126 0,563 *Ajout des variables d’âge et d’appartenance à un syndicat à la régression. Tab. 3.8 – Risque relatif brut et ajusté de la situation des cancéreuses et des femmes du groupe témoin de l’EDTR (SM,SA), 3 ans après le diagnostique EDTR SM, SA** % RRbrut Pvalue RRajusté * Pvalue Sans emploi Témoin (775) Cancéreuses (646) Sans récidive (567) Avec Récidives (79) 10 22 20 33 1,00 2,14 1,98 3,27 Emploi différent Témoin (775) Cancéreuses (646) Sans récidive (567) Avec Récidives (79) 24 20 21 13 1,00 1,04 1,07 0,78 (Réf érence) 0,000 0,000 0,000 (Réf érence) 0,703 0,510 0,389 1,00 1,61 1,52 2,79 1,00 1,38 1,42 0,61*** (Réf érence) 0,001 0,006 0,000 (Réf érence) 0,005 0,003 0,091 *Ajusté avec la variable d’âge des femmes et si elles appartiennent à un syndicat. **EDTR sans aucun ajustement. ***Ajout des variables d’âges et d’appartenance à un syndicat à la régression (problème de colinéarité). Chapitre 3. Les Résultats 26 Tab. 3.9 – Risque relatif brut et ajusté de la situation des cancéreuses et des femmes du groupe témoin de l’EDTR (SM,A), 3 ans après le diagnostique EDTR SM, A** % RRbrut Pvalue RRajusté * Pvalue Sans emploi Témoin (349) Cancéreuses (646) Sans récidive (567) Avec Récidives (79) 9 22 20 33 1,00 2,42 2,24 3,71 Emploi différent Témoin (349) Cancéreuses (646) Sans récidive (567) Avec Récidives (79) 17 20 21 13 1,00 1,49 1,53 1,12 (Réf érence) 0,000 0,000 0,000 (Réf érence) 0,005 0,003 0,722 1,00 2,00 1,83 2,86 1,00 1,48 1,53 1,07 (Réf érence) 0,000 0,001 0,000 (Réf érence) 0,006 0,003 0,833 *Ajout des variables d’âge et d’appartenance à un syndicat à la régression. **EDTR sans la ville de Montréal, mais avec ajustements pour la distribution de l’âge. Tab. 3.10 – Risque relatif brut et ajusté de la situation des cancéreuses et des femmes du groupe témoin de l’EDTR (M,SA), 3 ans après le diagnostique EDTR M, SA** % RRbrut Pvalue RRajusté * Pvalue Sans emploi Témoin (970) Cancéreuses (646) Sans récidive (567) Avec Récidives (79) 9 22 20 33 1,00 2,27 2,10 3,47 Emploi différent Témoin (970) Cancéreuses (646) Sans récidive (567) Avec Récidives (79) 25 20 21 13 1,00 0,99 1,02 0,74 (Réf érence) 0,000 0,000 0,000 (Réf érence) 0,912 0,847 0,301 1,00 1,77 1,66 2,93 1,00 0,89*** 0,91*** 0,58*** (Réf érence) 0,000 0,000 0,000 (Réf érence) 0,209 0,335 0,056 *Ajout des variables d’âge et d’appartenance à un syndicat à la régression. **EDTR avec la ville de Montréal, mais aucun ajustement pour les groupes d’âges. ***Ajout de la variable d’appartenance à un syndicat uniquement (problème de colinéarité). Chapitre 3. Les Résultats 27 Tab. 3.11 – Risque relatif brut et ajusté de la situation des cancéreuses et des femmes du groupe témoin de l’EDTR (S,A), 3 ans après le diagnostique EDTR M, A** % RRbrut Pvalue RRajusté * Pvalue Sans emploi Témoin (446) Cancéreuses (646) Sans récidive (567) Avec Récidives (79) 9 22 20 33 1,00 2,34 2,17 3,58 Emploi différent Témoin (446) Cancéreuses (646) Sans récidive (567) Avec Récidives (79) 18 20 21 13 1,00 1,37 1,41 1,03 (Réf érence) 0,000 0,000 0,000 (Réf érence) 0,012 0,007 0,932 1,00 1,98 1,82 2,91 1,00 1,35 1,39 0,92 (Réf érence) 0,000 0,000 0,000 (Réf érence) 0,020 0,011 0,785 *Ajout des variables d’âge et d’appartenance à un syndicat à la régression. **EDTR avec la ville de Montréal et ajustements pour les fréquences des groupes d’âges. relatif non ajusté est significatif dans tous les tableaux. Au niveau du risque ajusté, les échantillons faits à partir de l’Enquête sur la Dynamique du Travail et du Revenu ont des coefficients qui sont tous significatifs. Avec l’ECSQ, par contre, celui pour les cancéreuses sans récidive ne l’est pas. C’est la seule distinction que l’on trouve entre ces cinq échantillons pour la première situation d’emploi. Au niveau des risques relatifs reliés à l’occupation d’un emploi différent, les coefficients sont, encore une fois, très similaires d’un groupe à l’autre. Malgré tout, on décèle certaines différences. Dans un premier temps, on remarque que la significativité des coefficients des estimations basées sur les échantillons de l’EDTR n’est pas la même que ceux de l’ECSQ. Le risque relatif brut des cancéreuses et de celles sans récidive est significatif si l’échantillon de l’EDTR a subi une modification au niveau de la distribution des groupes d’âges. Dans les deux autres échantillons, on retrouve des niveaux de significativité semblables à ceux avec l’ECSQ. Le risque relatif ajusté présente également certaines différences selon l’échantillon utilisé. Plusieurs risques relatifs sont significatifs parmi les échantillons de l’EDTR, alors que tous les risques sont négligeables dans le cas de base, soit l’ECSQ. Malgré tout, dans cet échantillon aussi les risques sont comparables parmi tous les échantillons. Les femmes atteintes de cancer du sein ont un risque supérieur d’avoir un emploi différent et les cancéreuses victimes de récidives sont moins à risque que les autres cancéreuses. Les seuls résultats qui ne démontrent pas aussi clairement ces conclusions sont dans le tableau 3.10. En fait, avec Chapitre 3. Les Résultats 28 les régressions ajustées, on observe un problème de colinéarité entre les cancéreuses et la variable d’âge. Si l’on omet l’âge dans les régressions, les résultats sont inférieurs aux autres cas de l’EDTR et à celui de notre cas de base. La significativité est également affectée par cette modification. Néanmoins, on remarque la même tendance que dans les autres tableaux parmi les femmes cancéreuses. Avec un échantillon de taille plus importante, un tel problème ne serait vraisemblablement pas survenu. Ces comparaisons nous permettent de constater que les résultats des quatre nouveaux échantillons mènent à des conclusions qui sont très similaires à celles faites à partir de notre échantillon de l’ECSQ. Par les différences de significativité de certains risques relatifs, certaines distinctions subsistent entre les échantillons. Par contre, de manière générale, ces différents groupes sont comparables. On peut donc conclure que l’EDTR nous procurent des échantillons comparables à celui de l’ECSQ selon plusieurs caractéristiques descriptives et des risques relatifs divers. À ce stade, on constate que la possible contamination de cette enquête de Statistique Canada ne semble pas avoir un impact négatif sur la construction d’échantillons. Nous pouvons maintenant entamer la dernière partie de notre recherche, le matching. 3.3 Matching Le matching, comme nous l’avons expliqué précédemment, est une méthode plus élaborée que la comparaison de moyennes. Avec cette méthode statistique, on considère uniquement les femmes faisant partie du support commun établi selon le score de propension. La comparaison de moyennes, elle, utilise tous les individus à l’intérieur de ses calculs. Mêmes les femmes ayant des probabilités très élevées ou très basses font partie des calculs d’une telle méthode. C’est ce que nous tentons d’éviter avec l’utilisation du matching. Cette dernière requiert également l’utilisation de plusieurs caractéristiques personnelles pour compenser les différences entre les échantillons de femmes contrôles et de cancéreuses. On fait des régressions de type probit et cela nous permet d’identifier les différences entres les femmes cancéreuses et les femmes qui appartiennent à un groupe témoin particulier. Après avoir effectué ces quelques étapes supplémentaires, on pourra faire du matching. La méthode n’est en fait que des différences de moyennes, mais avec des compensations pour les différences entre les deux échantillons que l’on compare et la sélection d’individus qui trouvent leur équivalent au niveau du score de propension. Avant de commencer à faire du matching pur et simple, on doit réaliser quelques étapes supplémentaires. Tout d’abord, on doit identifier quelles variables sont a priori au traitement. En fait, ces variables sont fixes dans le temps ou indépendantes du groupe de femmes dans lequel elles se retrouvent, soit le groupe témoin ou de cancéreuses. Chapitre 3. Les Résultats 29 On trouve le score de propension de façon paramétrique en faisant un probit ayant comme variable indépendante le groupe de femmes témoins en incluant toutes les caractéristiques personnelles dans la régression. En imposant la condition du support commun sur les scores de propension, on peut appliquer la méthode statistique qui est à la base de notre recherche, le matching. Dans les tableaux suivants, on retrouve les variables qui font partie du probit et qui se retrouvent également dans le matching. Dans le tableau 3.12, on retrouve les résultats des probits de tous les groupes témoin pour lesquels on désire faire du matching. Dans l’échantillon de Maunsell et al (2004), on observe que les caractéristiques ont majoritairement un coefficient qui est non significatif. En fait, il n’y a que les caractéristiques qui désignent que la femme est mariée, qu’elle détient un deuxième emploi et son âge qui sont des éléments qui ont une influence significative sur les femmes faisant partie de cet échantillon. Toutes les autres variables ne semblent différencier les femmes du groupe de cancéreuses et du groupe contrôle. Pour les groupes de l’EDTR, la situation est tout autre. On remarque que presque toutes les variables ont un impact significatif, sauf quelques exceptions. Dans le premier cas, (SM, SA), on voit que les variables qui désignent si la femme a un deuxième emploi, le nombre d’enfants de moins de 18 ans qui vivent dans la maison familiale et finalement, la variable qui indique que la personne a atteint un niveau d’études secondaires comme scolarité, ont un coefficient non significatif. Le même scénario se répète pour l’échantillon suivant. Pour le troisième échantillon provenant de l’EDTR, soit le (M, SA), il n’y a qu’une seule variable qui semble avoir un impact non significatif, celle qui indique une scolarité maximale de niveau secondaire. Dans le dernier échantillon, le statut matrimonial de séparée, divorcée ou veuve, le fait d’avoir un emploi dans le secteur des services ou bien dans les secteurs primaires/col bleu, sont les variables qui n’ont pas d’impact significatif. Donc, dans les échantillons de l’EDTR, il y a beaucoup plus de caractéristiques qui ont un impact significatif sur les personnes qui composent l’échantillon témoin et de femmes cancéreuses par rapport à ce que l’on observe entre les deux échantillons de la recherche de Maunsell et al (2004). D’après les résultats de ces probits, on peut voir que, malgré la ressemblance des résultats des régressions binomiales et des statistiques descriptives, ils subsistent encore des différences notables entre les échantillons. Les femmes des groupes témoin de l’EDTR sont davantage différentes des cancéreuses que les femmes du groupe contrôle de Maunsell et al (2004). Dans l’échantillon de Maunsell et al (2004), on remarque que l’âge et le fait d’avoir plus d’un emploi ont encore un impact significatif sur l’échantillon, malgré certains ajustements déjà faits sur la distribution de l’âge. Ces deux variables permettent donc de dire que les cancéreuses et les non cancéreuses sont malgré tout des femmes différentes du point de vue observationnel. Pour les autres échantillons de l’EDTR, plusieurs différences subsistent avec l’échantillon de cancéreuses malgré la modification de la distribution d’âge, par exemple. Il demeure quand même des écarts au niveau de la valeur des coefficients 0.178 0.134 0.121 0.072 0.786 0.001 0.2225 0.2598 0.2718 -0.1668 -0.0282 -0.4501 -0.0869 0.381 0.1228 0.355 0.0530 0.234 0.0265 0.044 0.182 0.0896 -0.0007 0.000 0.027 0.167 0.317 0.000 - 0.000 0.000 -0.3958 0.002 -0.3216 0.026 0.2074 0.011 -0.0874 0.101 0.2590 -0.7600 -0.3118 -0.2793 -0.1059 -0.6017 - 0.2127 -0.0018 0.000 0.020 0.378 0.274 0.000 - 0.001 0.017 -0.5641 0.000 -0.3784 0.028 0.4619 0.000 -0.0557 0.000 -0.0607 0.361 0.2027 -0.7862 -0.3875 -0.2242 -0.1359 -0.5433 - 0.1819 -0.0015 **Nombre d’enfants qui ont au plus 18 ans et qui demeurent encore à la maison. **Emploi classé dans le secteur primaire ou col bleu. *La femme peut être séparée, divorcée ou veuve. Age Age2 Scolarité Primaire Secondaire Cégep Université Statut matrimonial Mariée SDV* 2ième emploi Type Emploi Service Primcolbleu** Syndiquée Expérience Nbrcohab*** Pseudo R2 0.000 0.007 0.054 0.822 0.000 - 0.000 0.000 -0.4710 0.000 -0.3548 0.014 0.4715 0.000 -0.0579 0.000 -0.1046 0.045 0.3250 -0.7957 -0.3674 -0.3837 -0.0234 -0.4778 - 0.2825 -0.0023 -0.0900 0.505 0.0760 0.641 0.1754 0.044 -0.1731 0.003 0.1237 0.000 0.315 0.014 0.000 0.7549 -0.5427 -0.1487 -0.5057 0.006 0.016 0.075 -0.5306 0.1174 -0.0010 Tab. 3.12 – Résultats du probit selon les caractéristiques personnelles pour chaque échantillon témoin EDTR Maunsell SM,SA SM,A M,SA M,A Caractéristiques coeff Pvalue coeff Pvalue coeff Pvalue coeff Pvalue coeff Pvalue Chapitre 3. Les Résultats 30 Chapitre 3. Les Résultats 31 0 1 2 Density 3 4 5 des caractéristiques entre les différents échantillons de l’EDTR. La dernière ligne du tableau 3.12, le pseudo R2 , nous indique si les variables présentent dans le calcul du probit permettent de bien expliquer la variabilité des échantillons. Pour l’échantillon de Maunsell et al (2004), le R2 est de 0.0265. Un résultat aussi faible n’est pas surprenant, sachant le nombre de variables non significatives dans le probit. Par ailleurs, comme cette recherche s’apparente grandement à une expérience aléatoire, il est presque impossible de prédire quelle personne appartient au groupe de cancéreuses ou de femmes témoins. Pour les échantillons de l’EDTR, les R2 sont plus élevés, entre autre pour le groupe (M, SA). Des résultats de cet ordre ne sont pas mauvais, sachant que les données sont en coupe transversale. On remarque donc que l’équipe de Maunsell réussi à avoir un échantillon témoin beaucoup plus semblable à celui des cancéreuses que ce qu’on peut faire avec l’EDTR. D’après les résultats du tableau 3.12 pour les échantillons de l’EDTR, il y a de fortes chances que le cancer soit relié aux variables qui sont inclues dans le probit. En fait, ces déviations entre les différents groupes témoins peuvent également s’observer à l’aide des distributions des scores de propension. Comme on l’a mentionné précédemment, le score de propension représente la probabilité d’avoir le cancer du sein chez une femme. Dans les graphiques suivants, qui représentent les distributions de ces scores de propension, on a donc une distribution pour le groupe témoin et une pour le groupe de femmes atteintes de cancer du sein. .1 .2 .3 .4 Estimated propensity score Groupe Témoin .5 .6 Groupe Cancéreuses fi Fig. 3.1 – Densité du score de propension pour l’échantillon de Maunsell et al (2004) Le premier graphique, qui représente les distributions des probabilités d’avoir le Chapitre 3. Les Résultats 32 0 .5 Density 1 1.5 2 cancer du sein pour les groupes témoin et traitement de Maunsell et al (2004), est composé de deux courbes qui sont très semblables. Le groupe de cancéreuses est composé de femmes ayant une probabilité légèrement supérieure d’avoir le cancer du sein (0.44) par rapport à celles formant le groupe témoin (0.41). Les scores s’étendent sur un domaine de 0 à 0.65. De façon assez surprenante, on remarque que les femmes du groupe témoin ont une forte probabilité d’avoir le cancer du sein, presque aussi élevée que les cancéreuses. Cela démontre que les deux groupes de femmes de ce graphique se ressemblent beaucoup par rapport au score, à la différence près qu’un des deux groupes est formé de femmes réellement atteintes de cancer de sein. 0 .2 .4 .6 Estimated propensity score Groupe Témoin (SM,SA) .8 1 Groupe Cancéreuses fi Fig. 3.2 – Densité du score de propension pour l’échantillon (SM,SA) Lorsqu’on regarde le graphique pour l’échantillon (SM, SA), on remarque que les deux distributions sont plus distinctes l’une de l’autre, comparativement à ce qu’on observe dans le cas précédent. Un grand nombre de femmes du groupe témoin ont une faible probabilité d’avoir le cancer du sein par rapport aux femmes cancéreuses. La probabilité moyenne du groupe témoin est de 0.29 et celle du groupe de cancéreuses est de 0.59. On remarque également que les deux distributions s’étendent sur tout le domaine possible des probabilités, soit entre 0 et 1. On peut donc dire que ces deux groupes sont assez différents, selon ce qu’on observe de leur score de propension. Le graphique du groupe ajusté pour l’âge, mais dans lequel la ville de Montréal n’est pas inclut ressemble davantage à celui de Maunsell et al (2004). La distribution 33 0 .5 Density 1 1.5 2 Chapitre 3. Les Résultats 0 .2 .4 .6 Estimated propensity score Groupe Témoin (SM,A) .8 1 Groupe Cancéreuses fi Fig. 3.3 – Densité du score de propension pour l’échantillon (SM,A) de probabilité des femmes du groupe témoin est plus rapprochée de celle du groupe de femmes cancéreuses, contrairement à ce qu’on observe dans la figure 3.2. On remarque que la distribution des scores de propension du groupe témoin, qui va de 0 à 1, s’est déplacée légèrement vers la droite par rapport à la situation précédente. La moyenne de la distribution est de 0.45. Le score moyen des femmes cancéreuses est plutôt de 0.71. On peut donc supposer que les femmes plus âgées ont une probabilité supérieure d’avoir le cancer du sein, ce qui est tout à fait plausible. Dans cet échantillon, on remarque que les femmes du groupe témoin ont une probabilité inférieure d’être atteintes du cancer du sein par rapport aux cancéreuses, quoique supérieure à ce qu’on a pu observer dans le graphique précédent. Néanmoins, l’écart entre les deux moyennes demeure semblable à ce qu’on a pu observer dans le graphique précédent. Le graphique du groupe témoin (M, SA) ressemble davantage au premier groupe de l’EDTR, soit celui sans modification. Les femmes de ce groupe témoin ont une distribution du score de propension qui est à l’extrême gauche du graphique. Elles ont donc de très faibles risque d’avoir le cancer du sein par rapport aux cancéreuses, dont la majorité des femmes ont un score supérieur ou égale à 0.45. La moyenne de la distribution pour les femmes témoin est de 0.45 et pour les cancéreuses, 0.71. Le fait d’ajouter la ville de Montréal à l’échantillon ne change pas de façon importante la probabilité d’avoir le cancer du sein pour un groupe témoin. 34 0 1 Density 2 3 Chapitre 3. Les Résultats 0 .2 .4 .6 Estimated propensity score Groupe Témoin (M,SA) .8 1 Groupe Cancéreuses fi Fig. 3.4 – Densité du score de propension pour l’échantillon de (M,SA) Finalement, lorsqu’on ajuste pour l’âge et qu’on inclut la ville de Montréal à notre échantillon témoin (figure 3.5) les distributions des scores de propension sont très semblables entre les deux groupes. La situation observée ressemble davantage à ce qu’on retrouve dans le graphique pour les échantillons de Maunsell et al (2004) car les femmes des deux groupes ont des probabilités semblables et assez élevées d’avoir le cancer du sein. Les femmes du groupe témoin ont une distribution en forme de cloche centrée à 0.45, mais la courbe pour les cancéreuses est encore un peu décalée vers la droite. Leurs moyennes respectives sont de 0.46 et 0.62. Les cancéreuses sont donc un peu plus à risque d’avoir le cancer du sein que les femmes du groupe témoin selon leur score de propension. Les femmes du groupe témoin sont plus âgées et ont donc une probabilité supérieure d’avoir le cancer du sein. Ces quelques vérifications supplémentaires nous ont donc permis de trouver certaines différences entres les échantillons de l’EDTR et de Maunsell et al (2004) par rapport à leur score de propension. À partir de ces probabilités calculées à l’aide de plusieurs caractéristiques personnelles, nous pouvons maintenant faire des régressions de matching. On impose l’hypothèse du support commun pour les distributions de scores et la pondération utilisée est de type Epanechnikov. Le support commun élimine des femmes qui ne trouvent pas de correspondance au niveau de leur probabilité d’avoir le cancer du sein, et ce, entre le groupe de femmes témoins et de cancéreuses. Le domaine de femmes pour lesquelles on trouve l’effet 35 0 .5 Density 1 1.5 2 Chapitre 3. Les Résultats 0 .2 .4 .6 Estimated propensity score Groupe Témoin (M,A) .8 1 Groupe Cancéreuses fi Fig. 3.5 – Densité du score de propension pour l’échantillon (M,A) traitement s’en trouve nécessairement réduit. Dans le tableau 3.13, on retrouve la taille de chacun des échantillons de l’EDTR et de l’ECSQ qui sont utilisés dans les calculs de matching après avoir imposé la contrainte du support commun. Pour les échantillons de Maunsell et al, soit les deux premières colonnes, on remarque que les tailles d’échantillon sont très similaires de variables en variables, autant pour le groupes de femmes témoin que de cancéreuses. La taille du groupe de femmes cancéreuses se situe entre 494 et 506 et celle du groupe témoin, entre 736 et 758 femmes. Le support commun peut, au maximum, entraı̂ner le rejet de 150 femmes dans chacun des deux échantillons. Observons maintenant ce qui se passe pour les groupes de l’EDTR. Dans le pire scénario, environ 230 cancéreuses ne feront pas partie des calculs relatifs au matching. Par contre, tout comme pour les échantillons de Maunsell et al, les dimensions des groupes sont relativement semblables entre les différentes caractéristiques. Dans la quatrième colonne, soit l’échantillon témoin sans ajustement, on remarque qu’au maximum 150 femmes seront exclues des calculs. Si on ajuste pour l’âge, on observe que la taille du groupe est déjà faible et elle peut diminuer d’au plus 50 personnes. Lorsqu’on inclut Montréal dans l’échantillon, la taille du groupe ne varie pas selon les caractéristiques pour lesquelles on désire estimer un coefficient par matching. Les tailles d’échantillons diminuent donc de 149 et 59 pour les colonnes 7 et 8 respectivement. Dans le tableau 3.13, on peut donc spécifier que la contrainte du support commun diminue les dimensions de tous les échantillons, mais permet tout de même de conserver des tailles d’échantillons encore Chapitre 3. Les Résultats 36 raisonnables pour les estimations par matching. Dans le tableau 3.14 on retrouve les résultats d’estimation de tous les échantillons témoins utilisés dans notre recherche. Les variables dépendantes utilisées dans le matching sont des variables présentes dans les tableaux 3.5 et 3.6. Ces derniers contiennent des caractéristiques descriptives de l’emploi que l’on observe au début et à la fin des trois années sur lesquelles on fait l’étude. La différence avec la méthode de Maunsell et al (2004) est que l’on utilise le score de propension et que certaines femmes sont exclues des calculs avec l’utilisation du support commun. Celles ne trouvant pas d’équivalent dans l’autre groupe par rapport à leur score de propension sont exclues de la démarche. Dans le tableau 3.14, on présente les résultats des trois variables au début et à la fin pour les cancéreuses et les femmes du groupe témoin. On pratique la méthode de matching sur les variables d’heures travaillées par semaine, d’emploi à temps partiel et sur le revenu. On compare les deux groupes de femmes entre elles (première différence) et dans le temps (deuxième différence) pour chaque échantillon témoin de l’EDTR et aussi pour celui de l’ECSQ. Le premier cas étudié est celui de Maunsell et al (2004). La première colonne contient les résultats de matching. La troisième colonne (∆) expose les résultats obtenus par les différences de moyennes utilisée dans l’étude de Maunsell et al (2004). La première variable représente le nombre d’heures travaillées par semaine. Les trois premières lignes sont des cas différents de ce nombre d’heures. La première, « heures début » , représente la différence entre le groupe traité et témoin au début. La deuxième, « heures fin » , indique la différence entre le groupe traité et témoin à la fin des trois ans, et finalement, « diff heures » est le coefficient de différence dans le temps des deux premières variables. On observe le même détail pour les deux autres variables du tableau des résultats de matching. Pour cet échantillon, on remarque certaines différences entre les résultats de matching (colonne 1) et de différence de moyennes (colonne 3). Ces écarts proviennent principalement de la significativité des coefficients. Dans leurs conclusions de recherche, Maunsell et al (2004) mentionnent que les cancéreuses ne sont pas différentes des femmes du groupe témoin, car les moyennes des deux groupes sont très semblables. Avec le matching, on observe le même genre de conclusion, mais de façon un peu plus directe. Les coefficients de matching non significatifs indiquent qu’il n’y a pas de réelle différence entre les deux groupes. On s’attend à une telle conclusion selon les distributions très similaires des pscores des deux groupes dans la figure 3.1 et les variables non significatives dans le probit du tableau 3.13. La principale conclusion est que, comme les deux échantillons de Maunsell et al (2004) se ressemblent beaucoup, il est tout à fait possible d’avoir des résultats similaires avec les deux méthodes statistiques. De façon plus précise, dans la colonne 1, on remarque que les femmes cancéreuses ne travaillent pas un nombre différent d’heures des femmes témoins, car les coefficients ne sont pas significatifs, autant au début qu’à la fin pour cette variable. Il n’y a que 501 506 501 501 506 501 497 496 494 heures** début heures fin diff heures jobtp*** début jobtp fin diff jobtp revenu30**** début revenu30 fin diff revenu30 739 740 736 755 758 755 755 758 755 890 414 415 413 418 421 418 418 421 418 646 626 626 628 626 622 626 626 622 626 775 SM,SA Cancéreuses* Contrôle *Dans tous les échantillons de l’EDTR, le nombre de cancéreuses est le même. **Nombre d’heures travaillées par semaine. ***Emploi à temps partiel. ****Revenu ≥ 30000$. 646 Maunsell Cancéreuses Contrôle DÉPART Caractéristiques 297 298 298 297 297 297 297 297 297 349 SM,A Contrôle 821 821 821 821 821 821 821 821 821 970 M,SA Contrôle Tab. 3.13 – Taille des échantillons respectant le support commun 387 387 387 387 387 387 387 387 387 446 M,A Contrôle Chapitre 3. Les Résultats 37 Chapitre 3. Les Résultats 38 le coefficient de la double différence qui représente un impact négatif significatif. L’interprétation de ce coefficient est que les femmes cancéreuses travaillent moins d’heures (-1.70 heures) que les femmes témoins après trois ans. Par contre, une différence de deux heures par semaine n’est pas un impact très percutant. Les coefficients de double différence de matching sont les plus intéressants à considérer de par leur construction. Passons maintenant aux autres coefficients de variables estimés à l’aide du matching pour l’échantillon de l’ECSQ. Selon les résultats du départ, les cancéreuses travaillent à temps partiel dans des proportions inférieures par rapport aux femmes du groupe témoin. Par contre, pour les deux autres coefficients, on ne remarque pas de différences significatives entre les deux groupes. Encore une fois, il s’agit de différences de moins de 5%, ce qui peut être considéré assez faible. Finalement, au départ, les cancéreuses gagnent un revenu supérieur aux femmes du groupe témoin. Les résultats de Maunsell et al (2004) démontrent donc que les différences entre les deux groupes étudiés sont très faibles, au début ou la fin, car la majorité des coefficients de matching ne sont pas significatifs. Ceux qui le sont ont une ampleur limitée. Les principales conclusions sont que les cancéreuses travaillent moins d’heures à la fin, gagnent un revenu supérieur au départ et travaillent également en moins grand nombre à temps partiel au départ. Ces résultats de matching concordent avec les conclusions finales de Maunsell et al (2004). Dans leur recherche, aucune différence majeure ne distingue les femmes atteintes de cancer par rapport aux femmes du groupe témoin. Faisons maintenant le même genre d’analyse, mais cette fois pour les quatre groupes formés à l’aide de l’EDTR. Dans les groupes de l’EDTR, on peut observer si la possible contamination de l’échantillon témoin amène des différences significatives au niveau des estimations des coefficients. Le premier échantillon de l’EDTR dont on analyse les résultats de matching dans le tableau 3.14 est le (SM, SA). À titre indicatif, on insert également les résultats obtenus pour chaque échantillon de l’EDTR avec la méthode de comparaisons de moyennes que Maunsell et al (2004) utilise dans leur étude (colonne ∆). Analysons maintenant les estimations des coefficients par la méthode de matching. Ces résultats figurent dans la quatrième colonne et ceux obtenus par différences de moyennes sont dans la sixième colonne. Pour les trois variables d’heures, les coefficients de matching sont significatifs. On voit que les coefficients sont différents selon la méthode statistique utilisée. Par contre, ici, il est question d’un nombre d’heures travaillées par semaine. Les écarts ne sont donc pas de plus de dix heures par semaine, ce qui représente une différence assez faible. On remarque que les cancéreuses travaillent plus d’heures par semaine que les femmes du groupe témoin au début (4.63 heures) et à la fin (1.65 heures). En comparant les résultats de matching de l’ECSQ et de (SM, SA), colonnes 1 et 4, on constate des différences entre les coefficients et leur significativité. Par contre, pour la variable « diff heures » , l’impact est similaire et significatif dans les deux situations. Considérons maintenant les variables relatives à un emploi à temps partiel. -0.04 -0.01 0.03 0.06 0.03 -0.02 revenu30*** début revenu30 fin diff revenu30 0.07 0.04 -0.03 -0.04 -0.02 0.02 -0.01 -0.03 -0.01 -0.02 0.08 0.10 4.63 1.65 -3.00 -0.21 -0.79 -0.42 -0.82 3.06 2.65 6.29 2.14 -3.93 0.09 0.03 -0.06 -0.05 0.04 0.09 7.39 4.49 -2.90 ∆ 0.08 0.06 -0.01 -0.11 0.00 0.10 7.85 2.97 -4.92 1.59 1.05 -0.29 -1.57 -0.06 2.15 4.75 2.44 -4.46 SM,A coeff t 0.02 -0.02 -0.04 0.00 0.08 0.08 5.54 3.17 -2.37 ∆ 0.04 0.05 0.02 -0.16 -0.05 0.11 7.75 3.54 -4.24 0.87 1.22 0.45 -3.32 -1.00 1.95 6.95 3.57 -3.78 M,SA coeff t *Nombre d’heures travaillées par semaine. **Emploi à temps partiel. ***Revenu ≥ 30000$. ****Résultats obtenus par la méthode de Maunsell et al (2004) (la différence de moyenne) pour chaque cas. 2.26 1.01 -1.06 -1.70 -0.51 1.11 1.59 -0.29 -1.88 jobtp** début jobtp fin diff jobtp 1.58 -0.50 -2.34 1.18 -0.43 -1.70 heures* début heures fin diff heures SM,SA coeff t Tab. 3.14 – Résultats de matching pour tous les échantillons Maunsell coeff t ∆**** Caractéristiques 0.07 0.02 -0.05 -0.05 0.04 0.09 7.26 4.34 -2.92 ∆ -0.09 -0.08 0.02 -0.04 0.03 0.07 4.82 2.37 -2.49 coeff -2.21 -1.62 0.49 -1.10 0.78 2.37 5.29 2.79 -3.15 M,A t 0.00 -0.03 -0.03 -0.02 0.04 0.06 5.69 3.79 -1.9 ∆ Chapitre 3. Les Résultats 39 Chapitre 3. Les Résultats 40 Pour (SM, SA), on remarque que les cancéreuses travaillent en plus grand nombre à temps partiel à la fin, contrairement à ce qu’on observe avec l’ECSQ, car l’effet est non significatif. Finalement, pour la variable de revenu personnel, on remarque que les trois coefficients du groupe de l’EDTR ont un impact non significatif. Dans la première colonne du tableau, le coefficient de « revenu30 départ » est significatif, mais de faible amplitude. La différence entre ces deux échantillons témoins au niveau des estimations n’est donc pas énorme. Finalement, on peut conclure qu’il y a certaines différences entre l’échantillon de l’ECSQ et (SM, SA), principalement au niveau de l’ampleur des coefficients. Malgré tout, il ne semble pas y avoir de différences majeures observées. De plus, On remarque que les résultats des deux méthodes (colonnes 4 et 6) ont certaines ressemblances lorsque les coefficients sont significatifs. Pour ce premier échantillon, on peut donc mentionner que les cancéreuses ne semblent pas être très différentes des femmes de ce premier groupe témoin de l’EDTR, malgré le fait qu’il y ait certaines différences supplémentaires par rapport à ce qu’on observe avec l’ECSQ. La septième colonne du tableau 3.14 contient les estimations pour l’échantillon dans lequel la ville de Montréal est exclue, mais où les fréquences d’âge sont ajustées. Comme pour l’échantillon précédent, on remarque une certaine similitude entre les résultats obtenus par matching (septième colonne) et les différences de moyennes (neuvième colonne). Pour les résultats du matching, on remarque que tous les coefficients relatifs au nombre d’heures travaillées sont significatifs. Les femmes cancéreuses travaillent plus d’heures au début et à la fin. Le coefficient de la variable en différence est significatif tout comme celui pour l’échantillon de Maunsell et al (2004) (colonne 1). Par contre, l’impact estimé est supérieur dans l’échantillon de l’EDTR. Pour le travail à temps partiel, on remarque que seul le coefficient de différence est significatif pour cet échantillon. Finalement, au niveau du revenu personnel, aucun coefficient n’est significatif. On note encore des différences pour le coefficient de « revenu30 début » entre la première et la septième colonne. Par contre, l’ampleur de la différence est faible. Encore une fois, on peut mentionner que les différences entre les deux échantillons témoin, celui de l’ECSQ et (SM, A) ne sont pas très importantes, plusieurs coefficients ayant un impact nul dans les deux cas. La différence la plus importante est au niveau des heures travaillées par semaine. Passons maintenant à l’évaluation de l’échantillon (M, SA). On remarque encore une fois la ressemblance qui persiste entre les résultats de matching (colonne10) et de comparaisons de moyennes (colonne 12), sans toutefois donner des résultats totalement identiques. Cet échantillon est également caractérisé par une variation du nombre d’heures travaillées qui est significative dans les trois coefficients, au début, à la fin et en différence. Encore une fois, le coefficient du nombre d’heures travaillées en différence est semblable entre les colonnes 1 et 10. Au niveau de l’emploi à temps partiel, on Chapitre 3. Les Résultats 41 remarque que les cancéreuses sont moins nombreuses à occuper un emploi à temps partiel au départ, tout comme dans l’ECSQ. L’estimation du coefficient en différence est significative pour l’échantillon de l’EDTR, sans toutefois signaler une variation majeure. Finalement, pour le revenu personnel, aucun coefficient n’a d’impact significatif. Les différences avec les résultats de la première colonne sont encore une fois de faible importance. On remarque donc que les deux échantillons donnent des résultats relativement semblables. Le dernier échantillon est celui où les modifications ont été faites pour l’âge et la ville de Montréal. Comme dans les autres échantillons de l’EDTR, on remarque que les estimations avec les différences de moyennes, soit la colonne 15, procurent des résultats qui sont assez similaires à ceux obtenus par matching. Pour les estimations par matching (colonne 13), on observe que les trois coefficients qui se rattachent au nombre d’heures travaillées par semaine sont significatifs. Par contre, avec les résultats de la première colonne, on remarque certaines différences pour les coefficients. Les estimations pour les heures travaillées au début et à la fin avec l’ECSQ, soit la colonne 1, sont non significatives. Par ailleurs, le coefficient en différence est très semblable entre les résultats de l’ECSQ et (M, A) au niveau du matching. Pour la variable d’emploi à temps partiel, seule la variable en différence a un coefficient significatif pour ce groupe de l’EDTR. Par contre, l’impact est assez faible, tout comme celui de l’ECSQ qui est non significatif. Finalement, on trouve que les cancéreuses gagnent un revenu inférieur aux femmes du groupe témoin au départ et à la fin, bien que l’impact soit faible. Pour cet échantillon, on peut donc signaler des différences principalement pour les heures travaillées. Encore une fois, les différences sont inférieures à cinq heures par semaine. L’écart est donc assez faible. Après avoir examiné tous les résultats de matching des groupes de l’EDTR et les avoir comparés avec les différences de moyennes et les résultats de matching de Maunsell et al (2004), on remarque certaines différences. D’un point de vu global, le matching donne des résultats qui sont assez semblables à ceux des différences de moyennes représentés par le ∆. Par contre, lorsqu’on compare les estimations par matching de Maunsell et al et des échantillons de l’EDTR, on observe certaines différences au niveau de l’ampleur des coefficients. La principale différence entre le matching pour l’ECSQ et l’EDTR se situe au niveau du nombre d’heures travaillées par semaine. On peut déjà voir cette distinction dans les tableaux de statistiques descriptives. Au niveau du revenu, les différences sont plutôt négligeables. Tous les échantillons de l’EDTR ont un coefficient de « diff jobtp » significatif et positif, ce qui laisse croire que les cancéreuses travaillent en plus grand nombre à temps partiel à la fin. Par contre, ces cancéreuses ne sont pas très nombreuses. Conclusion En conclusion de cette recherche, plusieurs éléments peuvent être mentionnés. Tout d’abord, en utilisant l’EDTR, quelques petits écarts subsistent entre les femmes qui forment les échantillons témoins et les femmes cancéreuses. Dans les tableaux de statistiques descriptives précédents, les proportions étaient comparables entre les groupes témoins (EDTR) et de cancéreuses. Par contre, en approfondissant nos méthodes de vérifications, avec le probit par exemple, on s’aperçoit que plusieurs divergences demeurent à plusieurs niveaux, comparativement à ce qu’on a pu observer dans l’étude faite par Maunsell et al (2004). Par ailleurs, d’après nos comparaisons entre les estimations de différences de moyenne, de matching et les ressemblances flagrantes entre le groupe témoin et traitement de l’ECSQ, il était tout à fait légitime que le groupe de Maunsell utilise la méthode sans matching. Leur travail se rapproche énormément d’une expérience aléatoire. En utilisant l’EDTR, qui est un échantillon possiblement contaminé, davantage de divergences s’incrustent dans les groupes. Plusieurs caractéristiques personnelles ont un impact significatif sur le groupe malgré un ajustement au niveau de l’âge. Il persiste donc des différences entre le groupe traité et témoin. Dans un tel cas, l’utilisation du matching est davantage conseillée pour compenser ces divergences d’échantillons qui peuvent provenir de différences au niveau de la population dans laquelle on tire les échantillons témoins ou de différences au niveau du questionnaire utilisé pour obtenir les statistiques descriptives. Avec les estimations obtenues, on peut mentionner que notre conclusion s’apparente à celle de Maunsell et al (2004) malgré les différences dans les échantillons témoins. Dans leur étude, l’équipe de Maunsell mentionne que les femmes cancéreuses sont plus susceptibles de ne pas travailler trois ans après le diagnostique par rapport aux femmes du groupe témoin. De plus, selon leurs résultats, la majorité des cancéreuses travaillent encore trois ans après le diagnostique et l’âge n’affecte pas leur situation de travail. Finalement, une proportion plus grande de femmes travaillent à temps partiel ou ont un deuxième emploi. En utilisant les échantillons de l’EDTR, on retrouve des résultats qui sont relativement similaires à ceux de Maunsell et al (2004) en comparant les statistiques descriptives. Avec les régressions binomiales sur les échantillons de l’EDTR, on observe Conclusion 43 que les femmes cancéreuses sont plus susceptibles de se retrouver sans emploi. Dans les deux groupes ajusté pour l’âge ((SM, A), (M, A)), on observe que les cancéreuses sont plus à risque d’avoir un emploi différent trois ans après le diagnostique. Si on se reporte maintenant aux résultats obtenus par matching, on observe que l’échantillon de l’ECSQ n’est pas différent de façon significative par rapport à celui formé des cancéreuses. Dans les différents échantillons de l’EDTR, certains coefficients sont significatifs. Par contre, l’ampleur des coefficients demeure majoritairement assez faible. Les différences entre les groupes de femmes témoins (EDTR) et de cancéreuses sont donc relativement faibles. Bien qu’il existe certaines différences, on pourrait possiblement diminuer encore cet écart en ajoutant plus de variables dans le probit. L’utilisation d’enquête publique pour former un groupe témoin permet donc de trouver des résultats qui se rapprochent de ceux de Maunsell et al (2004) en utilisant le matching comme méthode statistique, malgré la présence probable de femmes ayant le cancer du sein ou l’ayant déjà eu. Cette façon de faire est beaucoup moins coûteuse en temps et en argent. L’utilisation de telles enquêtes combinée au matching permet d’obtenir une bonne alternative à la fabrication d’échantillon comme l’ont fait Maunsell et al (2004). Bibliographie [1] Blundell, R., Costa, Dias M., Meghir, C., Reenen, J.V., (2002), « Evaluating the employment impact of a mandatory job search program », The institute for Fiscal Studies, WP01/20. [2] Bloom, J.B., Stewart, S.L., Johnston, M., Banks, P., (1998), « Intrusiveness of illness and quality of life in young women with breast cancer », Psycho-Oncology 7, 89-100. [3] Bondy, M.L., Newman, L.A., (2002), « Breast cancer risk assessment models », Cancer supplement,97(1), 230-235. [4] Bradley, C., Bednarek, H., Neumark, D., (2002)(a), « Breast cancer survival, work, and earnings », Journal of Health Economics, 21(5), 757-779. [5] Bradley, C., Bednarek, H., Neumark, D., (2002)(b), « Breast cancer and women’s labor supply », Health Services Research, 37(5), 13091328. [6] Bradley, C.J., Neumark, D., Bednarek, H.L., Schenk, M.J., (2005)(a), « Short-term effects of breast cancer on labor market attachment : results from a longitudinal study », Journal of Health Economics, 24(1), 137-160. [7] Bradley, C.J., Neumark, D., Luo, Z., Bednarek, H.L., (2005)(b), « Employment-contingent health insurance, illness, and labor supply of women : Evidence from married women with breast cancer », National Bureau of Economic Research, Working paper no. 11304. [8] Caliendo, M., Kopeinig, S., (2005), « Some practical guidance for the implementation of propensity score matching », The institute for the study of labor, Working paper no. 1588. [9] Cancer facts and figures, (2005). [10] Coile, C., (2004), « Health shocks and couples’ labor supply decisions », National Bureau of Economic Research, Working Paper Series #10810. Bibliographie 45 [11] Epping-Jordan, J.E., Compas, B.E., Osowiecki, D.M., Oppedisano, G., Gerhardt, C., Primo, K., Krag, D.N., (1999), « Psychological adjustment in breast cancer : Processes of emotinoal distress », Health Psychology, 18(4), 315-326. [12] Fondation Québécoise du Cancer, (2005). [13] Lalonde, R.J., (1986), « Evaluating the econometric evaluations of training programs with experimental data », The American Economic Review, 76(4), 604-620. [14] Maunsell, E., Drolet, M., Brisson, J., Brisson, C., Mâsse, B., Deschênes, L., (2004), « Work situation after breast cancer : Results from a population-based study », Journal of the national cancer institute, 96(24), 1813-1822. [15] Ruhm, C., (1998), « The economic consequences of parental leave mandates : Lessons from Europe », The Quarterly Journal of Economics, 113(1), 285-317. [16] Satariano, W.A., DeLorenze, G.N., (1996), « The likelihood of returning to work after breast cancer », Public Health Reports, 111(3), 236-241. [17] Société Canadienne du Cancer, (2005). [18] Turner, J., Kelly, B., Swanson, C., Allison, R., Wetzig, N., (2005), « Psychosocial impact of newly diagnosed advanced breast cancer », Psycho-Oncology, 14, 396-407. [19] Wong-Kim, E.C., Bloom, J.R., (2004), « Depression experienced by young women newly diagnosed with breast cancer », Psycho-Oncology.