Journées scientifiques de l’InVS 03 Prévision de l’incidence des cancers dans le Bas-Rhin à l’aide d’un modèle âge-période-cohorte bayésien. D. Eilstein1, G. Hédelin1, P. Schaffer†1. 1 Laboratoire d’épidémiologie et de santé publique, Université Louis Pasteur, Strasbourg. Introduction La prédiction de l’évolution de l’incidence du cancer est utile à plusieurs titres. • Informer le public et les professionnels de santé de l’évolution future de cette maladie ; • Aider les décideurs à prévoir les infrastructures nécessaires à l’accueil et à la prise en charge diagnostique et thérapeutique des patients. • Servir de base de comparaison avec l’évolution réelle future afin d’évaluer les traitements et les actions de prévention de la maladie. • Méthodes basées sur la prédiction de l’évolution des facteurs explicatifs ; • Modèles âge-période-cohorte (modèles APC) : ils expriment l’incidence comme une fonction de trois facteurs ➢ le facteur « âge » est une variable physiologique qui représente la durée de l’exposition à des facteurs de risque ; ➢ le facteur « période » correspond à la variation de l’exposition de l’ensemble de la population à des facteurs de risques ou protecteurs au cours du temps ➢ la « cohorte de naissance » témoigne d’une exposition touchant des sujets à un moment clef de leur vie, en particulier lors de la petite enfance ou même à la période embryonnaire). Objectif – Estimer l’incidence et le nombre de cas incidents futurs pour les cancers dans le Bas-Rhin ; – Tester la validité d’une méthode d’analyse fondée sur une approche bayésienne. Méthodes Données Les données de population (données de recensement de 1975, 1982 et 1990, données interpolées pour la période de base de la prédiction, données prédites pour la période de projection) ont été fournies par l’INSEE. Les données d’incidence ont été extraites du Registre des tumeurs du Bas-Rhin. Ces données étaient disponibles entre 1975 (date de création du registre) et 1996. Les âges extrêmes de la population étudiée sont, sauf cas particuliers, 25 et 89 ans. Analyse La prédiction a été établie, en général, jusqu’à la période 2005-2009 pour le cancer colorectal, le cancer du sein, du poumon, du col de l’utérus. L’analyse statistique repose sur un modèle APC et une approche bayésienne. Modèle Âge-période-cohorte • Ce modèle exprime l’incidence comme une fonction de trois facteurs – le facteur « âge » est une variable physiologique qui représente la durée de l’exposition à des facteurs de risque ; – le facteur « période » correspond à la variation de l’exposition de l’ensemble de la population à des facteurs de risques ou protecteurs au cours du temps ; – la « cohorte de naissance » témoigne d’une exposition touchant des sujets à un moment clef de leur vie, en particulier lors de la petite enfance ou même à la période embryonnaire. Le modèle APC se présente sous la forme d’un modèle linéaire généralisé : Yijk ~ LPoisson (mijk λijk) In (λijk) = ai + pj + ck Yijk est le nombre de cas incidents et sa densité de probabilité est celle d’une loi de Poisson. mijk représente le nombre de personnes-années pour l’âge i, la période j et la cohorte k ; lijk est le taux d’incidence pour l’âge i, la période j et la cohorte k ; ai est l’effet lié à la classe d’âge i ; pj est l’effet lié à la période j ; ck est l’effet lié à la cohorte k. Approche bayésienne Principe Le modèle bayésien exprime la distribution de probabilité prédictive a posteriori valeurs futures en fonction de la distribution de probabilité a postériori du paramètre de la distribution de probabilité des valeurs passées. Le calcul de la probabilité marginale de chacune des variables, à partir de la probabilité jointe de l’ensemble des variables, nécessite une intégration. Celle-ci est difficile à réaliser par les méthodes analytiques classiques car la loi de distribution a priori des paramètres (loi normale) et la loi de distribution de la variable expliquée (loi de Poisson) sont non conjuguées. Aussi l'analyse utilise-t-elle ici un l’échantillonnage de Gibbs (cas particulier de méthode de Monte Carlo par chaînes de Markov). Cette méthode construit des échantillons pour chacune des variables. Ces échantillons sont tirés de la densité marginale de ces variables sans calculer l’intégrale marginale elle-même mais en estimant les densités de probabilité conditionnelle d’une variable par rapport aux autres : ces densités conditionnelles sont en effet plus facile à calculer. Le modèle impose, de plus, des contraintes entre les paramètres successifs (les effets) des trois covariables « âge », « période » et « cohorte » : ce sont des relations autorégressives déduites des réflexions et des modèles de Breslow et Clayton [1] et de Berzuini et Clayton [2]. Le calcul est réalisé sur le logiciel BUGS (Bayesian inference Using Gibbs Sampling) [3]. Résultats Tableau 1 – Incidence du cancer du sein invasif standardisée sur la population européenne Période 1975- 1977- 1981- 1985- 1989- 19931976 1980 1984 1988 1992 1996 Sein invasif 115,7 125,7 136,7 148,9 172,0 180,6 1997-2000 2001-2004 2005-2008 195,3 212,3 230,1 [177,8-213,4] [189,6-236,2] [200,4-262,4] Tableau 2 – Incidences des cancers du col de l’utérus, du côlon, du rectum et du poumon, standardisées sur la population européenne Période 1975- 1980- 1985- 19901979 1984 1989 1994 1995-1999 2000-2004 2005-2009 Col utérus in situ 23,0 33,9 35,0 59,5 69,4 Col utérus invasif 32,1 24,3 20,5 17,6 14,7 13,0 [9,5-17,2] 11,7 [7,3-18,1] Côlon femmes 31,9 35,1 38,4 41,0 43,4 [34,9-53,3] 46,3 [31,1-65,2] 50,5 [23,1-94,5] Côlon hommes 45,4 53,8 62,7 74,8 88,8 105,4 129,6 [73,0-107,7] [73,1-150,1] [61,4-244,8] Rectum femmes 20,0 21,5 22,5 23,2 23,8 [18,7-29,8] 24,8 [15,8-36,1] 27,6 [10,8-53,4] Rectum hommes 48,6 47,9 47,7 47,4 46,8 [36,8-57,9] 45,7 [29,9-65,6] 45,9 [19,3-89,9] Poumon femmes 9,3 9,5 16,2 15,6 20,0 [13,6-24,7] 23,7 [14,7-31,5] 28,1 [15,7-40,4] Poumon hommes 97,5 103,8 116,6 122,0 159,4 164,7 [134,1-184,4] [118,2-216] 174,7 [90,1-295,9] 2010-2014 99,7 132,7 177,1 [82,7-118,5] [97,2-174,5] [103,7-288,5] 11,1 [4,5-22,7] Conclusion Le Bas-Rhin se situe dans la moyenne des pays européens. • Pour le cancer du sein : la croissance du taux est plus forte que dans les pays scandinaves mais plus faible qu’en Espagne ou en Bulgarie ; • Pour le cancer du col de l’utérus invasif : la décroissance du taux est du même ordre que dans les pays scandinaves ; • Pour le cancer du poumon : les taux prédits pour les hommes sont légèrement supérieurs à ceux de l’Écosse mais présentent une tendance croissante alors que les taux écossais, plus élevés au départ, sont stables voire diminuent ; pour les femmes, le taux prévu en Écosse est deux fois plus élevé que dans le Bas-Rhin ; un certain nombre de prédictions a été réalisé en tenant compte de différents scénarios de comportement tabagique (Finlande) ; • Pour le cancer colorectal : les taux d’incidences dans le Bas-Rhin sont deux fois plus élevés que les taux italiens pour les femmes et deux fois et demie plus importantes pour les hommes avec, toutefois un accroissement relatif plus important en Italie ; le rapport entre les taux d’incidence chez l’homme et chez la femme augmente de façon parallèle dans les deux zones ; il est plus important dans le Bas-Rhin qu’en Italie (2,1 pour 1,5 en 2000) ; les travaux scandinaves prédisent des taux nettement inférieurs aussi ; ces dissemblances sont vraisemblablement en relation avec des disparités d’ordre alimentaire. Les méthodes utilisant une extrapolation simple de la tendance des incidences spécifiques selon l’âge (modèles linéaires) sont trop rigides ; le modèle APC permet, au contraire, de prendre en compte des composantes de courbure. Les méthodes basées sur la prédiction de l’évolution des facteurs explicatifs sont difficiles à mettre en œuvre car ces facteurs ne sont pas tous connus et, lorsqu’il le sont, leur tendance ne l’est pas ; le modèle APC permet de s’affranchir de la connaissance des facteurs de risque. L’approche bayésienne, de plus en plus souvent utilisée actuellement, a été préférée à d’autres méthodes car elle permettait de prendre en compte une éventuelle autocorrélation entre les paramètres du modèle, de donner plus d’importance au données et d’améliorer la stabilité des coefficients (en particulier ceux qui sont liés au cohortes extrêmes moins pourvues en données), condition essentielle aux calculs de prévision [4]. Références 1. BRESLOW N.E., CLAYTON D.G. Approximate inference in generalized linear mixed models. J Am Stat Ass 1993 ; 88 : 9-25. 2. BERZUINI C., CLAYTON D. Bayesian analysis of survival on multiple time scales. Statist Med 1994 ; 13 : 823-38. 3. SPIEGELHALTER D., THOMAS A., BEST N., GILKS W. BUGS 0.5 Bayesian inference using Gibbs sampling Manual (version ii). 1996. 4. BASHIR S.A., ESTÈVE J. Projecting cancer incidence and mortality using Bayesian ageperiod-cohort models. J Epidemiol Biostatist 2001 ; 6 : 287-96.