3. Prévision de l`incidence des cancers dans le Bas-Rhin à l

publicité
Journées scientifiques de l’InVS
03
Prévision de l’incidence des cancers
dans le Bas-Rhin à l’aide d’un modèle
âge-période-cohorte bayésien.
D. Eilstein1, G. Hédelin1, P. Schaffer†1.
1
Laboratoire d’épidémiologie et de santé publique, Université Louis Pasteur, Strasbourg.
Introduction
La prédiction de l’évolution de l’incidence du cancer est utile à plusieurs
titres.
• Informer le public et les professionnels de santé de l’évolution future de cette maladie ;
• Aider les décideurs à prévoir les infrastructures nécessaires à l’accueil et à la prise en
charge diagnostique et thérapeutique des patients.
• Servir de base de comparaison avec l’évolution réelle future afin d’évaluer les
traitements et les actions de prévention de la maladie.
• Méthodes basées sur la prédiction de l’évolution des facteurs explicatifs ;
• Modèles âge-période-cohorte (modèles APC) : ils expriment l’incidence comme une
fonction de trois facteurs
➢ le facteur « âge » est une variable physiologique qui représente la durée de
l’exposition à des facteurs de risque ;
➢ le facteur « période » correspond à la variation de l’exposition de l’ensemble de la
population à des facteurs de risques ou protecteurs au cours du temps
➢ la « cohorte de naissance » témoigne d’une exposition touchant des sujets à un
moment clef de leur vie, en particulier lors de la petite enfance ou même à la période
embryonnaire).
Objectif
– Estimer l’incidence et le nombre de cas incidents futurs pour les cancers dans le Bas-Rhin ;
– Tester la validité d’une méthode d’analyse fondée sur une approche bayésienne.
Méthodes
Données
Les données de population (données de recensement de 1975, 1982 et 1990, données
interpolées pour la période de base de la prédiction, données prédites pour la période de
projection) ont été fournies par l’INSEE.
Les données d’incidence ont été extraites du Registre des tumeurs du Bas-Rhin. Ces
données étaient disponibles entre 1975 (date de création du registre) et 1996. Les âges
extrêmes de la population étudiée sont, sauf cas particuliers, 25 et 89 ans.
Analyse
La prédiction a été établie, en général, jusqu’à la période 2005-2009 pour le cancer
colorectal, le cancer du sein, du poumon, du col de l’utérus.
L’analyse statistique repose sur un modèle APC et une approche bayésienne.
Modèle Âge-période-cohorte
• Ce modèle exprime l’incidence comme une fonction de trois facteurs
– le facteur « âge » est une variable physiologique qui représente la durée de l’exposition
à des facteurs de risque ;
– le facteur « période » correspond à la variation de l’exposition de l’ensemble de la
population à des facteurs de risques ou protecteurs au cours du temps ;
– la « cohorte de naissance » témoigne d’une exposition touchant des sujets à un moment
clef de leur vie, en particulier lors de la petite enfance ou même à la période embryonnaire.
Le modèle APC se présente sous la forme d’un modèle linéaire généralisé :
Yijk ~ LPoisson (mijk λijk)
In (λijk) = ai + pj + ck
Yijk est le nombre de cas incidents et sa densité de probabilité est celle d’une loi de Poisson.
mijk représente le nombre de personnes-années pour l’âge i, la période j et la cohorte k ;
lijk est le taux d’incidence pour l’âge i, la période j et la cohorte k ;
ai est l’effet lié à la classe d’âge i ;
pj est l’effet lié à la période j ;
ck est l’effet lié à la cohorte k.
Approche bayésienne
Principe
Le modèle bayésien exprime la distribution de probabilité prédictive a posteriori valeurs
futures en fonction de la distribution de probabilité a postériori du paramètre de la
distribution de probabilité des valeurs passées.
Le calcul de la probabilité marginale de chacune des variables, à partir de la probabilité jointe
de l’ensemble des variables, nécessite une intégration. Celle-ci est difficile à réaliser par les
méthodes analytiques classiques car la loi de distribution a priori des paramètres (loi normale)
et la loi de distribution de la variable expliquée (loi de Poisson) sont non conjuguées. Aussi
l'analyse utilise-t-elle ici un l’échantillonnage de Gibbs (cas particulier de méthode de Monte
Carlo par chaînes de Markov). Cette méthode construit des échantillons pour chacune des
variables. Ces échantillons sont tirés de la densité marginale de ces variables sans calculer
l’intégrale marginale elle-même mais en estimant les densités de probabilité conditionnelle d’une
variable par rapport aux autres : ces densités conditionnelles sont en effet plus facile à calculer.
Le modèle impose, de plus, des contraintes entre les paramètres successifs (les effets) des
trois covariables « âge », « période » et « cohorte » : ce sont des relations autorégressives
déduites des réflexions et des modèles de Breslow et Clayton [1] et de Berzuini et Clayton [2].
Le calcul est réalisé sur le logiciel BUGS (Bayesian inference Using Gibbs Sampling) [3].
Résultats
Tableau 1 – Incidence du cancer du sein invasif standardisée sur la
population européenne
Période
1975- 1977- 1981- 1985- 1989- 19931976 1980 1984 1988 1992 1996
Sein
invasif
115,7 125,7
136,7 148,9 172,0
180,6
1997-2000
2001-2004
2005-2008
195,3
212,3
230,1
[177,8-213,4] [189,6-236,2] [200,4-262,4]
Tableau 2 – Incidences des cancers du col de l’utérus, du côlon, du
rectum et du poumon, standardisées sur la population européenne
Période
1975- 1980- 1985- 19901979 1984 1989 1994
1995-1999
2000-2004
2005-2009
Col utérus
in situ
23,0
33,9
35,0
59,5
69,4
Col utérus
invasif
32,1
24,3
20,5
17,6
14,7
13,0
[9,5-17,2]
11,7
[7,3-18,1]
Côlon
femmes
31,9
35,1
38,4
41,0
43,4
[34,9-53,3]
46,3
[31,1-65,2]
50,5
[23,1-94,5]
Côlon
hommes
45,4
53,8
62,7
74,8
88,8
105,4
129,6
[73,0-107,7] [73,1-150,1] [61,4-244,8]
Rectum
femmes
20,0
21,5
22,5
23,2
23,8
[18,7-29,8]
24,8
[15,8-36,1]
27,6
[10,8-53,4]
Rectum
hommes
48,6
47,9
47,7
47,4
46,8
[36,8-57,9]
45,7
[29,9-65,6]
45,9
[19,3-89,9]
Poumon
femmes
9,3
9,5
16,2
15,6
20,0
[13,6-24,7]
23,7
[14,7-31,5]
28,1
[15,7-40,4]
Poumon
hommes
97,5
103,8
116,6
122,0
159,4
164,7
[134,1-184,4] [118,2-216]
174,7
[90,1-295,9]
2010-2014
99,7
132,7
177,1
[82,7-118,5] [97,2-174,5] [103,7-288,5]
11,1
[4,5-22,7]
Conclusion
Le Bas-Rhin se situe dans la moyenne des pays européens.
• Pour le cancer du sein : la croissance du taux est plus forte que dans les pays
scandinaves mais plus faible qu’en Espagne ou en Bulgarie ;
• Pour le cancer du col de l’utérus invasif : la décroissance du taux est du même ordre
que dans les pays scandinaves ;
• Pour le cancer du poumon : les taux prédits pour les hommes sont légèrement
supérieurs à ceux de l’Écosse mais présentent une tendance croissante alors que les
taux écossais, plus élevés au départ, sont stables voire diminuent ; pour les femmes, le
taux prévu en Écosse est deux fois plus élevé que dans le Bas-Rhin ; un certain nombre
de prédictions a été réalisé en tenant compte de différents scénarios de comportement
tabagique (Finlande) ;
• Pour le cancer colorectal : les taux d’incidences dans le Bas-Rhin sont deux fois plus
élevés que les taux italiens pour les femmes et deux fois et demie plus importantes pour
les hommes avec, toutefois un accroissement relatif plus important en Italie ; le rapport
entre les taux d’incidence chez l’homme et chez la femme augmente de façon parallèle
dans les deux zones ; il est plus important dans le Bas-Rhin qu’en Italie (2,1 pour 1,5 en
2000) ; les travaux scandinaves prédisent des taux nettement inférieurs aussi ; ces
dissemblances sont vraisemblablement en relation avec des disparités d’ordre
alimentaire.
Les méthodes utilisant une extrapolation simple de la tendance des incidences
spécifiques selon l’âge (modèles linéaires) sont trop rigides ; le modèle APC permet, au
contraire, de prendre en compte des composantes de courbure. Les méthodes basées
sur la prédiction de l’évolution des facteurs explicatifs sont difficiles à mettre en
œuvre car ces facteurs ne sont pas tous connus et, lorsqu’il le sont, leur tendance ne
l’est pas ; le modèle APC permet de s’affranchir de la connaissance des facteurs de
risque.
L’approche bayésienne, de plus en plus souvent utilisée actuellement, a été préférée à
d’autres méthodes car elle permettait de prendre en compte une éventuelle
autocorrélation entre les paramètres du modèle, de donner plus d’importance au
données et d’améliorer la stabilité des coefficients (en particulier ceux qui sont liés au
cohortes extrêmes moins pourvues en données), condition essentielle aux calculs de
prévision [4].
Références
1. BRESLOW N.E., CLAYTON D.G. Approximate inference in generalized linear mixed models.
J Am Stat Ass 1993 ; 88 : 9-25.
2. BERZUINI C., CLAYTON D. Bayesian analysis of survival on multiple time scales. Statist Med
1994 ; 13 : 823-38.
3. SPIEGELHALTER D., THOMAS A., BEST N., GILKS W. BUGS 0.5 Bayesian inference using
Gibbs sampling Manual (version ii). 1996.
4. BASHIR S.A., ESTÈVE J. Projecting cancer incidence and mortality using Bayesian ageperiod-cohort models. J Epidemiol Biostatist 2001 ; 6 : 287-96.
Téléchargement