La survie nette actuelle à long terme Qualités de sept méthodes d

publicité
La survie nette actuelle à long terme
Qualités de sept méthodes d’estimation
PAR Alireza MOGHADDAM
TUTEUR : Guy HÉDELIN
Laboratoire d’Épidémiologie et de Santé publique, EA 1801
Faculté de Médecine de Strasbourg
Plan
• Survie nette : définition, estimation
• Description des méthodes d’estimation
• Simulation : intérêt, principes et réalisation
• Résultats
• Conclusions
1
Survie nette
Concept
• Survie liée à la maladie d’intérêt,
les autres causes de décès étant éliminées
• Traduit la mortalité liée spécifiquement à
une maladie
Risques compétitifs
• Compétition : un individu est soumis simultanément à
différents risques dont l’un aboutit au décès
Risque
Maladie
Autres causes
• La cause du décès est unique et détermine le temps de
survie
2
Taux observé λo
• Le taux global ou observé a deux composantes :
λo = λn + λa
λn : le taux net lié à la maladie d’intérêt
λa : le taux lié aux autres causes
• Lorsque la cause du décès n’est pas recueillie (registre),
les deux composantes λn et λa sont inconnues
Taux relatif
• λa : approché par le taux de mortalité de
la population générale (âge, sexe, année)
Soit λg cette approximation de λa
Taux relatif λr = λo – λg
• Le taux relatif λr est une approximation
du taux net λn
3
Du taux relatif à la survie relative
• λr = λo – λg
• Sr = So / Sg
Sr : survie relative
So : survie observée
Sg : survie attendue
Survie nette actuelle
• Celle des patients nouvellement diagnostiqués
• Dépend étroitement des moyens actuels
• Survie nette actuelle à long terme : difficultés
d’estimation par les méthodes classiques
4
Survie nette actuelle à 10 ans
?
1997
2007
2017
Survie nette
à 10 ans des patients
diagnostiqués en
1997
Survie nette
à 10 ans des patients
diagnostiqués en
2007
Suivi
Année de diagnostic
Valeur à estimer
Survie nette actuelle à 10 ans
2007
1997
?
Survie nette
à 10 ans des patients
diagnostiqués en
1997
Suivi
Année de diagnostic
5
Méthodes d’estimation
Méthodes utilisant une approche traditionnelle
de type Kaplan-Meier :
• Méthode par cohortes
• Méthode complète
• Analyse par période (Brenner)
Méthodes d’estimation
Méthodes utilisant une modélisation :
• Méthode régressive d’Estève
• Polynôme dérivé de la méthode d’Estève
• Analyse par période modélisée
6
Base de données
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
Cohorte
2004
2005
2006
Méthode par cohortes
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
Informations analysées
Informations exclues
2004
2005
2006
7
Méthode complète
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
Informations analysées
Informations exclues
2004
2005
2006
Analyse par période (Brenner)
• Principe : écarter l’information a priori trop
ancienne
Troncature à gauche = élimination des
décès et des censures survenus avant une
période considérée comme récente
8
Brenner 1 (analyse par période)
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
Informations analysées
2003
2004
Informations exclues
2005
2006
Analyse par période
• Méthode de Kaplan-Meier
S(10) = P (1) x P(2\1) x …x P(10\9)
9
Analyse par période
P(3\2)
Patient A
2006 2007
1999 2000 2001
Patient B
2004 2005 2006
Année calendaire
Suivi
Brenner 5 (analyse par période)
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
Informations analysées
Informations exclues
2003
2004
2005
2006
10
Méthode d’Estève
• Méthode régressive modélisant les taux en fonction de
l’année de diagnostic
• Chaque année calendaire est une strate
• Obtention d’un coefficient de régression par strate
• Tous les patients sont inclus
Méthode d’Estève
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
11
Polynôme
• Dérivé de la méthode d’Estève
• Fonction de l’année de diagnostic X :
β0 + β1X + β2X2 + … + βiXi
• Permet d’appréhender l’évolution de la survie nette
• Nombre réduit de coefficients de régression
Polynôme
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
12
Analyse par période modélisée
• Application d’un polynôme à des données
récentes
• Période d’analyse = 5 ans
Analyse par période modélisée
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
Données analysées
Données exclues
2003
2004
2005
2006
13
Survie nette actuelle
à long terme
Ces méthodes fournissent des résultats différents
Question : quelle est l’estimation la plus fiable?
Évaluation des méthodes
• Deux problèmes se posent en pratique :
Les estimations varient d’un échantillon
à l’autre (fluctuations)
La valeur du paramètre à estimer est
inconnue
14
Simulation
Seul procédé permettant d’évaluer
une méthode statistique :
Grand nombre d’échantillons
(fluctuations d’échantillonnage)
Valeur du paramètre à estimer
connue
Simulation
Principes
Population fictive
Simulation
proprement dite
Sondage aléatoire
Échantillons multiples
Analyse
Biais = écart entre la moyenne des estimations et la valeur théorique
Précision = dispersion des estimations
15
Simulation
Principes
• Simuler = générer des données à partir
de lois de probabilité
• Les données générées sont aléatoires et
indépendantes
Simulation
Méthodologie
• Identifier les processus à simuler
• Choisir les lois de probabilité adéquates
• Générer les données à partir des lois de
probabilité choisies
16
Simulation
Processus
La survie observée dépend de 4 processus
simultanés et indépendants :
•
•
•
•
La mortalité liée à la maladie (survie nette)
La mortalité liée aux autres causes
La guérison
La censure : aléatoire et non informative
Simulation
Lois de probabilité
PROCESSUS
LOIS DE PROBABILITÉ
Maladie
Weibull ou log-normale
Autres causes
Exponentielle
par morceau
Guérison
Bernoulli
Censure
Uniforme
17
Mortalité nette
• Durées de survie
• Variable quantitative continue
• Fonctions paramétriques du temps :
Loi de Weibull
Loi log-normale
Mortalité nette
Loi de Weibull
• Dépend de deux paramètres :
Un paramètre d’échelle α
Un paramètre de forme ß
• Les valeurs de ces paramètres déterminent
les caractéristiques de la fonction de survie
18
Mortalité nette
Loi de Weibull
• Le paramètre d’échelle α permet de simuler
une amélioration de la survie nette au cours
de périodes successives
• Le paramètre de forme ß détermine
l’évolution du risque au cours du temps :
Risque décroissant : ß < 1
Risque constant : ß = 1
Risque croissant : ß > 1
Survie nette
Loi de Weibull
Amélioration de la survie nette
ß = 0,8
α=5
α=2
19
Mortalité nette
Loi log-normale
• Dépend également de deux paramètres
• Propriété intéressante : permet d’obtenir
un risque biphasique
Mortalité par autres causes
• Durées de survie
• Loi exponentielle par morceau
• Table de mortalité (âge, sexe, période)
• Risque constant conditionnellement à l’intervalle
20
Mortalité par autres causes
Table de mortalité
Années calendaires
Age
50
51
52
53
54
2001
0,02
0,02
0,03
0,04
0,04
2002
0,03
0,02
0,04
0,05
0,04
2003
0,02
0,04
0,04
0,06
0,05
2004
0,02
0,03
0,05
0,04
0,05
2005
0,01
0,04
0,05
0,02
0,03
Loi exponentielle par morceau
• Un seul paramètre : taux instantané λ
• Propriété intéressante : λ est constant au cours
du temps, par morceau
• Morceau = une année calendaire
21
Mortalité par autres causes
Exemple
5 individus diagnostiqués à 50 ans début 2001 et suivi pendant 3 ans
Années calendaires
Table
de mortalité
Age 50
51
52
Données
générées
2001 2002
λ1
2003
Données
obtenues
λ2
λ3
1
0,5
1
1
1
1
0,6
1
1
1
0,9
1
-
Durée Statut
3
0
0,5
1
2,6
1
3
1,9
0
1
Simulation
Guérison
• Chaque patient guérit ou ne guérit pas
• Variable binaire
• Loi de Bernoulli
• Si guérison : mortalité par autres causes
• Sinon : compétition
22
Simulation
Censure
• Durées d’observation
• Loi uniforme
• Toutes les durées sont également probables
Simulation
Modèle de mélange
Patients
GUÉRIS
NON GUÉRIS
COMPÉTITION
AUTRES CAUSES
CENSURE
MALADIE AUTRES CAUSES
CENSURE
23
Simulation
Échantillons définitifs
Données initiales
N° Guérison Maladie
Données définitives
Autres
Censure
causes
Durée
Statut
1
1
2,5
3,5
4,2
3,5
1
2
1
1,2
8,2
5,3
5,3
0
3
0
3,6
5,9
6,2
3,6
1
Simulation
Échantillons définitifs
Structure de l’échantillon définitif
N° Durée Statut
Age*
Année*
Sexe
1
3,5
1
50
2001
1
2
5,3
0
50
1999
1
3
3,6
1
51
2002
2
* Au moment du diagnostic
24
Simulation
Échantillons définitifs
Certaines informations ne seront pas utilisées
lors de l’analyse :
• Statut vis-à-vis de la guérison
• Cause du décès
Simulation et analyse
Aspects pratiques
• La simulation et l’analyse des données
simulées nécessitent une programmation
informatique
Logiciel R
25
Simulation et analyse
Aspects pratiques
Cinq types de programmes permettant respectivement :
De générer les données pour chaque processus
De confronter les données générées afin d’obtenir
les temps de survie
De créer les fichiers contenant l’information
nécessaire pour chaque méthode
D’analyser les échantillons par chaque méthode
De calculer les 3 critères pour chaque méthode
Situations cliniques simulées
Cancer du poumon :
• Survie courte
• Risque décroissant
Cancer du sein :
• Survie longue
• Risque croissant puis décroissant
Amélioration régulière de la survie nette
26
Échantillons
• Nombre : 200
• Taille : 1050
• Pourcentage de censure aléatoire : de 0 à 30%
Analyse
• Critère : survie relative actuelle à 10 ans
• Biais = différence entre la survie théorique et la
survie moyenne estimée
• Variance des estimations (précision)
• Couverture = proportion d’échantillons dont les
intervalles de confiance à 95% contiennent la
valeur théorique
27
Survie théorique = 0,241
CANCER DU POUMON
Survie
relative
Écart-type
Couverture
(%)
Cohortes
0,084
0,015
0,000
Complète
0,125
0,015
0,000
Brenner 5
0,169
0,023
16,500
Brenner 1
0,202
0,054
85,500
Estève
0,231
0,074
89,500
Polynôme
0,239
0,047
93,800
Période
modélisée
0,252
0,073
95,400
Méthodes
Distribution
Survie théorique = 0,670
CANCER DU SEIN
Survie
relative
Écart-type
Couverture
(%)
Cohortes
0,490
0,027
0,000
Complète
0,543
0,021
0,000
Brenner 5
0,597
0,028
23,500
Brenner 1
0,626
0,061
90,500
Estève
0,729
0,118
86,300
Polynôme
0,695
0,037
91,000
Période
modélisée
0,671
0,092
92,000
Méthodes
Distribution
28
Cancer du sein
Polynôme
Période modélisée
Proportions d’estimations proches de la valeur théorique
Différence
Polynôme (%)
Période modélisée (%)
0,05
73
41
0,1
98
72
Influence de la censure
Cancer du poumon
• Méthodes n’utilisant pas de modèle : aucune
• Modèles : sous-estimation à partir de 25% de
censure
Estève : peu marquée
Polynômes : plus marquée
29
Influence de la censure
Cancer du poumon
Méthodes
Censure (%)
Estève
Polynôme
Période modélisée
0
0,231 (0,074)
0,239 (0,047)
0,252 (0,073)
5
0,231 (0,074)
0,239 (0,048)
0,251 (0,074)
10
0,230 (0,074)
0,236 (0,048)
0,249 (0,076)
15
0,231 (0,075)
0,234 (0,049)
0,249 (0,077)
20
0,230 (0,076)
0,235 (0,051)
0,252 (0,079)
25
0,227 (0,077)
0,220 (0,050)
0,224 (0,077)
30
0,226 (0,079)
0,214 (0,050)
0,216 (0,080)
Évaluation empirique
Registre du Bas-Rhin
• Estimation de la survie nette à 10 ans
des patients diagnostiqués entre 1989
et 1991
• Survie nette réelle fin 2000
30
Évaluation empirique
Cancer du poumon
• Meilleures méthodes :
65-74 ans et 75-84 ans : polynôme utilisant
l’ensemble des données
45-54 ans et 55-64 ans : analyse par période
(5 années)
Évaluation empirique
Cancer du sein
• Meilleures méthodes :
35-44 ans et 55-64 ans : polynôme utilisant
l’ensemble des données
45-54 ans et 65-74 ans et ≥85 ans : Estève
(mais intervalles de confiance plus larges)
31
REGISTRE DU BAS-RHIN
• Cancer du poumon
• Cas diagnostiqués entre 1975 et 2000
• Date de point : 31/12/2000
Registre : cancer du poumon
Méthodes
45-54
55-64
65-74
75-84
≥85
Cohortes
0,094
(0,018)
0,107
(0,013)
0,090
(0,015)
0,053
(0,019)
0 (0)
Complète
0,125
(0,015)
0,154
(0,022)
0,217
(0,055)
0,170
(0,017)
0,166
(0,013)
0,159
(0,027)
0,110
(0,009)
0,168
(0,027)
0,216
(0,050)
0,148
(0,015)
0,144
(0,011)
0,127
(0,022)
0,106
(0,012)
0,093
(0,022)
0,100
(0,022)
0,109
(0,013)
0,106
(0,011)
0,100
(0,009)
0,048
(0,015)
0,044
(0,019)
0,034
(0,064)
0,047
(0,008)
0,044
(0,006)
0,034
(0,010)
0 (0)
Brenner 5
Brenner 1
Estève
Polynôme
Brenner
modélisé
0 (0)
0 (0)
0,010
(0,004)
0,009
(0,003)
0,007
(0,005)
32
REGISTRE DU BAS-RHIN
• Cancer du sein
• Cas diagnostiqués entre 1975 et 2000
• Date de point : 31/12/2000
Registre : cancer du sein
Méthodes
35-44
45-54
55-64
65-74
75-84
≥85
Cohortes
0,709
(0,022)
0,739
(0.014)
0,765
(0,018)
0,827
(0,038)
0,774
(0,014)
0,802
(0,006)
0,792
(0,020)
0,674
(0,017)
0,710
(0,012)
0,751
(0,015)
0,716
(0,034)
0,748
(0,014)
0,778
(0,006)
0,793
(0,018)
0,605
(0.015)
0,654
(0.011)
0,694
(0,015)
0,814
(0,030)
0,688
(0,016)
0,724
(0,008)
0,718
(0,024)
0,525
(0.019)
0,540
(0.013)
0,558
(0,017)
0,551
(0,037)
0,576
(0,020)
0,621
(0,009)
0,571
(0,030)
0,409
(0.028)
0,435
(0,023)
0,456
(0,030)
0,436
(0,064)
0,442
(0,023)
0,494
(0,018)
0,447
(0,041)
0,119
(0.068)
0,179
(0,077)
0,258
(0,110)
0,195
(0,156)
0,259
(0,026)
0,311
(0,011)
0,200
(0,031)
Complète
Brenner 5
Brenner 1
Estève
Polynôme
Brenner
modélisé
33
Conclusions
• Polynôme : méthode la plus performante
• Méthode souple permettant de capter
l’évolution de la survie nette
• Peu de coefficients de régression
• Utilisation recommandée dans le cadre d’un
registre
34
Téléchargement