Cours
7
2008/2009 1
C
OURS
7
:
ETUDES
DE
SURVIE
ETUDES
PRONOSTIQUES
&
LECTURE
CRITIQUE
Julien Mancini, Stéphane Robitail
A- Les études de survie
Les études de survie ne constituent pas un type d’enquête au même titre que, par exemple, les enquêtes
cas-témoins. Ce type d’étude correspond à l’utilisation de méthodes d’analyse particulières, lorsque le
critère de jugement est la survenue d’un décès ou d’un événement de santé particulier. Ces méthodes
permettent d’étudier le délai de survenue d’un événement dont la survenue n’est pas constante. En
effet, l’objectif d’une étude peut être de savoir si une maladie va entraîner un décès ou pas ; mais plus
fréquemment, on souhaite également savoir quand cet éventuel décès va survenir.
Les méthodes d’analyse des données de survie ont été à l’origine utilisée pour étudier la survie de patients
(délai de survenue éventuelle de l’événement décès), mais elles peuvent être utilisées pour étudier toutes les
données dites censurées à droite : c’est à dire l’apparition au cours du temps d’un événement avec des
observations « incomplètes » constituées par les sujets chez qui l’événement n’est pas encore survenu lors
de l’analyse.
Les événements qui peuvent être pris en compte dans ce type d’analyse sont des événements qualitatifs
binaires (présence/absence) qui surviennent au cours du temps de manière non récurrente : le décès, mais
aussi la survenue d’une surdité, d’une récidive d’un cancer, d’une métastase, d’un rejet de greffe, d’une
maladie, etc.
Les études de survie nécessitent la connaissance d’un certain nombre de données. Lorsque le bilan de
l’étude est alisé à une certaine date, appelée date de point, on doit disposer pour chaque sujet des
données suivantes :
- la date d’origine qui est la date d’entrée du patient dans l’étude, à partir de laquelle la surveillance a
commencé. Cette date peut correspondre suivant le schéma de l’étude à la date de randomisation,
d’opération, au début du traitement, au diagnostic de la maladie… Ces dates d’origine seront
différentes pour chaque malade.
- la date des dernières nouvelles qui est la date la plus récente à laquelle on a pu avoir des nouvelles
du sujet quant au critère étudié (mort/vivant, surdité/non surdité…). Cette date correspond à la date
de la dernière consultation pour les sujets encore vivants ou à la date de décès pour les sujets décédés.
A cette date de dernières nouvelles correspond pour chaque sujet un état qui correspond au critère
étudié (vivant/mort,…).
- A partir de la date des dernières nouvelles, de la date d’origine et de l’état du sujet quant au critère
étudié, il est possible de définir :
- Le recul : c’est le délai qui sépare la date d’origine et la date de point. Ce délai situe le sujet dans le
temps par rapport à la date de l’analyse. Les sujets qui ont un recul identique ont la même date
d’origine. Les reculs minimum et maximum de l’échantillon de sujet suivis définissent
« l'ancienneté » de la série.
- Le temps de participation : c’est le délai qui correspond à toute la durée de la surveillance et qui
sera utilisé pour établir la courbe de survie. Si la date des dernières nouvelles est antérieure à la
date de point, c’est cette date qui sera utilisée pour calculer le temps de participation. Si la date des
dernières nouvelles est postérieure à la date de point, c’est cette date qui sera utilisée pour calculer
le temps de participation. Si le sujet est décédé à la date de point, le temps de participation mesure
sa survie exacte ; si le sujet est vivant, ce délai est inférieur à sa durée de survie. Dans ce cas, les
données sont dites censurées à droite. Les données « censurées à droite » peuvent correspondre à
deux sortes de sujets : les perdus de vue qui échappent à la surveillance régulière dont ils devraient
faire l’objet (il est important de les dénombrer, car les analyses peuvent alors être faussées) ; les
exclus vivants qui sont des sujets suivis régulièrement et vivants à la date de point.
Cours
7
2008/2009 2
Exemple : étude de survie débutée le 1
er
janvier 1977 avec une date de point le 1
er
juin 1978
Tableau I : Différentes données d’une étude survie, exemple.
Données de base
Sujet Date d’origine
(DO)
Dernières nouvelles
(DDN)
Etat à la
DDN
Etat à la date de
point
Temps de
participation
Recul
(01/06/78-DO)
I
II
III
IV
V
VI
VII
01/77
03/77
05/77
05/77
06/77
07/77
08/77
10/77
07/78
02/78
08/77
05/78
01/78
03/78
DCD
DCD
VV
DCD
VV
DCD
VV
DCD
VV
?
DCD
?
DCD
?
9
15
9
3
11
6
7
17
15
13
13
12
11
10
Remarque : les données sont censurées à droite pour les sujets II, III, V et VII. Pour le sujet II, on n’a pas
à tenir compte de ce qui se passe au-delà de la date de point puisque la surveillance est censée s’arrêter le
01/06/78 date de l’analyse ; il sera considéré vivant à la date de point (exclu-vivant). L’état des sujets III,
V, VII est inconnu à la date de point (perdus de vue).
Figure 1 : représentation graphique.
A partir de ces données, il va être possible de tracer une courbe de survie. Les méthodes les plus simples
pour établir des courbes de survie sont la méthode de Kaplan-Meier et la méthode actuarielle (voir plus
bas). Elles permettent de répondre aux principaux objectifs :
- descriptif :
Lorsque l’on désire décrire la survie d’une certaine population de malades, ces méthodes permettent
d’estimer principalement la survie médiane et le taux de survie à un temps donné (par exemple, taux de
survie à 5 ans d’un diagnostic de cancer).
- comparatif :
Ces méthodes permettent de comparer des groupes, notamment dans le cadre d’essais thérapeutiques. On
peut par exemple souhaiter démontrer que la survie d’un groupe de patients ayant bénéficié d’un nouveau
traitement est significativement meilleure que celle d’un groupe traité par le traitement de référence. Cette
comparaison univariée fait appel à des tests dérivés du test du chi². Le test le plus classiquement utilisé est
le test du logrank ou certains tests dérivés (Mantel-Cox, Tarone-Ware, Breslow, ou Peto-Prentice). La
comparaison simple de courbes de survie suppose qu’elles ne se croisent pas.
Une autre méthode d’analyse de la survie est basée sur un modèle de Cox. Ce modèle permet d’expliquer
la survenue d’un événement qualitatif au cours du temps (comme le décès) par une (analyse univariée) ou
plusieurs (analyse multivariée) variables explicatives.
Date de début d’étude Date de point
?
01/06/78
01/01/77
I
II
III
IV
V
VI
VII
?
?
Cours
7
2008/2009 3
1. Méthode de Kaplan-Meier
Une étude de survie nécessite pour chaque patient la connaissance d’un état (vivant ou mort par exemple)
et d’un délai de survie.
Les courbes de survie de Kaplan-Meïer sont représentées par un graphique en marche d’escalier de
hauteurs inégales, la survenue d’un ou plusieurs décès à une me date représente la verticale d’une
marche (la hauteur de la marche proportionnelle au nombre d’événements survenus).
A partir des données précédentes (tableau I), on peut construire le tableau suivant en classant les sujets
dans l’ordre croissant de leur temps de participation en indiquant leur état pour chacun d’eux. Le taux de
survie cumulée est recalculé chaque fois q’un événement survient.
Tableau II : Survie (méthode de Kaplan-Meier), exemple.
Temps de
participation
Etat Vivants au début du
temps (a)
Décédés (b)
Probabilité de survie
(a-b)/a
Taux de survie
cumulée
3 DCD 7 1 (7-1)/7=0.857 0.857
6 DCD 6 1 (6-1)/6=0.833 0.857x0.833=0.714
7 VV 5 0 1 0.714x1=0.714
9 DCD 4 1 (4-1)/4=0.75 0.714x0.75=0.536
9 VV 4 0 1 0.536
11 VV 4 0 1 0.536
15 VV 4 0 1 0.536
Ce tableau permet de construire la représentation graphique suivante :
0
0.2
0.4
0.6
0.8
1
0 2 4 6 8 10 12 14 16
Temps en mois
Taux de survie
Figure 2 : courbe de survie de Kaplan-Meier.
On obtient comme attendu 3 marches d’escalier correspondant aux 3 décès survenus à des temps de
participation différents (fortuitement les marches sont à intervalle régulier : décès à 3, 6 et 9 mois).
2. Méthode actuarielle
Dans ce cas, les taux de survie sont également estimés par un calcul des probabilités conditionnelles mais
les intervalles de temps ne sont plus déterminés par la survenue de chaque décès : on fixe a priori leur
Cours
7
2008/2009 4
taille (semaine, mois, semestre ou année…). On obtient ainsi des courbes de survie actuarielle, avec un
aspect de segments de droite reliant des points situés à intervalles réguliers au cours du temps.
Pour chaque sujet, on situe la fin de son histoire connue dans l’un des intervalle [t
i
, t
i+1
[ en fonction de son
délai de participation.
Pour chaque intervalle de temps [t
i
, t
i+1
[, on précise :
- le nombre de sujets vivants au début de l’intervalle juste avant l’instant t
i
: Vi,
- le nombre de sujets décédés dans l’intervalle de temps [t
i
, t
i+1
[ (sans prendre en compte t
i+1
) : D
i
,
- le nombre de sujets vivants aux dernières nouvelles dont le temps de participation s’arrête dans
l’intervalle [t
i
, t
i+1
[ : L
i
.
En raison de la longueur des intervalles, le nombre N
i
de sujets exposés au risque de décès entre t
i
et t
i+1
n’est pas égal au nombre de sujets vivants au début de cet intervalle. Certains sujets sont vivants aux
dernières nouvelles et ont un temps de participation compris entre t
i
et t
i+1
. Ces sujets ne sont donc
exposés au risque de décès que durant la portion d’intervalle pendant laquelle ils étaient encore en
observation. Sous l’hypothèse d’une distribution uniforme des exclusions et des décès dans chaque
intervalle, on peut admettre que les sujets dont l’histoire est censurée dans l’intervalle [t
i
, t
i+1
[ ont été en
moyenne exposés au risque de décès pendant la moitié de l’intervalle. On ne les prendra donc en compte
que pour moitié : N
i
=V
i
-L
i
/2.
La probabilité de survie conditionnelle juste avant l’instant t
i+1
sachant que l’on était vivant en t
i
peut être
estimée par la formule suivante : S
ti+1|ti
= (N
i
-D
i
)/N
i
De la même manière que pour la thode de Kaplan-Meier, la probabilité de survie au temps ti+1 est
égale à : S
ti+1
= S
ti
x S
ti+1|ti
Dans la méthode actuarielle, on estime la survie à chaque borne supérieure des intervalles constitués a
priori.
En mettant en œuvre cette méthode à partir des mêmes données que précédemment et en découpant
arbitrairement le temps en période de 4 mois :
Le sujet I est DCD dans l’intervalle 8-12
II VV 12-16
III VV 8-12
IV DCD 0-4
V VV 8-12
VI DCD 4-8
VII VV 4-8
On peut alors remplir le tableau suivant :
Tableau III : Survie (méthode actuarielle), exemple.
Intervalle i
Bornes
ti , ti+1
Vi Di Li Ni Sti+1|ti S ti+1
1 [0,4[ 7 1 0 7 (7-1)/7=0.857 0.857
2 [4,8[ 6 1 1 5.5 (5.5-1)/5.5=0.818 0.857x0.818=0.701
3 [8,12[ 4 1 2 3 (3-1)/3=0.667 0.701x0.667=0.468
4 [12,16[ 1 0 1 0.5 (0.5-0)/0.5=1 0.468x1=0.468
Cours
7
2008/2009 5
0
0.5
1
0 4 8 12 16
Temps de participation (mois)
Taux de survie
Figure 3 : courbe de survie actuarielle.
3. Modèle de Cox
Parmi les modèles multivariés d’analyse des durées de survie, le plus utilisé est le modèle de Cox. Il permet
de calculer une courbe de survie avec un ajustement sur l’influence de plusieurs variables. Ces variables,
qualitatives ou quantitatives, peuvent être choisies ou sélectionnées par des procédures dites « pas-à-pas ».
Pour chacune des variables présentes dans le modèle final, on obtient une estimation du risque relatif
ajusté (hazard ratio) de survenue du décès en présence de la variable, et de son intervalle de confiance. Le
«rapport de hasard» (hazard ratio) égal au risque relatif instantané chaque moment) de décès ajusté sur
l’ensemble des variables explicatives introduites dans le modèle. Cela implique l’hypothèse que le risque de
décès dans les différents groupes d’étude est constant dans le temps et similaire dans tous les sous-
groupes.
Lecture critique :
Au cours de la lecture d’un article utilisant les thodes de survie, les éléments spécifiques suivants
doivent être lus avec attention :
- L'estimation d'une durée de vie moyenne n'est appropriée qu'en l'absence de données censurées. En
leur présence c'est la médiane (délai de survie pour lequel on observe une mortalité de 50 % de la
population de sujets inclus dans l'étude) qu'il convient de prendre. Une médiane de survie peut
devenir imprécise si peu d'événements ont lieu dans le temps avant et après celle-ci.
- L'utilisation des méthodes d’analyse des données censurées suppose que le risque de décès soit
constant pendant toute la durée de l'étude.
- Il est recommandé de faire figurer à différents temps sur les courbes de survie, le nombre de sujets
toujours à risque ou un intervalle de confiance afin d’évaluer rapidement la précision de la
courbe à ces temps. Attention à ne pas interpréter une courbe de survie sans tenir compte du
nombre de sujets à risque encore inclus au moment de la fin du suivi. La partie droite de la courbe
(la queue de la distribution) devient instable si peu de sujets à risque sont encore présents.
- La comparaison simple de courbes de survie suppose qu’elles ne se croisent pas.
1 / 11 100%