to get the file

Cours

7

–

2008/2009 1

C

OURS

7

:

ETUDES

DE

SURVIE

–

ETUDES

PRONOSTIQUES

&

LECTURE

CRITIQUE

Julien Mancini, Stéphane Robitail

A- Les études de survie

Les études de survie ne constituent pas un type d’enquête au même titre que, par exemple, les enquêtes

cas-témoins. Ce type d’étude correspond à l’utilisation de méthodes d’analyse particulières, lorsque le

critère de jugement est la survenue d’un décès ou d’un événement de santé particulier. Ces méthodes

permettent d’étudier le délai de survenue d’un événement dont la survenue n’est pas constante. En

effet, l’objectif d’une étude peut être de savoir si une maladie va entraîner un décès ou pas ; mais plus

fréquemment, on souhaite également savoir quand cet éventuel décès va survenir.

Les méthodes d’analyse des données de survie ont été à l’origine utilisée pour étudier la survie de patients

(délai de survenue éventuelle de l’événement décès), mais elles peuvent être utilisées pour étudier toutes les

données dites censurées à droite : c’est à dire l’apparition au cours du temps d’un événement avec des

observations « incomplètes » constituées par les sujets chez qui l’événement n’est pas encore survenu lors

de l’analyse.

Les événements qui peuvent être pris en compte dans ce type d’analyse sont des événements qualitatifs

binaires (présence/absence) qui surviennent au cours du temps de manière non récurrente : le décès, mais

aussi la survenue d’une surdité, d’une récidive d’un cancer, d’une métastase, d’un rejet de greffe, d’une

maladie, etc.

Les études de survie nécessitent la connaissance d’un certain nombre de données. Lorsque le bilan de

l’étude est réalisé à une certaine date, appelée date de point, on doit disposer pour chaque sujet des

données suivantes :

- la date d’origine qui est la date d’entrée du patient dans l’étude, à partir de laquelle la surveillance a

commencé. Cette date peut correspondre suivant le schéma de l’étude à la date de randomisation,

d’opération, au début du traitement, au diagnostic de la maladie… Ces dates d’origine seront

différentes pour chaque malade.

- la date des dernières nouvelles qui est la date la plus récente à laquelle on a pu avoir des nouvelles

du sujet quant au critère étudié (mort/vivant, surdité/non surdité…). Cette date correspond à la date

de la dernière consultation pour les sujets encore vivants ou à la date de décès pour les sujets décédés.

A cette date de dernières nouvelles correspond pour chaque sujet un état qui correspond au critère

étudié (vivant/mort,…).

- A partir de la date des dernières nouvelles, de la date d’origine et de l’état du sujet quant au critère

étudié, il est possible de définir :

- Le recul : c’est le délai qui sépare la date d’origine et la date de point. Ce délai situe le sujet dans le

temps par rapport à la date de l’analyse. Les sujets qui ont un recul identique ont la même date

d’origine. Les reculs minimum et maximum de l’échantillon de sujet suivis définissent

« l'ancienneté » de la série.

- Le temps de participation : c’est le délai qui correspond à toute la durée de la surveillance et qui

sera utilisé pour établir la courbe de survie. Si la date des dernières nouvelles est antérieure à la

date de point, c’est cette date qui sera utilisée pour calculer le temps de participation. Si la date des

dernières nouvelles est postérieure à la date de point, c’est cette date qui sera utilisée pour calculer

le temps de participation. Si le sujet est décédé à la date de point, le temps de participation mesure

sa survie exacte ; si le sujet est vivant, ce délai est inférieur à sa durée de survie. Dans ce cas, les

données sont dites censurées à droite. Les données « censurées à droite » peuvent correspondre à

deux sortes de sujets : les perdus de vue qui échappent à la surveillance régulière dont ils devraient

faire l’objet (il est important de les dénombrer, car les analyses peuvent alors être faussées) ; les

exclus vivants qui sont des sujets suivis régulièrement et vivants à la date de point.

Cours

7

–

2008/2009 2

Exemple : étude de survie débutée le 1

er

janvier 1977 avec une date de point le 1

er

juin 1978

Tableau I : Différentes données d’une étude survie, exemple.

Données de base

Sujet Date d’origine

(DO)

Dernières nouvelles

(DDN)

Etat à la

DDN

Etat à la date de

point

Temps de

participation

Recul

(01/06/78-DO)

I

II

III

IV

V

VI

VII

01/77

03/77

05/77

06/77

07/77

08/77

10/77

07/78

02/78

08/77

05/78

01/78

03/78

DCD

VV

DCD

VV

DCD

VV

DCD

VV

?

DCD

?

DCD

?

9

15

9

3

11

6

7

17

15

13

12

11

10

Remarque : les données sont censurées à droite pour les sujets II, III, V et VII. Pour le sujet II, on n’a pas

à tenir compte de ce qui se passe au-delà de la date de point puisque la surveillance est censée s’arrêter le

01/06/78 date de l’analyse ; il sera considéré vivant à la date de point (exclu-vivant). L’état des sujets III,

V, VII est inconnu à la date de point (perdus de vue).

Figure 1 : représentation graphique.

A partir de ces données, il va être possible de tracer une courbe de survie. Les méthodes les plus simples

pour établir des courbes de survie sont la méthode de Kaplan-Meier et la méthode actuarielle (voir plus

bas). Elles permettent de répondre aux principaux objectifs :

- descriptif :

Lorsque l’on désire décrire la survie d’une certaine population de malades, ces méthodes permettent

d’estimer principalement la survie médiane et le taux de survie à un temps donné (par exemple, taux de

survie à 5 ans d’un diagnostic de cancer).

- comparatif :

Ces méthodes permettent de comparer des groupes, notamment dans le cadre d’essais thérapeutiques. On

peut par exemple souhaiter démontrer que la survie d’un groupe de patients ayant bénéficié d’un nouveau

traitement est significativement meilleure que celle d’un groupe traité par le traitement de référence. Cette

comparaison univariée fait appel à des tests dérivés du test du chi². Le test le plus classiquement utilisé est

le test du logrank ou certains tests dérivés (Mantel-Cox, Tarone-Ware, Breslow, ou Peto-Prentice). La

comparaison simple de courbes de survie suppose qu’elles ne se croisent pas.

Une autre méthode d’analyse de la survie est basée sur un modèle de Cox. Ce modèle permet d’expliquer

la survenue d’un événement qualitatif au cours du temps (comme le décès) par une (analyse univariée) ou

plusieurs (analyse multivariée) variables explicatives.

Date de début d’étude Date de point

?

01/06/78

01/01/77

I

II

III

IV

V

VI

VII

†

?

†

?

Cours

7

–

2008/2009 3

1. Méthode de Kaplan-Meier

Une étude de survie nécessite pour chaque patient la connaissance d’un état (vivant ou mort par exemple)

et d’un délai de survie.

Les courbes de survie de Kaplan-Meïer sont représentées par un graphique en marche d’escalier de

hauteurs inégales, où la survenue d’un ou plusieurs décès à une même date représente la verticale d’une

marche (la hauteur de la marche proportionnelle au nombre d’événements survenus).

A partir des données précédentes (tableau I), on peut construire le tableau suivant en classant les sujets

dans l’ordre croissant de leur temps de participation en indiquant leur état pour chacun d’eux. Le taux de

survie cumulée est recalculé chaque fois q’un événement survient.

Tableau II : Survie (méthode de Kaplan-Meier), exemple.

Temps de

participation

Etat Vivants au début du

temps (a)

Décédés (b)

Probabilité de survie

(a-b)/a

Taux de survie

cumulée

3 DCD 7 1 (7-1)/7=0.857 0.857

6 DCD 6 1 (6-1)/6=0.833 0.857x0.833=0.714

7 VV 5 0 1 0.714x1=0.714

9 DCD 4 1 (4-1)/4=0.75 0.714x0.75=0.536

9 VV 4 0 1 0.536

11 VV 4 0 1 0.536

15 VV 4 0 1 0.536

Ce tableau permet de construire la représentation graphique suivante :

0

0.2

0.4

0.6

0.8

1

0 2 4 6 8 10 12 14 16

Temps en mois

Taux de survie

Figure 2 : courbe de survie de Kaplan-Meier.

On obtient comme attendu 3 marches d’escalier correspondant aux 3 décès survenus à des temps de

participation différents (fortuitement les marches sont à intervalle régulier : décès à 3, 6 et 9 mois).

2. Méthode actuarielle

Dans ce cas, les taux de survie sont également estimés par un calcul des probabilités conditionnelles mais

les intervalles de temps ne sont plus déterminés par la survenue de chaque décès : on fixe a priori leur

Cours

7

–

2008/2009 4

taille (semaine, mois, semestre ou année…). On obtient ainsi des courbes de survie actuarielle, avec un

aspect de segments de droite reliant des points situés à intervalles réguliers au cours du temps.

Pour chaque sujet, on situe la fin de son histoire connue dans l’un des intervalle [t

i

, t

i+1

[ en fonction de son

délai de participation.

Pour chaque intervalle de temps [t

i

, t

i+1

[, on précise :

- le nombre de sujets vivants au début de l’intervalle juste avant l’instant t

i

: Vi,

- le nombre de sujets décédés dans l’intervalle de temps [t

i

, t

i+1

[ (sans prendre en compte t

i+1

) : D

i

,

- le nombre de sujets vivants aux dernières nouvelles dont le temps de participation s’arrête dans

l’intervalle [t

i

, t

i+1

[ : L

i

.

En raison de la longueur des intervalles, le nombre N

i

de sujets exposés au risque de décès entre t

i

et t

i+1

n’est pas égal au nombre de sujets vivants au début de cet intervalle. Certains sujets sont vivants aux

dernières nouvelles et ont un temps de participation compris entre t

i

et t

i+1

. Ces sujets ne sont donc

exposés au risque de décès que durant la portion d’intervalle pendant laquelle ils étaient encore en

observation. Sous l’hypothèse d’une distribution uniforme des exclusions et des décès dans chaque

intervalle, on peut admettre que les sujets dont l’histoire est censurée dans l’intervalle [t

i

, t

i+1

[ ont été en

moyenne exposés au risque de décès pendant la moitié de l’intervalle. On ne les prendra donc en compte

que pour moitié : N

i

=V

i

-L

i

/2.

La probabilité de survie conditionnelle juste avant l’instant t

i+1

sachant que l’on était vivant en t

i

peut être

estimée par la formule suivante : S

ti+1|ti

= (N

i

-D

i

)/N

i

De la même manière que pour la méthode de Kaplan-Meier, la probabilité de survie au temps ti+1 est

égale à : S

ti+1

= S

ti

x S

ti+1|ti

Dans la méthode actuarielle, on estime la survie à chaque borne supérieure des intervalles constitués a

priori.

En mettant en œuvre cette méthode à partir des mêmes données que précédemment et en découpant

arbitrairement le temps en période de 4 mois :

Le sujet I est DCD dans l’intervalle 8-12

II VV 12-16

III VV 8-12

IV DCD 0-4

V VV 8-12

VI DCD 4-8

VII VV 4-8

On peut alors remplir le tableau suivant :

Tableau III : Survie (méthode actuarielle), exemple.

Intervalle i

Bornes

ti , ti+1

Vi Di Li Ni Sti+1|ti S ti+1

1 [0,4[ 7 1 0 7 (7-1)/7=0.857 0.857

2 [4,8[ 6 1 1 5.5 (5.5-1)/5.5=0.818 0.857x0.818=0.701

3 [8,12[ 4 1 2 3 (3-1)/3=0.667 0.701x0.667=0.468

4 [12,16[ 1 0 1 0.5 (0.5-0)/0.5=1 0.468x1=0.468

Cours

7

–

2008/2009 5

0

0.5

1

0 4 8 12 16

Temps de participation (mois)

Taux de survie

Figure 3 : courbe de survie actuarielle.

3. Modèle de Cox

Parmi les modèles multivariés d’analyse des durées de survie, le plus utilisé est le modèle de Cox. Il permet

de calculer une courbe de survie avec un ajustement sur l’influence de plusieurs variables. Ces variables,

qualitatives ou quantitatives, peuvent être choisies ou sélectionnées par des procédures dites « pas-à-pas ».

Pour chacune des variables présentes dans le modèle final, on obtient une estimation du risque relatif

ajusté (hazard ratio) de survenue du décès en présence de la variable, et de son intervalle de confiance. Le

«rapport de hasard» (hazard ratio) égal au risque relatif instantané (à chaque moment) de décès ajusté sur

l’ensemble des variables explicatives introduites dans le modèle. Cela implique l’hypothèse que le risque de

décès dans les différents groupes d’étude est constant dans le temps et similaire dans tous les sous-

groupes.

Lecture critique :

Au cours de la lecture d’un article utilisant les méthodes de survie, les éléments spécifiques suivants

doivent être lus avec attention :

- L'estimation d'une durée de vie moyenne n'est appropriée qu'en l'absence de données censurées. En

leur présence c'est la médiane (délai de survie pour lequel on observe une mortalité de 50 % de la

population de sujets inclus dans l'étude) qu'il convient de prendre. Une médiane de survie peut

devenir imprécise si peu d'événements ont lieu dans le temps avant et après celle-ci.

- L'utilisation des méthodes d’analyse des données censurées suppose que le risque de décès soit

constant pendant toute la durée de l'étude.

- Il est recommandé de faire figurer à différents temps sur les courbes de survie, le nombre de sujets

toujours à risque ou un intervalle de confiance afin d’évaluer rapidement la précision de la

courbe à ces temps. Attention à ne pas interpréter une courbe de survie sans tenir compte du

nombre de sujets à risque encore inclus au moment de la fin du suivi. La partie droite de la courbe

(la queue de la distribution) devient instable si peu de sujets à risque sont encore présents.

- La comparaison simple de courbes de survie suppose qu’elles ne se croisent pas.

6

7

8

9

10

11

to get the file

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

to get the file

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib