L Théorie et pratique des essais thérapeutiques en onco-hématologie

publicité
m é t h o d o l o g i e
Théorie et pratique
des essais thérapeutiques
en onco-hématologie
Épisode 2
Theory and practice of clinical trials - Episode 2
N. Mounier*
L
ors du premier épisode de cette chronique,
nous avons vu comment construire un
essai thérapeutique en onco-hématologie.
Nous allons maintenant aborder la question de
sa conduite. Ces deux étapes peuvent paraître
triviales, mais elles sont d’une importance considérable, car elles représentent plus de 80 % du
temps et du budget alloués à l’essai et conditionnent sa réussite.
COnTRÔleR les RIsques D’eRReuR
Les résultats d’un essai thérapeutique s’expriment en termes de fréquence de survenue de
l’événement d’intérêt (réponse, toxicité, décès).
C’est simple lorsqu’il s’agit d’un taux de réponse
ou de toxicité, un peu plus complexe pour les données de survie. Dans ce dernier cas, on considère
un couple (délai ; survenue d’un événement) ;
l’événement pouvant être par exemple le décès
(survie globale) ou la progression/rechute (survie
sans progression). On exprime alors la probabilité
de survie à un temps donné.
Quoi qu’il en soit, chaque probabilité observée
doit être précisée par son intervalle de confiance,
qui représente l’intervalle à l’intérieur duquel
se situerait cette probabilité 95 fois sur 100 si
l’essai thérapeutique était répété 100 fois sur
une population identique.
* Département d’onco-hématologie,
CHU l’Archet, Nice.
74
Lorsque deux traitements sont comparés, la
différence observée peut être seulement due
au hasard des fluctuations d’échantillonnage.
L’expérimentateur court donc deux risques : le
risque alpha (type I, faux positif) de conclure que
les traitements sont différents, alors qu’ils sont
identiques, et le risque bêta (type II, faux négatif)
de conclure que les traitements sont identiques,
alors qu’ils sont différents. Le risque alpha est
généralement fixé à 5 %. Cette valeur est arbitraire et le résultat de tout test statistique doit
être précisé par le seuil de signification (p), qui
estime la probabilité que la différence observée
soit due aux fluctuations d’échantillonnage.
Le risque bêta a une importance fondamentale
pour calculer le nombre de sujets à inclure. En
effet, un effectif important et une forte différence
entre les traitements diminuent ce risque de faux
négatif. Il est donc essentiel, avant de commencer l’essai, de calculer l’effectif nécessaire pour
contrôler ce risque. Le tableau ci-dessous montre
le nombre de patients nécessaire pour détecter
des différences de survie à deux ans en fonction
de bêta.
Ainsi, lorsqu’un essai conclut à l’absence de
différence significative, deux explications sont
envisageables : soit il n’y a pas de différence entre
les deux traitements, soit l’effectif était trop petit
pour détecter la différence existant réellement
(bêta trop grand, manque de puissance).
Tableau. Effectifs nécessaires en fonction de l’écart attendu et du risque bêta (alpha = 0,05, test bila­
téral).
Survie à 2 ans
0,05
0,10
40 % versus 60 %
350
285
40 % versus 55 %
565
460
40 % versus 50 %
1 145
925
40 % versus 45 %
4 095
3 310
Correspondances en Onco-hématologie - Vol. II - n° 2 - avril-mai-juin 2007
Théorie et pratique des essais thérapeutiques en onco-hématologie
Optimiser la qualité des données
Pour chaque investigateur-coordinateur, en charge
de l’écriture du cahier de recueil des données, la
tentation est fréquente de vouloir collecter un
maximum de données avec des cahiers d’observation de plus de 100 pages ayant l’ambition
d’être absolument exhaustifs. En fait, plus les
informations sont nombreuses, plus elles courent
le risque d’être altérées ou inexploitables. Par
ailleurs, elles vont être extrêmement coûteuses
en temps et en argent, car il va falloir payer le
technicien d’étude clinique qui aura à “monitorer” l’étude en se rendant sur le site pour vérifier
les données et clarifier les imprécisions. Sur le
plan méthodologique, le cahier d’observation
doit essentiellement permettre de déterminer
l’éligibilité du patient, l’observance du traitement,
et de mesurer les critères de jugement principal et
secondaire. En pratique, les cahiers comportent
trois sections : caractéristiques hématologiques
initiales, traitements et toxicités, évaluation en
fin de traitement et au cours du suivi. Le niveau
de monitoring peut être adapté au niveau de
l’étude : toutes les variables pour les phases I et
seulement les principales pour les phases III. Les
cahiers associent, autant que possible, des items
à cocher afin de faciliter la saisie en ligne et limiter les possibilités d’interprétation personnelle.
En revanche, un espace de texte en clair est réservé
pour permettre à l’investigateur d’apporter des
précisions. Par ailleurs, la double validation de la
saisie sur logiciel et la validation médicale sont
garantes de la qualité du recueil des données.
Programmer les analyses
intermédiaires
En onco-hématologie, il arrive que l’investigateur
ait des nouvelles récentes concernant uniquement
un sous-groupe de patients non représentatifs de
la population étudiée. Par exemple, les patients
revus dans les trois derniers mois peuvent être
soit des patients dont la consultation était prévue
par le protocole, soit des patients en rechute ou
présentant une complication. Pour limiter ce biais,
une date de point est déterminée arbitrairement,
au-delà de laquelle on ne tient pas compte des
informations lors de l’analyse.
Les analyses intermédiaires non planifiées
constituent un autre difficile problème. Certes,
des considérations éthiques liées à l’expérimentation sur l’homme nécessitent l’arrêt précoce
de l’essai en cas de différence d’efficacité ou de
toxicité importante. Cependant, plus les données
sont réévaluées, plus elles sont exposées à des
fluctuations statistiques pouvant conduire à des
conclusions faussement positives (augmentation
du risque alpha en fonction du nombre d’analyses). Une solution est de planifier, lors du calcul
de l’effectif, le nombre d’analyses intermédiaires et de déterminer les seuils de signification
permettant de préserver un risque alpha de 5 %
sur l’ensemble de l’essai (par exemple pour deux
analyses intermédiaires, p = 0,02 à chacune).
Bien entendu, une analyse intermédiaire doit être
faite sur des données complètes. On prend, par
exemple, les deux premières années d’inclusion
(pour une étude qui dure quatre ans) et on se
donne six mois pour collecter les données afin
de ne pas s’exposer à une conclusion erronée,
comme le montre la figure.
Cas de la qualité de vie (QDV)
Figure. Effet des données manquantes sur la survie globale.
Courbes en pointillé : données incomplètes ; courbes en plein : données complètes. Les
données manquantes (mal actualisées) peuvent faire croire, à tort, à une différence.
Correspondances en Onco-hématologie - Vol. II - n° 2 - avril-mai-juin 2007
Durant ces dernières années, les essais thérapeutiques n’ont plus uniquement été centrés
sur le contrôle de la maladie, mais ils ont progressivement intégré un concept plus large de
la santé. Ce concept est sous-tendu par la défi-
75
m é t h o d o l o g i e
nition de la santé donnée par l’OMS : “La santé
n’est pas seulement l’absence d’infirmité ou de
maladie, mais aussi un état de bien-être physique, psychique et social.” Ainsi, la santé peut
être considérée comme un critère composite
combinant le bien-être physique, fonctionnel,
émotionnel et social avec le contrôle d’un état
pathologique. L’élargissement du concept de
santé a progressivement entraîné l’intégration de
l’étude, comme critère de jugement secondaire,
dans les essais thérapeutiques. Cette approche
tient aussi compte d’une évolution de la relation
médecin-malade qui va dans le sens d’un meilleur
échange dans la compréhension et la réalisation
des traitements.
L’étude de la QDV repose sur la mesure de ses
différents domaines en utilisant des méthodes
psychométriques et des questionnaires remplis
par le patient lui-même à des temps précis, en
général liés aux visites de surveillance. L’intérêt
de cette approche est sa facilité d’application
aux grandes études multicentriques. Sa principale limite est liée aux difficultés d’interprétation
des scores estimés par les questionnaires, peu
familiers au médecin et au patient.
Actuellement, les difficultés d’analyse des données de QDV apparaissent. Elles sont de trois
types. La première est liée au problème des
comparaisons multiples. En effet, les données
de QDV sont, d’une part, longitudinales, c’est-
à-dire mesurées de manière répétitive au cours
du temps et, d’autre part, multidimensionnelles,
c’est-à-dire composées par les nombreux domaines de la santé. La deuxième difficulté est liée à la
présence de données manquantes, principalement
dans les essais avec une longue période de surveillance. Plus particulièrement, le mécanisme des
données manquantes n’est vraisemblablement
pas aléatoire mais informatif, tenant au fait que
les patients ne répondant pas au questionnaire
peuvent souffrir de la toxicité du traitement ou
de la reprise évolutive de la maladie. Enfin, la
dernière difficulté consiste en l’intégration des
données de survie dans l’analyse des données
de QDV. Dans les situations où la survie et la QDV
sont supérieures d’un groupe à l’autre, le choix
est simple. En revanche, un dilemme apparaît lors
de divergences : par exemple, un traitement peut
être plus efficace, mais aussi plus toxique.
Nous verrons lors d’un prochain épisode que
l’ensemble des travaux actuels dans le domaine
de l’analyse des données de survie laisse des
possibilités d’intégration de la QDV. En particulier, la méthode Q-TWiST (Quality-adjusted Time
Without Symptom and Toxicity) permet de limiter
simultanément ces difficultés.
■
lectuRe
Recommandée
• Molenberghs G, Kenward M. Missing data in clinical studies. Wiley, 2007.
Correspondances en Onco-hématologie
vous souhaite de tout cœur un bel été et vous remercie
de la fidélité de votre engagement
76
Correspondances en Onco-hématologie - Vol. II - n° 2 - avril-mai-juin 2007
Téléchargement