m é t h o d o l o g i e Théorie et pratique des essais thérapeutiques en onco-hématologie Épisode 2 Theory and practice of clinical trials - Episode 2 N. Mounier* L ors du premier épisode de cette chronique, nous avons vu comment construire un essai thérapeutique en onco-hématologie. Nous allons maintenant aborder la question de sa conduite. Ces deux étapes peuvent paraître triviales, mais elles sont d’une importance considérable, car elles représentent plus de 80 % du temps et du budget alloués à l’essai et conditionnent sa réussite. COnTRÔleR les RIsques D’eRReuR Les résultats d’un essai thérapeutique s’expriment en termes de fréquence de survenue de l’événement d’intérêt (réponse, toxicité, décès). C’est simple lorsqu’il s’agit d’un taux de réponse ou de toxicité, un peu plus complexe pour les données de survie. Dans ce dernier cas, on considère un couple (délai ; survenue d’un événement) ; l’événement pouvant être par exemple le décès (survie globale) ou la progression/rechute (survie sans progression). On exprime alors la probabilité de survie à un temps donné. Quoi qu’il en soit, chaque probabilité observée doit être précisée par son intervalle de confiance, qui représente l’intervalle à l’intérieur duquel se situerait cette probabilité 95 fois sur 100 si l’essai thérapeutique était répété 100 fois sur une population identique. * Département d’onco-hématologie, CHU l’Archet, Nice. 74 Lorsque deux traitements sont comparés, la différence observée peut être seulement due au hasard des fluctuations d’échantillonnage. L’expérimentateur court donc deux risques : le risque alpha (type I, faux positif) de conclure que les traitements sont différents, alors qu’ils sont identiques, et le risque bêta (type II, faux négatif) de conclure que les traitements sont identiques, alors qu’ils sont différents. Le risque alpha est généralement fixé à 5 %. Cette valeur est arbitraire et le résultat de tout test statistique doit être précisé par le seuil de signification (p), qui estime la probabilité que la différence observée soit due aux fluctuations d’échantillonnage. Le risque bêta a une importance fondamentale pour calculer le nombre de sujets à inclure. En effet, un effectif important et une forte différence entre les traitements diminuent ce risque de faux négatif. Il est donc essentiel, avant de commencer l’essai, de calculer l’effectif nécessaire pour contrôler ce risque. Le tableau ci-dessous montre le nombre de patients nécessaire pour détecter des différences de survie à deux ans en fonction de bêta. Ainsi, lorsqu’un essai conclut à l’absence de différence significative, deux explications sont envisageables : soit il n’y a pas de différence entre les deux traitements, soit l’effectif était trop petit pour détecter la différence existant réellement (bêta trop grand, manque de puissance). Tableau. Effectifs nécessaires en fonction de l’écart attendu et du risque bêta (alpha = 0,05, test bila­ téral). Survie à 2 ans 0,05 0,10 40 % versus 60 % 350 285 40 % versus 55 % 565 460 40 % versus 50 % 1 145 925 40 % versus 45 % 4 095 3 310 Correspondances en Onco-hématologie - Vol. II - n° 2 - avril-mai-juin 2007 Théorie et pratique des essais thérapeutiques en onco-hématologie Optimiser la qualité des données Pour chaque investigateur-coordinateur, en charge de l’écriture du cahier de recueil des données, la tentation est fréquente de vouloir collecter un maximum de données avec des cahiers d’observation de plus de 100 pages ayant l’ambition d’être absolument exhaustifs. En fait, plus les informations sont nombreuses, plus elles courent le risque d’être altérées ou inexploitables. Par ailleurs, elles vont être extrêmement coûteuses en temps et en argent, car il va falloir payer le technicien d’étude clinique qui aura à “monitorer” l’étude en se rendant sur le site pour vérifier les données et clarifier les imprécisions. Sur le plan méthodologique, le cahier d’observation doit essentiellement permettre de déterminer l’éligibilité du patient, l’observance du traitement, et de mesurer les critères de jugement principal et secondaire. En pratique, les cahiers comportent trois sections : caractéristiques hématologiques initiales, traitements et toxicités, évaluation en fin de traitement et au cours du suivi. Le niveau de monitoring peut être adapté au niveau de l’étude : toutes les variables pour les phases I et seulement les principales pour les phases III. Les cahiers associent, autant que possible, des items à cocher afin de faciliter la saisie en ligne et limiter les possibilités d’interprétation personnelle. En revanche, un espace de texte en clair est réservé pour permettre à l’investigateur d’apporter des précisions. Par ailleurs, la double validation de la saisie sur logiciel et la validation médicale sont garantes de la qualité du recueil des données. Programmer les analyses intermédiaires En onco-hématologie, il arrive que l’investigateur ait des nouvelles récentes concernant uniquement un sous-groupe de patients non représentatifs de la population étudiée. Par exemple, les patients revus dans les trois derniers mois peuvent être soit des patients dont la consultation était prévue par le protocole, soit des patients en rechute ou présentant une complication. Pour limiter ce biais, une date de point est déterminée arbitrairement, au-delà de laquelle on ne tient pas compte des informations lors de l’analyse. Les analyses intermédiaires non planifiées constituent un autre difficile problème. Certes, des considérations éthiques liées à l’expérimentation sur l’homme nécessitent l’arrêt précoce de l’essai en cas de différence d’efficacité ou de toxicité importante. Cependant, plus les données sont réévaluées, plus elles sont exposées à des fluctuations statistiques pouvant conduire à des conclusions faussement positives (augmentation du risque alpha en fonction du nombre d’analyses). Une solution est de planifier, lors du calcul de l’effectif, le nombre d’analyses intermédiaires et de déterminer les seuils de signification permettant de préserver un risque alpha de 5 % sur l’ensemble de l’essai (par exemple pour deux analyses intermédiaires, p = 0,02 à chacune). Bien entendu, une analyse intermédiaire doit être faite sur des données complètes. On prend, par exemple, les deux premières années d’inclusion (pour une étude qui dure quatre ans) et on se donne six mois pour collecter les données afin de ne pas s’exposer à une conclusion erronée, comme le montre la figure. Cas de la qualité de vie (QDV) Figure. Effet des données manquantes sur la survie globale. Courbes en pointillé : données incomplètes ; courbes en plein : données complètes. Les données manquantes (mal actualisées) peuvent faire croire, à tort, à une différence. Correspondances en Onco-hématologie - Vol. II - n° 2 - avril-mai-juin 2007 Durant ces dernières années, les essais thérapeutiques n’ont plus uniquement été centrés sur le contrôle de la maladie, mais ils ont progressivement intégré un concept plus large de la santé. Ce concept est sous-tendu par la défi- 75 m é t h o d o l o g i e nition de la santé donnée par l’OMS : “La santé n’est pas seulement l’absence d’infirmité ou de maladie, mais aussi un état de bien-être physique, psychique et social.” Ainsi, la santé peut être considérée comme un critère composite combinant le bien-être physique, fonctionnel, émotionnel et social avec le contrôle d’un état pathologique. L’élargissement du concept de santé a progressivement entraîné l’intégration de l’étude, comme critère de jugement secondaire, dans les essais thérapeutiques. Cette approche tient aussi compte d’une évolution de la relation médecin-malade qui va dans le sens d’un meilleur échange dans la compréhension et la réalisation des traitements. L’étude de la QDV repose sur la mesure de ses différents domaines en utilisant des méthodes psychométriques et des questionnaires remplis par le patient lui-même à des temps précis, en général liés aux visites de surveillance. L’intérêt de cette approche est sa facilité d’application aux grandes études multicentriques. Sa principale limite est liée aux difficultés d’interprétation des scores estimés par les questionnaires, peu familiers au médecin et au patient. Actuellement, les difficultés d’analyse des données de QDV apparaissent. Elles sont de trois types. La première est liée au problème des comparaisons multiples. En effet, les données de QDV sont, d’une part, longitudinales, c’est- à-dire mesurées de manière répétitive au cours du temps et, d’autre part, multidimensionnelles, c’est-à-dire composées par les nombreux domaines de la santé. La deuxième difficulté est liée à la présence de données manquantes, principalement dans les essais avec une longue période de surveillance. Plus particulièrement, le mécanisme des données manquantes n’est vraisemblablement pas aléatoire mais informatif, tenant au fait que les patients ne répondant pas au questionnaire peuvent souffrir de la toxicité du traitement ou de la reprise évolutive de la maladie. Enfin, la dernière difficulté consiste en l’intégration des données de survie dans l’analyse des données de QDV. Dans les situations où la survie et la QDV sont supérieures d’un groupe à l’autre, le choix est simple. En revanche, un dilemme apparaît lors de divergences : par exemple, un traitement peut être plus efficace, mais aussi plus toxique. Nous verrons lors d’un prochain épisode que l’ensemble des travaux actuels dans le domaine de l’analyse des données de survie laisse des possibilités d’intégration de la QDV. En particulier, la méthode Q-TWiST (Quality-adjusted Time Without Symptom and Toxicity) permet de limiter simultanément ces difficultés. ■ lectuRe Recommandée • Molenberghs G, Kenward M. Missing data in clinical studies. Wiley, 2007. Correspondances en Onco-hématologie vous souhaite de tout cœur un bel été et vous remercie de la fidélité de votre engagement 76 Correspondances en Onco-hématologie - Vol. II - n° 2 - avril-mai-juin 2007