Méthodologie L’analyse en intention de traiter et analyse per protocole Sylvie Chabaud , Michel Cucherat EA3736, Faculté Laennec, rue Guillaume Paradin, BP 8071, 69 376 Lyon Cedex 08 Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017. Les essais thérapeutiques contrôlés font souvent état, lors de leur publication, d’une analyse en intention de traiter (ITT) et d’une analyse per protocole. Ces deux approches se distinguent par le nombre de patients pris en compte dans l’analyse. Cet article montre à travers différents exemples que seule l’analyse en intention de traiter donne des résultats non biaisés de l’effet du traitement. Nous verrons également que l’exclusion de patients présentant des données manquantes ne permet en rien de se rapprocher d’une analyse en intention de traitement. Mots clés : intention de traiter, per protocole, essai clinique L mt Tirés à part : S. Chabaud <[email protected]> 350 orsque l’on réalise un essai randomisé comparant deux traitements, chaque patient est inclus et suivi selon un protocole d’étude bien défini, ayant été approuvé par un CCPPRB (Comité consultatif de protection des personnes se prêtant à la recherche biomédicale). Néanmoins, malgré toute la vigilance des médecins investigateurs, il n’est pas impossible d’avoir quelques patients inclus à tort, des patients qui arrêtent l’étude en cours de route, des patients traités non conformément à ce que le tirage au sort avait décidé... Même si l’objectif de tous les intervenants de la recherche est de limiter de tels cas, la question demeure : comment doit-on analyser ces patients ? Différentes solutions sont possibles, notamment l’intention de traiter, qui consiste à prendre en compte tous les patients de l’essai, quel que soit leur écart au protocole. Pourtant, le maintien dans l’analyse de patients qui n’ont pas été traités en conformité avec le protocole, qui ont reçu par erreur le traitement de l’autre groupe ou qui ont eu un suivi incomplet, peut paraître dé- mt, vol. 10, n° 5, septembre-octobre 2004 raisonnable et ne pas permettre une estimation correcte de l’effet du traitement évalué. C’est ainsi que l’on définit une analyse dite per protocole, basée sur l’exclusion de tous ces patients pouvant « perturber » l’estimation de l’effet du traitement. L’objectif de cet article est de montrer que seule l’analyse en intention de traiter est synonyme d’absence de biais d’estimation de l’effet du traitement dans les études cherchant à mettre en évidence une différence entre des thérapeutiques. Populations analysées – Définitions Lorsque un patient est inclus dans un essai thérapeutique randomisé, il est alloué par tirage au sort à un groupe de traitement (nouvelle molécule ou traitement de référence). Il doit ensuite être suivi et évalué selon un protocole d’étude bien précis, identique pour tous les patients. Dans la vraie vie, les règles de traitement, de suivi et d’évaluation décrites dans le Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017. protocole ne sont jamais totalement respectées pour tous les patients. Il y a : • les patients qui n’ont pas été traités ou ceux qui ont reçu le traitement A alors qu’ils auraient dû recevoir le traitement B ; • les patients qui, à un moment du suivi, ont arrêté prématurément le traitement de l’essai ; • les patients qui ont reçu la moitié de la dose prévue ; • les patients qui ont pris un traitement concomitant interdit par le protocole ; • les patients qui n’auraient jamais dû être inclus dans l’essai car ils ne faisaient pas partie de la population cible de l’étude, etc. En fait, il existe de multiples raisons expliquant que le déroulement idéal n’existe pas. La question sous-jacente est finalement la suivante : Que fait-on de ces patients au moment de l’analyse de l’essai ? Doit-on tenir compte d’un patient traité deux mois sur les six prévus ? Ne va-t-il pas fausser les résultats du nouveau traitement ? Ou au contraire, s’il a reçu deux fois la dose préconisée, ne va-t-il pas surestimer l’effet du traitement ? La première idée venant à l’esprit serait de ne pas tenir compte de ces patients tous regroupés sous le terme de patients ayant au moins une « violation de protocole ». Une autre idée intéressante pourrait être de réaliser plusieurs analyses distinctes, avec puis sans ces patients, ou sans les patients ayant un type de violation précis et de comparer les résultats obtenus. Mais, on pourrait ainsi définir un grand nombre de populations d’analyse et, par conséquent, multiplier les résultats d’un même essai. Parmi toutes les populations que l’on peut définir, trois sont couramment utilisées. C’est ainsi que l’on différencie l’analyse en « intention de traiter » (intention-to treat) de l’analyse « per protocole » (per protocol) ou de l’analyse en « traitement reçu » (on treatment) : • l’analyse en intention de traiter consiste à analyser tous les patients dans le groupe où ils ont été randomisés ; • l’analyse per protocole consiste à analyser un sousgroupe de la population totale, c’est-à-dire de l’intention de traiter, incluant uniquement les patients en parfaite conformité avec le protocole ; • l’analyse en traitement reçu consiste à analyser les patients en fonction de la nature du traitement qu’ils ont réellement reçu. La figure 1 illustre la manière dont les patients sont pris en compte dans ces trois types d’analyse en fonction de la concordance ou non entre le traitement alloué par la randomisation et le traitement réellement pris par le patient. On voit bien que le nombre de patients dans l’analyse varie en fonction du type d’analyse, et que, par conséquent, les résultats seront différents d’une analyse à l’autre. Par exemple, les patients alloués A mais ayant reçu B sont considérés comme ayant reçu A dans l’analyse en intention de traiter. Pourquoi une telle idée ? Randomisation Allocation au traitement A Allocation au traitement B Traitement Traitement Traitement Traitement A reçu B reçu A reçu B reçu Intention de traiter A A B B Per protocole A - - B Traitement reçu A B A B Figure 1. Les différentes populations d’analyse pour la même étude. Pourquoi analyser en ITT ? Intention de traitement et conservation de la comparabilité des groupes L’analyse en intention de traiter comme nous l’avons vu précédemment concerne tous les patients randomisés dans le groupe où ils ont été randomisés : • qu’ils aient ou non reçu le traitement, • qu’ils aient ou non suivi le protocole, • qu’ils soient ou non évaluables pour le critère étudié. De par sa définition, il n’existe qu’une et qu’une seule analyse en intention de traiter pour un essai contrôlé donné et cette définition n’est en aucun cas subjective. La première conséquence issue de cette définition est le respect du tirage au sort. La randomisation dans un essai comparatif est le seul moyen d’assurer, en moyenne, la comparabilité des groupes à l’inclusion et par conséquent d’attribuer uniquement au traitement la différence observée en fin d’essai [1]. Pourquoi randomiser tous les patients et ainsi créer des groupes équitables en termes de risque si ensuite on supprime certains patients ? Le premier biais potentiel engendré par l’exclusion de sujets comme dans l’analyse per protocole est l’éventuelle destruction de cette comparabilité initiale des groupes de traitement. Afin d’éviter ce biais, on conserve tous les patients dans l’analyse : c’est la justification première de l’analyse en intention de traiter. Exclusion des écarts au protocole et biais d’attrition Dans la pratique courante, malgré certaines précautions, il est fréquent d’observer au cours de l’essai des patients présentant une ou plusieurs déviation(s) de protocole. L’exclusion des patients qui, à un moment donné de l’essai, n’ont pas été traités ou suivis en conformité avec le protocole, est très souvent basée sur des informations obtenues après la randomisation, voire même après l’initiation du traitement. Mais, dans ce cas particulièrement, est-on sûr que ces informations sont indépendantes du traitement reçu ? On peut par exemple envisager que les arrêts prématurés de traitement soit dus à une mauvaise mt, vol. 10, n° 5, septembre-octobre 2004 351 Méthodologie tolérance au nouveau traitement et donc plus importants dans le groupe testé [2]. À l’inverse, ces mêmes arrêts de traitement peuvent par exemple être plus fréquents dans le groupe contrôle et principalement dus à un manque d’efficacité. Une illustration du biais entraîné par la suppression des patients qui arrêtent prématurément leur traitement est présentée dans l’exemple 1. Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017. Exemple 1 Un nouvel antidépresseur est comparé à un traitement de référence chez 2 000 patients équitablement répartis. Le critère de jugement utilisé pour l’analyse est le taux de patients ne répondant pas au traitement donc en échec thérapeutique. Il se trouve en réalité que ces deux traitements ont la même efficacité mais que le nouveau traitement entraîne plus d’événements indésirables tels que des nausées. Comme on arrête plus facilement un traitement lorsqu’on ne ressent pas d’effet positif, les arrêts de traitement sont deux fois plus fréquents chez les patients en échec thérapeutique. L’essai est résumé au tableau 1. En analysant les données de cet essai selon le principe de l’intention de traiter, il s’avère que le nouveau traitement n’est pas différent du traitement standard. Par contre, en retirant de l’analyse les patients ayant arrêté prématurément leur traitement, c’est-à-dire en réalisant une analyse per protocole, le nouveau traitement montre une meilleure efficacité que le traitement standard. On perçoit ici toute l’importance du choix de la population d’analyse dans la validation d’une nouvelle thérapeutique. L’exemple 2 montre comment l’exclusion des patients ne recevant pas le traitement auquel ils ont été alloués peut biaiser les résultats de l’analyse [3]. Exemple 2 Supposons que dans un essai clinique, 200 patients sont randomisés entre deux groupes : • 100 patients alloués traitement A : traitement per os + chirurgie 1 mois après inclusion ; • 100 patients alloués traitement B : traitement per os uniquement. Il s’agit d’un essai en ouvert, comparant deux stratégies thérapeutiques. Supposons enfin que la chirurgie n’apporte rien de plus que le traitement oral sur le critère principal d’efficacité, à savoir la mortalité totale. Les résultats de cet essai sont résumés (figure 2). Selon le principe de l’intention de traiter, tous les patients sont inclus dans l’analyse. Dans ce cas, le traitement A n’est pas différent du traitement B. Par contre, en retirant de l’analyse les patients qui n’ont pas reçu le traitement de l’étude, on conclut que la chirurgie diminue le risque de mortalité de près de 50 %. L’exclusion des patients décédés avant la chirurgie introduit un biais dans les résultats, dans le sens où les patients les plus à risque du groupe A sont exclus. De plus, dans cet exemple où les traitements A ou B sont donnés en ouvert, on pourrait imaginer que les sorties d’étude soient plus fréquentes dans un des deux bras selon la conviction du médecin investigateur en faveur de l’une ou l’autre des thérapeutiques testées. L’intention de traitement permet donc aussi de garantir l’absence d’influence des attitudes volontaires ou involontaires qui pourraient favoriser un traitement. Ces deux exemples illustrent le principe selon lequel l’analyse en intention de traiter donne un résultat non biaisé de l’effet du traitement. Les violations de protocole qui surviennent après randomisation peuvent avoir un Tableau 1. Description de l’essai illustrant l’exemple 1 ITT Patients randomisés Hypothèse : même efficacité Taux d’échec thérapeutique Soit effectif Répondeurs Non-répondeurs (a) Hypothèse : nouveau produit moins bien toléré Taux d’arrêt prématurés Hypothèse : arrêt prématuré 2 fois plus fréquent chez non-répondeurs Taux d’arrêt prématurés chez les non-répondeurs Soit : nombre patients avec arrêt prématuré Parmi les répondeurs (b) Parmi les non-répondeurs (c) Soit : nombre de patients sans arrêt prématuré du traitement (1000-b-c) Effectif analysé (d) Résultat donné par l’analyse (a/d) Soit : Risque relatif Per protocole Nouveau Traitement traitement standard Nouveau traitement Traitement standard 1 000 1 000 1 000 1 000 10 % 900 100 10 % 900 100 10 % 900 100 10 % 900 100 13 % 2% 13 % 2% 26 % 4% 26 % 4% 117 26 857 1 000 10 % 18 4 978 1 000 10 % 117 26 857 857 8,6 % 18 4 978 978 9,8 % 1,0 Le risque relatif est calculé par le rapport de l’incidence d’événements du nouveau traitement par rapport au traitement standard. 352 mt, vol. 10, n° 5, septembre-octobre 2004 0,88 10 DC 10 DC Trait A ITT Per Prot. 20/100 = 0,2 10/90 = 0,11 RR = 0,55 RR = 1 20/100 = 0,2 20/100 = 0,2 Chirurgie Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017. Randomisation Trait B 10 DC T0 10 DC 1 mois 1 an Figure 2. Description de l’essai illustrant l’exemple 2. impact sur les données et les conclusions, particulièrement si leur occurrence est liée à l’efficacité et à la tolérance du traitement assigné. Dans la plupart des cas, il est donc approprié d’inclure les données de tels sujets dans l’analyse. Lorsque l’effectif de l’essai analysé est réduit par rapport à l’effectif randomisé, on parle d’attrition de la cohorte. En cas d’exclusion de patients durant l’essai, on génère un risque de conclure à tort à une différence entre les traitements comparés, car l’exclusion de patients peut introduire un biais en faveur d’un des groupes : c’est le biais d’attrition. L’analyse en intention de traiter évite donc d’entacher les résultats d’un biais d’attrition. L’exemple 2 permet également d’illustrer le fait que si une forte proportion de patients du groupe A reçoit le traitement du groupe B, l’intention de traiter conduit à comparer deux groupes qui sont identiques. En effet, si un nombre important de patients n’est pas opéré, on se rapproche du groupe « pas de chirurgie ». De même, lorsqu’une majorité de patients du groupe « nouveau traitement » arrêtent prématurément celui-ci, la mise en évidence de l’effet traitement n’est pas optimale. L’analyse en intention de traiter, par manque de puissance du fait des bruits accumulés dans les deux groupes de traitement, bruits correspondant au non-respect strict du protocole, ne permettra pas aisément la mise en évi- dence d’un réel effet du traitement. Mais c’est la seule analyse qui fournit des résultats non biaisés. Pour éviter une telle situation, les violations de protocole doivent rester des situations marginales. Le protocole doit être respecté au plus près sans pour autant nuire à l’intérêt du patient. Analyse en intention de traiter et représentativité de la réalité Une autre justification de l’analyse en intention de traiter est qu’elle permet d’analyser l’essai conformément à ce qui se passe dans la pratique médicale courante [4]. Si l’on reste sur l’exemple 1, la mauvaise tolérance au nouveau traitement peut limiter l’intérêt de celui-ci et il est impératif que les patients qui arrêtent prématurément leur traitement soient pris en compte dans l’analyse. Cela est particulièrement vrai par exemple en cancérologie où les chimiothérapies sont très souvent mal supportées par les patients. Est-il intéressant de traiter 100 patients si le traitement n’est efficace que chez les 10 patients qui le tolèrent ? Une autre présentation de l’importance de la représentativité de la réalité est montré dans l’exemple 3. Exemple 3 Pour être efficace, l’administration de fibrinolytiques à la phase aiguë de l’infarctus du myocarde (IDM) doit être mt, vol. 10, n° 5, septembre-octobre 2004 353 Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017. Méthodologie effectuée le plus précocement possible. Une reperfusion trop tardive, survenant au-delà du stade d’ischémie réversible, ne permet pas de limiter la taille de la nécrose et ne peut donc pas avoir un effet sur la mortalité. Ainsi, ce traitement doit donc être administré au stade de suspicion, avant que le diagnostic n’ait pu être confirmé par une élévation enzymatique. Ces patients pourraient donc être inclus dans un essai concernant des patients en phase aiguë d’IDM puis considérés comme inclus à tort car ne présentant pas la pathologie étudiée. Or, parmi les tableaux cliniques pouvant se présenter comme une suspicion d’infarctus, figurent les péricardites et les dissections aortiques, pathologies à hauts risques de complications graves après administration de fibrinolytiques. Pourtant, en pratique courante, ces patients seront effectivement traités. Il est donc indispensable de vérifier que les effets délétères observés sur ces patients « traités à tort » sont contrebalancés par l’effet bénéfique du même traitement chez des patients avec confirmation d’IDM. Cet exemple illustre le fait que l’on ne cherche pas à mettre en évidence l’effet théorique d’un nouveau traitement dans des conditions idéales d’utilisation (diagnostic confirmé, pas d’oubli de prise, pas de surdosage...). L’analyse en intention de traiter produit une estimation la plus proche de la réalité. L’analyse per protocole, en supprimant ces patients inclus à tort, ne permet pas cette estimation. Comment sont gérés les perdus de vue dans les différentes populations d’analyse ? Une des implications de l’analyse en intention de traiter est que tous les patients inclus dans un essai doivent être suivis jusqu’à la fin de l’étude ou jusqu’à leur décès, indépendamment du fait qu’ils poursuivent ou non le traitement de l’étude. L’analyse étant réalisée sur toute la population randomisée, la récupération d’un maximum de données pour chaque patient est importante. La moin- dre donnée manquante sur un critère d’évaluation biaise autant l’analyse que la suppression des patients présentant une violation au protocole. En effet, en présence de données manquantes, on s’éloigne de l’analyse en intention de traiter. Aussi, il existe souvent une confusion entre population d’analyse et patients perdus de vue, probablement parce que l’intention de traiter permet de limiter le biais d’attrition alors que la présence de perdus de vue l’introduit. On imagine qu’en excluant les perdus de vue, on évite aussi le biais ! Mais exclure les patients présentant des valeurs manquantes notamment sur le critère principal ne réduira pas le biais d’attrition : les perdus de vue existant, un biais potentiel d’attrition existe aussi. La solution, c’est une lapalissade : éviter d’avoir des données manquantes. En réalité, le choix de la population d’analyse ne règle en aucun cas le problème des données manquantes. Aussi, il faut être particulièrement prudent lorsque l’on décide d’exclure de l’analyse per protocole les patients avec des données manquantes sur le critère principal. L’exemple 4 peut illustrer ce phénomène. Exemple 4 200 patients sont inclus dans un essai randomisé en double aveugle. Le critère principal est défini par le taux de thromboses veineuses profondes (TVP) phlébographiques 10 jours après randomisation. L’étude s’intéresse aussi aux événements thromboemboliques après 3 mois de traitement pour la prévention des thromboses postopératoires. Sur les 200 patients randomisés, 40 n’ont pas eu de phlébographie à J10 (20 patients par groupe), ce qui entraîne une évaluation manquante du critère principal. En fait, dans le groupe A, les patients n’ont pas eu la phlébographie car leur état général critique ne permettait pas éthiquement parlant de réaliser l’examen. La preuve, tous ont présenté par la suite une embolie pulmonaire (EP) au cours du suivi. L’illustration est donnée au tableau 2. L’analyse per protocole consiste à exclure les patients dont le suivi diagnostique n’est pas conforme au proto- Tableau 2. Description de l’essai illustrant l’exemple 4 ITT Patients randomisés Hypothèse : 20 % de phlébographies manquantes Soit : Nombre de patients évaluables Nombre de phlébographies positives à J10 (TVP) Patients avec EP à 3 mois Effectif analysé Total événements thromboemboliques Soit : Conclusion 354 Per protocole (exclusion des manquants sur le critère principal) Nouveau traitement Traitement standard Nouveau traitement Traitement standard 100 100 100 100 80 80 10 20 20 0 100 100 30 20 30 % 20 % Traitement standard meilleur mt, vol. 10, n° 5, septembre-octobre 2004 80 80 10 20 0 0 80 80 10 20 12,5 % 25 % Nouveau traitement meilleur Copyright © 2017 John Libbey Eurotext. Téléchargé par un robot venant de 88.99.165.207 le 24/05/2017. cole, c’est-à-dire les patients n’ayant pas eu de phlébographie. Par là-même, on exclut les patients les plus à risque dans un des groupes : on déséquilibre la randomisation et on crée artificiellement des résultats favorables à l’autre groupe de traitement. Le fait d’analyser l’essai en intention de traiter ne change rien au résultat du critère principal mais peut modifier l’évaluation d’un autre critère. Si les patients non évaluables à J10 n’avaient pas été suivis, on retrouvait pour l’intention de traiter les résultats de l’analyse per protocole à 3 mois de suivi. Au total, il existe différentes méthodes de prise en compte des données manquantes, par exemple : • en considérant les patients comme manquants ou non, critère par critère (ce qui ne veut pas dire exclure le patient de l’analyse, mais l’exclure uniquement du critère pour lequel il est manquant) ; • en comptant les patients à « non à l’événement » en l’absence de donnée prouvant le contraire (ils font alors partie du dénominateur et diminuent le taux d’événement) ; • en réalisant une analyse au pire (par exemple « oui à l’événement »), c’est-à-dire en défavorisant systématiquement l’hypothèse que l’on cherche à démontrer (ces patients sont alors comptés dans le numérateur et augmentent le taux d’événement). La gestion des données manquantes ferait l’objet d’un chapitre à lui seul. Retenons simplement que ce problème de données manquantes existe quelle que soit la population d’analyse retenue. Même si l’analyse est dite en intention de traiter, un nombre important de perdus de vue peut entraîner un biais identique à l’analyse per protocole. Une pseudo-intention de traiter tolérée Selon les dernières normes ICH [5], on peut considérer que l’analyse en intention de traiter soit définie par tout patient randomisé ayant reçu au moins une administration du traitement étudié. Le principe de l’intention de traiter serait alors préservé en dépit des patients supprimés, si la décision de commencer ou non le traitement ne peut pas être influencée par la nature du traitement effectivement assigné au patient par randomisation. montrer le produit testé comme équivalent au produit de référence). Dans les essais de supériorité, l’intention de traiter est utilisée comme analyse principale (sauf circonstances exceptionnelles) parce qu’elle a tendance à éviter une surestimation de l’effet du traitement (visible dans l’analyse per protocole). En effet, les patients ayant mal suivis le traitement (dits non observants), inclus dans l’ITT, diminuent généralement l’effet du traitement évalué en rapprochant les deux groupes de traitement. Dans un essai d’équivalence ou un essai de noninfériorité, le rapprochement de ces deux groupes peut conduire à tort à une conclusion d’équivalence. L’ITT n’est donc alors pas l’analyse la plus conservatrice et on doit considérer son rôle avec attention, et toujours l’accompagner de l’analyse per protocole. Conclusion La conservation de la randomisation initiale dans l’analyse est importante pour prévenir les biais. Dans beaucoup d’expérimentations cliniques, l’utilisation de la population totale dans l’analyse fournit une stratégie conservatrice mais cela peut aussi fournir une estimation de l’effet traitement qui est le miroir de celle observée dans la pratique courante. C’est pour ces raisons que l’analyse en intention de traiter reste la seule approche qui permet de fournir des résultats non biaisés et représentatifs. Il est souvent approprié de conduire une analyse selon l’ITT et de la compléter par une analyse per protocole, pour que les différences entre ces deux approches puissent être un sujet de discussion et d’interprétation. Quand l’ITT et la per protocole donnent essentiellement les mêmes conclusions, la confiance dans les résultats de l’essai est augmentée. Par contre, le besoin d’exclure une proportion substantielle de sujets de l’analyse jette des doutes sur la validité de l’essai. Références 1. Mismetti M, Laporte S. Méthodologie des essais cliniques : pourquoi et pour qui ? Les notions essentielles à une lecture critique. Médecine thérapeutique 2003 ; 9(3) : 68-72. 2. Cucherat M. Lecture critique et interprétation des résultats des essais cliniques pour la pratique médicale. Paris : MédecineSciences Flammarion, 2004. 3. Montori VM, Guyatt GH. Intention-to-treat principle. CMAJ 2001 ; 165(10) : 1339-41. Problème posé par les études d’équivalence L’ITT et la per protocole jouent des rôles différents dans les essais de supériorité (qui cherchent à montrer le produit testé comme supérieur) et dans les essais d’équivalence ou dans les essais de non-infériorité (qui cherchent à 4. Laporte S, Cucherat M. The intention to treat. Rev Prat 2001 ; 51(20) : 2177-9. 5. Ich harmonized tripartite guideline international conference on harmonization of technical requirements for refistration of pharmaceuticals for human use. Efficacy quidelines E9: Statistical Principles for Clinical Trials. mt, vol. 10, n° 5, septembre-octobre 2004 355