La LCA en anglais facile aux EDN Fiches théoriques et pratiques Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Chez le même éditeur Maîtriser la LCA en anglais - Méthodologie et Entraînement - Réussir les ECNi par le Collège universitaire des enseignants de santé publique (CUESP), coordonné par Damien Jolly, 2019, 288 pages. ECNi Le Tout-en-un par Alexandre Somogyi, 2017,1416 pages. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 La LCA en anglais facile aux EDN Fiches théoriques et pratiques Hervé Devilliers Médecin interniste, professeur de thérapeutique et coordonnateur de FUE12 à la faculté de médecine de Dijon Thomas Thibault Chef de clinique - Assistant en médecine interne au CHU de Dijon 2e édition Elsevier Masson Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 ELSEVIER Elsevier Masson SAS, 65, rue Camille-Desmoulins, 92442 Issy-les-Moulineaux cedex, France La LCA en anglais facile aux EDN - Fiches théoriques et pratiques^ de Hervé Devilliers et Thomas Thibault. © 2022 Elsevier Masson SAS ISBN : 978-2-294-77638-0 e-ISBN : 978-2-294-76674-9 Tous droits réservés. Les praticiens et chercheurs doivent toujours se baser sur leur propre expérience et connaissances pour évaluer et utiliser toute information, méthodes, composés ou expériences décrits ici. Du fait de l’avancement rapide des sciences médicales, en particulier, une vérification indépendante des diagnostics et dosages des médicaments doit être effectuée. Dans toute la mesure permise par la loi, Elsevier, les auteurs, collaborateurs ou autres contributeurs déclinent toute responsabilité pour ce qui concerne la traduction ou pour tout préjudice et/ou dommages aux personnes ou aux biens, que cela résulte de la responsabilité du fait des produits, d’une négligence ou autre, ou de l’utilisation ou de l’application de toutes les méthodes, les produits, les instructions ou les idées contenus dans la présente publication. Tous droits de traduction, d’adaptation et de reproduction par tous procédés, réservés pour tous pays. Toute reproduction ou représentation intégrale ou partielle, par quelque procédé que ce soit, des pages publiées dans le présent ouvrage, faite sans l’autorisation de l’éditeur est illicite et constitue une contrefaçon. Seules sont autorisées, d’une part, les reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective et, d’autre part, les courtes citations justifiées par le caractère scientifique ou d’information de l’œuvre dans laquelle elles sont incorporées (art. L. 122-4, L. 122-5 et L. 335-2 du Code de la propriété intellectuelle). DANGER PHOTOCOPILLAGE TUE LE LIVRE Ce logo a pour objet d’alerter le lecteur sur la menace que représente pour l’avenir de l’écrit, tout particulièrement dans le domaine universitaire, le développement massif du « photo-copillage ». Cette pratique qui s’est généralisée, notamment dans les établissements d’enseignement, provoque une baisse brutale des achats de livres, au point que la possibilité même pour les auteurs de créer des œuvres nouvelles et de les faire éditer correctement est aujourd’hui menacée. Nous rappelons donc que la reproduction et la vente sans autorisation, ainsi que le recel, sont passibles de poursuites. Les demandes d’autorisation de photocopier doivent être adressées à l’éditeur ou au Centre français d’exploitation du droit de copie : 20, rue des Grands-Augustins, 75006 Paris. Tél. 01 44 07 47 70. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Ta b l e d e s m a t iè r e s ( s o mm a i r e c l i q u a b l e) Avant-propos................................................................................. IX Remerciements............................................................................... XIII Historiques des types d’articles aux épreuves des EDN ... XV Abréviations................................................................................... XVII PARTIE I Généralités 1 Fic h e 1 Types d’études............................................................................... Introduction....................................................................................... Types d’études le plus souvent rencontrés aux EDN...................... Exemples........................................................................................... 3 3 5 6 Fic h e 2 Les trois biais : sélection, classement, confusion................. Biais et fluctuation d’échantillonnage.............................................. Les différents biais............................................................................. 13 13 14 Fic h e 3 Niveau de preuve des études..................................................... 23 Fic h e 4 Statistiques descriptives............................................................... Les différents types de variables...................................................... Mesures de l’état de santé d’une population.................................. Phénomène de fluctuation d’échantillonnage et intervalles de confiance....................................................................................... 25 25 33 Fic h e 5 Statistiques comparatives et mesures d’association.......... Mesures d’association entre une exposition et un événement........ Principe des tests d’hypothèse.......................................................... Risque d’erreur et test statistique.................................................... Calcul du nombre de sujets nécessaires à inclure dans une étude. . . Quel test statistique utiliser ?.......................................................... 43 43 49 50 52 54 Fic h e 6 Analyses dépendantes du temps ou « analyses de survie ».......................................................... Principe............................................................................................. Quelques définitions utilisées dans les analyses de survie au cours des essais cliniques............................................................ Données nécessaires à une analyse de survie.................................. Critères de qualité............................................................................. Représentation des résultats............................................................ 64 64 66 66 Méta-analyse................................................................................. Définition de la méta-analyse.......................................................... Avantages de la méta-analyse.......................................................... Limites de la méta-analyse.............................................................. Présentation des résultats................................................................ Hétérogénéité dans les méta-analyses.............................................. Evaluation du biais de publication.................................................. 73 73 73 74 75 76 78 Fic h e 7 36 63 63 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 VI Fic h e 8 Conditions réglementaires et éthiques dans la recherche impliquant la personne humaine................ 83 Aspects réglementaires....................................................................... Participants à la recherche et définitions........................................ 83 85 PARTIE II Essais cliniques 91 Fic h e 9 Caractéristiques d’un essai clinique.......................................... Phases de développement d’un médicament.................................... Phase préclinique............................................................................... Phase clinique................................................................................... 93 94 94 94 Fic h e 10 Critères de jugement et objectifs............................................. Définition des critères de jugement.................................................. Nature de la variable = critère de jugement qualitatif ou quantitatif.................................................................................... Critère de jugement principal.......................................................... Critères de jugement secondaires.................................................... 97 97 97 98 101 Fic h e 11 Critères de sélection...................................................................... Echantillon, population source et population cible (voir fiche 2). . . Critères d’inclusion et d’exclusion.................................................. 109 109 109 Fic h e 12 Randomisation............................................................................. Définition........................................................................................... Caractéristiques à connaître............................................................ 113 113 113 Fic h e 13 Procédure d’aveugle et effet placebo....................................... Définitions......................................................................................... Quels sont les problèmes posés par un essai en ouvert ?................ Quelles mesures peut-on prendre pour maintenir la procédure d’aveugle tout au long d’un essai ?.................................................. Quelles mesures peut-on prendre pour limiter les biais liés à la nature ouverte d’un essai ?........................................................ Aspects éthiques................................................................................. 127 127 127 129 130 Fic h e 14 Plan expérimental.......................................................................... Introduction....................................................................................... Essai en groupes parallèles.............................................................. Essai en cross-over............................................................................. Plans factoriels................................................................................... 139 139 139 140 141 Fic h e 15 Suivi de l’étude et diagramme de flux...................................... Eléments importants à repérer........................................................ Biais d’attrition................................................................................. 143 144 144 Fic h e 16 Population d’analyse (ITT et per-protocole)....................... Population pour l’analyse en intention de traiter (intention to treat ou ITT)................................................................ Population pour l’analyse per-protocole (PP).................................. Population pour l’analyse en traitement reçu (as treated).............. Population pour l’analyse « de sécurité » (safety analysis)............ Synthèse............................................................................................. 151 151 153 154 155 155 Essais de non-infériorité et d’équivalence............................. Principe............................................................................................. Notions statistiques........................................................................... 163 163 163 Fic h e 17 129 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 VII Exemples........................................................................................... Choix de l’analyse statistique : intention de traiter ou per-protocole/en traitement reçu ?.............................................. 166 Fic h e 18 Analyse en sous-groupes............................................................ Définition et principe......................................................................... Comment interpréter une analyse en sous-groupes ?...................... Limites de l’analyse en sous-groupes.............................................. 175 175 176 179 Fic h e 19 Conclusion de l’étude et critique des résultats.................... Résultats sur le critère de jugement principal.................................. Résultats sur les critères de jugement secondaires.......................... Validité interne/validité externe...................................................... Généralisation des résultats.............................................................. Pertinence clinique du résultat........................................................ Raisons possibles d’un essai positif ou d’un essai négatif.............. 189 189 189 189 190 190 191 Pa r t i e III Etudes de performances diagnostiques 203 Fic h e 20 Performances diagnostiques...................................................... Caractéristiques intrinsèques du test = sensibilité et spécificité.... Caractéristiques extrinsèques (valeurs prédictives = probabilités post-test)............................................................................................. Influence de la prévalence sur les caractéristiques extrinsèques . . . Estimateur ponctuel des caractéristiques du test et intervalle de confiance....................................................................................... Exemple............................................................................................. Rapports de vraisemblance (likelihood ratio)................................ Nomogramme de Fagan.................................................................. 205 205 Fic h e 21 164 206 207 207 208 209 211 Objectifs et méthodologie des études de performance diagnostique................................................................................... Principe............................................................................................. Types de tests..................................................................................... Objectifs du test................................................................................. Définition de la population source.................................................. Test de référence (gold standard).................................................... Application du test étudié, notion de reproductibilité (ou fiabilité)...................................................................................... 222 Fic h e 22 Courbe ROC et choix d’un seuil............................................. Introduction....................................................................................... La courbe ROC (receiver operating characteristic)........................ Aire sous la courbe ROC.................................................................. Choix d’un seuil................................................................................. 235 235 235 236 237 PARTIE rv Études observationnelles (analytiques)247 Fic h e 23 Objectifs de l’étude....................................................................... Etudes observationnelles descriptives.............................................. Etudes observationnelles analytiques.............................................. Considérations éthiques.................................................................. 249 249 249 250 Fic h e 24 Confusion dans les études observationnelles....................... Position du problème........................................................................ Définition de la confusion (voir fiche 2).......................................... 251 251 251 219 219 219 220 221 221 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 VIII Analyse du tableau descriptif de la population (comparant les cas et les témoins ou les exposés et les non exposés)............................ Comment prendre en compte les facteurs de confusion dans les études analytiques ?............................................................ C’est quoi, mathématiquement, une analyse multivariée ?............ Cas particulier d’ajustement/appariement : le score de propension................................................................................... Exemple............................................................................................. 252 253 254 254 255 Fic h e 25 Principes généraux des études cas-témoins et des études de cohorte.......................................................... 269 Fic h e 26 Études cas-témoins : sélection des participants et définition de la maladie............................ Définition de la maladie................................................................... Sélection des cas................................................................................. Sélection des témoins......................................................................... Appariement..................................................................................... Cas particulier de l’étude cas-témoins nichée dans une cohorte (nested case-control study).............................................................. 281 Études de cohorte : sélection des participants et mesure de l’exposition.................................................. Objet de l’étude de cohorte.............................................................. Modalités de sélection des participants.......................................... Biais de sélection et notion de représentativité (voir fiche 2).......... En résumé........................................................................................... 287 287 287 287 288 Fic h e 28 Recueil des données...................................................................... Exposition......................................................................................... Maladie (ou événement étudié)........................................................ Dans les études cas-témoins............................................................ Études de cohorte de type exposés/non exposés.............................. 293 293 293 294 295 Fic h e 29 Analyse des résultats et évaluation de la causalité............. Analyse des résultats des études observationnelles analytiques. . . . Raisons possibles d’une association significative/non significative . . . Évaluation de la causalité................................................................. 303 303 306 307 Index................................................................................................. 327 Fic h e 27 279 279 279 280 280 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Av a n t -pr o po s Pourquoi cet ouvrage ? La lecture critique d’articles (LCA) est un des exercices des épreuves dématérialisées nationales (EDN) les plus craints par les étudiants. Pourtant, comme pour l’ensemble des autres épreuves, les connaissances et les compétences nécessaires pour la réussir ne sont qu’une question d’entraînement ! Cet ouvrage ne prétend pas contenir exhaustivement l’ensemble des connaissances nécessaires et suffisantes à la réussite aux EDN ni même à la pratique de la LCA en 3e cycle et après. D’autres ouvrages publiés par les collèges d’enseignants et les polycopiés fournis par vos professeurs remplissent déjà cette fonction. Les auteurs ont souhaité aborder les différentes notions utiles pour l’apprentissage de la LCA à partir des questions des annales des EDN et des EDN tests depuis 2016. La revue des questions a donné lieu à la rédaction de fiches de synthèse exposant brièvement les notions théoriques indispensables, accompagnées d’exemples concrets. Chaque fiche est illustrée par deux ou trois questions issues d’annales des EDN dont les propositions justes et les distracteurs sont commentés en détail. Comment utiliser cet ouvrage ? Cet ouvrage ne se substitue pas aux connaissances en statistiques et en épidémiologie acquises pendant le premier cycle des études médicales, ni aux ouvrages de référence permettant d’appliquer ces notions à la lecture d’un article. Les étudiants en début de second cycle des études médicales y verront un glossaire synthétique des premières notions à acquérir pour aborder l’exercice difficile de la LCA. Les étudiants en DFASM3 pourront plutôt l’utiliser comme un aide-mémoire à consulter lors des séances d’entraînement, pour comprendre et approfondir les notions qui leur poseraient des difficultés. L’organisation de l’ouvrage en fiches et en grandes thématiques permettra aisément de retrouver la notion d’intérêt et les questions déjà posées par le jury des EDN en rapport avec cette notion. Enfin, de courtes vidéos pédagogiques disponibles sur la chaine Youtube « Pr Geek », vous permettront de vérifier que vous avez compris l’essence des notions abordées. Comment aborder l’épreuve de LCA aux EDN ? En LCA, l’entraînement est sans doute encore plus important que dans les autres matières. Les connaissances théoriques nécessaires à l’abord de la matière peuvent s’acquérir relativement rapidement. En revanche, l’aptitude Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 X à la lecture « rapide » d’un article en anglais est le savoir-faire qui fera la différence le jour J. Seul l’entraînement vous permettra d’acquérir les réflexes de lecture afin de gagner de précieuses minutes pour répondre aux QCM de vos examens facultaires et de l’épreuve finale. La clé de votre réussite réside dans les principes pragmatiques suivants : • en fin de cursus, vous devez être capable de lire et de comprendre un article de recherche en 30 minutes ; • les aspects techniques et statistiques n’ont d’intérêt que s’ils sont nécessaires à l’interprétation des résultats ou au jugement de la validité de l’étude présentée ; • derrière chaque QCM, l’enseignant cache plus ou moins subtilement un objectif pédagogique que vous avez certainement déjà entendu ou lu quelque part... Le jour J, l’épreuve comportera deux articles de recherche en anglais, dont au moins un essai clinique. Chaque article sera accompagné de 13 à 15 questions à réponse unique ou réponses multiples, présentées à l’étudiant sur un mode « progressif » (les QCM sont obligatoirement complétés dans l’ordre défini par l’enseignant, sans retour en arrière possible). La durée de l’épreuve est de 3 heures. Pour être utile à votre préparation, chaque séance d’entraînement doit vous rapprocher le plus possible des conditions d’examen. Étape 1 : la lecture de l’article (30 à 45 minutes maximum) Lors des examens facultaires, trop d’étudiants sont encore en train de détailler l’article plus d’une heure après le début de l’épreuve. À l’inverse, lors des entraînements et conférences, cette étape est souvent « bâclée » en 15 minutes. Notre expérience montre que le meilleur compromis est de passer environ 30 minutes de concentration sur l’article avant d’envisager de répondre aux questions. Peu importe le détail de l’analyse statistique ou de la description des paramètres biologiques recueillis, ce temps est nécessaire et suffisant pour « habituer l’œil » à l’article et en comprendre l’essentiel : • schéma et type d’étude ; • critère de jugement principal, population d’étude ; • nature de la maladie et de l’exposition (étude épidémiologique) ou de l’intervention (essai clinique) ; • caractéristiques de la randomisation et de la procédure d’aveugle (essais cliniques) ; • principaux résultats, compréhension des tableaux et figures. En fonction de votre niveau d’anglais et de vos connaissances théoriques en épidémiologie/statistiques, il est normal de ne pas être capable de réussir cet exercice dans le temps imparti dès la première fois ! L’entraînement à la lecture est donc la clé du succès. Étape 2 : la réponse aux QCM (30 à 45 minutes, soit 2 à 4 minutes par QCM) Après avoir lu l’ensemble des propositions du QCM, deux questions doivent se poser immédiatement : Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Re m e r c ie m e n t s Les auteurs remercient Nicolas Rousselot, étudiant en DFASM2, et l’ensemble des étudiants en médecine de Dijon pour leur relecture attentive. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 XI • quel est l’objectif pédagogique du QCM ? (Ex. : savoir qu’un critère de jugement subjectif pose problème dans un essai ouvert, savoir que la connaissance de la maladie peut influencer la mesure rétrospective d’une exposition, comprendre pourquoi l’analyse per-protocole est plus conservatrice dans un essai de non-infériorité, etc.) Si vous arrivez à formuler cet objectif à la lecture de l’intitulé de la question, l’ensemble des propositions doit être ensuite critiqué à la lumière du point de cours que vous avez identifié ; • y a-t-il une ou des propositions que je peux éliminer d’emblée ? Certaines propositions sont fausses dans l’absolu (ex. : dans cette étude, l’analyse en perprotocole comprenait plus de patients que l’analyse en intention de traiter, tous les facteurs de confusion possibles ont été pris en compte, Vodds ratio est significatif car son intervalle de confiance exclut la valeur 1, etc.). La stratégie consiste donc à éliminer, sur votre brouillon, les propositions fausses dans l’absolu, s’il y en a, puis à retourner chercher dans le texte les informations nécessaires à la réponse aux autres propositions en gardant à l’esprit l’objectif pédagogique du QCM en cas de doute. Étape 3 : l’autoévaluation Il est conseillé de ne découvrir la correction qu’après avoir répondu à l’ensemble du sujet proposé. La notation des QCM est faite de la manière suivante : • toutes les bonnes réponses : 1 point ; • une discordance (une réponse manquante ou une mauvaise réponse cochée) : 0,5 point ; • deux discordances (réponses manquantes ou cochées à tort) : 0,25 point ; • plus de deux discordances : 0 point. Bon courage et belle réussite à toutes et tous ! Thomas Thibault Hervé Devilliers Twitter/Instagram/Facebook : @Professeur_geek Youtube : Pr Geek D es q u e st io n s s u r c e t t e o u v r a g e ? C o n t a c t e z l e s a u t e u rs s u r l e g r o u p e F a c e b o o k : h t t p : / / g ro u p e.p rg e e k .fr Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 His t o r iq u e d e s t y pe s d ’a r t ic l e s a u x é pr e u v e s d e s EDN Année Épreuve test Examen final 2016 Essai thérapeutique de supériorité Étude cas-témoins Essai thérapeutique de supériorité Étude cas-témoins 2017 Essai d’intervention de supériorité Essai thérapeutique de supériorité Étude de cohorte prospective Essai thérapeutique de supériorité 2018 Essai thérapeutique de supériorité Étude de cohorte prospective exposés/ non exposés Étude de performance diagnostique Essai thérapeutique de non-infériorité 2019 Étude de cohorte rétrospective Essai thérapeutique de non-infériorité Essai thérapeutique de non-infériorité Étude de performance diagnostique 2020 Essai thérapeutique de supériorité Étude cas-témoins Essai thérapeutique de supériorité Étude cas-témoins 2021 Essai thérapeutique de non-infériorité Étude de performance diagnostique Essai thérapeutique de supériorité Étude cas témoins En résumé, sur 24 épreuves élaborées par le CNCI : • 13 essais thérapeutiques (dont 9 essais de supériorité et 4 essais de noninfériorité) ; • 8 études analytiques observationnelles (dont 5 études cas-témoins et 3 études de cohorte) ; • 3 études de performance diagnostique. Les épreuves les moins bien réussies par les étudiants sont habituellement les études de performance diagnostique. La lecture critique d’articles (LCA) est un des exercices des épreuves dématérialisées nationales (EDN) les plus craints par les étudiants. Pourtant, comme pour l’ensemble des autres épreuves, les connaissances et les compétences nécessaires pour la réussir ne sont qu’une question d’entraînement ! Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Ab r é v ia t io n s AD AMM ANSM AOD AUC AVC AVK AZT BMI BPCO CA-PUR CHU CKDepi CNIL CPP CRP DDN DFG DFS DR ECBU ECN EGFR EP FLP FN FP FPS GHS HAS HbAlc HCG HCQ HR HTA IC IEC IMC INCa INSERM IQR IRM axillary dissection autorisation de mise sur le marché Agence nationale de sécurité du médicament et des produits de santé anticoagulants oraux directs area under curve accident vasculaire cérébral antivitamine K azithromycine body mass index (indice de masse corporelle) bronchopneumopathie chronique obstructive California State mandated Pesticide Use Reporting centre hospitalier universitaire Chronic Kidney Disease EPIdemiology collaboration Commission nationale de l’informatique et des libertés comité de protection des personnes C-reactive protein date des dernières nouvelles débit de filtration glomérulaire disease-free survival différence de risque examen cytobactériologique des urines épreuves classantes nationales estimated glomerular filtration rate embolie pulmonaire fente labiopalatine faux négatif faux positif fente palatine seule glenohumeral subluxation Haute Autorité de santé hémoglobine glyquée hormone chorionique gonadotrophique hydroxychloroquine hazard ratio hypertension artérielle intervalle de confiance inhibiteur de l’enzyme de conversion indice de masse corporelle Institut national du cancer Institut national de la santé et de la recherche médicale interquartile range imagerie par résonance magnétique Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 XVIII ITT IV IVT IVTMT LADA LOCF MDRD mITT NI NNS NNT OR PCT PEC PFS PMSI PO PP PSA PT RIPH RNIPH ROC RR RV SaO2 SD Se SIR SLA SMR SOFA Sp TI TVP VEMS VN VP VPN VPP intention to treat intraveineux intravenous thrombolysis intravenous thrombolysis plus mechanical tbrombectomy latent autoimmune diabètes in adults last observation carried forward modification of diet in rénal disease modifed intention to treat non-infériorité number needed to be screened number needed to treat odds ratio procalcitonine prise en charge progression-free survival programme de médicalisation des systèmes d’information per os per-protocole prostate-spécifie antigen personne-temps recherche impliquant la personne humaine recherche n’impliquant la personne humaine receiver operating characteristic risque relatif rapport de vraisemblance saturation artérielle en oxygène standard déviation sensibilité standardized incidence ratio sclérose latérale amyotrophique standardized mortality ratio sequential organ failure assessment spécificité taux d’incidence thrombose veineuse profonde volume d’expiration maximale seconde vrai négatif vrai positif valeur prédictive négative valeur prédictive positive Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Pa r t ie I Généralités Pl a n Fiche 1 Fiche 2 Fiche 3 Fiche 4 Fiche 5 Fiche 6 Fiche 7 Fiche 8 Types d’études Les trois biais : sélection, classement, confusion Niveau de preuve des études Statistiques descriptives Statistiques comparatives et mesures d’association Analyses dépendantes du temps ou « analyses de survie » Méta-analyse Conditions réglementaires et éthiques dans la recherche impliquant la personne humaine 3 13 23 25 43 63 73 83 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Types d’études In tro d uctio n Cette fiche décrit brièvement les études les plus importantes à connaître afin de pouvoir en appréhender facilement leurs principes. Les trois types d’études ayant fait l’objet de questions à l’ECNi à ce jour sont : • les études observationnelles analytiques (à visée étiologique ou pronostique) ; • les essais cliniques ; • les études d’évaluation de la performance diagnostique. Elles sont toutes les trois détaillées dans les parties correspondantes de ce livre. En pratique, il faut dissocier cinq notions : 1. la nature observationnelle ou expérimentale de l’étude : - étude expérimentale : l’attribution de l’exposition (ou facteur à évaluer) est fixée par le design de l’étude (le plus souvent par tirage au sort). Cela permet d’établir une relation causale car la seule différence entre les groupes est l’exposition d’intérêt, - étude observationnelle : l’exposition (ou le facteur pronostique étudié) est recueillie mais non imposée par le design de l’étude ; ► Remarque : la confusion est régulièrement faite entre le terme « expérimental » qui est une définition « méthodologique », et « interventionnel » qui est un terme règlementaire. Sur le plan méthodologique, on oppose les études observationnelles et expérimentales (comme défini ci-dessus en 1). Sur le plan réglementaire, on oppose les études interventionnelles (modifiant la prise en charge habituelle du patient) et les études non interventionnelles (qui ne modifient pas la prise en charge habituelle du patient, voir fiche 8, « Conditions réglementaires et éthiques dans la recherche impliquant la personne humaine »). Par exemple, une étude imposant la réalisation systématique d’un coroscanner chez les patients suivis en consultation pour une polyarthrite rhumatoïde en vue de prédire le risque ultérieur d’événement cardiovasculaire est une étude observationnelle (non expérimentale) au plan méthodologique mais interventionnelle au sens de la réglementation (on impose la réalisation d’un examen en dehors de la pratique courante). La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 4 Généralités 2. la temporalité entre le début de l’étude et l’événement étudié : - prospectif : la planification de l’étude commence avant la survenue de l’événement étudié, - rétrospectif (ou historique) : la planification de l’étude commence après la survenue de l’événement étudié, ► Remarque : cette terminologie pose actuellement problème, car certaines études sont planifiées après l’événement d’intérêt, alors que le recueil de l’information concernant la maladie est prospectif. C’est le cas des études cas-témoins réalisées à partir des données de registres de population. Dans ce cas, on voit parfois apparaître le terme « d’étude castémoins prospective » qui est une appellation hautement controversée, la terminologie exacte serait « étude rétrospective avec recueil prospectif de l’information ». - historicoprospectif : l’étude est planifiée avant la survenue de la maladie, mais tout ou partie de l’exposition est recueilli rétrospectivement ; 3. le type de suivi : - transversal (cross-sectional) : recueil simultané d’un facteur d’exposition et d’un événement, - longitudinal (ou étude de cohorte) : il existe plusieurs mesures au cours du temps pour un patient. Le recueil de l’exposition et/ou de la maladie nécessite un suivi. En pratique, au moins deux visites sont prévues dans le cadre de l’étude ; 4. la finalité/l’objectif : - étude analytique à visée étiologique : faire le lien entre un facteur de risque et une maladie, - étude analytique à visée pronostique : faire le lien entre un facteur pronostique et l’évolution naturelle ou une complication de la maladie, - à visée descriptive : décrire un phénomène de santé (prévalence, incidence, etc.), - étude de performance diagnostique : étudier les performances diagnostiques d’un marqueur par rapport à un gold standard (sensibilité, spécificité), - essai clinique/essai thérapeutique : comparer l’efficacité et la tolérance d’un traitement à un placebo ou à celles du traitement de référence, - évaluation des pratiques : décrire les pratiques professionnelles et éventuellement les facteurs pouvant les influencer ; 5. le design/plan expérimentale : - pour les essais cliniques : essais en groupes parallèles, en cross-over, en plan factoriel ; ces termes sont détaillés dans la fiche 14, - étude de type exposés/non exposés : étude observationnelle, prospective ou rétrospective, longitudinale, à visée étiologique ou pronostique dans lesquelles des sujets exposés ou non à un facteur de risque sont suivis sur une période plus ou moins longue (éventuellement après appariement). La fréquence de la maladie (ou du facteur pronostic) chez les exposés est ensuite comparée à celle des non-exposés, Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Types d’études 5 - étude de type cas-témoins : étude observationnelle, rétrospective, à visée étiologique ou pronostique, dans laquelle des patients sont comparés à des témoins indemnes de la pathologie (ou de la complication de la pathologie) étudiée (éventuellement après appariement), en termes de fréquence des facteurs de risque ou des facteurs pronostiques. Ty p es d'é tu d es le plus so uvent re nco n trés au x ED N Études observationnelles descriptives Études observationnelles analytiques Objectifs : décrire ou mesurer un problème de santé Étude transversale = étude de prévalence : étude réalisée à un instant t, afin d’estimer la fréquence d’une maladie au sein d’une population donnée à un moment donné Étude longitudinale = étude d’incidence : estime le nombre de nouveaux cas d’une maladie au sein d’une population au cours d’une période de temps Objectifs : - rechercher des facteurs de risque (étude étiologique) - rechercher des facteurs pronostiques (étude pronostique) Étude cas-témoins (rétrospective) : des cas sont comparés à des témoins sur la base d’un recueil de données construit de manière rétrospective concernant le ou les facteurs d’exposition. Le ratio cas/témoins est fixé par l’investigateur Étude exposés/non exposés ou de cohorte (prospective ou rétrospective, longitudinale) : des patients exposés on non à un ou des facteurs de risque (ou pronostiques) sont suivis dans le temps, ce qui permet d’étudier le lien entre ce(s) facteur(s) et la survenue de la maladie (ou son évolution) Études interventionnelles (expérimentales) Évaluation d’une méthode diagnostique Objectifs : évaluer l’efficacité d’une intervention. Contrairement aux études observationnelles, l’étude contrôle le facteur d’exposition Essais cliniques : le facteur d’exposition est le traitement évalué. Le traitement sera appliqué par l’investigateur à un groupe de patients. Il y a donc intervention de l’investigateur concernant le facteur d’exposition (à savoir le traitement évalué) Évaluation d’une nouvelle stratégie de prévention : on applique la nouvelle stratégie à un groupe d’individus. On compare alors les résultats obtenus aux résultats d’un autre groupe chez qui la stratégie de prévention n’a pas été appliquée ROC : receiver operating characteristic. Objectif : évaluer les performances d’un nouveau test diagnostique par rapport au test de référence Principe : le nouveau test à l’étude et le test de référence sont tous les deux appliqués aux patients. Cela permet de calculer la sensibilité et la spécificité d’un nouveau test et également, en fonction des caractéristiques du test, le choix d’un seuil grâce à une courbe ROC Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 6 Généralités Ex e m ples • Étude évaluant le nombre de nouveaux cas annuels de cancer au sein de la population française = étude d’incidence. • Étude évaluant le nombre de cancers en 2018 dans la région Bourgogne = étude de prévalence. • Étude visant à établir comme facteur de risque de cancer l’exposition passée à certains toxiques en comparant un groupe d’individus atteints d’un cancer et un groupe d’individus sains = étude cas-témoins. • Étude visant à établir comme facteur de risque de cancer l’exposition supposée au rayonnement ionisant en suivant dans le temps l’apparition d’un cancer chez un groupe d’individus habitant à côté d’une centrale nucléaire et chez un groupe d’individus éloignés de toute centrale = étude exposés/non exposés. • Étude évaluant l’impact sur la mortalité du cancer colorectal de la recherche de sang occulte dans les selles en comparant une population chez qui l’on applique cette stratégie de prévention à une population chez qui on ne l’applique pas = étude interventionnelle (ou expérimentale). • Étude évaluant les performances d’un marqueur biologique d’évolution métastatique en comparant les résultats du marqueur aux résultats du scanner thoraco-abdomino-pelvien. On établit une sensibilité et une spécificité et on détermine le choix du meilleur seuil grâce à une courbe ROC (receiver operating characteristic] - étude d’évaluation des performances diagnostiques. En pra tique Ex e m ple 1 (é pre uve t est ED N 2018) Johansson K, Cnattingius S, Nâslund I, Roos N, Trolle Lagerros Y, Granath F, Stephansson O, Neovius M. Outcomes of pregnancy after bariatric surgery. N Engl J Med 2015 ; 372 : 814-24. Maternai obesity is associated with increased risks of gestational diabètes, large-for-gestational-age infants, preterm birth, congénital malformations, and stillbirth. The risks of these outcomes among women who hâve undergone bariatric surgery are unclear. We investigated the risks of gestational diabètes and adverse périnatal outcomes among women with a history of bariatric surgery as compared with women without such a history but with similar characteristics. We identified 627,693 singleton pregnancies in the Swedish Medical Birth Register from 2006 through 2011, of which 670 occurred in women who had previously undergone bariatric surgery and for whom presurgery weight was documented. For each pregnancy after bariatric surgery, up to five control pregnancies were matched for the mother’s presurgery body-mass index (BMI ; we used early-pregnancy BMI in the Controls), âge, parity, smoking history, educational level, and delivery year. We assessed the risks of gestational diabètes, large-for-gestational-age and small-for-gestational-age infants, preterm birth, stillbirth, néonatal death, and major congénital malformations. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Types d’études 7 Il s’agissait d’une étude : Il aurait fallu cocher... Commentaires Observationnelle De toute évidence, l’exposition d’intérêt (l’obésité maternelle traitée par chirurgie bariatrique) n’a pas été contrôlée par les investigateurs De cohorte Le suivi des patientes (par l’intermédiaire des données des registres) du début de la grossesse à l’accouchement définit une étude de cohorte Avec un groupe contrôle Ici, le groupe contrôle est le groupe des femmes ayant réalisé une grossesse sans avoir été opérée d’une chirurgie bariatrique De type exposés/non exposés On part du facteur d’exposition (la chirurgie bariatrique) pour définir les groupes, contrairement à une étude cas-témoins où l’on part de la maladie Longitudinale L’enregistrement des complications pendant la durée de la grossesse impose un suivi longitudinal À visée étiologique On cherche la relation entre une exposition (la chirurgie bariatrique) et plusieurs maladies, notamment les complications obstétricales Analytique L’objectif principal de cette étude est d’obtenir une mesure d’association (risque relatif d’avoir un diabète gestationnel quand on a une obésité traitée par chirurgie bariatrique par rapport à une obésité non traitée par chirurgie bariatrique) Avec appariement des exposés et des non-exposés L’appariement des mères opérées à des mères non opérées sur l’indice de masse corporelle (BMI) et les autres facteurs de confusion a pour but d’améliorer la comparabilité des groupes exposés et non exposés Il n’aurait pas fallu cocher... Commentaires Cas-témoins Dans cette étude, le point de départ est l’exposition, pas la maladie. Si on avait voulu réaliser une étude cas-témoins, il aurait fallu partir des diabètes gestationnels et leur apparier des grossesses sans cette complication Expérimentale L’exposition d’intérêt n’est ni contrôlée, ni randomisée Randomisée Que cinq grossesses de femmes non opérées aient été tirées au sort dans le registre des naissances pour chaque femme opérée ne fait pas de cette étude une étude randomisée. Une étude randomisée est une étude dans laquelle l’exposition est tirée au sort pour un patient donné Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 8 Généralités Il n’aurait pas fallu cocher... Commentaires Avec appariement des cas et des témoins Les mères souffrant de diabète gestationnel n’ont pas été appariées à des mères indemnes À visée pronostique Une partie des femmes de l’étude sont indemnes de toute pathologie à l’inclusion, et on ne peut pas considérer la grossesse comme une maladie Transversale Comme explicité plus haut, l’enregistrement des complications de la grossesse nécessite un suivi de plusieurs mois Remarque : ici, la nature prospective ou rétrospective de l’étude est sujette à discussion. Nous sommes en toute rigueur dans le cadre d’une étude rétrospective (planifiée après l’apparition de l’événement) avec recueil prospectif de l’information. Ex e m ple 2 (ED N 2016) Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai consumption of coffee and caffeine-containing beverages and oral clefts : a population-based case-control study in Norway. Am J Epidemiol 2009 ; 69 : 1216-22. We used data from a population-based study to evaluate the association of maternai consumption of coffee and caffeinated beverages in early pregnancy with the risk of delivering an infant with an orofacial cleft. Ail infants born with facial clefts in Norway are treated at government expense in surgical centers at university hospitals located in Oslo and Bergen. In collaboration with these 2 centers, we identified ail babies born from 1996 to 2001 who were referred for treatment for either cleft lip with or without cleft palate (CLP) or cleft palate only (CPO). Controls were recruited during the same period by randomly selecting approximately 4 births per 1,000 from the National Medical Birth Registry (which includes ail births in the country). These births served as Controls for both case groups, with the target of 2 Controls per case of CLP (nearly 4 Controls for each case of CPO). Both cases and Controls were recruited during their first weeks of life. Il s’agissait d’une étude : Il aurait fallu cocher... Commentaires Cas-témoins Dans cette étude, on part des cas pour leur apparier des témoins. C’est bien la définition d’une étude cas-témoins. Le ratio cas/témoin est fixé par l’investigateur Rétrospective L’étude débute après l’apparition de la maladie étudiée À visée étiologique Le but de l’étude est de chercher un facteur de risque de fente labiopalatine Le ratio cas/témoins était de 1:2 Comme indiqué ci-dessus, on a inclus deux enfants indemnes pour chaque cas Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Types d’études Il n’aurait pas fallu cocher... 9 Commentaires Prospective L’étude débute après l’apparition de la maladie Historicoprospective Toute l’information est recueillie dans le passé, y compris la maladie. Cette étude ne mérite donc pas la dénomination d’étude historicoprospective Transversale Le schéma de l’étude impose plusieurs « points de suivi », même s’ils sont reconstitués rétrospectivement À visée pronostique, étudiant les facteurs pronostiques des fentes labiopalatines Dans cette étude, il y a des témoins, donc le but n’est clairement pas d’étudier les facteurs pronostiques des fentes labiopalatines. Dans une étude pronostique, tous les patients sont porteurs de la maladie dont on cherche le(s) facteur(s) pronostique(s) ; le facteur d’exposition est le facteur pronostique et l’état pathologique étudié est la complication de la maladie De cohorte historique Le terme de cohorte, même historique ou rétrospective, impose un suivi de patients avec un recueil prospectif de l’information (par l’intermédiaire de registres ou de bases de données médico-administratives, par exemple) Ex e m ple 3 Hjort R, Alfredsson L, Carlsson PO, Groop L, Martinell M, Storm P, Tuomi T, Carlsson S. Low birthweight is associated with an increased risk of LADA and type 2 diabètes : results from a Swedish case-control study. Diabetologia 2015 ; 58 : 2525-32. Le texte ci-dessous est issu d’un résumé PubMed : The aim of a study was to investigate the association between birthweight and latent autoimmune diabètes in adults (LADA), a common diabètes form with features of both type 1 and type 2 diabètes. Authors used data from a Swedish population-based study, recruiting incident cases of diabètes through diabètes registries in the Swedish counties of Skâne and Uppsala. Ail participants gave self-reported information on birthweight. Participants free from diabètes (six per LADA case) were randomly selected via the National Population Registry, which covers the whole population of Skâne and Uppsala. They were matched on geographical area (county) and date of participation. Il s’agit d’une étude : Il aurait fallu cocher... Commentaires Cas-témoins Dans cette étude, on part des cas pour leur apparier des témoins. C’est bien la définition d’une étude castémoins. Le ratio cas/témoins est fixé par l’investigateur Rétrospective L’étude débute après l’apparition de la maladie étudiée À visée étiologique Le but de l’étude est de chercher un facteur de risque de LADA Le ratio cas/témoin était de 1:6 Comme indiqué ci-dessus, on a inclus 6 enfants indemnes pour chaque cas Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 10 Généralités Il n’aurait pas fallu cocher... Commentaires Prospective L’étude débute après l’apparition de la maladie Historicoprospective Toute l’information est recueillie dans le passé, y compris la maladie. Cette étude ne mérite donc pas la dénomination d’étude historicoprospective Transversale Le schéma de l’étude impose plusieurs « points de suivi », même s’ils sont reconstitués rétrospectivement À visée pronostique Dans cette étude, il y a des témoins, donc le but n’est clairement pas d’étudier les facteurs pronostiques des LADA. Dans une étude pronostique, tous les patients sont porteurs de la maladie dont on cherche le(s) facteur(s) pronostique(s) ; le facteur d’exposition est le facteur pronostique et l’état pathologique étudié est la complication de la maladie De cohorte historique Le terme de cohorte, même historique ou rétrospective, impose un suivi de patients avec un recueil prospectif de l’information (par l’intermédiaire de registres ou de bases de données médico-administratives, par exemple). Ici, le poids de naissance est recueilli en interrogeant les patients Ex e m ple 4 (ED N 2020) Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for Pancreatic Cancer in China : A Multicenter Case-Control Study. J Epidemiol 2016 ; 26(2) : 64-70. Quel(s) serai(en)t l’(les) obstacle(s) à la mise en place d’un essai contrôlé randomisé évaluant l’efficacité d’une supplémentation quotidienne en thé pour la prévention primaire du cancer du pancréas ? Il aurait fallu cocher... L’incidence du cancer du pancréas est faible Le temps d’apparition du cancer du pancréas dure plusieurs années Commentaires Les résultats issus d’un essai randomisé sont d’un niveau de preuve plus élevé que les résultats issus d’une étude observationnelle. Dans un certain nombre de cas cependant, la réalisation d’un essai randomisé est impossible, soit parce que l’événement attendu est rare ou survient après un temps d’apparition trop long (comme dans cet exemple), soit parce qu’on dispose déjà de suffisamment d’information pour penser qu’il serait nocif d’exposer les participants à un des deux bras expérimentaux (problème éthique) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Types d’études Il n’aurait pas fallu cocher... Commentaires L’effet protecteur du thé est controversé dans la survenue du cancer du pancréas Comme il n’existe pas de preuve d’un tel effet pour l’instant, un essai randomisé pourrait être théoriquement intéressant, mais des questions de faisabilité rendent ce type d’essai impossible (il faudrait sélectionner des patients indemnes de cancer du pancréas et les randomiser dans 2 groupes. Un groupe serait exposé à une consommation de thé et l’autre non. On suivrait alors les participants dans le temps jusqu’à l’apparition d’un cancer du pancréas. On se doute bien qu’il faudrait certainement suivre les patients pendant plusieurs dizaines d’années pour recueillir suffisamment d’événements nous permettant de conclure, ce qui est impossible en pratique) Cet essai clinique ne serait pas éthique car le rôle protecteur de la consommation de thé est prouvé 11 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 2 Les trois biais : sélection, classement, confusion Biais e t fluct u atio n d'écha n tillo n n a g e Biais Définition : erreur systématique qui entraîne une déviation de ce qui est observé par rapport à la réalité. Si on étudie l’association entre un facteur de risque et une maladie donnée, l’erreur est dans la même direction à chaque fois. Cela peut donc entraîner une surestimation ou une sous-estimation d’un effet. On distingue trois grands types de biais : confusion, classement et sélection. Fluctuation d'échantillonnage et erreur aléatoire • Erreur aléatoire : une erreur aléatoire est liée au hasard. Elle affecte de la même manière tous les groupes d’une étude (exemple : utilisation d’un automate défectueux mesurant la C-reactive protein avec une précision de 30 mg/L). • Fluctuation d’échantillonnage : lors de la constitution d’un échantillon à partir d’une population source, la probabilité d’obtenir un échantillon présentant les mêmes caractéristiques que cette population à 1 % près est très faible. L’âge moyen des patients et le pourcentage de femmes dans l’échantillon sont des estimateurs ponctuels des valeurs « vraies » de la population source. La fluctuation d’échantillonnage est une erreur aléatoire, résultant de l’écart entre cet estimateur ponctuel et la valeur « vraie » que l’on observerait dans l’ensemble de la population source. Augmenter la taille de l’échantillon réduit les fluctuations d’échantillonnage. Le risque alpha correspond au risque qu’une différence observée soit liée aux fluctuations d’échantillonnage plutôt qu’à la réalité. Dans le tableau ci-dessous : • les fluctuations d’échantillonnage entraînent des erreurs aléatoires et donc une imprécision des résultats ; • les biais entraînent des erreurs systématiques et donc une surestimation ou une sous-estimation des résultats. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 14 Généralités Les dif f ére nts biais Biais de sélection • Echantillon : patients inclus dans une étude. • Population source : population dont est tiré l’échantillon : par exemple, tous les patients vus dans un service pendant la période d’étude, tous les patients hospitalisés dans un service de neurologie pour un accident vasculaire cérébral (AVC) pendant la période d’étude, etc. • Population cible : population à laquelle on veut généraliser les résultats : par exemple, tous les patients souffrant d’AVC en France. On parle de biais de sélection lorsque l’échantillon n’est pas représentatif de la population cible (3 raisons principales à cela) : • échantillon non représentatif de la population source : le seul médecin qui inclut des patients dans une étude monocentrique est le spécialiste régional d’une forme rare de la maladie ; • population source non représentative de la population cible : inclure des patients uniquement dans des centres experts qui présentent des pathologies avec des caractéristiques particulières et rares ; • sorties d’étude : si l’échantillon est réduit par des sorties d’études (on parle d’attrition), l’échantillon restant est sélectionné et par conséquent moins représentatif de la population source et donc de la population cible. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Les trois biais : sélection, classement, confusion 15 Biais de classement, de mesure ou d'information Dans une étude épidémiologique, le biais de classement concerne toute erreur conduisant à une mesure erronée de l’exposition (considérer un patient comme exposé alors qu’il ne l’est pas) ou de la maladie (considérer un patient comme malade alors qu’il est indemne). Dans un essai clinique randomisé, le biais de classement concerne essentiellement la mesure des critères de jugement (considérer que le critère est atteint alors qu’il ne l’est pas ou inversement). C’est le cas dans les essais réalisés en ouvert (le patient et le médecin investigateur connaissent le bras de traitement). L’erreur est dite différentielle lorsque : • l’erreur de mesure ou de classement sur l’exposition est influencée par la connaissance de la maladie : - ce type d’erreur est impossible si l’étude est prospective (on recueille l’exposition alors que la maladie n’est pas encore survenue), - dans une étude cas-témoins, on interroge des patients sur leur consommation de tabac après le diagnostic de cancer bronchique. Les cas ont tendance à surestimer leur consommation, tandis que les témoins la sous-estiment. Le lien entre le cancer et le tabac est donc artificiellement augmenté ; • l’erreur de mesure ou de classement sur la maladie est influencée par la connaissance de l’exposition : - ce type d’erreur est rare dans les études rétrospectives, puisqu’au moment où l’on recueille l’exposition, la maladie est déjà connue, - par exemple, lors d’une étude exposés/non exposés sur le lien entre la consommation de café et le cancer du côlon, la connaissance du lien potentiel va conduire à un sur-dépistage du cancer du côlon par coloscopie chez les grands consommateurs de café, et donc à une augmentation artificielle de l’association ; Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 16 Généralités • l’évaluation de l’efficacité d’un traitement et des effets secondaires est faite en ouvert : par exemple, dans le cas d’un essai comparant l’efficacité d’un antibiotique 7 jours versus 14 jours dans l’infection urinaire haute, si le critère de jugement est la récidive des symptômes, et que l’essai est réalisé en ouvert, les patientes du groupe « 7 jours » signaleront plus facilement des symptômes après la fin du traitement que les patientes encore sous antibiotique. Ceci augmentera artificiellement l’efficacité du traitement de 14 jours. L’erreur est dite non différentielle lorsque l’erreur affecte de manière aléatoire les deux groupes : par exemple, on interroge des sujets sains de 40 ans sur leurs habitudes alimentaires à l’adolescence, puis on les suit pendant 10 ans pour étudier le lien entre alimentation riche en graisse et cancer (étude historicoprospective). Le cancer n’étant pas survenu au moment de la mesure de l’exposition, une erreur différentielle est impossible. En revanche, certains patients ont oublié leurs habitudes alimentaires passées et répondront mal au questionnaire. Cette erreur affecte identiquement les deux groupes, et aura tendance à réduire l’estimation de l’association entre l’alimentation et le cancer (voir figure ci-dessous). Alimentation riche en graisse = exposés Alimentation pauvre en en graisse = non exposés Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Les trois biais : sélection, classement, confusion 17 À retenti Une erreur de classement différentielle peut augmenter ou diminuer une associa tion ou l'effet d'un traitement par rapport à la réalité. Elle remet en question le résultat de l'étude, qu'il soit significatif ou non. Une erreur de classement non différentielle peut rapprocher la mesure d'associa tion de la valeur neutre (1 ou un risque relatif, 0 pour un risque absolu) et diminuer le niveau de significativité. Une telle erreur ne remet pas en question un résultat significatif. En pratique, un résultat significatif dans une étude comportant une erreur de classe ment non différentielle est probablement encore plus significatif dans la réalité. Un résultat non significatif est peut-être lié à cette erreur. Biais de confusion (voir fiche 24) On parle de biais de confusion lorsque l’association observée entre une exposition et une maladie est en réalité liée à un troisième facteur, associé à l’exposition (c’est-à-dire plus fréquent chez les exposés que chez les non-exposés) et lié à la maladie. Par exemple : • on souhaite étudier le lien entre tabagisme et cirrhose. En analyse bivariée, la cirrhose est significativement plus fréquente chez les fumeurs. Or, la consommation d’alcool plus fréquente chez les fumeurs est fortement liée au risque de cirrhose. L’alcool est un facteur de confusion dans l’étude de la relation entre tabac et cirrhose ; ► Attention ! Il faut distinguer facteur de confusion et élément de la chaîne causale entre le facteur de risque et la maladie. • on souhaite étudier l’association entre consommation de nourriture grasse et AVC ischémique. On s’interroge sur la place éventuelle de l’hypercholestérolémie comme facteur de confusion. L’hypercholestérolémie est bien associée à la fois à la consommation de nourriture grasse et à la survenue d’AVC ; or elle fait partie de la chaîne causale entre les deux éléments, la survenue d’accident vasculaire étant la conséquence de l’élévation du cholestérol qui est elle-même conséquence des habitudes alimentaires. Ce n’est donc pas un facteur de confusion. À retenir V oca b ulaire u tile fra nçais-a n glais Biais = bias Échantillon = sample Échantillonnage = sampling Fluctuation d'échantillonnage = sampling distribution Tirage au sort = random sampling Facteur de confusion = confounding factor Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 18 Généralités En pra tique Ex e m ple 1 On réalise une étude sur le lien entre allaitement maternel et développement cognitif dans la petite enfance. Les mères présentant leur enfant à l’examen obligatoire des 2 ans ont été systématiquement invitées à remplir un questionnaire sur la durée et les modalités de l’allaitement pendant la première année de vie de leur enfant. Un test neuropsychologique a été proposé à l’entrée au cours préparatoire aux enfants des mères ayant rempli le questionnaire à l’examen obligatoire des 2 ans. Concernant l’erreur de mesure sur les modalités d’allaitement, il est vrai que : Il aurait fallu cocher... Commentaires L’erreur est non différentielle Il n’y a aucune raison que l’erreur soit différentielle, car la mesure de l’exposition, bien que rétrospective, n’a aucune raison d’être influencée par la maladie étudiée (développement cognitif), car elle n’est pas connue au moment du recueil L’erreur ne peut pas être influencée par le développement cognitif de l’enfant Cette proposition est synonyme de la précédente L’erreur aura tendance à rapprocher le risque relatif de la valeur 1 L’erreur est ici liée à la mémorisation et introduit donc une diminution de la précision dans la mesure de l’exposition qui risque de réduire le lien éventuel entre allaitement et développement cognitif L’erreur aura tendance à faire sous-estimer le niveau de significativité Si le résultat obtenu est significatif, la conclusion n’est pas remise en cause par cette erreur Il n’aurait pas fallu cocher... Dans la mesure où l’erreur conduit à une sous-estimation de l’association, si on observe une association significative malgré l’erreur, elle le serait sans doute encore plus dans la réalité Commentaires La mesure risque d’être influencée par la connaissance du résultat des tests neurocognitifs La temporalité de l’étude rend ce biais impossible L’erreur est limitée car le recueil des modalités d’allaitement est prospectif Le recueil est bien rétrospectif, ce qui risque d’induire un biais de mémorisation Le calcul de risque relatif n’est pas possible en raison du recueil rétrospectif de l’exposition En épidémiologie, le seul schéma ne permettant pas le calcul d’un risque relatif est l’étude cas-témoins. La nature prospective ou rétrospective du recueil de la maladie ou de l’exposition importe peu Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Les trois biais : sélection, classement, confusion Il n’aurait pas fallu cocher... Commentaires L’erreur n’aura aucune influence sur la mesure d’association Il est impossible de faire cette affirmation, il est tout à fait possible que l’erreur diminue la mesure d’association Si le résultat est significatif, cette erreur remet en cause la conclusion Une erreur non différentielle risque de diminuer la significativité. Un résultat non significatif pourra donc être remis en question, mais pas un résultat significatif 19 Ex e m ple 2 Hjort R, Alfredsson L, Carlsson PO, Groop L, Martinell M, Storm P, Tuomi T, Carlsson S. Low birthweight is associated with an increased risk of LADA and type 2 diabètes : results from a Swedish case-control study. Diabetologia 2015; 58(11): 2525-32. Le texte ci-dessous est issu d’un résumé PubMed : In a study on birthweight and latent autoimmune diabètes in adults (LADA), ail individuals with incident LADA registered in Skâne (2010-) and Uppsala (2012-) in a régional pathology registry were invited to take part in a study and participants free from diabètes (six per LADA case) were randomly selected via the National Population Registry, which covers the whole population of Skâne and Uppsala. They were matched on geographical area (county) and date of participation. Ail participants who gave self-reported information on birthweight were eligible for the analyses presented here. Those who filled in the questionnaire but did not remember their birthweight (answered ‘I do not know’ to the birthweight question) were excluded from the analysis. The overall response rates were 80 % for incident LADA cases and 66 % for participants free from diabètes. Were presented here Odds Ratios and 95 % CIs for LADA in relation to birthweight, adjusted for sex, âge, BMI and family history of diabètes. Results : Eligible for the analysis were 134 incident LADA cases and 603 randomly selected participants free from diabètes. The OR (95 % Cis) for participants weighing < 3 kg compared with > 4 kg at birth was estimated as 2.38 (1.23,4.60) for LADA. Il est vrai que : Il aurait fallu cocher... Il existe potentiellement un biais de mesure différentiel Commentaires Il est tout à fait possible que la mesure de l’exposition (le poids de naissance) soit influencée par la connaissance de la maladie (le LADA) dans la mesure où la maladie est connue au moment du recueil de l’exposition Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 20 Généralités Il aurait fallu cocher... Commentaires Il existe potentiellement un biais de sélection Les cas sont sélectionnés car seuls les patients connaissant leur poids de naissance ont été inclus. Les témoins sont sélectionnés car seuls ceux acceptant de participer ont été inclus. On n’a donc pas d’indication sur le fait que l’échantillon représente en effet la population source (biais de sélection). En revanche, la population source semble être représentative de la population cible (utilisation de registres de population donc source = cible) La valeur de Vodds ratio (OR) donnée tient compte des éventuels facteurs de confusion L’OR est en effet ajusté sur le sexe, l’âge, les antécédents grâce à une analyse multivariée. Ces variables sont des facteurs de confusion dans l’étude du lien entre poids de naissance et LADA Les investigateurs ont réalisé un appariement Chaque cas se voit apparier (matched) 6 témoins originaires de la même région géographique et avec la même date de participation Les investigateurs ont réalisé un ajustement Le calcul d’un OR ajusté atteste la réalisation d’une analyse multivariée et donc d’un ajustement Il est possible que le résultat obtenu soit uniquement lié à l’erreur de mesure Un biais de mesure différentiel peut expliquer la modification d’une association dans les deux sens, il peut expliquer à lui seuil un résultat positif ou négatif L’utilisation d’un registre limite le biais de mesure sur la maladie Les cas étant tous issus d’un registre, on est en droit de penser que la véracité de la pathologie a été vérifiée, et que tous les cas sont vraiment malades Les témoins sont issus de la population générale Le tirage au sort des témoins à partir de registres de population indique bien qu’ils sont issus de la population générale (la population source et la population cible sont confondues) Cette étude ne permettra pas l’étude de l’effet de la zone géographique sur le risque de LADA L’appariement signifie que pour chaque patient d’une région donnée, on recrute 6 témoins de la même région. La proportion de patients de cette région est donc la même chez les cas et les témoins. L’effet de la région sur le risque de LADA est donc nul par définition Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Les trois biais : sélection, classement, confusion Il n’aurait pas fallu cocher... Commentaires L’utilisation de registres limite le biais de mesure sur l’exposition L’exposition n’est pas recueillie à partir de données de registre, mais par interrogatoire des patients. Le registre assure la qualité des données pour les variables qui sont recueillies dans son cadre L’étude est randomisée Le tirage au sort des témoins ne fait pas d’une étude une étude randomisée. Les seules études méritant le qualificatif de randomisée sont les études expérimentales dans lesquelles l’exposition (ou le traitement) est randomisée On ne sait pas si la mesure de l’association entre faible poids de naissance et risque de diabète LADA est significative L’intervalle de confiance de l’OR permet de tirer cette conclusion. En l’occurrence, l’exclusion de la valeur neutre « 1 » permet d’affirmer que l’association est significative Les témoins ont été sélectionnés à partir d’un registre de patients atteints de LADA Les témoins sont issus d’un registre de population générale 21 Ex e m ple 3 Une étude cas-témoins monocentrique a été réalisée pour étudier l’existence d’une relation entre certaines expositions environnementales, liées à l’activité professionnelle ou aux habitudes de vie, et la survenue de lymphomes malins non hodgkiniens. Les cas étaient définis comme l’ensemble des patients atteints de lymphome, actuellement suivis dans le service participant, avec confirmation par un examen histopathologique. Les témoins étaient recrutés par le département de médecine du travail lors de la visite systématique, et devaient être indemnes d’hémopathie maligne. Quelle(s) est(sont) la(les) proposition(s) exacte(s) ? Il aurait fallu cocher... Commentaires Les modalités de recrutement des témoins exposent à un biais de sélection Les témoins sont recrutés par le département de médecine du travail, alors que la population cible concerne clairement l’ensemble des personnes résidant dans les lieux exposés (« expositions liées aux habitudes de vie »). La population source de l’échantillon n’est donc pas représentative de la population cible > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 22 Généralités Il aurait fallu cocher... Commentaires Les critères de définition des cas visent à limiter un biais de classement La nécessité d’une confirmation histologique permet de limiter le biais de classement sur les cas Le recrutement de cas prévalents expose au risque de biais de sélection L’ensemble des patients actuellement suivis dans le service participant correspond en effet à la définition des cas prévalents, ce qui limite le recrutement aux survivants et donc potentiellement aux cas les moins graves Le calcul des risques relatifs est impossible dans cette étude Dans une étude cas-témoins, le ratio cas/ témoins est fixé, ce qui interdit le calcul de taux d’incidence, de prévalence ou de risque relatif. On estime les risques relatifs par des OR Il n’aurait pas fallu cocher... Commentaires Le schéma d’étude envisagé permet de mesurer de façon non biaisée les facteurs d’exposition Les facteurs d’exposition sont recueillis dans cette étude de manière rétrospective, ce qui n’est pas le meilleur moyen de s’assurer qu’il n’y ait pas de biais Les cas recrutés sont les cas incidents, ce qui assure leur représentativité Comme indiqué plus haut, le recueil de cas incidents est préférable, mais ce n’est pas le cas dans cette étude Il existe potentiellement un biais de mesure différentiel sur la maladie Dans une étude rétrospective, il est souvent possible que le recueil de l’exposition soit sujet à un biais différentiel (c’est-à-dire lié à la maladie). En revanche, le recueil de la maladie est réalisé sans tenir compte de l’exposition, on n’a donc pas de raison de penser que le diagnostic de lymphome peut être retenu plus facilement chez les exposés Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 3 Niveau de preuve des études Toutes les études n’apportent pas le même degré de confiance vis-à-vis des résultats. L’essai randomisé en double insu apporte toujours un meilleur niveau de preuve qu’une étude observationnelle, car la seule différence entre les deux groupes comparés est la prise du traitement. Cependant, certaines questions de recherche ne peuvent pas donner lieu à un essai randomisé (pour étudier le lien entre tabac et cancer, on ne peut pas randomiser l’utilisation du tabac et forcer un groupe de patients à fumer). L’étude avec le niveau de preuve le plus élevé n’est donc pas toujours faisable pour répondre à une question donnée. Une étude de cohorte apporte toujours un meilleur niveau de preuve qu’une étude cas-témoins, principalement du fait du caractère prospectif du recueil des données. La recherche et la publication d’études scientifiques entraînent à terme l’élaboration et la publication de recommandations scientifiques. Ces dernières se verront attribuer différents grades définis par le niveau de preuve des études publiées sur le sujet. Le tableau ci-dessous, publié par la Haute Autorité de santé (HAS), définit les niveaux de preuve et les grades des recommandations en fonction du type de l’étude et de certains critères de qualité méthodologiques. Grade des recommandations Niveau de preuve scientifique fourni par la littérature A Preuve scientifique établie Niveau 1 : - essais comparatifs randomisés de forte puissance - méta-analyse d’essais comparatifs randomisés - analyse de décision fondée sur des études bien menées B Présomption scientifique Niveau 2 : - essais comparatifs randomisés de faible puissance - études comparatives non randomisées bien menées - études de cohortes Niveau 3 : - études cas-témoins Niveau 4 : - études comparatives comportant des biais importants - études rétrospectives - séries de cas - études épidémiologiques descriptives (transversale, longitudinale) Source : HAS. Niveau de preuve et gradation des recommandations de bonne pratique. 2013. C Faible niveau de preuve scientifique La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 24 Généralités Il est donc nécessaire, pour juger du niveau de preuve d’une étude, d’évaluer deux éléments : • le type d’étude en lui-même : une étude rétrospective sera d’emblée classée en faible niveau de preuve ; • la qualité méthodologique : la présence de biais importants dans une étude comparative rétrograde immédiatement l’étude en niveau 4. /À retenir^ La m é t a-a n alyse (v oir fich e 7) Une méta-analyse regroupe les résultats de plusieurs études comparatives déjà réalisées sur un sujet donné : l'objectif est d'effectuer une synthèse des essais cliniques réalisés sur le même sujet ; il ne s'agit pas simplement de dresser une liste des résultats des différents essais, mais réellement de permettre une analyse statistique grâce aux données des études déjà réalisées ; point fort : augmentation de l'effectif donc meilleure représentation de la population et augmentation de la puissance ; point faible : résultats pouvant être biaisés notamment en raison de la non-publication des essais négatifs (biais de publication). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques descriptives Les dif f ére n ts t y p es d e varia bles Une variable, en statistiques, est définie par toute caractéristique pouvant être mesurée chez plusieurs individus et susceptible de prendre des valeurs différentes selon ces individus. Dans les études, on recueille ces variables chez les individus de l’échantillon d’étude. En recherche clinique, on utilise des variables comme critères de jugement. En statistiques, la nature d’une variable a moins d’importance que la manière dont elle est traitée. Prenons l’exemple de l’indice de masse corporelle (IMC) : • si on compare l’IMC moyen en kg/m2 entre deux groupes, la variable étudiée est quantitative ; • si on compare le pourcentage de patients obèses (l’obésité étant définie par un IMC > 30) entre deux groupes, la variable étudiée est qualitative. Variables quantitatives À l’échelle du patient, c’est une valeur numérique. À l’échelle de l’échantillon, on peut calculer une moyenne. Variable quantitative Caractéristiques Exemples Continue Peut prendre n’importe quelle valeur numérique dans l’intervalle des observations possibles. Le nombre de chiffres après la virgule est limité par la précision des appareils de mesure. Une unité de mesure y est généralement associée Variables biologiques +++ (taux de C-reactive protein en mg/L, taux d’hémoglobine en g/dL, etc.) Taille en cm, tension artérielle en mmHg, poids en kg, etc. Discrète (discontinue) Ne prend comme valeur que les nombres entiers dans l’intervalle d’observations possible Nombre d’hospitalisations, de rappels de vaccinations, d’épisodes d’infection, etc. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 26 Généralités Para m è tres d e p ositio n Définition Paramètre Moyenne (mean) Valeur correspondant à la somme des valeurs de la série divisée par le nombre d’individus : Xx LL =-----N p = moyenne Sx = somme des valeurs de la série N = nombre d’individus Médiane (médian) Valeur qui partage les individus d’une série en 2 groupes d’effectifs identiques 50 % des individus présentent une valeur inférieure à la médiane et 50 % des individus présentent une valeur supérieure. L’avantage par rapport à la moyenne est que la médiane n’est pas influencée par des valeurs extrêmes pouvant être considérées comme aberrantes Quartiles (Ql: 1er quartile, Q3 : 3e quartile) Les quartiles sont au nombre de 3 et partagent la série en 4 groupes d’effectif identique : - 1er quartile : 25 % des individus présentent une valeur inférieure et 75 % une valeur supérieure - 2e quartile : 50 % des individus présentent une valeur inférieure et 50 % des individus présentent une valeur supérieure = médiane - 3e quartile : 75 % des individus présentent une valeur inférieure et 25 % une valeur supérieure Déciles Les déciles sont au nombre de neuf et partagent la série en 10 groupes d’effectifs identiques : - 1er décile = 10 % des individus présentent une valeur inférieure et 90 % une valeur supérieure - 5e décile = la médiane - 7e décile = 70 % des individus présentent une valeur inférieure et 30 % une valeur supérieure Percentiles Les percentiles sont au nombre de 99 et partagent la série en 100 groupes d’effectifs identiques : - 1er percentile = 1 % des individus présentent une valeur inférieure et 99 % une valeur supérieure - 10e percentile = 1er décile - 25e percentile = 1er quartile - 50e percentile = la médiane = 2e quartile - 75e percentile = 3e quartile - 99e percentile = 99 % des individus présentent une valeur inférieure et 1 % une valeur supérieure Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques descriptives Paramètre 27 Définition Mode Valeur la plus fréquente au sein d’une série de données. On parle de distribution unimodale lorsqu’il existe une seule valeur surreprésentée et de distribution bimodale lorsqu’il existe deux valeurs surreprésentées Étendue (range) L’étendue est l’intervalle entre la valeur la plus basse (le minimum) et la valeur la plus haute possible (ou maximum). Par exemple, l’étendue des valeurs possibles du score de Glasgow est de 3 à 15 Para m è tres d e disp ersio n Définition Paramètre Variance Il s’agit du paramètre de dispersion le plus important car c’est celui qui est le plus utilisé dans les analyses statistiques. Il résume la distribution des valeurs de la série étudiée autour de la moyenne Il correspond à la somme des carrés des écarts à la moyenne de toutes les valeurs de la série divisée par le nombre d’individus : N Dans le cadre de l’estimation de la variance d’une population après échantillonnage de celle-ci la formule est légèrement différente car on utilise le terme n — 1 en tant que dénominateur. La notation est également différente dans cette situation : s2 _S(x-m)2 n-1 Écart type (standard déviation) L’écart type correspond à la racine carrée de la variance : ct = Vct ^ Dans le cadre de l’estimation de l’écart type après réalisation d’un échantillonnage, la notation est : S= Intervalle interquartile (interquartile range ou IQR) Correspond à la différence entre le 1er quartile et le 3e quartile. L’intervalle interquartile comprend alors les 50 % de la population les plus proches de la médiane. Il est souvent noté IQR : IQR = Q3-Q1 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 28 Généralités Re prése nt a tio n gra p hiq u e Histogramme Prenons l’exemple de la distribution de la consommation de café en tasses par jour des patientes d’une étude cas-témoins pendant le premier trimestre de grossesse : médiane = 3 tasses, étendue (range) = 0-8, intervalle interquartile (IQR ou Q1-Q3) = 1-5. Dans cet échantillon de 400 patientes, on peut donc en déduire qu’un quart des patientes (soit 100) boivent moins d’une tasse de café par jour, la moitié (soit 200) entre 1 et 5 tasses, et un quart plus de 5 tasses. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques descriptives 29 Boîte à moustaches (boxplot) 8 Max 5 03 Moyenne 2 Médiane 01 0 Min tasses / jour Cette figure est réalisée à partir du même exemple ci-dessus portant sur la consommation de café de patientes lors de leur premier trimestre de grossesse. La boîte à moustaches {boxplot en anglais) est un autre mode classique de représentation des différents paramètres de position. À retenir Dans un tableau de résultats, on représente habituellement pour une variable quantitative : la moyenne et l'écart type (m ± ET) ou la moyenne et l'intervalle de confiance si la distribution de la variable est gaussienne ; la médiane et l'étendue ou la médiane et l'intervalle interquartile si la distribu tion n'est pas symétrique. Les parenthèses qui suivent une valeur donnée par un paramètre de position (moyenne ou médiane) dans un article peuvent donc contenir un seul chiffre (écart type) ou deux chiffres (intervalle interquartile ou IQR, étendue ou range, intervalle de confiance). Dans un tableau, des annotations définissent quels paramètres de position et de dispersion ont été utilisés. P o u r q u oi u t ilis e r p l u t ô t la m é d i a n e q u e la m o y e n n e e t l es I Q R p l u t ô t q u e l es i n t e r v a ll es d e c o n fi a n c e ? Quand la distribution n'est pas symétrique, ou qu'il y a des valeurs aberrantes ou extrêmes, la moyenne est « attirée par les extrêmes ». Pensez à l'exemple du salaire des Français : la moyenne est de 3 000 , or très peu des salariés français ont un tel salaire ; la médiane est de 1 800 ; les quelques très gros salaires attirent donc la moyenne mais donnent une piètre représentation de la rémunération de la majorité des salariés. On préfère donc parler en médiane et utiliser l'IQR ou le range. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 30 Généralités Variables qualitatives • À l’échelle du patient, c’est un oui/non ou un choix entre plusieurs possibilités (imaginer des cases à cocher). • À l’échelle de l’échantillon, c’est un pourcentage. Caractéristique Exemple Nominale Variable qui est représentée par différentes classes ou catégories sans hiérarchie possible entre elles Groupe sanguin (A, B, O, AB) Sexe (féminin ou masculin) Ville de résidence Ordinale Variable qui est représentée par différentes classes ou catégories avec une hiérarchie entre elles. On peut définir un ordre entre ces différentes catégories Résultat d’un score de risque de l’embolie pulmonaire (faible risque, risque intermédiaire, risque élevé) Variable qualitative Il est possible de transformer une variable quantitative en variable qualitative ordinale. 1. Par exemple : prenons la variable quantitative « Age » de dix individus : Individus A B C D E F G H I Âge en années 45 60 33 98 85 54 59 62 23 J 77 2. transformons la variable quantitative « Âge » en variable qualitative ordinale à trois classes : Classes d’âge Âge < 60 ans Âge entre 60 et 79 ans Âge >80 ans Effectifs par classe 5 3 2 Proportion 50 % 30 % 20 % Le choix des bornes des classes est important car en fonction de celui-ci les résultats peuvent varier considérablement : Classes d’âge Âge < 40 ans Âge en 40 et 59 ans Âge >60 ans Effectifs par classe 2 3 5 Proportion 20 % 30 % 50 % Description des variables qualitatives D escrip tio n d'u ne se ule v aria ble q u alit ativ e On définit des variables qualitatives à deux (ou plus) modalités : • ex. : statut vivant/décès = variable à 2 modalités ; • ex. : groupe sanguin A, B, AB, O = variable à quatre modalités. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques descriptives 31 Afin de décrire ce type de variable au sein d’une population, on réalise un calcul des fréquences relatives (ce qui correspond à une proportion ou un pourcentage). Par exemple, au sein d’une population de 200 personnes on retrouve : • 150 femmes et 50 hommes (correspondant à une variable qualitative nominale) ; • 20 personnes avec une hypertension artérielle (HTA) sévère, 60 avec une HTA modérée et 120 sans HTA (correspondant à une variable qualitative ordinale). On calcule alors les fréquences relatives pour la variable « sexe » et la variable « HTA » : Sexe Total Masculin Féminin Effectif 150 50 200 Fréquence relative 75 % 25 % 100 % HTA Non Total Modérée Sévère Effectif 120 60 20 200 Fréquence relative 60 % 30 % 10 % 100 % Les femmes représentent 75 % de l’échantillon. Les individus avec HTA sévère représentent 10 % de l’échantillon. D escrip tio n co njoin t e d e d e u x v aria bles q u alita tiv es Construction d'un tableau de contingence Dans l’exemple précédent, on a décidé de décrire les variables qualitatives « sexe » et « HTA » de manière séparée. Il est également possible de les décrire de manière simultanée ce qui permettra éventuellement par la suite de réaliser des statistiques comparatives. On pourra dans l’exemple se demander si l’HTA sévère est plus fréquente chez les femmes ou chez les hommes. On commence par construire un tableau de contingence qui correspond au calcul des effectifs partiels : Total Absence d’HTA HTA modérée Hommes 25 15 10 50 Femmes 95 45 10 150 Total 120 60 20 200 HTA sévère Dans cet échantillon de 200 individus, 25 individus sont des hommes sans HTA, 10 sont des femmes avec HTA sévère, 45 sont des femmes avec HTA modérée. ► Remarque : la ligne et la colonne « total » correspondent aux effectifs marginaux qui sont équivalents à la description indépendante de chacune des deux variables. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 32 Généralités Calcul des fréquences partielles Les fréquences partielles correspondent au calcul de la proportion des effectifs partiels au sein de l’échantillon total. Il faut pour cela diviser chaque effectif partiel par le nombre total de l’échantillon (ici 200) : Absence d’HTA HTA modérée Total HTA sévère Hommes 25 (12,5 %) 15 (7,5 %) 10 (5 %) 50 (25 %) Femmes 95 (47,5 %) 45 (22,5 %) 10 (5 %) 150 (75 %) Total 120 (60 %) 60 (30 %) 20 (10 %) 200 (100 %) Dans cet échantillon : 47,5 % sont des femmes sans HTA, 5 % sont des hommes avec HTA sévère, 7,5 % sont des hommes avec HTA modérée. ► Remarque : on retrouve les fréquences marginales propres à chaque variable dans la ligne et dans la colonne « total ». Calcul des fréquences conditionnelles Il s’agit ici de calculer les fréquences de distribution d’une variable au sein d’une des modalités de l’autre variable. Distribution conditionnelle de la variable « sexe » en fonction de la variable « HTA » (pourcentage en colonne) : Absence d’HTA HTA modérée HTA sévère Total Hommes 25 (20,8 %) 15 (25 %) 10 (50 %) 50 Femmes 95 (79,2 %) 45 (75 %) 10 (50 %) 150 Total 120 (100 %) 60 (100 %) 20 (100 %) 200 Parmi les individus avec une HTA sévère, on retrouve 50 % d’hommes, alors que parmi les individus sans HTA on retrouve seulement 20,8 % d’hommes. Distribution conditionnelle de la variable « HTA » en fonction de la variable « sexe » (pourcentage en ligne) : Absence d’HTA HTA modérée HTA sévère Total Hommes 25 (50 %) 15 (30 %) 10 (20 %) 50 (100 %) Femmes 95 (63,33 %) 45 (30 %) 10 (6,67 %) 150 (100 %) Total 120 60 20 200 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques descriptives 33 Parmi les femmes, on retrouve 6,67 % d’HTA sévère, alors que parmi les hommes on en retrouve 20 %. À retenir Pour comprendre un tableau, et les questions qui s'y rapportent, il est indispensable de comprendre si les pourcentages donnés sont les fréquences partielles ou les fréquences conditionnelles en ligne ou en colonne. Vous pouvez vous y retrouver en faisant le total des pourcentages en ligne et en colonne. S’il n ’ y a pas de donnée manquante, le pourcentage en ligne (ou en colonne) vaut 100 °/o dans le cas de fréquences conditionnelles en ligne (ou en colonne). M esures d e l'é t a t d e san t é d'u ne p o p ula tio n Taux et notion de personnes-temps à risque Ta ux Un taux est un indicateur qui représente la fréquence de survenue d’un événement au cours du temps (taux d’incidence, taux de mortalité, etc.). Un taux se calcule dans le cadre d’une étude longitudinale : par exemple, taux de mortalité au sein d’une population x = 5 décès pour 100 000 habitants par an. On peut calculer : • le taux brut prenant en compte la survenue de l’événement au cours du temps au sein de l’ensemble de la population étudiée ; • des taux spécifiques prenant en compte ce taux au sein d’une tranche de la population étudiée (par exemple, taux d’incidence spécifique chez les femmes). N o tion d e p erso n n es-t e m ps à risq u e Le calcul d’un taux nécessite au préalable de calculer le nombre de personnestemps (PT) au sein de la population considérée. Les PT regroupent au sein d’une même unité de mesure le nombre de personnes et le temps pendant lequel ces personnes sont exposées au phénomène (ou au risque) étudié. Ex e m ple a v ec calcul d'u n t a u x d'incid e nce • Incidence = nombre de nouveaux cas au cours d’une période de temps. • Personnes-temps à risque exprimées en personnes-années = 17. • Nombre de nouveaux cas = 2. • Taux d’incidence = 2/17 = 0,12 = 12 nouveaux cas par an pour 100 personnesannées exposées au risque. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 34 Généralités Indicateurs de morbidité Incide nce L’incidence correspond au nombre de nouveaux cas d’une maladie survenant au sein d’une population. Il s’agit d’une mesure longitudinale. Le taux d’incidence est un calcul qui reflète la vitesse d’apparition d’une maladie dans une population. Calcul du taux d’incidence : TI - N/PT Avec : • TI : taux d’incidence ; • N : nombre de nouveaux cas de la maladie constatés dans la population étudiée pendant la période de temps étudiée ; • PT : nombre de personnes-temps à risque calculé dans la population étudiée pendant la période de temps étudiée. Pré vale nce La prévalence est le pourcentage d’individus malades dans une population à un moment donné. Il s’agit d’une mesure transversale. Calcul de la prévalence : P = n/N Avec : • P : prévalence ; • n : nombre de personnes malades dans la population étudiée à un instant t ; • N : effectif total de la population étudiée. La prévalence dépend de deux éléments : • l’incidence : plus le nombre de cas incidents (nouveaux cas) augmente, plus le nombre de cas prévalents augmente ; • la durée d’évolution de la maladie : plus la maladie évolue longtemps, plus le nombre de cas prévalents augmente. Par exemple, une maladie qui, auparavant, entraînait le décès rapidement et qui dispose depuis peu de temps d’un traitement qui la transforme en maladie chronique verra sa prévalence augmenter, et cela sans que l’on observe d’augmentation de nouveaux cas. Indicateurs de mortalité Ta ux d e m ort alité • Taux de mortalité brut : le taux de mortalité brut est égal au nombre de décès divisé par le nombre de personnes-temps à risque au sein d’une population entière. • Taux de mortalité spécifique : le taux de mortalité spécifique est égal au nombre de décès divisé par le nombre de personnes-temps à risque au sein d’un sous-groupe d’une population. Par exemple, le taux de mortalité spécifique dans la classe d’âge des 40-49 ans. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques descriptives 35 M ort alit é pré m a t uré e • Décès prématuré : par définition, décès avant l’âge de 65 ans. • Taux de mortalité prématurée = taux de mortalité spécifique chez la souspopulation des moins de 65 ans. • Années potentielles de vie perdues = nombre d’années entre un décès prématuré et 65 ans : - par exemple, pour un sujet décédé à 30 ans, années de vie perdues = 35 ans ; - cela permet de nuancer le taux de mortalité prématurée. Deux populations avec un taux de mortalité prématurée identique mais avec un nombre d’années potentielles de vie perdues différentes n’auront pas forcément les mêmes problématiques. Lé t alité La létalité correspond à la proportion de personnes décédées secondairement à une maladie au sein d’une population atteinte de cette maladie. In dica t e urs d e m ort alit é f œ t o -in f a n tile • Indicateurs prenant en compte la mortalité avant l’âge de 1 an. • Différents indicateurs en fonction de la période de vie considérée : Mortalité foeto-infantile Z X_____________ Mortalité infantile X 2 z __________ x X 2 Mortalité post-néonatale Mortalité néonatale X 2 Z____________________ X z X X___________ 2 Mortalité néonatale précoce z x X__________ 2 Mortalité néonatale tardive z Mortalité périnatale X ____________________ X 2 X Mortinatalité Z \__________ 2 22 semaines d'aménorrhée ou foetus > 500g Naissance 7 jours 28 jours 1 an Standardisation des taux Les taux dépendent de la structure d’âge de la population étudiée. Le taux de mortalité d’un pays dépend évidemment de la proportion de personnes plus âgées qui compose ce pays. Pour comparer les taux entre des pays de structures d’âge différentes, on utilise la standardisation. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 36 Généralités Sta n d ardisa tio n direct e o u m é t h o d e d e la p o p ula tio n t y pe On applique les taux spécifiques de chaque tranche d’âge du pays étudié à une population type (population du monde, par exemple). On calcule ensuite le taux standardisé à partir du nombre de décès attendus si la structure d’âge était celle de la population type. Les taux de plusieurs pays standardisés sur la même population type deviennent ainsi comparables. St an d ardisatio n in directe o u m é t h o d e d u t a u x t y pe On applique les taux spécifiques par âge de la population type (ou de référence) à chaque tranche d’âge du pays étudié. On obtient ainsi un nombre de décès attendus. En divisant le nombre de décès observés dans la population étudiée par le nombre de décès attendus, on obtient un ratio standardisé (standardized incidence ratio ou SIR, standardized mortality ratio ou SMR). Si le ratio est supérieur à 1, la mortalité est plus importante dans la population étudiée que dans la population de référence. S’il est inférieur à 1, elle est moins importante. On utilise habituellement les taux standardisés (méthode directe) pour comparer des pays et les ratios standardisés (méthode indirecte) pour comparer une population plus petite à une unité plus grande (ex. : une région versus un pays ou un pays versus le monde). Phén o m ène d e fluct u atio n d'échan tillo n n a g e e t in t ervalles d e co n fia nce Principe En épidémiologie, on souhaite décrire un phénomène au sein d’une population. Il est donc nécessaire de mesurer ce phénomène chez les individus constituant cette population. Malheureusement, il est le plus souvent impossible de réaliser la mesure chez tous les individus, ce qui prendrait énormément de temps et coûterait beaucoup d’argent. On décide alors de mesurer le phénomène chez un groupe plus restreint d’individus représentatif de la population. Ce groupe d’individus correspond à l’échantillon qui a été choisi aléatoirement au sein d’une population source. Cet échantillon est destiné à représenter la population cible (pour la définition de ces termes, voir fiche 2). La valeur d’un phénomène obtenu dans un échantillon est appelée « estimateur ponctuel » de la valeur de ce phénomène dans la population cible. L’intervalle de confiance représente la zone dans laquelle la « valeur vraie » dans la population cible a 95 % de chances de se trouver. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques descriptives 37 Fluctuations d'échantillonnage et intervalle de confiance Prenons l’exemple suivant : • vous souhaitez calculer la moyenne du taux d’hémoglobine glyquée (HbAlc) au sein d’une population de 1 000 patients diabétiques ; • vous tirez au sort pour cela un échantillon de 10 patients et vous mesurez chez eux leur taux d’HbAlc ; • vous obtenez une moyenne de 8,8 %, il s’agit d’une estimation ponctuelle de la moyenne du taux d’HbAlc de la population de 1 000 patients ; • vous décidez d’effectuer un autre tirage au sort de 10 patients et vous réitérez les mesures, vous obtenez cette fois-ci une moyenne de 8,1 % ; vous recommencez et vous obtenez cette fois-ci 9,2 % ; • vous pouvez ainsi effectuer des mesures à l’infini au sein de plusieurs échantillons de 10 patients et vous obtiendrez des mesures à chaque fois différentes ; • ces différents résultats issus des différents échantillons se distribuent autour de la véritable moyenne de la population de 1 000 patients que vous souhaitez estimer ; • ce phénomène est le reflet des fluctuations d’échantillonnage. Comment prendre en compte ce phénomène ? Ce phénomène est pris en compte par le calcul d’un intervalle de confiance (IC) souvent défini à 95 %. Dans le cadre de notre exemple, on retrouve une moyenne estimée à 8,8 % [IC95 % : 7,8 %-9,8 %]. Cela signifie que la vraie moyenne a 95 % de chances de se trouver entre 7,8 et 9,8 %. Comment limiter les fluctuations d’échantillonnage ? • En augmentant la taille de l’échantillon l’estimation sera de plus en plus précise. • Si l’on réalise la mesure d’HbAlc chez 999 des 1 000 malades, on se rapprochera de très près de la véritable moyenne de la population et si l’on réalise la mesure chez les 1 000 patients on connaîtra la vraie moyenne. • Donc lorsque l’on augmente la taille de l’échantillon, on limite le phénomène de fluctuations d’échantillonnage et on diminue la distance entre les bornes de l’intervalle de confiance à 95 %. • Pour un échantillon de 100 patients, on retrouve une moyenne à 8,6 % [IC95 % : 8,1 %- 9,1 %]. • Pour un échantillon de 500 patients, on retrouve une moyenne à 8,7 % [IC95 % : 8,5 %- 8,9 %]. En pratique, chaque mesure estimée grâce à la constitution d’un échantillon vue précédemment (moyenne, proportion, prévalence, incidence, taux de mortalité, etc.) doit être accompagnée des résultats du calcul de son intervalle de confiance à 95 %. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 38 Généralités En pra tique Ex e m ple 1 (ED N 2017) Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML, Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D, Nutt CL, McNamee JJ, Reschreiter H, Breen A, Lin KD, Ashby D. Levosimendan for the prévention of acute organ dysfunction in sepsis. N Engl J Med 2016 ; 375 : 1638-48. Le tableau suivant est donné dans un essai clinique comparant un vasodilatateur (le lévosimendan) à un placebo sur la mortalité du choc septique. Ce tableau compare les caractéristiques à l’inclusion des deux groupes randomisés. Baseline Characteristics*. Levosimendan (N = 258) Characteristic Placebo (N = 257) 69 (58-77) Médian âge (IQR) - yr 67 (58-75) Male sex - no. ( %) 145 (56.2) 144 (56.0) Médian weight (IQR) - kg 76 (65-90) 80 (68-91) Médian body-mass index (IQR) 27 (23-30) 28 (24-32) Médian time from shock to randomization (IQR) - hr 16 (10-21) 15 (10- 20) Médian SOFA score (IQR) 10 (8-12) 10 (7- 12) Stroke volume - ml 55.7 (40.0-73.5) 67.0 (49.4-79.7) * There were no significant between-group différences in the characteristics at baseline, except for stroke volume (P = 0.02). Que peut-on dire du tableau ci-dessus ? Il aurait fallu cocher... Commentaires 25 % des patients du groupe lévosimendan avaient un index de masse corporelle (IMC) supérieur à 30 Le 3e quartile de l’IMC correspond bien à 30 kg/m2 Le délai médian entre le choc et la randomisation était comparable entre les 2 groupes En effet, une différence d’une heure de délai moyen entre les groupes ne correspond pas à une différence cliniquement pertinente Le groupe lévosimendan comprenait 145 hommes Le signe « no. » signifie « nombre d’observations » Le groupe de référence pour l’étude du sexe était le sexe féminin Le pourcentage d’hommes est donné par rapport aux femmes. La catégorie de référence implicite est donc bien les femmes 1/4 des patients du groupe lévosimendan avaient un score SOFA entre 10 et 12 On trouve bien 25 % de la distribution entre la médiane et le 3e quartile (voir plus bas) SOFA : sequential organ failure assessment. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques descriptives Il n’aurait pas fallu cocher... Commentaires Le score SOFA à la randomisation était compris entre 8 et 12 dans le groupe lévosimendan Cette affirmation correspondrait à l’étendue {range) du score SOFA et pas à l’intervalle interquartile (1QR) La moyenne d’âge dans le groupe placebo était de 69 ans C’est la médiane qui est représentée La randomisation était déséquilibrée À l’évidence, le ratio de randomisation était de 1:1 Plus de la moitié des patients inclus dans l’étude était des femmes SOFA : sequential organ failure assessment. Le pourcentage d’hommes inclus dans chaque groupe dépasse les 50 % 39 Pour mémoire, répartition des patients entre les quartiles : Fréquence simple Classes [Xmin ; Q1 [ 25 % [Q1 ; Q2 [ 25 % [Q2 ; Q3 [ 25 % [Q3 ; Xmax [ 25 % Ex e m ple 2 (ED N 2016) Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai Consumption of coffee and caffeine-containing beverages and oral clefts : a population-based case-control study in Norway. Am J Epidemiol 2009 ; 169 : 1216-22. Le tableau ci-dessous est issu d’une étude cas-témoin comparant les caractéristiques de mères ayant donné naissance à des fentes palatines seules d’une part, et des fentes labiopalatines d’autre part à celles de mères ayant donnés naissance à des enfants indemnes {control group). 1 336 patientes ont été incluses dans cette étude. Démographie and Other Characteristics of Participants in the Case-Control Study of Maternai Consumption of Caffein-containing. Beverages and Oral Clefts, Norway, 1996-2001. Cleft Lip With or Without Cleft Palate Only (n = 196) Cleft Palate (n = 377) Médian (25th, 75th percentile)3 % Mean (SD) Médian (25th, 75th percentile)3 % Mean (SD) Control Group (n = 763) Médian (25th, 75th percentile)3 % Mean (SD) Mother’s characteristics Coffee consumption before pregnancy, cups/day 3.0(1.0,4.1) 3.0 (1.0,5.0) 3.0 (1.0,4.3) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 40 Généralités Cleft Lip With or Without Cleft Palate Only (n = 196) Cleft Palate (n = 377) Médian (25*, 75* percentile)3 % Mean (SD) Médian (25*, 75* percentile)3 % Mean (SD) Médian (25*, 75* percentile)3 % Smoking during the first trimesterb 44.1 36.8 31.9 Working during the first trimester 76.3 79.5 83.1 1.0 (1.0,2.0) 1.0 (1.0,2.0) Alcohol 2.0 (1.0,2.0) consumption, drinks/sitting Mean (SD) 2.0 (07,3.0) 2.0 (0.4,3.0) 2.0(07,4.0) Coffee consumption during the first trimester, cups/day Control Group (n = 763) Age at delivery, years 28.9 (4.9) 28.9 (5.1) 29.2 (4.8) Height, cm 168.6 (5.7) 166.9 (6.6) 167.7 (6.0) Abbreviation : SD, standard déviation. a Intake among consumers only. b Ail levels of active smoking versus nonsmoking and passive smoking. D’après le tableau ci-dessus : Il aurait fallu cocher... Commentaires La fréquence du tabagisme maternel actif au cours du premier trimestre de grossesse était de 31,9 % dans le groupe contrôle En effet, cette valeur est un pourcentage, comme indiqué dans l’en-tête du tableau 573 cas de fente labiopalatine (FLP) ou fente palatine seule (FPS) ont été inclus au total dans cette étude Cette valeur est obtenue en sommant les effectifs des 2 groupes de cas (377 + 196) Parmi les femmes consommant du café avant la grossesse, 25 % en consommaient moins de 1 tasse par jour Le 1er quartile de la consommation de café est en effet à 1 tasse dans les 3 groupes. Attention, la note de bas de page a indique clairement que ces statistiques descriptives ne portent que sur les consommatrices Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques descriptives Il n’aurait pas fallu cocher... Commentaires Avant la grossesse, 75 % des femmes consommaient au moins 1 tasse de café par jour Même si le 1er quartile est effectivement à 1 dans les 3 groupes, cette formulation est fausse en raison de la note de bas de page a qui précise que les statistiques descriptives ne sont calculées que chez les consommatrices 79,5 % des mères travaillant durant le premier trimestre de grossesse ont donné naissance à un nouveau-né avec une fente palatine seule (FPS) La formulation exacte serait « 79,5 % des patientes ayant donné naissance à un enfant avec une fente labiopalatine travaillaient pendant le premier trimestre ». Dans le tableau de l’exemple 2, les pourcentages sont donnés en colonne 50 % des mères du groupe témoin consommaient au moins 2 tasses de café quotidiennement pendant le premier trimestre de grossesse Cette proposition est fausse en raison de la note de bas de page a 41 Ex e m ple 3 Dans une étude descriptive à propos du taux de C-reactive protein (CRP) en mg/L portant sur 100 patients atteints de pneumopathie à pneumocoque à la phase précoce, on peut lire que le taux moyen de CRP est de 70 mg/L avec une étendue (range) de 7 à 300 mg/L, une médiane de 110 mg/L, un intervalle interquartile de 80 à 150 mg/L. Il est vrai que : Il aurait fallu cocher... Commentaires Compte tenu de la distribution des valeurs de la CRP, la médiane est plus informative que la moyenne de la CRP Il existe des valeurs extrêmes semblant « tirer » la moyenne vers le bas (valeur minimale : 7 mg/L), il existe un écart significatif entre la moyenne et la médiane semblant indiquer que la distribution n’est pas symétrique. La médiane semble donc plus informative que la moyenne pour décrire cette distribution 1/4 des patients ont une valeur de CRP de moins de 80 mg/L C’est la signification de la première valeur de l’intervalle interquartile (1er quartile ou Ql) 1/4 des patients ont une valeur de CRP entre 110 et 150 mg/L 1/4 de la distribution se trouve entre la médiane et le 3e quartile Aucun patient n’a une CRP supérieure à 300 mg/L dans cette étude L’étendue (range) étant de 7 à 300, cela signifie que la valeur maximale est de 300 et la valeur minimale de 7 mg/L Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 42 Généralités Il n’aurait pas fallu cocher... Commentaires Les valeurs de CRP ont probablement une distribution gaussienne Dans une distribution symétrique, notamment la distribution normale, la moyenne et la médiane sont très proches. Ici, la médiane (110) est bien plus importante que la moyenne (70), ce qui semble indiquer que certaines valeurs basses « extrêmes » tirent la moyenne vers le bas La valeur réelle de la CRP dans la population cible a 95 % de chances de se trouver entre 80 et 150 mg/L Cette formulation serait exacte si l’intervalle donné était un intervalle de confiance à 95 % La valeur réelle de la CRP dans la population cible a 50 % de chances de se trouver entre 80 et 150 mg/L 50 % des valeurs de l’échantillon se trouvent dans cet intervalle, mais cela ne permet pas de conclure sur la précision de l’estimateur ponctuel. Seul un intervalle de confiance le permet Ex e m ple 4 (ED N t est 2021) Hoffmann MHK, Shi H, Schmitz BL, Schmid FT, Lieberknecht M, Schulze R, et al. Noninvasive coronary angiography with multislice computed tomography. JAMA 25 mai 2005 ; 293(20) : 2471-8. The mean (SD) interval between the multislice computed tomography scan and conventional coronary angiography was 16.3 (15.1) days, while the médian (IQR) was 10 (7-15) days. Pour le délai entre le scanner multicoupe 16 barrettes et la coronarographie conventionnelle sélective, quelle(s) est (sont) la (les) statistique(s) descriptive(s) la (les) plus appropriée(s) ? Il aurait fallu cocher... La médiane L’intervalle interquartile (interquartile range, IQR) L’étendue (range) Il n’aurait pas fallu cocher... La moyenne Commentaires La distribution de ce délai est clairement asymétrique, la médiane et la moyenne étant assez éloignées. Il serait donc préférable de décrire la variable par sa médiane et son intervalle interquartile qui sont moins influencées par les valeurs extrêmes, ou l’étendue, qui permet d’identifier les valeur aberrantes Commentaires L’écart type La moyenne et l’écart type sont préférés en cas de distribution symétrique des valeurs (c’est-à-dire autant d’individu en dessous et au-dessus de la moyenne), auquel cas la moyenne est très proche de la médiane La variance La variance correspond à l’écart type au carré Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 5 Statistiques comparatives et mesures d’association M esures d'associatio n e n tre une e x p ositio n e t un évé ne m e n t Calcul d'un risque Dif fére nce a bsolu e d u risq u e o u dif f ére nce d e risq u e (DR) • Correspond à la différence absolue des risques entre deux groupes, en points de pourcentage. • Exemple : si le risque de déclarer la grippe chez le groupe vacciné est de 30 % et que le risque chez le groupe non vacciné est de 70 %, la réduction absolue du risque est de 70 % — 30 % = 40 %. Cela signifie qu’en vaccinant 100 individus, on évite 40 cas de grippe. On parle parfois d’une diminution de 40 points de pourcentage. Risq u e rela tif (RR) • Le risque relatif est le rapport entre le risque chez les exposés et le risque chez les non-exposés. La diminution relative du risque en pourcentage (comparable à la réduction du prix pendant les soldes) est égale à « (1 — RR) X 100 ». • Dans notre exemple précédent, le RR correspond à 0,3/0,7 = 0,44. Cela signifie que la vaccination « multiplie le risque de grippe » par 0,44 ; ce qui correspond à une réduction relative de (1 — 0,44) X 100 = 56 % du nombre de cas de maladie chez les vaccinés, ou encore que le RR est de 0,44 pour les sujets vaccinés par rapport aux sujets non vaccinés. • On peut aussi dire que le RR des sujets non vaccinés par rapport aux sujets vaccinés est de 0,7/0,3 = 2,3 ; soit une augmentation de (1 — 2,3) X 100 = 130 % du RR chez les non-vaccinés par rapports aux vaccinés. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Généralités 44 Prenons l’exemple du vaccin avec les patients non vaccinés comme référence : Si le risque relatif est de... Le risque relatif des patients vaccinés par rapport aux patients non vaccinés diminue de... 1 0% 0,8 20 % 0,65 35 % 0,55 45 % Prenons l’exemple du vaccin avec les patients vaccinés comme référence : Si le risque relatif est de... Le risque relatif des patients non vaccinés par rapport aux patients vaccinés augmente de... 1 0% 1,5 50 % 1,7 70 % 2 100 % 8,5 750 % À retenir^ Attention à la différence entre risque absolu et risque relatif pour les pourcentages ! Variables qualitatives = comparaison de pourcentages Exemple - une étude sur une chimiothérapie dans le traitement d’un lymphome montre à 1 an une réduction de la mortalité (50 % de mortalité dans le groupe placebo, et 25 % dans le groupe traité) : • la différence absolue de la mortalité due au traitement est de 50 % — 25 % = 25 points de pourcentage (on passe de 50 % à 25 % de mortalité) ; • la réduction relative de mortalité due au traitement est de 100 % — 25 %/50 %, soit 1 — 0,5 = 50 % de réduction relative du risque (le taux de mortalité a été divisé par 2) ; • pour la différence absolue, on parle parfois d’une différence en « points de pourcentage ». Variables quantitatives = comparaison de moyennes Exemple - une étude sur un traitement antalgique permet contre placebo une diminution de la douleur mesurée en millimètres sur une échelle visuelle numérique (40 mm dans le groupe traité, 60 mm dans le groupe placebo) : • le traitement permet une réduction absolue de la douleur de 20 mm ; • la réduction relative de la douleur est de 40/60 = 0,66, soit une diminution relative de 100 — 66 = 34 % de la douleur (la douleur diminue d’un tiers). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques comparatives et mesures d’association 45 In t ervalle d e co n fia nce d'un e dif f ére nce d e risq ue e t d'u n risq u e rela tif • Si le risque est identique entre les deux groupes, la réduction absolue est égale à 0 %. Si l’intervalle de confiance d’une différence absolue en points de pourcentage exclut la valeur 0, on peut raisonnablement exclure le fait que la valeur vraie de cette différence absolue soit égale à 0 (ce qui revient à exclure l’hypothèse HO : réduction du risque absolu = 0). • Si le risque est identique entre les deux groupes, le risque relatif (RR) est égal à 1. Si l’intervalle de confiance du RR exclut la valeur 1, on peut raisonnablement exclure le fait que les risques soient identiques (ce qui revient à exclure l’hypothèse HO : RR = 1). N o m bre d e p a tie n ts à trait er (n u m ber needed to tre a t ou N N T) • Le NNT correspond au nombre de patients à traiter pour éviter un événement. • Son calcul est l’inverse de la réduction absolue du risque : NNT = 1/DR. • Dans notre exemple précédent, NNT = 1/0,4 = 2,5 ; il est donc nécessaire de vacciner entre deux et trois individus pour éviter la survenue d’un cas de maladie. Fractio n é tiolo giq ue Le « risque attribuable pour les exposés » (ou « fraction étiologique ») mesure la proportion de cas de la maladie que l’on peut attribuer au facteur de risque parmi les sujets exposés à ce facteur (par exemple, pourcentage des cas de cancer du poumon dus au tabagisme parmi les fumeurs). La fraction étiologique vaut : (RR - 1)/RR. Ainsi, si le RR vaut 4, la fraction étiologique vaut : (4 — 1 )/4 = 0,75. C’est-à-dire que 75 % des cas survenus chez des sujets exposés peuvent être attribués à l’exposition au facteur de risque, et auraient donc pu être évités si ces sujets n’avaient pas été exposés. Prenons l’exemple du cancer du poumon : • si le RR vaut 4 parmi la population fumeuse par rapport à la population non fumeuse, cela signifie que pour 4 cas de cancer chez les fumeurs on a 1 cas de cancer chez les non-fumeurs pour des populations identiques en effectif ; • imaginons maintenant que les 4 patients fumeurs n’aient pas fumé au cours de leur vie, ils rejoindraient alors le risque de la population générale. On aurait alors parmi ces 4 patients non pas 0 cas de cancer mais bien 1 cas de cancer, ce qui correspond au risque dans la population générale ; • donc en pratique, on peut dire que le tabac explique 3 cas de cancer sur 4 chez les patients fumeurs, soit 75 % des cas survenus chez les patients exposés au tabac. Ce pourcentage correspond bien à la fraction étiologique évoquée ci-dessus en cas de RR à 4. Calcul de rapports Ét u d e d e co h ort e : calcul d'un risq u e rela tif o u d'un h a z a rd r a tio Le RR est le rapport du risque entre les sujets exposés et les sujets non exposés. Le RR peut être calculé dans les études (prospectives ou rétrospectives) dans Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 46 Généralités lesquelles le ratio malades/non malades n’est pas fixé par l’étude (c’est-à-dire toutes les études à l’exception des études cas-témoins). Tableau de contingence. Indemne Malade Exposé a b Non exposé c d RR = — In t erpré ta tio n d u risq u e rela tif (RR) • RR < 1 (par exemple : RR = 0,78 [IC95 % : 0,71-0,85]) : l’association entre l’événement et le facteur d’exposition est négative. L’exposition étudiée entraîne une diminution de la survenue de l’événement, c’est un facteur protecteur. • RR > 1 (par exemple : RR = 4,78 [IC95 % : 3,80-5,76]) : l’association entre l’événement et le facteur d’exposition est positive. L’exposition étudiée entraîne une augmentation de la survenue de l’événement, c’est un facteur de risque. • Il reflète directement l’effet de l’exposition sur la survenue de la maladie avec exactitude. Par exemple, en cas de RR = 5, cela signifie que l’exposition multiplie par 5 la survenue de l’événement (on retrouve 5 fois plus l’événement chez les sujets exposés). H azard ra tio (HR) Il est équivalent au RR et s’interprète de la même façon. Il est utilisé dans la comparaison des risques instantanés de survenue d’un événement entre exposés et non-exposés dans les modèles statistiques étudiant un événement dépendant du temps (comme le modèle de Cox ; on parle aussi d’analyse de survie). Ét u d e cas-t é m oins : calcul d'un o d ds ra tio (OR) • L’OR peut être calculé dans tous les types d’études, mais c’est la seule mesure d’association que l’on peut calculer dans les études cas-témoins. • Dans les études cas-témoins, le calcul de l’incidence ou de la prévalence ou des risques relatifs n’est pas possible car le ratio cas/témoins est fixé par l’étude. [il 1-R. OR=HrH __o 1-R o 7 a/a + c c / a+c b/b + d d/b + d Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques comparatives et mesures d’association 47 • Signification de l’OR : il s’interprète de la même façon que le RR à la différence près qu’il n’est pas le reflet exact de l’augmentation ou de la diminution du risque en cas d’exposition. Lorsque la maladie ou l’événement étudié touche moins de 10 % de la population étudiée, l’OR est alors une bonne estimation du RR et peut s’interpréter comme tel. À retenir On peut calculer un OR dans toutes les études. L'OR est la seule mesure d'association que l'on peut calculer dans une étude cas-témoins. L’ OR est un estimateur du RR d'autant plus fiable que l'événement étudié est rare. Si la fréquence de l'événement est < 10 °/o, on estime que l'OR évalue correctement le RR. In t erv alle d e co n fia nce (IC) En complément V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l e s i n t e r v all e s d e c o n fi a n c e : h t t ps: / / y o u t u .b e / K 2 h M 6 Q Q q p O s Une valeur d’OR ou RR sans son intervalle de confiance n’est pas suffisante. Afin de définir une association significative, il est nécessaire que l’intervalle de confiance à 95 % ne comprenne pas la valeur 1 : • intervalle de confiance comprenant 1 —» association non significative (on ne rejette pas l’hypothèse nulle). Par exemple, RR (ou OR) = 2,43 [IC95 % : 0,864,00] ; • intervalle de confiance ne comprenant pas 1 —> association significative (on rejette l’hypothèse nulle). Par exemple, RR (ou OR) = 1,78 [IC95 % : 1,312,25]. On distingue deux situations en fonction de la valeur du rapport : • OR ou RR < 1 (par exemple, OR = 0,78 [IC95 % : 0,71-0,85]) l’association entre l’événement et le facteur d’exposition est négative. L’exposition étudiée entraîne une diminution de la survenue de l’événement ; • OR ou RR > 1 (par exemple, OR = 4,78 [IC95 % : 3,80-5,76]) -> l’association entre l’événement et le facteur d’exposition est positive. L’exposition étudiée entraîne une augmentation de la survenue de l’événement. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Généralités 48 Corrélation et concordance Le coefficient de corrélation permet d’étudier la relation entre deux variables quantitatives. Il quantifie le degré de liaison entre deux variables mais ne préjuge pas d’une éventuelle relation de causalité. Le coefficient de corrélation noté r prend une valeur qui varie entre - 1 et 1. La valeur 0 correspond à l’absence de corrélation. Les valeurs - 1 et 1 correspondent à une corrélation parfaite (c’est-à-dire que les points sont tous alignés sur une même droite dont la pente est 1, la relation entre les variables est de type Y = -X ou Y = X). Les valeurs négatives correspondent à une corrélation négative (lorsque les valeurs prises par X augmentent, les valeurs de Y diminuent, et inversement) et les valeurs positives correspondent à une corrélation positive (lorsque les valeurs prises par X augmentent, les valeurs de Y augmentent). Le coefficient de corrélation s’accompagne généralement d’un test de signification dont l’hypothèse nulle est HO : coefficient de corrélation = 0. On distingue le coefficient de corrélation de Pearson (qui nécessite une distribution gaussienne des variables), et le coefficient de corrélation de Spearman qui n’a pas cette contrainte. Le coefficient de détermination (r2) correspond au carré du coefficient de Pearson. C’est le pourcentage de la variabilité d’une variable que l’on peut expliquer par l’autre variable. Par exemple, admettons que le poids soit corrélé à la taille avec un r (de Pearson) à 0,7 dans un échantillon. Ceci correspond à un r2 = 0,72 = 0.49. La variabilité du poids est donc expliquée à 49 % par la variation de la taille. Ce qui veut dire que 51 % de la variabilité du poids s’explique par d’autres facteurs (la composition corporelle notamment !). 80 - 70 60 50 - 40 - . • 20 - 30 - * 1 ---------- r 5 10 1 15 • 1 20 ---- 1------------- 1------------- 1------------- 1------------- 1 5 10 15 20 X 1 25 X Graphique 1 : r = - 0,90 ; p < 0.05 (Corrélation négative entre X et Y) Graphique 2: r = 1 ; p < 0.05 (Corrélation positive parfaite entre X et Y, les points sont parfaitement alignés) 25 - 25 “ I 20 - 20 - 15 - 15 - 10 - 10 - 5 - 5 - 30 40 50 Y 60 70 80 Graphique 3: r = - 0,90; p < 0.05 (même interprétations que le graphique 1 malgré X et Y interchangés au niveau des axes). 25 --------------- i--------------------1------------------- 1r~ 40 60 80 Y Graphique 4: r = -0,22; p = 0,30 (Absence de corrélation significative) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques comparatives et mesures d’association 49 La concordance est plus exigeante que la corrélation. Elle établit dans quelle mesure deux techniques différentes sont en accord pour mesurer la même chose. Par exemple, pour étudier la relation entre le poids et la taille, on utilise la corrélation (de Pearson ou de Spearman). Pour étudier la relation entre la formule MDRD et la formule CKDepi pour la mesure du DFG, on utilisera une technique de concordance (le coefficient de corrélation intraclasse car la variable est quantitative). Pour étudier l’accord de deux radiologues concernant l’existence d’une récidive tumorale, on utilisera une technique de concordance (le coefficient kappa [k ] car la variable est qualitative, voir partie « Application du test étudié, notion de reproductibilité [ou fiabilité] » de la fiche 21). Princip e d es t ests d'hy p o t hèse Un test statistique a pour objectif de déterminer si la différence observée entre les groupes comparés existe vraiment dans la population cible ou si elle est liée au hasard de la constitution de l’échantillon (fluctuations d’échantillonnage) : • exemple 1 : on étudie le lien entre activité physique (actif/sédentaire) et mortalité ; • exemple 2 : on étudie le lien entre taux de CRP (en mg/L) à l’entrée en réanimation et la mortalité. Pour répondre à chaque question, on formule deux hypothèses dites H1 et HO : • hypothèse nulle HO, « il n’y a pas de différence entre les groupes étudiés » : - exemple 1 : « le taux de décès est le même quel que soit le niveau d’activité », - exemple 2 : « la moyenne de CRP à l’entrée est la même chez les patients qui survivent que chez les patients qui décèdent » ; • hypothèse alternative H1, « il y a une différence entre les groupes » : - exemple 1 : « le taux de décès diffère entre les deux groupes » (hypothèse bilatérale) ou « le taux de mortalité cardiovasculaire est plus faible chez patients actifs » (hypothèse unilatérale), - exemple 2 : « la moyenne de CRP diffère entre les deux groupes » (hypothèse bilatérale) ou « la moyenne de CRP à l’entrée est plus élevée chez les patients survivants » (hypothèse unilatérale). La conclusion du test repose sur le calcul d’un critère de test permettant de déterminer la probabilité que la différence observée soit liée au hasard {p-value}. Habituellement, on tolère un risque d’erreur (risque de conclure à une différence qui n’existe pas, alpha) de 5 %. Après le test, on peut calculer cette probabilité dans notre étude (la p-value) : • p-value < 0,05, « on rejette HO », « la différence observée est significative » : - exemple 1 : le taux de décès est significativement différent entre les deux groupes, - exemple 2 : la moyenne de CRP diffère significativement entre les deux groupes ; Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Généralités 50 • p-value > 0,05, « on ne peut pas rejeter HO », « la différence observée n’est pas significative », « on ne peut pas conclure à une différence » : - exemple 1 : le taux de décès ne diffère pas significativement entre les deux groupes ; - exemple 2 : la CRP moyenne ne diffère pas significativement entre les deux groupes. ► Attention ! Ne pas rejeter l’hypothèse nulle signifie que le risque est trop important pour que l’on puisse conclure à une différence. Ceci ne veut pas dire que les deux moyennes comparées sont égales/équivalentes. Il reste possible que la différence existe, mais que les conditions du test ne permettent pas de le démontrer. Risque d ’ erre ur e t t est st a tistiq u e Introduction Peu importe la conclusion d’un test, il existe un risque de se tromper à chaque fois : • risque alpha (a) : conclure à une différence qui n’existe pas ; • risque bêta (P) : conclure à l’absence de différence alors qu’il en existe une. Conclusion Différence Réalité Différence 1-0 Pas de différence a Pas de différence p 1-oc Risque de première espèce = risque a Le risque a est le risque de conclure à une différence qui en réalité n’existe pas, autrement dit : risque de rejeter l’hypothèse HO à tort. Il est fixé a priori le plus souvent à 5 % (ou 0,05) pour un test bilatéral et 2,5 % pour un test unilatéral. Il augmente si on fait plusieurs tests : critères multiples, analyse intermédiaire. C’est la raison pour laquelle le critère de jugement principal d’une étude doit être unique. Si tel n’est pas le cas, il faut vérifier que les auteurs aient diminué le seuil du risque a (à 2,5 % par exemple dans le cas de deux critères de jugement principaux). Le degré de signification, « petit p », « p-value » C’est la probabilité de se tromper si on dit qu’il existe une différence significative après avoir réalisé un test. Il a la même signification que le risque a, à savoir le risque de rejeter H0 à tort, mais il est déterminé a posteriori par la réalisation du test lui-même. Si p < a, on conclut à une différence significative et on rejette donc H0. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques comparatives et mesures d’association 51 Risque de deuxième espèce = risque P Le risque [3 est le risque de conclure à l’absence de différence, alors qu’en réalité cette différence existe, autrement dit : risque de ne pas rejeter HO à tort. Il est fixé a priori le plus souvent à 10 ou 20 %. Il augmente avec la diminution du nombre d’événements attendus pour le critère de jugement principal et si la différence attendue entre les groupes comparés est faible. Puissance = 1 - p Elle correspond à la probabilité de conclure à une différence qui existe vraiment, c’est-à-dire à l’aptitude d’une étude à montrer une différence. Une étude dite de forte puissance a donc beaucoup de chances de mettre en évidence ce pour quoi elle a été construite. Un des principaux déterminant de la puissance est le nombre de sujets inclus dans une étude et le nombre d’événements pour le critère de jugement principal (déterminé par la fréquence de l’événement dans la population sélectionnée). Une étude concluant à l’absence de différence (étude dite négative) a potentiellement plusieurs raisons de l’être. Cette absence de différence peut être liée à : • l’absence réelle de différence ; • la présence de biais masquant la différence entre les groupes (sélection, mesure, confusion) ; • un manque de puissance. Si on augmentait le nombre de sujets inclus dans l’étude et donc le nombre d’événements, on augmenterait la puissance (on diminuerait le risque P), l’hypothèse HO pourrait être rejetée et on pourrait conclure à une différence significative. Risque a Risque p Puissance p de signification Défini a priori généralement à 5 % en bilatéral, 2,5 % en unilatéral Défini a priori généralement à 10 ou 20 % Correspond à 1 — p donc défini a priori généralement à 80 ou 90 % Défini a posteriori, correspond au résultat du test Risque de rejeter HO à tort Risque de ne pas rejeter HO à tort Probabilité de rejeter H0 à raison Risque de rejeter H0 à tort a posteriori Risque de conclure à une différence qui n’existe pas Risque de conclure à l’absence de différence alors qu’elle existe Probabilité de conclure à une différence qui existe vraiment Risque de conclure à une différence qui n’existe pas Inflation du risque a en cas d’utilisation de tests multiples Augmentation du risque p en cas d’une diminution du nombre d’événements Augmentation de la puissance en cas d’une augmentation du nombre d’événements Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 52 Généralités Calcul du n o m bre de suje ts n écessaires à inclure d ans u ne é t u d e Pourquoi calculer un nombre de sujets nécessaires dans une étude ? En complément V o us p o u v e z co ns u l t e r c e t t e v i d é o s u r l a pl a ylist « G é n é r a lit é s s t a t ist i q u es w w w .y o u t u b e.co m / p l a y lis t ? H s t = PLL3 6 x s y T 4 F F fc u L9 Z 9 -SSV N - _ U r w j c A y a Afin de maximiser les chances de prouver la différence que l’on souhaite mettre en évidence entre les groupes comparés, il est nécessaire de disposer d’une puissance suffisante. ► Rappel : risque p —» risque de conclure à une absence de différence qui existe en réalité. Puissance (1 - P) —> risque de conclure à une différence qui existe en réalité. En augmentant la puissance, on recherche donc à augmenter la possibilité de montrer une véritable différence. Nous avons vu que le principal déterminant de l’augmentation de la puissance est l’augmentation du nombre de sujets à inclure dans l’étude. Néanmoins, une augmentation trop importante du nombre de sujets s’accompagne de plusieurs difficultés : • l’étude peut alors devenir trop compliquée à réaliser voire infaisable en cas de faiblesse de recrutement ; le budget s’alourdit et la durée de l’étude s’allonge ; • augmenter le nombre de sujets et donc augmenter la puissance revient à réaliser un zoom qui permettra la mise en évidence de détails et de différences de plus en plus petites (voir figure ci-après). Cela peut donc entraîner un risque de mettre en évidence des différences qui ne sont pas toujours cliniquement pertinentes ; • exemple : dans le cadre de l’évaluation d’un nouveau traitement antidiabétique, une étude de très forte puissance avec 100 000 patients est réalisée et montre une diminution significative de l’HbAlc de 0,01 %. Cette étude a été très coûteuse, a duré de nombreuses années et l’information recueillie n’est finalement pas intéressante. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques comparatives et mesures d’association Augmentation du nombre d'individus Augmentation de la puissance 53 Mise en évidence d'une différence de plus en plus petite En résumé, il est indispensable de calculer un nombre de sujets nécessaires avant de réaliser une étude. Ce nombre de sujet doit être suffisant pour mettre en évidence la différence minimale cliniquement intéressante, sans atteindre un nombre excessif de participants, ce qui rendrait la réalisation de l’étude compliquée. ► Remarque : en pratique, le facteur limitant le plus fréquent lors de la mise en place d’une étude est d’avoir un nombre de participants inclus inférieur au nombre calculé de sujets nécessaires et non pas l’inverse. Éléments nécessaires au calcul du nombre de sujets nécessaires On retrouve : • d’une part, les risques d’erreurs statistiques vus précédemment : risque oc, risque p et puissance ; • d’autre part, la différence minimale attendue cliniquement pertinente entre les groupes. Ce qui augmente le nombre de sujets nécessaires Ce qui diminue le nombre de sujets nécessaires Augmenter la puissance Diminuer le risque p Diminuer le risque oc Diminuer la différence minimale attendue entre les groupes Faire l’étude dans une population où le risque d’événements est faible Diminuer la puissance Augmenter le risque P Augmenter le risque a Augmenter la différence minimale attendue Faire l’étude dans une population où le risque d’événements est élevé Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 54 Généralités À retenir^ En pra tiq u e lors d e l'EC N Vérifier que la différence minimale attendue utilisée dans le calcul est cliniquement pertinente. Vérifier que les risques a et P sont fixés a priori à des seuils classiquement admis. Vérifier que le nombre de sujets inclus dans l'étude atteint le nombre de sujets nécessaires calculé, et/ou que le nombre d'événements prévus par le calcul d'effectif a été atteint (si tel n'est pas le cas, cela pourrait expliquer un résultat négatif par manque de puissance). Q uel t est st a tistiq u e u tiliser ? Quelques notions à prendre en compte pour le choix du test à utiliser N o tio n d e v aria ble e x plicativ e / à e x pliq u er o u in d é pe n da n te / d é p e n d a n te • Variable à expliquer (ou dépendante) : correspond à la variable que l’on mesure, que l’on décrit et que l’on compare ensuite entre les groupes. Il s’agit généralement du critère de jugement. Elle est dite dépendante de la variable explicative indépendante. • Variable explicative (ou indépendante) : correspond à la variable qui permet la constitution des groupes de comparaison et dont on se sert pour expliquer la variable dépendante. • Exemples : - exemple 1 : on souhaite comparer la mortalité entre deux groupes de traitement (traitement A et traitement B). La variable à expliquer est la mortalité et la variable explicative est le traitement ; - exemple 2 : on souhaite évaluer le niveau de tension artérielle en fonction de l’âge. La tension artérielle est la variable à expliquer (ou dépendante) et l’âge est la variable explicative (ou indépendante). • La variable à expliquer est dite dépendante de la variable explicative (= variable indépendante). N o tio n d'a n alyses u niv arié es o u m ultiv arié es (v oir fich e 24) • Analyse univariée : il y a une seule variable à expliquer (dépendante) et une seule variable explicative (indépendante) dans l’analyse. L’influence d’éventuels facteurs de confusion n’est donc pas prise en compte. • Analyse multivariée : prise en compte de plusieurs variables explicatives (indépendantes) dans l’analyse (avec prise en compte des éventuels facteurs de confusion). On obtient alors des résultats dits « ajustés ». Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques comparatives et mesures d’association 55 • Exemple : lors de la comparaison de la mortalité entre deux groupes de traitements, l’analyse univariée ne prendra en compte qu’une seule variable explicative (variable explicative = le traitement). L’analyse multivariée prendra en compte plusieurs variables explicatives, c’est-à-dire les éventuels facteurs de confusion qui pourront interférer sur la variable à expliquer (variable à expliquer = la mortalité) comme l’âge ou le stade de la maladie. N o tio n d e m esures ré p é t é es (« d o nn é es a p parié es ») • Mesures répétées (données appariées) : comparaison de deux groupes de données mesurées chez un même patient (par exemple, avant et après traitement). Chaque patient est alors son propre témoin. • Séries indépendantes : comparaison de deux groupes de données mesurées chez des patients différents (par exemple, entre un groupe de patients recevant le traitement et un groupe de patients recevant le placebo). • Dans le cas de mesures répétées, on utilise des tests statistiques spécifiques : test de McNemar (= test du Chi2 apparié), test t apparié (= test de Student apparié), test de Wilcoxon (test non paramétrique pour série appariée). N o tion d e t est p ara m é triq u e / no n p ara m é triq ue La plupart des test utilisés sont des tests paramétriques. Ceux-ci ne sont utilisables que si leurs conditions d’utilisation sont remplies (comme l’égalité et la distribution normale des variances pour le test de Student, ou des effectifs théoriques > 5 pour le test du Chi2). Si les conditions d’application ne sont pas remplies, il convient alors d’utiliser des tests non paramétriques : le test de Mann-Whitney, le test de Wilcoxon, le coefficient de corrélation de Spearman sont les tests non paramétriques à connaître. À retenir Cas des variables à expliquer qualitatives Objectif : comparaison de deux (ou plus) pourcentages Analyse univariée = test du Chi2 Analyse multivariée = régression logistique Cas des variables à expliquer quantitatives Objectif : comparaison de deux moyennes Analyse univariée = test de Student (paramétrique)/tests de Mann-Whitney ou Wilcoxon (non paramétrique) Analyse multivariée = régression linéaire multiple Cas des analyses de survie (analyse de données censurées) Objectif : comparaison de deux (ou plus) courbes de survie Analyse univariée = test du log rank Analyse multivariée = modèle de Cox Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 56 Généralités En pra tique Ex e m ple 1 On souhaite planifier un essai clinique visant à évaluer l’effet d’un antiagrégant plaquettaire sur la mortalité cardiovasculaire d’un groupe de patients à risque. Le nombre de patients à inclure pour obtenir la puissance souhaitée sera d’autant plus important que : Il aurait fallu cocher... Commentaires Le risque a diminue Plus le risque d’erreur de type 1 que l’on accepte est faible, plus il faut inclure de patients dans l’essai Le risque p diminue De la même manière, si le risque d’erreur de type 2 est faible (donc la puissance plus forte), il faut inclure plus de patients La réduction relative du risque liée au traitement est faible Plus on souhaite mettre en évidence une différence qui est petite, plus le nombre de sujets nécessaires augmente. Si l’effet d’un traitement attendu est une différence de 1 % de mortalité, le nombre de sujets nécessaires sera plus important que si l’effet du traitement attendu est une différence de 20 % de mortalité Le traitement est peu efficace Cette proposition a la même signification que la précédente La mortalité cardiovasculaire dans ce groupe, en l’absence de traitement, est faible Si le risque d’événements est faible, pour un même nombre de patients, on aura moins de puissance, car moins d’événements. Pour faire un essai de prévention cardiovasculaire, il faudra inclure beaucoup plus de sujets sains que de patients avec de nombreux facteurs de risque On souhaite réaliser un test bilatéral à 5 % plutôt qu’un test unilatéral à 5 % Pour un même risque a, il faut inclure plus de patients pour un test bilatéral que pour un test unilatéral Il n’aurait pas fallu cocher... Commentaires Le risque cardiovasculaire dans le groupe sans traitement est élevé Si le risque dans le groupe contrôle est élevé, cela indique qu’on attend un nombre important d’événements et donc que la puissance sera plus élevée. Il n’est pas nécessaire d’inclure beaucoup de patients pour avoir la puissance attendue La puissance diminue La diminution de la puissance correspond à une augmentation du risque p Le nombre de centres participant à l’étude est important C’est un élément de faisabilité qui ne rentre pas en compte dans le calcul de l’effectif (capacité de recrutement) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques comparatives et mesures d’association Il n’aurait pas fallu cocher... Commentaires On souhaite réaliser un test bilatéral à 5 % plutôt qu’un test unilatéral à 2,5 % Il faut le même nombre de patients pour un test unilatéral à 2,5 % que pour un test bilatéral à 5 % L’essai est réalisé en ouvert Cet élément du design n’a pas de conséquence sur le calcul du nombre de patients à inclure 57 Ex e m ple 2 (ED N 2016) Deslée G, Mal H, Dutau H, Bourdin A, Vergnon JM, Pison C, Kessler R, Jounieaux V, Thiberville L, Leroy S, Marceau A, Laroumagne S, Mallet JP, Dukic S, Barbe C, Bulsei J, Jolly D, Durand-Zaleski I, Marquette CH, for the REVOLENS Study Group. Lung volume réduction coil treatment vs usual care in patients with severe emphysema: The REVOLENS Randomized Clinical Trial. JAMA 2016 ; 315(2) : 175-84. On a conduit un essai clinique comparant un traitement par spirales endobronchiques dans la bronchopneumopathie chronique obstructive (BPCO) à un traitement conventionnel. Cette étude rapporte une amélioration cliniquement pertinente, à 6 mois, de la distance parcourue au test de marche de 6 minutes, chez 36 % des patients du groupe « spirales » et chez 18 % des patients du groupe « soins habituels ». Il est possible de conclure à la supériorité du traitement par spirales, comparativement aux soins habituels. La différence absolue (IC95 %) entre les groupes est de + 18 % (4 % ; 60 %), p-value = 0,03. Il est vrai que : Il aurait fallu cocher... Commentaires L’intervalle de confiance indique la significativité de la différence car il exclut la valeur « 0 » Dans la situation de l’évaluation d’une différence de risque absolu en points de pourcentage (36 — 18 = 18%), on cherche bien à montrer que la différence diffère significativement de 0 La probabilité de conclure, à tort, à l’efficacité du traitement est de 3 % C’est la définition de la p-value Il y a 2,5 % de chances que la différence absolue d’efficacité réelle entre les 2 groupes soit inférieure à 4 % C’est la signification de l’intervalle de confiance Il y a 95 % de chances que la différence absolue réelle d’efficacité entre les 2 groupes soit comprise entre 4 % et 60 % C’est la signification de l’intervalle de confiance Il n’aurait pas fallu cocher... Commentaires L’intervalle de confiance indique la significativité de la différence car il exclut la valeur « 1 » La valeur 1 est la valeur neutre pour un risque relatif, pas pour une différence absolue de risque > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 58 Généralités Il n’aurait pas fallu cocher... Commentaires 95 % des patients de l’échantillon sont compris dans l’intervalle (+ 4 % ; + 60 %) L’intervalle de confiance à 95 % représente la fourchette des valeurs au sein de laquelle la vraie différence du pourcentage entre les 2 groupes a 95 % de chances de se trouver La probabilité de conclure, à tort, à l’absence d’efficacité est de 3 % Cette probabilité définit le risque p et non la p-value La différence absolue réelle d’efficacité a 97 % de chances de se trouver dans l’intervalle (+ 4 % ; + 60 %) L’intervalle de confiance reste un intervalle de confiance à 95 % quelle que soit la valeur de la p-value. Ces deux informations s’interprètent indépendamment l’une de l’autre Ex e m ple 3 (é preuve t est 2017) Hugosson J, Carlsson S, Aus G, Bergdahl S, Khatami A, Lodding P, Pihl CG, Stranne J, Holmberg E, Lilja H. Mortality results from the Gôteborg Randomised Prostate Cancer Screening Trial. Lancet Oncol 2010 ; 11(8) : 725-32. In December 1994, 20,000 men born from 1930 to 1944, randomly sampled from the Population Register, were computer randomised in a 1:1 ratio to a screening group invited for biennial PSA [prostate-specific antigen] testing or to a control group not invited. The primary endpoint was prostate cancer spécifie mortality analyzed according to the intention to-screen principle. The number needed to screen (NNS) was calculated as (1/absolute réduction in prostate cancer mortality). As this study is an intention-to-screen analysis, we refer to NNS as number needed to invite for screening. The number needed to treat (NNT) was calculated as ((1/absolute réduction in prostate cancer mortality) * excess prostate cancer incidence). This measure was also rephrased to number needed to diagnose, because many patients actually were not treated. The number of men needed to invite for screening (NNS) to prevent one prostate cancer death was calculated as 293 while the number needed to diagnose (NNT) was calculated as 12. » Les auteurs font référence au calcul de l’indicateur NNS {number needed to be screened). Que peut-on dire de cet indicateur ? Il aurait fallu cocher... Commentaires Il est calculé comme le NNT {number needed to treat) pour la mesure d’efficacité d’un essai thérapeutique La définition donnée par les auteurs (1/réduction absolue du risque) indique bien que le NNS est calculé comme le NNT Il donne le nombre de patients à dépister pour éviter un décès par cancer de la prostate durant la période de suivi considérée Cette définition correspond à ce que nous avons décrit plus haut Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques comparatives et mesures d’association Il aurait fallu cocher... Dans cette étude, il faut dépister 293 patients pour éviter un décès et diagnostiquer 12 patients en plus grâce au dépistage pour éviter un décès Il n’aurait pas fallu cocher... 59 Commentaires C’est bien ce que signifient ces deux marqueurs Commentaires Il donne le nombre d’événements évités pour 100 patients dépistés Non, cette définition correspond à la diminution absolue du risque Il fait référence à la réduction relative de risque de décès par cancer de la prostate durant la période de suivi considérée Non, la réduction relative du risque correspond à 1-RR de cancer de prostate Il fait référence à la fraction étiologique du risque de décès Le risque attribuable pour les exposés (ou « fraction étiologique ») mesure la proportion de cas de la maladie qu’on peut attribuer au facteur de risque parmi les sujets exposés à ce facteur (pourcentage des cas de cancer du poumon dus au tabagisme parmi les fumeurs) Que peut-on dire du résultat concernant le risque relatif de décès par cancer de la prostate (RR estimé à 0,56, IC à 95 % [0,39 à 0,82], p = 0,002) ? Il aurait fallu cocher... Commentaires Le risque d’erreur de lre espèce de la comparaison est égal à 0,002 Le risque de lre espèce d’une comparaison donnée est la p-value La réduction relative de risque de décès par cancer de la prostate est égale à 44 % Le RR est de 0,56, ce qui correspond à une réduction relative du risque de 44 % (= 1 - 0,56)_________________________ Le risque de décès est significativement réduit dans le groupe PSA (prostate-specific antigeri) Cette conclusion est attestée par la p-value < 0,05 Le risque de décès par cancer de prostate dans le groupe PSA est multiplié par 0,56 par rapport au groupe contrôle C’est la signification du risque relatif Il n’aurait pas fallu cocher... Commentaires Le RR est statistiquement différent de 0 parce que p < 0,05 Un RR par définition ne peut pas prendre la valeur 0 La comparaison des taux cumulés de mortalité par cancer de la prostate entre les 2 groupes a une puissance de 99,8 % 99,8 % (1 - p) correspond à la probabilité d’avoir raison si on affirme que la différence n’est pas significative, et non à la puissance Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 60 Généralités Il n’aurait pas fallu cocher... Le RR est statistiquement significatif car compris entre les bornes de son intervalle de confiance à 95 % Commentaires Par définition, une valeur est contenue dans les bornes de son intervalle de confiance. Un RR est statistiquement significatif si la valeur 1 n’est pas comprise entre les bornes de son intervalle de confiance Ex e m ple 4 (ED N 2017) Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML, Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D, Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D. Levosimendan for the prévention of acute organ dysfunction in sepsis. N Engl J Med 2016 ; 375 : 1638-48. This trial was designed to test whether the addition of levosimendan to standard care would reduce the severity of organ dysfunction among patients with septic shock. We calculated that a sample of 500 patients would provide the trial with 90% power to detect a différence of 0.5 points in the mean SOFA score, assuming a standard déviation of 1.5 and a significance level of 0.05. To allow for a 3% rate of withdrawal of consent, the recruitment target was 516 patients. A p-value of less than 0.05 was considered to indicate statistical significance, with the use of two-sided tests ; no corrections were made for multiple testing. Concernant le calcul d’effectif : Il aurait fallu cocher... Commentaires Il a été déterminé sans préjuger du sens de la différence entre lévosimendan et placebo Le test bilatéral two-sided indique que l’hypothèse alternative est bilatérale (placebo > lévosimendan ou lévosimendan > placebo) Il a été déterminé en tenant compte de l’écart type du score SOFA Standard déviation et écart type sont des synonymes Il a été déterminé pour un risque p de 10 % Une puissance de 90 % implique un risque p de 10 % La différence attendue du critère de jugement principal, entre les 2 groupes, était d’au moins 0,5 point SOFA : sequential organ failure assessment. C’est l’hypothèse qui est faite par les auteurs. Une différence plus faible ne sera pas détectée Il n’aurait pas fallu cocher... Commentaires Le calcul d’effectif a considéré un taux de perdus de vue de 3 % Le calcul d’effectif tient compte de 3 % de retrait de consentement, pas de perdus de vue (difficiles à imaginer en réanimation) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Statistiques comparatives et mesures d’association Il n’aurait pas fallu cocher... Commentaires La différence attendue du critère de jugement principal, entre les 2 groupes, est au maximum de 0,5 point Attention, 0,5 est la différence minimale que l’on pouvait mettre en évidence L’essai nécessite une différence minimale de 50 % de la valeur du score SOFA entre les 2 groupes La différence attendue est formulée en termes de différence absolue et pas relative comme indiqué dans cette proposition Il était basé sur les capacités de recrutement des centres Le calcul du nombre de sujets nécessaire est basé sur les risques de lre et de 2e espèce fixés a priori et sur la différence minimale attendue cliniquement pertinente entre les 2 groupes. La durée de période de recrutement et les capacités de recrutement des centres sont des éléments dont il faudra tenir compte pour la faisabilité de l’étude suite au calcul du nombre de sujets nécessaires, mais ils n’interviennent pas dans ce calcul Il était basé sur la durée de la période de recrutement 61 SOFA : sequential organ failure assessment. Ex e m ple 5 (ED N 2019) Galimberti V, Cole BF, Zurrida S, Viale G, Luini A, Veronesi P, et al. Axillary dissection versus no axillary dissection in patients with sentinel-node micrometastases (IBCSG 23-01) : a phase 3 randomised controlled trial. Lancet Oncol avr 2013 ; 14(4) : 297-305. As originally designed, target accrual was 1960 patients with analysis planned after 558 events. These targets were based on having 90% power to detect non-inferiority of no axillary dissection with a one-sided statistical significance level of 10% (ie, a= 0.10) under the assumption that 5-year disease-free survival with axillary dissection was 70 % and defining non-inferiority as a hazard ratio (HR) of less than 1.25 (no axillary dissection relative to axillary dissection). Les auteurs ont fixé le seuil de signification statistique alpha à 10 % (c’est-à-dire 0,10), en situation unilatérale. Cela correspondrait à (une ou plusieurs réponses possibles) : Il aurait fallu cocher... Commentaires Un risque alpha bilatéral de 20 % Un risque alpha à 10 % en unilatéral, en mettant bien 10 % de « chaque côté » correspond à un risque alpha bilatéral de 20 %. C’est très inhabituel de choisir un risque alpha à 10 % mais c’est ce qui a été fait Un risque de conclure à tort à la non-infériorité égal à 10 % C’est la définition du risque alpha de lre espèce : le risque de conclure à tort à une différence qui n’existe pas Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 62 Généralités Il n’aurait pas fallu cocher... Commentaires Une puissance statistique de 90 % La puissance se calcule grâce au risque de 2e espèce bêta et est égale à 1-bêta, qui est par ailleurs bien de 90 % dans cette étude mais ce n’était pas la question posée Un risque alpha bilatéral de 5 % Un risque alpha à 10 % en unilatéral, en mettant bien 10 % de « chaque côté » correspond à un risque alpha bilatéral de 20 % Une marge de non-infériorité de 10 % La marge de non-infériorité n’a rien à voir avec le risque alpha ni le risque bêta. C’est la perte maximale d’efficacité tolérée pour conclure à la non-infériorité Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyses dépendantes du temps ou « analyses de survie » Princip e • L’analyse de survie permet d’étudier la survenue d’un événement, mais également le délai de survenue de cet événement. • Utilisée historiquement pour étudier la survie des patients (délai de survenue du décès), elle peut s’appliquer à tout type d’événement de nature binaire pouvant survenir au cours du temps (par exemple, délai de survenue d’une rétinopathie au sein d’une cohorte de diabétiques, d’un rejet de greffe, de la survenue de métastases, etc.). • Ce type d’analyse est largement utilisée dans : - les études observationnelles analytiques à visée pronostique au cours desquelles l’objectif est de mettre en évidence un ou des facteurs pronostiques d’évolution d’une pathologie. On compare alors la survie entre le groupe exposé au facteur pronostique supposé et le groupe non exposé à ce facteur pronostique ; - les essais cliniques, notamment en cancérologie (par exemple, comparaison de la survie des patients randomisés dans le groupe recevant une nouvelle chimiothérapie à la survie des patients randomisés dans le groupe recevant le traitement de référence). À retenir A t te n tio n à la dif fére nce e n tre f act e ur d e risq u e e t f act e ur pro n ostiq u e Facteur de risque : élément associée à la survenue d'une maladie au cours du temps. C'est un facteur qui augmente le risque de développer une maladie. Facteur pronostique : élément associé l'aggravation d'une maladie au cours du temps. Dans cette situation la maladie s'est déjà déclarée et le facteur pronos tique est un élément qui aggrave (ou améliore) le pronostic de la maladie. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 64 Généralités Q uelq ues d é finitio ns u tilisées d ans les analyses d e survie au co urs d es essais cliniqu es • Survie globale (overall survival) : décès, toutes causes confondues (le patient a présenté l’événement d’intérêt s’il est décédé, quelle que soit la cause du décès). • Survie spécifique : décès lié spécifiquement à la pathologie étudiée. Les décès d’autres causes ne seront pas pris en compte et les patients décédés d’autres causes seront censurés à droite (voir plus bas la définition de la censure à droite). • Survie sans rechute (progression free survival) : survenue d’un décès ou survenue d’une rechute (il s’agit d’un critère composite : il est considéré qu’un patient a présenté l’événement d’intérêt s’il est décédé ou s’il a présenté une rechute de la maladie). D o n nées n écessaires à u ne analyse d e survie • Date d’origine : date d’entrée dans l’étude pour chaque patient. • Date de point : considérée comme la date de fin de l’étude au-delà de laquelle plus aucun événement ne sera pris en compte (date d’arrêt du suivi) ; correspond à une date du calendrier ou à une durée de suivi identique pour tous les patients. • Date des dernières nouvelles (DDN) = date du dernier contact avec chaque patient (correspond généralement à la date de la dernière consultation pour les patients vivants et à la date de décès pour les patients décédés) : - en cas de décès avant la date de point : DDN = date du décès ; - en cas de décès après la date de point : DDN = date de point ; - patient vivant et dernière date connue avant la date de point : DDN = dernière date connue ; - patient vivant et dernière date connue après la date de point : DDN = date de point. • Données censurées à droite : on parle de données censurées à droite lorsque l’information sur la survenue de l’événement étudié n’est pas disponible à la date de point et que l’on ne peut donc pas mesurer la survie exacte du patient ; cela s’observe soit lorsque les patients sont perdus de vue au cours de la période de suivi de l’étude, soit lorsque les patients n’ont pas encore présenté l’événement d’intérêt au moment de la date de point (on parle alors d’exclu vivant). La censure d’un patient à droite permet de prendre malgré tout en compte ce patient au moment de l’analyse statistique bien que l’on ne connaisse pas sa durée de survie exacte. • Exemple : Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyses dépendantes du temps ou « analyses de survie 65 Date de point Date de début de l'étude I Décès II III IV V Décès Statut à la date des dernières nouvelles Statut Particularités à la date de point 5 jours 3 jours Décédé Décédé Donnée non censurée (mesure de la survie exacte à la date de point) Samedi 4 jours 4 jours Vivant Vivant Données censurées à droite (exclu vivant) Vendredi 4 jours 3 jours Vivant ? Données censurées à droite (perdu de vue) Mercredi Samedi 3 jours 3 jours Vivant Vivant Données censurées à droite (exclu vivant) Samedi 2 jours 2 jours Vivant Vivant Données censurées à droite (exclu vivant) Patient Date des Date d’origine dernières nouvelles Recul I Lundi Jeudi II Mardi III Mardi IV V Jeudi Temps de participation Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 66 Généralités Crit ères d e q ualité • La date d’origine doit être clairement définie (date d’une chirurgie, date du diagnostic, date du début du traitement, date d’admission aux urgences, etc.). Au mieux, elle est choisie le plus tôt possible dans l’évolution d’une maladie. Une inclusion tardive induit un biais par sélection des patients en meilleure santé, les patients décédés précocement ne pouvant pas être inclus. • La date de point doit être clairement définie à l’avance et doit permettre une durée de suivi suffisamment longue afin de recueillir le maximum d’informations. Il peut arriver d’observer précocement une différence de survie entre deux groupes qui s’estompe avec le temps, donc si le suivi n’est pas assez long, on risque de conclure à une différence qui n’existe pas au final. D’un autre côté un suivi trop long peut induire une augmentation du nombre de perdu de vue. • Le critère de jugement doit être mesuré de la manière la plus objective possible et de manière identique dans les groupes comparés, si possible en aveugle (éviter le biais de classement). Le décès est le critère le plus objectif qui existe, il est impossible de mal classer un patient. • La raison de l’arrêt de suivi chez les perdus de vue doit être si possible notifiée dans le but de vérifier qu’elle ne soit pas en lien avec l’état de santé du patient. Par exemple, si les patients sont perdus de vue car leur état de santé s’aggrave, il apparaîtra un biais car les malades les plus graves ne pourront pas être analysés. Re prése n t atio n d es résulta ts • Grâce aux données brutes obtenues précédemment, on construit une courbe de survie en marche d’escalier avec la méthode de Kaplan-Meier. Chaque point de la courbe représente la probabilité de survie en fonction du temps. • La médiane de survie d’un groupe correspond au délai pour lequel un sujet appartenant à ce groupe a 50 % de chances de ne pas avoir présenté l’événement étudié. • Dans l’exemple suivant, il semble que le groupe de sujets représenté par la courbe orange ait un pronostic plus sombre que le groupe représenté par la courbe grise. La médiane de survie de la courbe orange est moins bonne que celle de la courbe grise. Afin d’en être certain, il est nécessaire d’utiliser un test statistique de comparaison de courbes de survie. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyses dépendantes du temps ou « analyses de survie 67 Courbe de survie de Kaplan-Meier Survie 100 o/o — Courbe noire = groupe exposé au facteur pronostic étudié Courbe rouge = groupe non exposé au facteur pronostic étudié 50 o/o Échelle Médiane de survie dans le groupe exposé Médiane de survie dans le groupe non exposé de temps • Afin de comparer deux courbes de survie, on utilise un test du log-rank après avoir posé deux hypothèses : - hypothèse HO : les deux courbes sont identiques ; - hypothèse H1 : les deux courbes sont différentes ; - attention : ne pas rejeter HO ne permet pas de conclure à l’équivalence des courbes. • Le modèle de régression de Cox est utilisé pour réaliser une analyse multivariée prenant en compte d’éventuels facteurs de confusion. Les modèles multivariés d’analyse de survie dont le modèle de Cox sont essentiels au cours des études observationnelles à visée pronostique. A contrario des essais cliniques, au cours des études observationnelle, l’exposition d’intérêt (le facteur pronostique) n’a pas été affecté aux participants de manière aléatoire par randomisation. On ne peut donc pas être certain à 100 % que la différence de survie observée entre les deux groupes (à savoir le groupe des patients non exposés au facteur pronostique et le groupe des patients exposés au facteur pronostique) ne soit pas liée à la présence d’un ou plusieurs facteurs de confusion. Le modèle de Cox permet donc de mesurer la différence entre les deux groupes indépendamment de la prise en compte de ces facteurs de confusion. Le modèle de Cox rend des résultats sous la forme de hazard ratio (HR) qui s’interprètent exactement de la même façon que le risque relatif (RR) ou Vodds ratio (OR). Ce hazard ratio correspond au rapport des risques instantanés à chaque moment du suivi de l’étude. Survie 100 o/o Survie Hypothèse H0 100 o/o Temps Hypothèse H1 Temps Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 68 Généralités Partie pra tique Ex e m ple 1 (ED N 2021) Cappuzzo F, Ciuleanu T, Stelmakh L, Cicenas S, Szczésna A, Juhâsz E, et al. Erlotinib as maintenance treatment in advanced non-small-cell lung cancer: a multicentre, randomised, placebo-controlled phase 3 study. Lancet Oncol juin 2010; 11(6) : 521-9. Kaplan-Meier estimâtes of progression-free survival in the intention-to-treat population (A), progression-free survival in patients with EGFR immunohistochemistry-positive tumours (B), progression-free survival in patients with EGFR mutation-positive tumours (C), and progression-free survival in patients with EGFR wild-type tumours (D). Numbers at risk Erlotinib 438 400 329 261 204 168 118 76 Placebo 451 404 326 256 196 157 102 63 42 24 11 1 0 Kaplan-Meier estimâtes of overall survival in the intention-to-treat population (A) and in patients with EGFR wild-type tumours (B). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyses dépendantes du temps ou « analyses de survie 69 À propos de ces deux figures (une ou plusieurs propositions attendues) : Il aurait fallu cocher... Commentaires La décroissance en marches d’escalier régulièrement espacées de la survie sans progression résulte de la périodicité des visites de suivi programmées Chaque marche d’escalier survient à un rythme de toutes les 6 semaines, ce qui correspond au rythme de surveillance par imagerie (scanner ou IRM), la date de progression de la maladie pour chaque patient est donc influencée par le rythme de surveillance Les marches d’escalier de la survie globale correspondent aux moments des décès La survie globale considère comme événement d’intérêt le décès de toute cause. On remarque par ailleurs que la courbe en marche d’escalier de la survie globale est beaucoup plus lisse que la courbe de la survie sans progression. Cela s’explique par le fait que les dates de décès correspondent à la date individuelle de décès pour chaque patient (qui est une date facile à identifier) alors que la date de progression de la maladie est fortement influencée par le rythme de surveillance par imagerie La médiane de la survie sans progression est plus courte que la médiane de survie globale Elle est d’environ 12 semaines (3 mois) pour la survie sans progression et d’une douzaine de mois pour la survie globale (attention, car l’échelle de temps renseignée sur l’axe des abscisses n’est pas la même entre les deux figures). Il est logique que la médiane de survie sans progression soit plus courte que la médiane de survie globale, la survie sans progression étant un critère composite qui considère l’événement « décès » ou l’événement « progression » alors que la survie médiane considère seulement l’événement « décès » Il n’aurait pas fallu cocher... Commentaires Les événements apparaissent aux mêmes durées de suivi pour la survie sans progression et la survie globale La progression survient la plupart du temps avant le décès, ce qui explique la différence de médiane de survie entre la survie globale et la survie sans progression L’efficacité de l’erlotinib sur la survie sans progression est identique à celle observée pour la survie globale L’efficacité de l’erlotinib semble un peu moins importante sur la survie globale (HR à 0,81 [IC95 % : 0,70-0,95]) que sur la survie sans progression (HR à 0.71 [IC95 % : 0,62-0,82]) même si l’effet est significatif dans les deux cas Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 70 Généralités Ex e m ple 2 (ED N 2019) Galimberti V, Cole BF, Zurrida S, Viale G, Luini A, Veronesi P, et al. Axillary dissection versus no axillary dissection in patients with sentinel-node micrometastases (IBCSG 23-01): a phase 3 randomised controlled trial. Lancet Oncol avr 2013; 14(4): 297-305. We designed IBCSG trial 23-01 to détermine whether no axillary dissection was non-inferior to axillary dissection in patients with one or more micrometastatic (< 2 mm) sentinel nodes and tumour of maximum 5 cm. Patients were randomly assigned (in a 1:1 ratio) to either undergo axillary dissection or not to undergo axillary dissection. The primary endpoint was disease-free survival. Non-inferiority was defined as a hazard ratio (HR) of less than 1.25 for no axillary dissection versus axillary dissection. The primary endpoint was disease-free survival, determined as the number of years from randomisation until first evidence of invasive relapse at any site, second primary tumour (controlatéral or non-breast), or death. We assessed disease-free survival and overall survival using the Kaplan-Meier product-limit method. We used the log-rank test, stratified by menopausal status, to compare the treatment groups. Le critère de jugement principal de survie sans récidive {disease-free survival) est un critère {une ou plusieurs réponses possibles) : Il aurait fallu cocher... Commentaires Composite Le critère de jugement Disease-free survival est clairement défini dans l’article comme étant soit la survenue d’une rechute invasive du cancer, soit la survenue d’un second cancer, soit du décès. Il correspond à la survie sans rechute que l’on retrouve au sous sus le terme progression free survival Identique pour les 2 groupes Oui, c’est la base de l’évaluation du critère de jugement dans les essais cliniques Avec données censurées C’est un critère de jugement d’une analyse de survie, il y aura donc des données censurées car tous les patients n’auront pas présenté l’événement d’intérêt au moment de la date de point et que certains auront été perdus de vue Il n’aurait pas fallu cocher... Commentaires Qualitatif à 3 modalités Bien qu’il y ait 3 types d’événement pris en compte (rechute invasive, second cancer ou décès), le critère de jugement est un critère binaire (OUI/NON) car il s’agit d’un critère composite. C’est-à-dire qu’un patient aura présenté l’événement s’il présente soit une rechute invasive, soit un second cancer soit le décès Quantitatif C’est un critère qualitatif binaire, c’est-à-dire survenue de l’événement : OUI/NON Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyses dépendantes du temps ou « analyses de survie 71 Analysis of disease-free survival AD = axillary dissection, DFS = disease-free survival. À propos de la figure ci-dessus sur la survie sans récidive {une ou plusieurs réponses possibles) : Il aurait fallu cocher... Commentaires La non-infériorité de l’absence de curage ganglionnaire axillaire est significative car la borne supérieure de l’intervalle de confiance à 95 % du rapport des risques instantanés {hazard ratio) est inférieure à 1,25 Le hazard ratio est la mesure d’association la plus couramment utilisé dans les analyses de survie. Il correspond au rapport des risques instantanés à chaque moment du suivi de l’étude entre 2 groupes comparés et s’interprète de la même manière d’un risque relatif. Ici, la borne supérieure de son intervalle de confiance est inférieure au seuil de non-infériorité choisi par les auteurs (voir fiche 17 sur les études de non-infériorité) La supériorité de l’absence de curage ganglionnaire axillaire est non significative car l’intervalle de confiance à 95 % contient la valeur 1 Oui, même si la conclusion principale de l’étude ne peut pas reposer sur ce résultat car l’objectif principal est de démontrer la non-infériorité, il est tout à fait possible de conclure sur la supériorité dans cette situation Il n’aurait pas fallu cocher... Commentaires La réduction du nombre de patients exposés, divisé par 3 en 6 ans, résulte du taux élevé de récidives et de décès Le taux d’événement est faible dans cette situation (moins de 20 % en 6 ans). Cela s’explique par une durée de suivi des patients très hétérogène {médian follow-up of 5-0 [IQR 3.6-7.3] years) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 7 Méta-analyse La méta-analyse est définie comme une « approche statistique qui a pour but de rassembler, de résumer les résultats empiriques d’études singulières pour en faire une synthèse reproductible et quantifiée » (Laroche P. La méta-analyse. Méthodes et applications en sciences sociales. Louvain-la-Neuve : De Boeck Supérieur, 2015). D éfinitio n d e la m é t a-a n alyse • Agrégation des résultats de plusieurs études (essais cliniques, études observationnelles à visée étiologique, études de performances diagnostique, études descriptives). Dans la méta-analyse on n’inclut pas des patients directement, mais on inclut des études (on parle alors d’études primaires). • L’objectif est d’apporter des réponses supposées plus précises et moins biaisés. • Il ne s’agit pas simplement d’une revue de la littérature exposant le résultat de chaque étude primaire prise isolément, la méta-analyse regroupe les résultats et présente une taille globale de l’effet du traitement pour l’ensemble des études primaires incluses dans la méta-analyse (comme un risque relatif global, par exemple), en y associant son intervalle de confiance et une p-value globale. A va n t a ges d e la m é t a-a n alyse Dans quel contexte de recherche va-t-on bénéficier le plus de la réalisation d’une méta-analyse ? • Lorsque les résultats des essais sur un sujet sont en apparence contradictoires. • Lorsque vous pensez qu’un traitement est efficace mais que la plupart des essais sont négatifs par manque de puissance. Quels sont les avantages de la méta-analyse ? • Mesure d’un effet global permettant d’avoir un estimateur plus fiable de l’effet d’un médicament par rapport à toutes les études prises séparément. • Augmentation de l’effectif donc Meilleure représentativité de la population et augmentation de la puissance. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 74 Généralités Limit es d e la m é t a-a n alyse Principal problème = biais de publication • Plus une étude montre un effet important et un résultat statistiquement significatif, plus celle-ci a de chance d’être publiée. A contrario les études dites négatives ou retrouvant de faibles effets ont moins de chance d’être publiées. • Le risque majeur de la méta-analyse est donc d’inclure majoritairement des études « positives » car ce sont elles qui ont été majoritairement publiées. Les études « négatives » non publiées sont alors ignorées et ne sont pas incluses dans la méta-analyse. • Le biais de publication entraîne donc un risque majeur de déséquilibre entre les études « positives » et les études « négatives » avec une balance qui penche en faveur des études « positives ». Finalement, plus le biais de publication est important, plus le risque de conclure à une efficacité du traitement alors que celui-ci n’existe pas l’est également. Autres problèmes méthodologiques Les études publiées sur un sujet donné sont très hétérogènes. Les critères de sélection des études à inclure dans une méta-analyse doivent donc être rigoureuse ment établis afin de permettre une évaluation des résultats la plus fiable possible (la moins biaisée) sans pour autant perdre trop d’information (il ne faut pas exclure des études intéressantes). Voilà quelques questions méthodologiques qui se posent lors du choix des critères de sélection des études : Définition de la population Les populations peuvent être très différentes d’une étude à une autre, notamment si les critères de définition de la maladie ne sont pas les mêmes à chaque fois Exemple : durée d’évolution de la maladie différente, stade métastatique vs localisé, âge des patients différents Définition du critère de jugement Le critère de jugement peut être différent d’une étude à l’autre Exemple : tout événement cardiovasculaire versus AVC seulement versus infarctus seulement Qualité des études La qualité des études publiées n’est bien sûr pas homogène. La présence de biais sera plus ou moins importante selon les études Exemple : essais randomisés contre placebo en aveugle vs essais ouverts voire non randomisés Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Méta-analyse 75 Langue de publication des études Certaines études peuvent être publiées dans d’autres langues que l’anglais ou le français. Cela peut donc poser des problèmes de recherche et de traduction La recherche uniquement en langue anglaise peut entraîner une perte d’information si des études présentant un intérêt ont été publiées dans une autre langue Manque d’information dans certaines études Certaines études vont manquer de données pour permettre la réalisation de l’analyse statistique de la méta-analyse et risquent donc d’être exclues Une possibilité est alors de réaliser une méta-analyse sur données individuelles (il faut alors contacter l’auteur de l’article et qu’il accepte de partager sa base de données) Prése n t atio n d es résult ats • Flow chart de la procédure d’inclusion des études. - Visualisation des sources des études (PubMed, Cochrane, ClinicalTrials.gov, etc.). - Visualisation du nombre d’études identifiées comme candidates et du nombre d’études exclues et incluses dans la méta-analyse. - Visualisation schématique de la méthodologie mise en œuvre pour la sélection des études. ► Remarque : la bonne méthodologie consiste à demander à deux auteurs différents de sélectionner les études. En cas de discordance sur une étude, on peut demander à un 3e auteur d’intervenir afin d’obtenir un consensus sur l’inclusion ou l’exclusion de l’étude. • Evaluation de la qualité des études sélectionnées. - C’est une étape importante de la méta-analyse qui permet d’apprécier la qualité méthodologique des études sélectionnées. - Les auteurs notent la méthodologie utilisée par chaque étude pour répondre à la question posée par la méta-analyse. - Il ne s’agit pas de noter la méthodologie de chaque étude hors contexte de la méta-analyse mais bien dans le contexte de la question posée. Par exemple, un essai clinique peut être de très bonne qualité méthodologique mais avoir une « mauvaise note » dans le contexte de la méta-analyse car celle-ci s’intéresse à un résultat sur un critère secondaire recueilli aléatoirement dans l’étude primaire. - Cette étape aide à l’interprétation des résultats et permet de faire des analyses en sous-groupe en fonction de la qualité des études primaires sélectionnées. • Diagramme en forêt (forest plot) avec une ligne de résultat pour chaque étude et une ligne de résultat (généralement la dernière ligne) qui représente l’effet global et que l’on appelle la taille de l’effet. - Exemple de forest plot : Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 76 Généralités En faveur du placebo RR=1 En faveur du traitement *---------------- ; ------------------------* 0.6 Study A Study B 1 0.8 1.2 1.4 1.6 1.8 2 2.2 ---------------------------------- •---------------------------------- 1 ----------------------- •----------------------- 1 Study C Study D Global effect ---------------------------------- ♦--------------------------------- 1 i-------------------- •-------------------- 1 ------------- •------------- 1 Fig u r e 7.1 • Les études A et B retrouvent un RR à 1,4 et 1,2 en faveur du traitement mais avec un effet non significatif car leur IC à 95 % comprend la valeur 1. • Les études C et D retrouvent un RR à 1,6 et 1,5 en faveur du traitement mais avec un effet cette fois significatif car leur IC à 95 % ne comprend pas la valeur 1. • La taille de l’effet global retrouve un RR à 1,3 en faveur du traitement avec un effet significatif car son IC à 95 % ne comprend pas la valeur 1. ► Remarque : l’IC à 95 % de l’effet global est plus étroit que l’IC à 95 % des RR des études prises isolément car la taille de la population prise en compte est plus importante du fait de l’agrégation des données. H é t éro g é n éité d ans les m é t a-a n alyses L’hétérogénéité peut être de deux types dans les méta-analyses : clinique et/ou statistique. Les conséquences de ces deux types d’hétérogénéité ne sont pas les mêmes. Hétérogénéité clinique Par exemple, on peut retrouver une hétérogénéité sur les populations des études (stade localisé vs stade métastatique, population hospitalière vs population ambulatoire, etc.), sur les critères de jugement (décès vs variable biologique), sur les durées de suivi (transversales vs longitudinales), sur la manière d’administrer les médicaments (posologies différentes), etc. C’est la lecture de la partie matériel et méthodes de chaque étude qui permet de se rendre compte de l’importance de l’hétérogénéité clinique de la métaanalyse. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Méta-analyse L’hétérogénéité clinique peut poser des problèmes d’interprétabilité des résultats : quelle interprétation faire d’un estimateur commun issu de la sélection d’études très hétérogènes entre elles (concernant des populations très différentes, par exemple) ? Parfois, le calcul d’un estimateur commun est impossible car les études sont tellement différentes que cela n’aurait aucun sens. La définition a priori des critères permettant d’inclure les études lors de la rédaction du protocole de la méta-analyse doit permettre de trouver un équilibre entre homogénéité clinique et exclusion trop importante d’études intéressantes pour répondre à la question posée. Hétérogénéité statistique La méta-analyse est statistiquement hétérogène quand les différentes études qui la composent sont discordantes sur le plan de leurs résultats. Le forest plot permet d’identifier visuellement une hétérogénéité statistique si les estimateurs de chaque étude se distribuent de manière différente de chaque côté de la ligne verticale représentant un risque relatif = 1 ou une différence absolue = 0. L’hétérogénéité statistique fait généralement l’objet d’un test statistique que l’on retrouve généralement positionné tout en bas du forest plot. Il s’agit du test du I2 ou du T2. Si toutes les études retrouvent toutes le même risque relatif, on dit que les résultats sont homogènes et alors le I2 est à 0 %. Au contraire, si les études retrouvent des résultats différents, les résultats sont hétérogènes et alors le I2 est différent de 0 %. Un petit p est parfois associé et représente le résultat du test sous l’hypothèse nulle HO : I2 = 0 %. On peut définir le niveau d’hétérogénéité selon les valeurs de I2 suivantes : • I2 < 0,25 hétérogénéité faible ; • 0,25 < I2 < 0,5 —> hétérogénéité modérée ; • I2 > 0,5 hétérogénéité importante. Parfois, un intervalle de prédiction {prédiction interval) est représenté juste en dessous du résultat représentant la taille globale de l’effet associée à son intervalle de confiance. L’intervalle de prédiction est une notion différente de l’intervalle de confiance de la taille globale de l’effet. L’intervalle de prédiction indique dans quelle tranche a 95 % de chance de se trouver la mesure d’association estimée par la prochaine étude qui sera réalisée sur le sujet. Il reflète l’homogénéité ou l’hétérogénéité des différents résultats des études incluses dans la méta-analyse car l’intervalle de prédiction est très fortement lié au I2 d’homogénéité. En effet, si les études sont homogènes (le RR est pratiquement identique dans toutes les études), alors le I2 est à 0 %. Dans ce cas, le risque qu’une prochaine étude publiée sur le même sujet retrouve un résultat identique est très important et en conséquence l’intervalle de prédiction de la méta-analyse sera très étroit. À l’inverse, plus les résultats des études sont hétérogènes, plus le I2 est éloigné de 0 %, plus il est difficile de prédire le résultat d’une future étude avec certitude et donc l’intervalle de prédiction s’agrandit. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 78 Généralités Évaluatio n du biais d e p u blica tio n Le funnel plot (graphique en entonnoir) représente les estimations ponctuelles de chaque étude primaire en fonction de la taille de l’échantillon de chaque étude. On retrouve la mesure d’association utilisée dans l’étude (le risque relatif, par exemple) en abscisse et l’erreur standard (qui dépend de la taille de l’échantillon) en ordonnée. Le triangle représente artificiellement les intervalles de confiance. Les études avec les effectifs les plus importants et donc avec les intervalles de confiance les plus étroits se situent en haut du graphique, à l’endroit où le triangle se resserre. Exemple de funnel plot : Dans l’exemple de funnel plot ci-dessus, le résultat de chaque étude primaire est représenté par un petit carré orange. On remarque qu’une zone est vierge de ces petits carrés (la zone entourée d’un cercle gris). Cette zone correspond aux études de faible puissance qui montrent un effet délétère du traitement. Cet aspect est typique d’un biais de publication car cela laisse penser que les études qui se situent dans cette zone n’ont pas été publiées. E x e m pl e d e m é t a - a n a l ys e Fiolet T, Guihur A, Rebeaud ME, Mulot M, Peiffer-Smadja N, Mahamat-Saleh Y. Effect of hydroxychloroquine with or without azithromycin on the mortality of coronavirus disease 2019 (COVID-19) patients: a systematic review and meta-analysis. Clin Microbiol Infect Off Publ Eur Soc Clin Microbiol Infect Dis janv 2021 ; 27(1) : 19-27. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Méta-analyse 79 Flow diagram of study sélection process. Study Type of study = non-randomised Ayerbe et al., 2020 [17]- Spain Gelerisétal., 2020 [15]- USA Rivera et al., 2020 [47]-USA/Canada/Spain Ip et al., 2020 [42]- USA Magagnoli et al., 2020 [41]- USA Mahevas et al., 2020 [13]- France Membrillo et al., 2020 [16]- Spain Mikami et al., 2020 [56]- USA Paccoud et al., 2020 [46] France Rosenberg et al., 2020 [18]- USA Sanchez-Alvarez et al., 2020 [44]- Spain Sbidian et al., 2020 [48]- France Singh et al., 2020 [19]- USA Yu et al., 2020 [14]- China TE seTE Risk Ratio RR -0.86 0.1323 0.04 0.1214 0.10 0.2287 -0.01 0.1077 0.60 0.2329 0.18 0.5400 -2.66 0.8958 -0.63 0.1253 -0.12 0.6923 -0.08 0.2742 -0.75 0.2652 0.05 0.1394 -0.05 0.1300 -1.02 0.3641 ss ; ia 7» si 0.42 1.04 1.11 0.99 0.83 0.20 0.07 0.53 0.89 1.08 0.47 1.05 0.95 0.36 0.79 (0.33-0.55) (0.82-1.32) (0.71-1.74) (0.80-1.22) (1.16-2.89) (0.42-3.45) (0.01-0.41) (0.23-0.68) (0.63-3.46) (0.28-1.85) (0.80-0.79) (0.80-0.38) (0.74-1.23) (0.18-0.73) (0.60-1.04) 8.1% 8.1% 6.9o/o 8.3% 6.80/0 3.4% I.60/0 8.20/0 2.4% 6.20/0 6.40/0 8.0% 8.10/0 5.10/0 87.50/0 1.47 1.09 1.01 1.09 (0.48-0.55) (0.96-1.32) (0.06-1.74) (0.97-1.22) 3.10/0 8.70/0 O.7O/o 12.5% 0.83 (0.65-1.06) (0.33-2.12) 1OO.OO/o -h - A, V 1 s' * s 95% Cl Weight Random effects model hetergeneity:/2 =84%, t2 =0.2021, p<0.01 Type of study=RCT Cavalcanti et al.,2020 [51 Brazil Horby et al., 2020, RECOVERY Trial [40]-UK Skipper et al.,2020, [39]-USA/Canada Ramdom effects model Helerogeneity. /2 =0%, t2 =0,87 Random effect model Prédiction interval Helerogeneity: /2 =83o/o.t2 =0.1768, p<0,01 Residual heterogeneity: /2 =82%, p<0.01 ____ i s !> 0.39 0.5726 0.09 0.0632 0.01 1.4264 4 1 1 1 1 0.1 0.5 1 2 10 Forest plot of the association between hydroxychloroquine alone and COVID-19 mortality (excluding studies with critical risk of bias) RR, risk ratio. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 80 Study Généralités TE seTE Type of study = observational -0.02 0.1364 lp 0.27 0.2500 Magagnoli 0.77 0.2497 Rivera Rosernberg 0.30 0.2900 0.34 0.1565 Sbidian 0.17 0.1500 Singh Random effects model Heterogeneity: I2 = 42°/o, x 2 = 0.0263, p = 0.12 Risk Ratio RR | ; LL ----- B -L----- 0.98 r 0.5 1 Weight 23.3o/o II.60/0 11.6o/o 9.3o/o 2O.5O/o 21.40/0 97.7o/o !----- +---------Hi----4H- 2.15 1.35 1-40 1-19 O 11 1.29 (0.75-1.28) (0.80—2.14) (1.32-3.51) (0.76-2.38) (1.03—1.90) (0.88-1.59) (1.06-1.58) 0.64 0.64 (0.18-2.24) (0.18—2.24) 2.3o/o 2.3o/o ï 27 (1.04-1.54) (0.79-2.05) WO.OO/o 1.31 Type of study - RCT -0.45 0.6397 ----------------- *----- -[------Cavalcanti Random effects model ■f 11 Heterogeneity: not applicable 1 Random effects model Prédiction interval i Heterogeneity: 0.2 I2 = 38O/o, t 2 = 0.0247, p = 0.14 Residual heterogeneity: I2 ■ = 42o/o, p = 0.12 95o/o Cl 1 2 1 5 Forest plot of the association between hydroxychloroquine with azithromycin and COVID-19 mortality (excluding studies with critical risk of bias) RR, risk ratio. Concernant les études incluses dans cette méta-analyse : Il aurait fallu cocher... Commentaires Les études avec un risque de biais important n’ont pas été prises en compte dans l’analyse C’est pour cette raison que le nombre d’études utilisées pour les analyses ne correspond pas au nombre d’études incluses. Il est par ailleurs précisé dans le titre des figures : excluding studies with critical risk of bias L’identification des études candidates à l’inclusion dans cette méta-analyse semble avoir été réalisée de manière à rendre compte d’un screening le plus exhaustif possible Du fait de l’utilisation de différentes sources de données (Pumed, Embase, Web of science, Cochrane) 283 articles ont été exclues car ils ne correspondaient pas à des études épidémiologiques ou thérapeutiques Il s’agit des articles publiant des résultats qui ne correspondent pas directement aux résultats d’études conduites directement avec des patients (lettres commentées, des revues de la littérature, des métaanalyses, etc.) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Méta-analyse Il n’aurait pas fallu cocher... Commentaires Toutes les études incluses ont été utilisé dans la réalisation de l’analyse statistique Concernant les études évaluant l’HCQ seule 17/27 études incluses ont été analysées et concernant les études évaluant l’HCQ et l’AZT seule 7/12 ont été analysées La majorité des études utilisées dans l’analyse sont des essais thérapeutiques randomisés Seulement 3 essais randomisés pour l’HCQ seule et seulement 1 essai randomisé pour l’association HCQ + AZT Le risque d’inclure 2 fois certains patients n’a pas été pris en compte par les auteurs 2 études ont été exclues car elles étaient des doublons d’une même cohorte 81 Concernant les résultats de la méta-analyse sur l’effet de l’hydroxychloroquine seule : Il aurait fallu cocher... Commentaires Il n’y a pas d’effet statistiquement significatif sur la mortalité comparé au placebo selon cette méta-analyse Oui, avec un RR à 0,83 et un IC comprenant la valeur 1 Les résultats des essais cliniques randomisés sont très homogènes entre eux Oui, globalement le RR est proche de 1 et toujours > à 1 avec intervalle de confiance comprenant la valeur 1 et I2 d’homogénéité est à 0 % On retrouve un effet statistiquement significatif en faveur du traitement dans certaines études non randomisées Oui, est ce pour 5 études sur 14 pour lesquelles le RR est < 1 avec un intervalle de confiance ne comprenant pas la valeur 1 Dans cette méta-analyse, la largeur de l’intervalle de prédiction est liée à la prise en compte importante d’études non randomisées Oui, car les résultats des études non randomisées sont très hétérogènes alors que les résultats des études randomisées sont homogènes. Si on calculait un intervalle de prédiction seulement en prenant en compte les essais randomisés, celui-ci serait très étroit Il n’aurait pas fallu cocher... Commentaires Les résultats des études non randomisées sont très homogènes entre eux Certaines études ne retrouvent pas d’effet de l’HCQ, certaines retrouvent un effet protecteur et d’autres un effet délétère. Par ailleurs, le I2 est très éloignés de 0 (83 %) est très large et comprend la valeur 1 (0,33-2,12) On retrouve un effet statistiquement significatif en faveur du traitement dans certaines études randomisées Les 3 essais randomisés retrouvent un RR proche de 1 avec un intervalle de confiance comprenant la valeur 1 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 82 Généralités Il n’aurait pas fallu cocher... Commentaires L’estimation du risque relatif donnée par la taille de l’effet global et mesurée à 0,83 est probablement moins biaisée que celle donnée par l’agrégation des essais randomisés et mesurée à 1,09 étant donné que beaucoup plus d’études sont utilisées pour son calcul L’estimation donnée par le résultat des 3 essais randomisés est certainement moins biaisée que l’estimation donnée par les 14 études observationnelles. Augmenter le nombre d’études les plus biaisés ne permet pas de diminuer les biais Il y a 95 % de chance que la vraie valeur du risque relatif de mortalité liée à la prise d’HCQ soit comprise entre 0,33 et 2,12 Il s’agit de l’intervalle de prédiction et non pas de l’intervalle de confiance. Les résultats de cette méta-analyse indiquent qu’il y a 95 % de chance que la vraie valeur du risque relatif de mortalité liée à la prise d’HCQ soit comprise entre 0,65 et 1,06 Concernant les résultats de la méta-analyse sur l’effet de l’hydroxychloroquine en association avec l’azithromycine : Il aurait fallu cocher... Commentaires L’effet significatif du traitement sur la mortalité dans cette méta-analyse pourrait s’expliquer par un biais de prescription de l’association HCQ + AZT vers les patients les plus graves La plupart des études non randomisées retrouvent une tendance à un effet délétère du traitement. Ceci peut s’expliquer par le fait que le traitement pourrait avoir été prescrit pour les patients les plus graves ou les plus fragiles. Par ailleurs, le seul essai randomisé pris en compte retrouve plutôt une tendance à un effet positif du traitement (même si celui-ci n’est pas significatif) Il n’aurait pas fallu cocher... Commentaires Les résultats concernant l’association HCQ + AZT retrouvent un effet significatif en faveur du traitement Le RR est à 1,27 avec un intervalle de confiance ne comprenant pas la valeur 1 ; l’effet est donc significatif, mais en faveur du placebo (il s’agit du RR estimant l’effet du traitement sur la mortalité, donc un risque > 1 suggère une augmentation de la mortalité des patients traités vs placebo) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 8 Conditions réglementaires et éthiques dans la recherche impliquant la personne humaine Asp ects ré gle m en t aires En France, deux lois principales régissent les autorisations pour réaliser des études dans le champ de la santé : • la loi Jardé de 2012 : loi sur la recherche impliquant des personnes humaines. Elle permet notamment de classer les différents types de recherche en différentes catégories (voir tableau ci-dessous) et définit les différentes démarches à suivre en fonction de la catégorie dans laquelle se situe l’étude ; • la loi Informatique et liberté : loi sur la protection des données. Elle vise à établir des règles concernant les données collectées, notamment l’obligation d’assurer la sécurité de ces données, l’obligation d’informer les individus concernés et le droit à l’accès, la modification et la suppression de ces données pour les individus concernés. Les structures impliquées dans ces processus règlementaires sont : • le comité de protection des personnes (CPP) : qui veille au respect de la loi Jardé et qui donne son avis préalable à toute recherche biomédicale. Il en existe un par région. S’il donne un avis défavorable, il est interdit de mettre en place la recherche ; • le Comité national de l’informatique et des libertés (CNIL) qui veille au respect de la loi informatique et liberté ; • enfin, l’Agence nationale de sécurité du médicament (ANSM), est un troisième acteur qui doit donner son autorisation pour tout ce qui concerne l’évaluation du médicament et des dispositifs médicaux. Donc, en pratique, pas d’essai clinique sans autorisation de l’ANSM. La LCA en anglais facile aux ED N © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 84 Généralités Démarches réglementaires en fonction du projet selon la loi Jardé (recherche impliquant la personne humaine [RIPH]). Catégorie 1 Recherches interventionnelles Catégorie 2 Recherches interventionnelles à risques et contraintes minimes Catégorie 3 Recherches non interventionnelles Etude avec intervention non justifiée par la prise en charge habituelle qui est susceptible de comporter un risque pour le patient (essai évaluant un médicament, un acte diagnostique invasif, etc.) Etudes non médicamenteuses avec contraintes et risques minimes (par exemple, une étude de cohorte avec un ou des bilans sanguins supplémentaires par rapport à ce qui est réalisé en pratique courante) Etudes observationnelles type cas-témoins ou cohorte n’impliquant aucune procédure supplémentaire par rapport à la prise en charge habituelle du patient (même pas une prise de sang supplémentaire) Autorisation du CPP nécessaire Autorisation spécifique de la CNIL nécessaire Information auprès de l’ANSM Autorisation de l’ANSM nécessaire Assurance nécessaire Consentement libre, éclairé et écrit Autorisation de la CNIL ou engagement de respect de la méthodologie de référence de la CNIL Consentement libre, éclairé et exprès Assurance non nécessaire Non-opposition Démarches réglementaires des études non couvertes par la loi Jardé (recherche n’impliquant la personne humaine [RNIPH]). Catégorie 4 Recherche dite « hors champ de la loi Jardé » ou RNIPH Réutilisation secondaire de données et/ou de collections déjà acquises ou d’un registre agréé, ou de dossiers médicaux sans que de nouvelles informations soient collectées auprès de patients pas de nécessité de revenir au patient Pas d’autorisation du CPP requise. Avis d’un comité d’éthique souhaitable pour publication mais non imposé par la loi Autorisation de la CNIL non obligatoire si méthodologie de référence de la CNIL utilisée ANSM non impliquée Pas d’assurance nécessaire (pas de promoteur obligatoire) Non-opposition Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Conditions réglementaires et éthiques dans la recherche impliquant... 85 En pratique La publication du protocole ne garantit pas qu'il respecte les règles éthiques, c ’ est l’ autorisation du comité d ’ éthique qui en est garante. Toutes les études avec traitement informatisé des données doivent obtenir l'autorisation de la CNIL Toutes les études dans lesquelles on doit recueillir des informations auprès des patients dans le cadre de l'étude (cas-témoins) doivent obtenir l’ accord du CPP. Les études interventionnelles sur le médicament doivent obtenir l'autorisation de l'ANSM. Les seules études dispensées de l'autorisation du CPP sont les études sur des données ou des collections existantes. PS : l'expression « recherche interventionnelle » définit ici toute procédure réalisée sur le patient qui n'est pas prévue par la prise en charge habituelle de la pathologie considérée. C'est à bien différencier de l'expression « étude expérimentale », utilisé en méthodologie pour définir les études au cours desquelles l'attribution de l'exposition est fixée par le design de l'étude (au contraire des études observationnelles). Particip a n ts à la recherche e t d é finitio ns Promoteur Personne physique ou morale qui est responsable d’une recherche impliquant la personne humaine ; il en assure la gestion et vérifie que son financement est prévu. C’est généralement le promoteur qui prend l’initiative de l’essai clinique. Le promoteur est responsable de la sécurité des personnes et doit contracter une assurance. Il peut être industriel (laboratoire pharmaceutique) ou institutionnel (par exemple, un CHU, l’INSERM, l’INCa, etc.). Dans les articles on repère le promoteur grâce aux termes de promoter ou sponsor. Le terme investigator-initiated study signifie que l’étude a été conçue et réalisée par un médecin académique, promue par un hôpital public ou privé, mais payée par une firme pharmaceutique. Normalement, la firme pharmaceutique n’a pas de droit de regard sur le protocole, l’étude ou le résultat, mais en pratique cela ne garantit pas l’indépendance de l’étude. Investigateur Personne physique médicalement qualifiée qui inclut les patients et veille à leur sécurité. Il est responsable de la conduite de la recherche. Il informe et recueille le consentement des patients. Il veille au bon respect du protocole et à la qualité du recueil des données. Un investigateur principal est l’investigateur responsable de la recherche dans un centre investigateur (un service, un hôpital, etc.). L’investigateur coordonnateur représente l’ensemble des investigateurs et fait le lien direct avec le promoteur. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 86 Généralités Lie n d'int érê t / co n flit d'in t érê t Un lien d’intérêt est un lien direct ou indirect (via un membre de sa famille, par exemple) qui permet d’obtenir un avantage en rapport ou non avec la profession. Un conflit d’intérêt apparaît dans la situation au cours de laquelle un professionnel voit son lien d’intérêt influer ou paraître influer sur l’exercice impartial et objectif de ses fonctions. Établir l’existence d’un lien d’intérêt ne veut pas forcément dire qu’il existe un conflit d’intérêt. En revanche un conflit d’intérêt survient dans le contexte d’un lien d’intérêt préexistant. La loi impose la transparence des liens existant entre l’industrie pharmaceutique (ou de santé de manière générale) et les acteurs du monde de la santé. La déclaration des liens d’intérêts est donc obligatoire. En pra tique Ex e m ple 1 (ED N 2017) Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML, Santhakumaran S, et al. Levosimendan for the Prévention of Acute Organ Dysfunction in Sepsis. N Engl J Med T7 oct 2016 ; 375(17) : 1638-48. We conducted this multicenter, randomized, double-blind, placebo-controlled clinical trial in 34 general adult intensive care units (ICUs) in the United Kingdom. London-Harrow Research and Ethics Committee approved the protocol. The trial was funded by the National Institute for Health Research and Tenax Therapeutics and sponsored by Impérial College London. Data management and analysis were performed by the Impérial Clinical Trials Unit. Orion Pharma provided levosimendan and placebo free of charge. The funders, the sponsor, and Orion Pharma had no rôle in designing the trial, gathering or analyzing the data, writing the manuscript, or making the decision to submit the manuscript for publication. The first author vouches for the data and analyses, as well as for the fidelity of this report to the trial protocol. Dr. Gordon reports receiving Consulting fees from Ferring Pharmaceuticals and grant support from HCA International, both paid to his institution. Concernant les aspects éthiques ou règlementaires, quelle(s) est(sont) la (les) proposition(s) exacte(s) ? Il aurait fallu cocher... Commentaires Le premier auteur ne déclarait pas de lien d’intérêt avec Orion Les liens d’intérêts (Disclosure of interest) sont généralement fournis en fin d’article Le principe d’ambivalence a été respecté L’étude a été réalisée avec une randomisation en double aveugle. Donc, tous les patients avaient de fait la même probabilité de recevoir l’un ou l’autre des traitements. On suppose en conséquence que l’ensemble des contre-indications aux deux traitements ont été prises en compte, même si ce n’est pas directement précisé Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Conditions réglementaires et éthiques dans la recherche impliquant... Il n’aurait pas fallu cocher... Commentaires La signature d’un consentement aux patients garantit l’éthique du protocole La signature d’un consentement est indispensable mais ne garantit pas en soi l’éthique du protocole. Seule la validation par un comité d’éthique le peut En France, une telle étude multicentrique aurait seulement requis l’autorisation d’un CPP En France, un essai clinique sur le médicament requiert l’autorisation d’un CPP, de la CNIL, et de l’ANSM (loi Jardé) : Toute étude prospective = CPP + CNIL Toute étude sur le médicament = CPP + CNIL + ANSM Le promoteur de l’étude était la firme Orion En anglais le promoteur est décrit sous les termes promoter ou sponsor. Ici il s’agit donc de l’Imperial College of London. Pour rappel, le promoteur est la personne physique ou morale qui prend l’initiative de l’essai clinique. Elle est responsable de la sécurité des personnes et doit contracter une assurance 87 Ex e m ple 2 (é preuve t est 2017) Hugosson J, Carlsson S, Aus G, Bergdahl S, Khatami A, Lodding P, et al. Mortality results from the Gôteborg randomised population-based prostate-cancer screening trial. Lancet Oncol août 2010 ; 11(8) : 725-32. Funding : The Swedish Cancer Society, the Swedish Research Council and the National Cancer Institute. Disclosure : Dr. Hans Lilja holds patents for free PSA and hK2 assays. Dr. Lilja reports having received honoraria from GlaxoSmithKline. Dr. Hugosson reports receiving lecture fees from GlaxoSmithKline and Abbott Pharmaceuticals. Ail other authors déclaré that they hâve no conflicts of interest. This study is registered [as an International Standard Randomised Controlled Trial], controlled-trials.com identifier number [ISRCTN49127736]. Rôle of the funding source : The funding sources had no rôles in the design and conduct of the study ; collection, management, analysis, and interprétation of the data ; and préparation, review, or approval of the manuscript. The funding sources had no access to the database which is kept at the Sahlgrenska University Hospital. Parmi les éléments suivants, quels sont ceux qui traduisent le respect par les auteurs des règles de transparence ou d’indépendance ? Il aurait fallu cocher... L’étude a été référencée dans un registre des essais cliniques sous le numéro ISRCTN54449243 Commentaires Enregistrement et autorisation, financement, liens d’intérêts sont des éléments à repérer à la première lecture du texte Le financeur n’a joué aucun rôle dans la conception et la réalisation de l’étude Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 88 Généralités Il aurait fallu cocher... Commentaires Les auteurs ont publié les sources de financement de l’étude Les auteurs ont publié les liens d’intérêts Il n’aurait pas fallu cocher... L’étude est multicentrique L’étude est réalisée en population Commentaires Distracteurs n’ayant aucun rapport avec les règles de transparence et d’indépendance Ex e m ple 3 (é preuve t est 2020) Bracard S, Ducrocq X, Mas JL, Soudant M, Oppenheim C, Moulin T, et al. Mechanical thrombectomy after intravenous alteplase versus alteplase alone after stroke (THRACE): a randomised controlled trial. Lancet Neurol oct 2016; 15(11): 1138-47. The study protocol was approved by the CPP (comité de protection des personnes) III Nord Est Ethics Committee and the research boards of the participating centres. Ail patients or their legal représentatives provided written informed consent. Patients were randomised (1:1) as soon as possible during intravenous thrombolysis to receive intravenous thrombolysis and mechanical thrombectomy (IVTMT group) or intravenous thrombolysis alone (IVT group). Quelle(s) est(sont) la(les) propositions) exacte(s) concernant les démarches éthiques de cette étude ? Il aurait fallu cocher... Commentaires La loi permet d’inclure des patients n’étant pas en mesure de fournir un consentement éclairé Lorsque la personne n’est pas en état de pouvoir donner son consentement libre et éclairé (ce qui arrive souvent au cours des études se déroulant en réanimation et en soins intensifs), il est possible de recueillir le consentement de la personne de confiance, de la famille ou d’une personne entretenant avec le patient des liens stables et étroits L’étude est en accord avec les exigences règlementaires françaises The study protocol was approved by the CPP (comité de protection des personnes) III Nord-Est Ethics Committee and the research boards of the participating centres. AU patients or their legal représentatives provided written informed consent > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Conditions réglementaires et éthiques dans la recherche impliquant... Il n’aurait pas fallu cocher... Commentaires Le protocole aurait dû être approuvé par le CPP de chaque centre français En France, l’autorisation d’un seul CPP est nécessaire. Le CPP est tiré au sort Un consentement oral était suffisant et aurait permis d’élargir le recrutement Le consentement écrit est indispensable au cours des essais cliniques. Il doit être donné après avoir reçu toutes les informations nécessaires et après lecture de la lettre d’information Les patients randomisés dans le groupe thrombectomie mécanique auraient dû donner un 2e consentement, compte tenu du caractère invasif de cette stratégie Le patient exprime son consentement avant randomisation et doit donc recevoir toutes les informations nécessaires concernant l’étude et notamment le fait qu’il puisse être randomisé dans le groupe avec ou sans thrombectomie. Il n’y a donc qu’une seule signature. Néanmoins, il a le droit de retirer son consentement par la suite et à tout moment, qu’il ait été randomisé dans l’un ou l’autre bras 89 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Pa r t ie II Essais cliniques Pl a n Fiche 9 Fiche 10 Fiche 11 Fiche 12 Fiche 13 Fiche 14 Fiche 15 Fiche 16 Fiche 17 Fiche 18 Fiche 19 Caractéristiques d’un essai clinique Critères de jugement et objectifs Critères de sélection Randomisation Procédure d’aveugle et effet placebo Plan expérimental Suivi de l’étude et diagramme de flux Population d’analyse (ITT et per-protocole) Essais de non-infériorité et d’équivalence Analyse en sous-groupes Conclusion de l’étude et critique des résultats 93 97 109 113 127 139 143 151 163 175 189 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 9 Caractéristiques d’un essai clinique Un essai clinique de phase III est une étude dont l’objectif est de comparer deux interventions thérapeutiques entre elles ou une intervention thérapeutique à un placebo. Un essai clinique de phase III est donc par définition toujours une étude : • prospective ; • comparative ; • interventionnelle ; • randomisée. Un essai clinique n’est donc jamais une étude : • rétrospective ; • descriptive ; • observationnelle. À l’issue de la lecture de cette partie du livre, vous devrez être capable de repérer à la lecture d’un essai clinique : • si l’essai est de phase II ou III (l’ensemble des essais présentés jusqu’ici aux ECN et EDN concernait des essais de phase III) ; • si l’essai est randomisé ou non et les caractéristiques de la randomisation ; • si l’essai est mono- ou multicentrique. Si la randomisation est stratifiée sur le centre (voir fiche 12) ; • si une procédure d’aveugle est mise en place (essai en double aveugle ou en ouvert) ; • le schéma d’étude (en groupes parallèles, en cross-over ou en plan factoriel) : l’ensemble des essais présentés jusqu’ici aux ECN et EDN concernait des essais en groupes parallèles ; • si l’essai est de supériorité, d’infériorité ou d’équivalence ; • si l’analyse principale est présentée en intention de traiter ou en per-protocole ; • le nombre de perdus de vue et la technique pour les prendre en compte, ceci permettant de se rendre compte du biais d’attrition ; • le critère de jugement principal et les critères de jugement secondaires ; • les critères d’inclusion et d’exclusion des participants (ce qui définira la population de l’étude). La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 94 Essais cliniques Phases d e d évelo p p e m en t d'un m é dica m e n t Au cours du développement d’un médicament, différentes phases se succèdent. La phase préclinique permet dans un premier temps de sélectionner le meilleur « candidat médicament ». Dans un second temps, l’évaluation est autorisée chez l’homme au cours de la phase clinique. Phase précliniq u e • Objectif : sélectionner parmi de nombreuses molécules celle possédant les meilleures qualités lui permettant d’être testée chez l’homme. • Se déroule au laboratoire in vitro et in vivo sur l’animal. • Pas d’administration chez l’homme. • Sélection selon des données de toxicité et les potentiels effets thérapeutiques. Phase cliniq u e Phase I • Objectifs : déterminer la tolérance du médicament, la dose maximale tolérée, le mode d’administration. • Administration du médicament sélectionné en phase préclinique à dose croissante à des volontaires sains (sauf cas particuliers) sur un effectif réduit. • Étude de pharmacocinétique associée. • En cas de profil de toxicité favorable, permet de choisir les posologies qui seront testées en phase IL • Essai non comparatif. Phase II • Objectifs : évaluer l’efficacité du médicament et déterminer la dose optimale chez l’homme ; évaluer la toxicité à court terme ; étudier la pharmacocinétique et la relation dose-effet. • Administration du médicament à des malades (phase Ilb) ou à des sujets sains (phase Ha). • Dépiste des effets indésirables moins fréquents et non constatés en phase I en raison d’un effectif un peu plus grand. • Permet de choisir la posologie offrant la meilleure balance bénéfice/risque pour la réalisation des essais de phase III. • Ces essais sont parfois comparatifs. Phase III • Objectif : évaluer l’efficacité du médicament de manière comparative soit face à un placebo, soit face à un traitement de référence. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Caractéristiques d’un essai clinique 95 • Effectifs de plus grande importance avec constitution d’un groupe témoin : essai comparatif. • Poursuite de l’analyse de tolérance avec recueil des effets indésirables. • Permet au traitement l’obtention de l’autorisation de mise sur le marché (AMM) et donc sa commercialisation. Phase IV • Concerne toutes les études réalisées sur un médicament après son obtention de l’AMM et de sa commercialisation. • Concrètement, on désigne l’étude des conditions d’application du médicament notamment en termes de sécurité (étude de pharmacovigilance). Concerne de larges échantillons de sujets et permet ainsi de dépister des effets indésirables très rares mais potentiellement très graves et de mesurer son efficacité en situation de vie réelle (pharmacoépidémiologie). Peut entraîner un retrait du marché du médicament, ou une modification de son AMM. ► Remarque : les essais qui évaluent de nouvelles indications, de nouveaux dosages, de nouveaux modes d’administration, de nouvelles associations en vue de l’obtention d’une nouvelle AMM doivent être considérés comme des essais de phase III (on parle de phase Illb) et pas comme des essais de phase IV. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 10 Critères de jugement et objectifs En complément V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l e s cri t è r es d e j u g e m e n t : h t t ps: / / y o u t u .b e / l 6 L W sC 4 k 3 gs D éfinitio n d es crit ères de ju g e m e n t • Les critères de jugement correspondent aux mesures qui permettent de répondre aux questions posées dans les objectifs. • Le critère de jugement principal permet de répondre à la question posée par la formulation de l’objectif principal et les critères de jugement secondaires permettent de répondre aux questions posées par la formulation des objectifs secondaires. N a t ure d e la variable = crit ère d e ju g e m e n t q u alit a tif ou q u a n tit atif Critère quantitatif Critère qualitatif Paramètre calculable On peut calculer une moyenne On peut calculer un pourcentage Tests statistiques utilisés Comparaison de deux moyennes : test de Student et régression linéaire pour l’analyse multivariée - Analyse de pourcentage : test du Chi2 et régression logistique pour l’analyse multivariée - Analyse de survie (données censurées) : courbes de Kaplan-Meier, test du log rank et modèle de Cox pour l’analyse multivariée Exemples Age, taux de C-reactive protein (CRP), indice de masse corporelle (IMC en kg/m2), score de qualité, échelle visuelle analogique de la douleur, etc. Décès (oui/non), rechute de la maladie (oui/non), IMC (< ou > 30), âge (< ou > 40 ans), etc. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 98 Essais cliniques ► Attention ! Ce qu’il faut prendre en compte c’est la façon dont la variable est traitée (calcul de moyennes ou de pourcentages). L’âge est un critère quantitatif lorsque l’on compare des moyennes entre plusieurs groupes et un critère qualitatif lorsque l’on compare des pourcentages (ex. : pourcentage des patients âgés de plus de 80 ans). Crit ère de ju g e m e n t princip al • Le critère de jugement principal est le plus souvent unique sauf cas particuliers. • Dans un essai clinique, on repère facilement le critère de jugement principal : - c’est la variable qui a servi à calculer le nombre de sujets nécessaires (voir fiche 5) ; - c’est très souvent la mesure qui permet de répondre à la question de l’objectif principal formulée dans la dernière phrase de l’introduction d’un article. • Dans l’idéal, un critère de jugement est : - unique (unique simple ou unique composite) ; - objectif ; - cliniquement pertinent ; - clinique (ou final). Critère de jugement unique (ou composite) ou multiple • Critère unique, il s’agit d’une variable unique qui donne lieu à un seul test statistique : - critère unique simple : - il existe une seule mesure qui donne lieu à la réalisation d’un seul test statistique, - par exemple, le taux de décès est un critère unique ; - critère unique composite (ou composé) : - plusieurs conditions créent une mesure et un résultat unique. Un critère composite (ou composé) est également unique car il donne lieu à un seul résultat et à l’utilisation d’un seul test statistique, - par exemple, le critère de jugement « événement cardiovasculaire majeur ou décès » est un critère de jugement composite mais unique. On considère le patient comme ayant déclaré un événement s’il a fait un AVC, un infarctus ou s’il est décédé. Les résultats sont rendus sous la forme d’un seul pourcentage qui est le pourcentage d’événements. Un seul pourcentage représente la survenue d’au moins l’une de ces trois situations et amène à la réalisation d’un seul test, donc le critère est bien unique. • Critère multiple : on retrouve plusieurs critères de jugement principaux indépendants correspondants à plusieurs mesures avec autant de tests statistiques réalisés que de mesures. Cela peut arriver quand on n’a pas déterminé quelle Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Critères de jugement et objectifs 99 était la meilleure mesure qui évaluera l’efficacité d’un médicament. Un critère multiple pose classiquement deux problèmes : - à chaque fois que l’on réalise un test statistique, on a 5 % de risque de conclure à une différence significative par hasard (cela correspond au risque a). Donc si on réalise deux tests, on prend deux fois ce risque. On parle d’inflation du risque a par la multiplicité des tests : - pour pallier ce problème, le risque a doit être ajusté. Par exemple, au lieu de tester un seul critère avec un risque a à 5 %, on testera deux critères avec un risque a à 2,5 %. Cette méthode d’ajustement (diviser le risque a par le nombre de tests) est la méthode de Bonferroni. Il en existe beaucoup d’autres qui ont toutes en commun de diminuer le seuil a pour l’interprétation des tests, - une autre approche est celle de la méthode séquentielle hiérarchique. Les critères de jugement sont hiérarchisés a priori dans le protocole, un ordre leur est attribué. Les critères sont ensuite testés les uns après les autres, et on arrête l’analyse au premier test non significatif. L’intérêt de cette approche est de pouvoir éventuellement (en fonction des résultats obtenus) conclure à la démonstration de l’effet sur plusieurs critères à partir d’un seul essai, sans inflation du risque a ; - en l’absence de hiérarchie préétablie, la conclusion de l’essai est difficile si les résultats sont discordants sur plusieurs critères (un positif et un négatif, par exemple). Cela peut être clarifié par la détermination a priori d’une règle de conclusion (par exemple, un essai sur la vaccination antigrippale pourra n’être considéré comme positif que si les résultats sont positifs pour le critère de séroconversion et le critère de séroprotection pour chacun des sérotypes testés). Critère de jugement subjectif ou objectif • Critère objectif : - un critère est objectif lorsque sa mesure est non influençable par les opinions ou par des aspects psychologiques, ou n’est pas soumise à interprétation. Le critère est objectif s’il veut dire la même chose pour tout le monde et s’il n’a aucune raison d’être influencé par le traitement étudié dans l’essai. Il repose sur la mesure d’une grandeur physique objective ; - exemples : la mortalité, le taux de C-reactive protein (CRP), la vitesse de marche (si mesure standardisée), la spirométrie, etc. À retenir Dans un essai ouvert, un critère est parfaitement objectif lorsque tout a été fait pour que sa mesure ne soit pas influencée par le bras. Par exemple, dans un essai ouvert sur le traitement du cancer de la prostate (comparant une stratégie fondée sur la surveillance régulière du PSA [prostate-specific antigen] à une stratégie sans PSA), le critère « progression radiologique du cancer de la prostate », bien qu'en apparence objectif, peut être influencé par la connaissance du bras de traitement (l'augmentation du PSA peut justifier la réalisation de plus d'examens d'imagerie). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 100 Essais cliniques En faveur de l’objectivité d’un critère dans un essai ouvert, on retient : • la standardisation de la mesure : la mesure est faite de manière fiable et reproductible pour tous les patients ; • la standardisation du suivi : la recherche de cancer est faite à intervalle régulier et imposée par le protocole dans les deux bras ; • l’existence d’un comité d’adjudication externe : groupe d’experts validant la valeur du critère en aveugle du bras de traitement. • Critère subjectif : - un critère est subjectif lorsque sa mesure peut être influencée par des effets psychologiques ou soumise à interprétation ; - exemples : échelle visuelle de la douleur, échelle de qualité de vie, impression du médecin sur l’observance, etc. Critère de jugement cliniquement pertinent • Un critère cliniquement pertinent doit avoir un sens pour la prise en charge du patient. • Un résultat positif sur un critère non cliniquement pertinent retire tout intérêt à la conclusion de l’étude. • Exemple 1 - comparaison de deux antibiotiques dans la pneumopathie à pneumocoque en réanimation : - critère cliniquement pertinent : mortalité ; - critère non cliniquement pertinent : taux de CRP ; - un résultat positif sur le taux de CRP ne permet en aucun cas de savoir si le traitement est efficace sur la mortalité. • Exemple 2 - la survie sans récidive versus la survie globale dans le cancer de prostate : - la pertinence clinique de la survie globale est supérieure à celle de la survie sans rechute. Connaissant la fréquence des cancers asymptomatiques, que pourrait-on dire d’un traitement qui allonge la survie sans rechute mais pas la survie globale ? - dans ce cas, utiliser le critère composite « survie sans rechute » plutôt que « survie globale » permet d’augmenter le nombre d’événements, et la puissance, et donc la probabilité d’un résultat positif pour une pertinence clinique discutable ! Critère de jugement clinique ou intermédiaire/de substitution • Critère clinique = cliniquement pertinent/démontre l’efficacité d’un traitement. On le retrouve parfois sous l’appellation de critère final. • Critère « intermédiaire » = critère utilisé pour démontrer indirectement l’efficacité du médicament. • Critère « de substitution » = critère intermédiaire ayant démontré son lien avec le critère clinique. Survient plus tôt que le marqueur d’efficacité clinique et lui est fortement corrélé. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Critères de jugement et objectifs Pathologie Critère intermédiaire 101 Critère clinique Hypertension Pression artérielle Evénements coronariens, accident vasculaire cérébral (AVC) Rhumatisme inflammatoire C-reactive protein (CRP)/ disparition du signal inflammatoire en échographie Handicap fonctionnel Déformation Ostéoporose Densité osseuse Fracture du col du fémur Infarctus du myocarde Taux de reperméabilisation coronaire Décès, événements coronariens Diabète non insulinodépendant (DNID) Glycémie, hémoglobine glycosylée, épaisseur intima-média Evénements cardiovasculaires, rétinopathie, insuffisance rénale, etc. Crit ères de ju g e m e n t seco n d aires • Les critères secondaires sont utiles pour étudier la tolérance du traitement ou pour étudier un certain nombre de variables que l’on pense pouvoir être améliorées par le traitement mais qui semblent d’importance moindre ou plus difficiles à mesurer. On retrouve habituellement : - des critères de tolérance (effets secondaires ++). Exemple : saignements intracrâniens sous anticoagulants oraux directs (AOD) versus antivitamine K (AVK) ; - des critères de ressenti du patient grâce à des échelles de qualité de vie ; - des échelles fonctionnelles évaluant l’autonomie, le handicap, etc. • Peut-on conclure sur un critère de jugement secondaire ? - on a le droit de conclure sur la significativité d’un critère de jugement secondaire avec les mêmes exigences sur le plan statistique (ex. : il est vrai de dire que l’on retrouve de manière significative moins de saignements intracrâniens sous AOD que sous AVK si p < 0,05) ; - mais ce ne sont pas sur ces résultats que va reposer la conclusion principale de l’essai ; - chaque essai a été construit avec une puissance suffisante pour tenter de montrer une différence significative sur le critère de jugement principal. Donc il faut que l’essai soit significatif sur le critère de jugement principal pour qu’il soit considéré comme positif. • En d’autres termes, un traitement n’obtiendra pas d’autorisation de mise sur le marché (AMM) sur les résultats portant sur un critère secondaire. En pra tique Ex e m ple 1 (é preuve t est 2017) Griffin D, Parsons N, Shaw E, Kulikov Y, Hutchinson C, Thorogood M, Lamb SE; UK Heel Fracture Trial Investigators. Operative versus non-operative treatment for closed, displaced, intra-articular fractures of the calcaneus: randomised controlled trial. BMJ 2014; 349: g4483. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 102 Essais cliniques Objective: To investigate whether surgery by open réduction and internai fixation provides benefit compared with non-operative treatment for displaced, intra-articular calcaneal fractures. Methods: The primary outcome instrument was the Kerr-Atkins calcaneal fracture score. This is a validated patient reported instrument quantifying pain and function after calcaneal fracture. One hundred points represent normal pain and function. Scores in the range 80-100 indicate either slight pain or minor restrictions to walking ability, such as occasional use of a walking stick, and scores in the range 60-80 indicate moderate pain, restricted walking, and more than occasional use of a walking stick. We measured the primary outcome at two years after injury when at least two thirds of the patients would be expected to hâve reached maximal recovery. Patient reported outcomes were gathered before randomisation, and by postal questionnaires after 6, 12, and 18 months. Complications, additional surgery, and return to work were recorded at a six week follow-up consultation, and at 6, 12, 18, and 24 months. We designed the study to detect a treatment effect of 10 points with 80% power at the 5% significance level, which required data from 126 participants. Allowing for approximately 20% loss to follow-up, we sought to recruit 150 participants. Dans cette étude, le critère de jugement principal est : Commentaires Il aurait fallu cocher... Subjectif Il s’agit d’un score patient patient reported outcome, donc influencé par la perception subjective de l’efficacité du traitement Traité comme une variable quantitative La différence attendue dans le calcul d’effectif est une différence en termes de points sur l’échelle, ce qui indique que cette variable est bien traitée comme une variable quantitative Unique Le calcul d’effectif porte bien sur une valeur unique, qui est la valeur du score de fracture « Kerr-Atkins » Cliniquement pertinent L’utilisation d’une échelle de symptômes ressentis par les patients pour évaluer l’efficacité d’un traitement chirurgical est probablement le critère le plus cliniquement pertinent que l’on puisse imaginer Il n’aurait pas fallu cocher Commentaires Evalué en aveugle La nature de l’intervention rend le double aveugle impossible. L’évaluateur est le patient qui a évidemment connaissance du traitement chirurgical ou non Un score dont les valeurs les plus élevées indiquent une douleur plus importante et une fonction plus altérée C’est clairement indiqué dans les méthodes Mesuré à 6, 12, 18 et 24 mois Composite C’est un critère unique Intermédiaire C’est un critère clinique Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Critères de jugement et objectifs 103 Ex e m ple 2 (é preuve t est 2018) Fleshner NE, Lucia MS, Egerdie B, Aaron L, Eure G, Nandy I, Black L, Rittmaster RS. Dutasteride in localised prostate cancer management: the REDEEM randomised, double-blind, placebo-controlled trial. Lancet 2012; 379: 1103-11. We aimed to assess whether treatment with dutasteride decreased the rate of prostate cancer progression (pathological or therapeutic) compared with placebo in men with low-risk, localised disease who would otherwise undergo active surveillance. The primary endpoint was time to pathological progression (at least one of the predefined criteria : four or more cores involved, > 50% of any one core involved, or a Gleason pattern score of > 4) or the institution of definitive medical therapy (referred to as therapeutic progression; eg, prostatectomy, radiation, or hormonal therapy). Secondary endpoints were time to pathological progression, time to therapeutic progression, absence of cancer in repeat biopsy, change in Gleason score from baseline, change in biopsy characteristics from baseline, and change in MAX-PC score (memorial anxiety scale for prostate cancer) from baseline. We recorded adverse events, serious adverse events, laboratory data (including total prostate-specific antigen), and physical examinations. We analysed the primary endpoint on the basis of a restricted crude rate approach, which included participants from the intention-to-treat population who had at least one post-baseline biopsy procedure or documented therapeutic progression. We compared time to prostate cancer progression (pathological or therapeutic) between treatment groups with the log-rank test. As a supportive analysis, we used a Cox proportional hazards model. Cette étude vise à : Il aurait fallu cocher... Commentaires Démontrer la supériorité du dutastéride sur le taux de progression du cancer localisé de la prostate comparativement à un placebo C’est l’objectif principal de l’étude Évaluer la sécurité d’utilisation du dutastéride pour le traitement du cancer localisé de la prostate comparativement à un placebo C’est un objectif secondaire Comparer l’anxiété liée à un cancer localisé de la prostate des patients traités par dutastéride et de ceux traités par un placebo C’est un objectif secondaire Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 104 Essais cliniques Il n’aurait pas fallu cocher... Commentaires Démontrer la supériorité du dutastéride sur le taux de progression du cancer localisé de la prostate comparativement à une surveillance active simple La surveillance active est une modalité de prise en charge du cancer de la prostate. Dans cet essai, les bras comparés sont dutastéride + surveillance active et placebo + surveillance active. Un tel design ne permet pas de comparer le dutastéride à la surveillance active Le critère de jugement principal est : Il aurait fallu cocher... Composite Commentaires Le critère de jugement principal était le temps jusqu’à progression anatomopathologique ou l’instauration d’un traitement. Il s’agit donc bien d’un critère composite Identique pour les deux bras de l’essai Une variable de survie censurée La formulation (temps jusqu’à survenue) et les analyses utilisées (modèles de Cox, méthodes de Kaplan-Meier) indiquent que ce critère est bien une variable dite « censurée » Analysé en intention de traiter L’analyse a été réalisée en intention de traiter comme indiqué dans les méthodes Un critère intermédiaire Si le critère le plus cliniquement pertinent imaginable est la mortalité globale, on peut considérer que le temps jusqu’au début d’un traitement est un critère intermédiaire Il n’aurait pas fallu cocher... Commentaires Objectif La décision de traiter étant laissée à la discrétion du clinicien, ce critère est donc subjectif. Les auteurs du sujet nous mettaient la puce à l’oreille dans la question précédente indiquant que la connaissance du PSA (et donc potentiellement du bras, puisque le dutastéride réduit le PSA) pourrait influencer la décision de traiter et donc l’objectivité du critère de jugement principal Plus pertinent cliniquement que la mortalité globale En cancérologie, et en particulier dans le cancer de la prostate, la mortalité globale est toujours plus pertinente cliniquement que les autres critères Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Critères de jugement et objectifs 105 Ex e m ple 3 (ED N 2018) Bonjer HJ, Deijen CL, Abis GB, Cuesta MA, van der Pas MHGM, de Lange-de Klerk ESM, Lacy AM, Bemelman WA, Andersson J, Angenete E, Rosenberg J, Fuerst A, Haglind E, for the COLOR II Study Group. A randomized trial of laparoscopie versus open surgery for rectal cancer. N Engl J Med 2015; 372: 1324-32. In this international trial conducted in 30 hospitals, we randomly assigned patients with a solitary adenocarcinoma of the rectum within 15 cm of the anal verge, not invading adjacent tissues, and without distant métastasés to undergo either laparoscopie or open surgery in a 2:1 ratio. The primary end point was locorégional récurrence 3 years after the index surgery. Three years after the index surgery, CT or MRI of the pelvis combined with imaging of the liver and the chest were performed. Récurrent disease was defined as the presence of locorégional récurrence, the presence of distant métastasés, or death from rectal cancer. Le critère de jugement principal de l’étude est un critère : Il aurait fallu cocher... Commentaires Identique pour les deux bras de l’essai Il est évalué dans les deux bras de la même façon Intermédiaire Dans la mesure où la finalité principale du traitement est la survie, on peut considérer que la récidive locorégionale est un critère intermédiaire, puisqu’il est lié à la survie mais qu’il sera accessible plus précocement Il n’aurait pas fallu cocher... Commentaires Evalué par des investigateurs en aveugle du bras de l’essai Les investigateurs qui évaluent ce critère sont les praticiens qui ont pris en charge les patients, ils ne sont pas en aveugle du traitement (la chirurgie) Composite Un seul critère est considéré pour mettre en évidence une récidive locorégionale, il ne s’agit donc pas d’un critère combiné La recherche de cancer n’a pas pu être influencée par le bras de traitement. Ce critère est fondé sur des données d’imagerie, mais on aimerait qu’il soit quand même plus précisément défini, la recherche du cancer peut être influencée par la connaissance du bras de traitement Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 106 Essais cliniques Ex e m ple 4 (ED N 2017) Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML, Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D, Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D. Lévosimendan for the prévention of acute organ dysfunction in sepsis. N Engl J Med 2016; 375: 1638-48. We conducted a double-blind, randomized clinical trial to investigate whether lévosimendan reduces the severity of organ dysfunction in adults with sepsis. Patients were randomly assigned to receive a blinded infusion of levosimendan for 24 hours or placebo in addition to standard care. The primary trial outcome was the mean daily Sequential Organ Failure Assessment (SOFA) score while the patient was in the ICU, as measured from randomization to a maximum of 28 days. The daily SOFA score after baseline was calculated for each patient on the basis of five organ Systems : cardiovascular, respira tory, rénal, hepatic, and coagulation Systems. (Scores for each System range from 0 to 4, with higher scores indicating more severe organ-system dysfunction ; maximum score, 20.) The neurologie System was not included, as in some previous trials, owing to the difficulties of accurately scoring the Glasgow Coma Score daily in the presence of sédation. Daily scores were totaled for each patient’s ICU stay and divided by the number of days that they remained in the ICU in order to calculate the mean SOFA score for that patient. Le critère de jugement principal : Il aurait fallu cocher... Commentaires Est fondé sur un score SOFA modifié Il est effectivement modifié (score SOFA moins l’évaluation neurologique) A été évalué à l’aveugle de la connaissance du groupe de traitement Oui car l’essai a été réalisé en double aveugle Il n’aurait pas fallu cocher... Commentaires Est traité comme une variable qualitative Un score « moyen » indique forcément la prise en compte de la variable comme une variable quantitative, une variable qualitative est exprimée en pourcentage Est le score SOFA mesuré à J28 Il ne s’agit pas du score à J28 mais du score SOFA quotidien moyen obtenu pour l’ensemble du séjour en réanimation, et au maximum 28 jours (addition du score SOFA quotidien divisé par le nombre de jours de séjour en réanimation pour chaque patient) Est un critère combiné Le score SOFA quotidien moyen est un seul élément. Les différents éléments constituant le score n’en font pas un critère composite ou combiné. Le score a une existence en tant que tel (score de Glasgow, par exemple) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Critères de jugement et objectifs 107 Ex e m ple 5 (ED N 2021) Cappuzzo F, Ciuleanu T, Stelmakh L, Cicenas S, Szczésna A, Juhâsz E, et al. Erlotinib as maintenance treatment in advanced non-small-cell lung cancer: a multicentre, randomised, placebo-controlled phase 3 study. Lancet Oncol juin 2010; 11(6): 521-9. The co-primary endpoints were PFS in ail analysable patients irrespective of EGFR status, and PFS in patients with EGFR immunohistochemistry-positive tumours. The alpha level of 5% was split between the two coprimary endpoints: 3% for ail patients and 2% for patients with EGFR immunohistochemistry-positive tumours. Il y a deux cocritères de jugement principaux dans cette étude : la survie sans progression (PFS) dans la population totale et la survie sans progression chez les patients qui sur-expriment l’EGFR en immunohistochimie (EGFR positif). Qu’implique ce choix méthodologique ? Il aurait fallu cocher... Commentaires Le risque global de conclure à tort à l’efficacité du traitement est conservé à 5 % (3 % + 2 %) le risque alpha correspond bien au risque de conclure à tort à l’efficacité du traitement. Dans le cas de critères multiples, pour éviter l’inflation d’alpha, une des techniques consiste à répartir le risque total de l’étude entre les différents critères. On parle d’ajustement du risque alpha Il n’aurait pas fallu cocher... Commentaires On ne prend pas en compte la multiplicité des tests La multiplicité des tests est prise en compte car le risque alpha global de 5 % est réparti entre les deux tests correspondant aux cocritères de jugements principaux Chacun des deux tests doit être significatif au seuil de 5 % pour conclure à l’efficacité Le premier test comprenant l’ensemble des patients doit être significatif au seuil de 3 % et le second test comprenant seulement les patients avec une expression tumorale de l’EGFR doit être significatif au seuil de 2 % Il faudra d’abord montrer la supériorité sur la PFS dans la population totale pour pouvoir faire le test chez les patients EGFR positifs Dans cette situation-là, on aurait d’abord réalisé un seul test au seuil de signification alpha de 5 % puis si, et seulement si, ce test avait été significatif on aurait alors réalisé le second test au seuil alpha de 5 % Il ne sera pas possible de conclure chez les patients EGFR positifs car c’est un sous-groupe Il s’agit effectivement d’un sous-groupe mais qui a été défini en amont de l’analyse comme cocritère de jugement principal avec une anticipation sur la prise en compte de la multiplicité des tests. Il sera donc tout à fait possible de conclure chez ces patients si le résultat du test est significatif à un seuil de 2 % Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 11 Critères de sélection En complément V o u s p o u v e z co nsu l t e r c e t t e v id é o su r l es crit è r e s d e s é l ec t io n d a n s l es e ssa is cli n iq u e s : h t t ps: / / y o u t u.b e / 6L_ U n 9 B t G D I Ech a n tillo n, p o p ula tio n so urce e t p o p ula tio n cible (v oir fich e 2) • Dans un essai clinique, le biais de sélection peut survenir si : - l’échantillon n’est pas représentatif de la population cible : critères de sélection trop restrictifs, inclusion de patients non consécutifs, etc. ; - la population source n’est pas représentative de la population cible. Par exemple, si la population source est choisie dans un centre d’expertise de la maladie étudiée, les malades auront alors un profil particulier (plus graves, présentations atypiques, etc.). Il est alors possible que l’échantillon constitué finalement ne soit plus représentatif de la population cible (c’est-à-dire de tous les patients atteints de la maladie). • Le biais de sélection ne remet pas en cause la validité interne des résultats, mais ils ne seront généralisables qu’à une population ayant les mêmes caractéristiques que celles de l’échantillon (moindre validité externe). Crit ères d'inclusio n e t d'e xclusio n Les critères d’inclusion et d’exclusion peuvent être classés en trois grands groupes en fonction de leurs objectifs. Homogénéiser la population • L’objectif est d’optimiser l’efficacité du traitement afin de ne pas gaspiller du temps et de l’argent. On sélectionne une population homogène pour laquelle on s’attend à une efficacité du traitement. On exclut également les patients pour lesquels on sait que le traitement ne fonctionnera pas. • Exemple : on souhaite tester l’efficacité d’une statine en prévention primaire des accidents vasculaires au sein d’une population d’étudiants de 20 à 25 ans. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 110 Essais cliniques Le taux d’événements attendu est si bas que l’étude nécessitera de sélectionner des milliers de patients à suivre sur plusieurs dizaines d’années pour avoir une chance d’être positive. Il est plus judicieux de sélectionner une population de sujets de plus de 60 ans, consommateurs de tabac et atteints de diabète. Assurer la sécurité des patients • Il est bien entendu logique d’exclure d’emblée les patients pour lesquels on sait par avance que le traitement peut être dangereux ou comporte un risque. • Exemple : les patients allergiques aux médicaments étudiés, les femmes enceintes (médicaments à risque tératogène), les enfants, les patients ayant une contreindication au traitement étudié (les asthmatiques pour les bêta-bloquants, les insuffisantes rénaux pour la metformine, etc.). Respecter la clause d'ambivalence • Respecter la clause d’ambivalence, c’est s’assurer que tous les patients ont la même probabilité d’être randomisés dans l’un ou l’autre bras de l’essai clinique. Il s’agit principalement d’exclure à l’avance les patients ayant une contre-indication à l’un et à l’autre des traitements testés. Le problème se pose essentiellement dans les essais ouverts où l’on pourrait être tenté d’inclure des patients dans un bras, alors qu’ils ont une contre-indication à l’autre traitement. • Exemple 1 : on souhaite comparer chirurgie d’emblée et antibiothérapie dans la prise en charge de l’appendicite aiguë non compliquée. Les patients ayant des contre-indications anesthésiques doivent être exclus (et non pas inclus dans le bras antibiothérapie) pour respecter la clause d’ambivalence. • Exemple 2 : on souhaite comparer l’effet thérapeutique des inhibiteurs de l’enzyme de conversion (IEC) et des bêta-bloquants. Il faut exclure des deux bras les sténoses bilatérales des artères rénales (contre-indication aux IEC) et l’asthme sévère (contre-indication aux bêta-bloquants). À retenir A t t e n tio n au piè ge O C M sur la clause d ’ a m biv ale nce Le fait d'exclure les patients ayant une contre-indication commune aux deux traitements testés dans les deux bras n'intervient pas dans le respect de la clause d'ambivalence. La clause d'ambivalence intervient lorsqu'on exclut des patients ayant une contre-indication à seulement un des deux bras. Exemple : on souhaite évaluer dans le traitement de la pneumopathie à pneumo coque la non-infériorité d ’ une durée d'un traitement par amoxicilline de 5 jours versus 10 jours. Le fait d'exclure les patients avec une allergie à l'amoxicilline ne rentre pas dans le cadre du respect de la clause d'ambivalence puisque les deux bras exposent les patients à cette contre-indication. La probabilité d'être rando misé dans le bras « amoxicilline 5 jours » ou dans le bras « amoxicilline 10 jours » est la même pour tous les patients allergiques, c'est-à-dire égale à 0. En revanche, on exclut bien ces patients pour assurer leur sécurité. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Critères de sélection 111 E n p r a t iq u e Ex e m ple (é preuve t est 2017) Hugosson J, Carlsson S, Aus G, Bergdahl S, Khatami A, Lodding P, Pihl CG, Stranne J, Holmberg E, Lilja H. Mortality results from the Gôteborg Randomised Prostate Cancer Screening Trial. Lancet Oncol 2010; 11(8): 725-32. In December 1994, 20,000 men born 1930 to 1944, randomly sampled from the Population Register, were computer randomised in a 1:1 ratio to a screening group invited for biennial PSA [prostate-specific antigen] testing or to a control group not invited. In each arm, 48 men were excluded from analysis due to either death or émigration before randomization date or prévalent prostate cancer. The primary endpoint was prostate cancer spécifie mortality analyzed according to the intention to-screen principle. Le registre de population qui recense au 31 décembre 1994 les 32 298 hommes nés entre 1930 et 1944 à Gôteborg peut être considéré comme : Il aurait fallu cocher... La population source de l’étude Commentaires La population source est la population au sein de laquelle est tiré l’échantillon. Il s’agit de la population de recrutement. Dans le meilleur des cas, elle doit être représentative de la population cible pour laquelle on souhaite généraliser les résultats Il n’aurait pas fallu cocher... Commentaires Un registre épidémiologique des cancers C’est un registre de population, toutes les naissances sont enregistrées entre 1930 et 1944, et non pas seulement les cas de cancer L’échantillon de l’étude L’échantillon est constitué des 20 000 hommes tirés au sort au sein du registre (registre = population source) La cohorte des participants Cela correspond à l’échantillon de l’étude. La cohorte des patients est tirée au sort au sein du registre Le groupe témoin Le groupe témoin correspond au groupe des participants randomisés au sein de l’échantillon dans le groupe contrôle Les auteurs ont choisi de réaliser l’étude en population parce qu’ils souhaitaient privilégier : Il aurait fallu cocher... La meilleure généralisation possible des résultats Commentaires L’intérêt principal d’une étude en population est qu’elle permet une meilleure généralisation des résultats à la population cible grâce à une bonne représentativité de l’échantillon Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 112 Essais cliniques Il n’aurait pas fallu cocher... Commentaires La qualité de la randomisation en 2 groupes parallèles Le choix de la population source n’affecte en rien la qualité de la randomisation Les aspects éthiques liés à ce type d’étude Le recrutement en population n’améliore pas les aspects éthiques par rapport à un recrutement par des investigateurs La procédure d’assignation masquée des patients dans chacun des groupes Le choix de la population source est indépendant du choix de mettre en place une procédure en aveugle ou non Le contrôle d’un biais de classement La mesure de la maladie n’est pas influencée par le choix de la population de recrutement (population source) Ex e m ple 2 (ED N 2020) Hofmann R, James SK, Jernberg T, Lindahl B, Erlinge D, Witt N, et al. Oxygen Therapy in Suspected Acute Myocardial Infarction. N Engl J Med 28 sept 2017; 377(13): 1240-9. We therefore conducted a registry-based randomized clinical trial to evaluate the effect of oxygen therapy on all-cause mortality at 1 year among patients with suspected myocardial infarction who did not hâve hypoxemia at baseline. À la phase aiguë d’un infarctus du myocarde, l’ambivalence entre l’oxygénothérapie et l’air ambiant n’est pas respectée en cas : Il n’aurait pas fallu cocher... Commentaires D’arrêt cardiaque se produisant à l’arrivée des secours Le principe d’ambivalence précise que les patients inclus dans les deux bras doivent avoir la même probabilité de recevoir les deux traitements évalués dans l’étude. Ici, le principe d’ambivalence n’est pas respecté si les patients ont soit une indication formelle à recevoir de l’oxygène, soit au contraire une contre-indication absolue. Dans ce cas, ils ne peuvent pas être inclus dans l’essai, car ils ne pourraient être inclus que dans un seul des deux bras. En cas d’arrêt cardiaque, d’hypoxémie (SaO2 < 90 %) ou d’insuffisance respiratoire, l’oxygénothérapie est impérative. Les patients ne pourraient pas être inclus dans le bras sans oxygène D’oxygénothérapie au long cours indiquée pour insuffisance respiratoire chronique De saturation artérielle en oxygène inférieure à 90 % Il n’aurait pas fallu cocher... Commentaires De démence ne permettant pas le recueil du consentement oral En cas de refus ou d’incapacité de donner son consentement, les patients ne peuvent pas être inclus dans l’étude, quel que soit le bras De refus de participer à un essai randomisé Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 12 Randomisation En complément V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l a r a n d o m is a t io n : h t t ps: / / y o u t u .b e / D h f-i n CiT 7 M D éfinitio n • La randomisation (ou allocation aléatoire) est le tirage au sort des traitements ou de l’intervention à l’étude. • La randomisation et toutes ses caractéristiques ont pour but de : - garantir la comparabilité initiale des groupes ; - s’assurer que la seule différence entre les bras est liée au traitement ; - conférer aux essais cliniques un niveau de preuve élevé ; - limiter l’effet des facteurs de confusion. • La randomisation ne garantit pas : - l’éthique de l’étude ; - la comparabilité du suivi entre les deux groupes ; - que le critère de jugement soit mesuré de la même manière dans les deux groupes ; - l’absence d’effet placebo. • Si la randomisation a marché, la seule différence entre les deux groupes est le traitement. Si un groupe va mieux à la fin de l’étude, il est très probable que ce soit lié au traitement. Caract éristiq u es à co n n aître Unité de randomisation Ra n d o m isa tio n in divid u elle (u nit é = le p atie nt) On tire au sort des patients pour recevoir l’un ou l’autre des traitements à l’étude. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 114 Essais cliniques Par gra p p es (o u clusters, u nité = un grou pe d e p a tie n ts) On tire au sort des groupes d’individus (à l’échelle d’un service, d’un hôpital, d’un établissement scolaire), par exemple : • parce que l’action étudiée ne peut se mesurer qu’à l’échelle d’un groupe : concernant la prévention des conduites sexuelles à risque, une intervention orale auprès de lycéens (A) est comparée à la remise d’une brochure sur le sujet (B). Certains lycées auront l’intervention A, d’autres l’intervention B ; • parce qu’il existe des risques d’interférence, ou « contamination », entre les groupes patients (si certains lycéens ont bénéficié de l’information orale sur les conduites à risque, ils vont sans doute l’expliquer à leurs camarades du même établissement). Randomisation équilibrée/déséquilibrée : le ratio de randomisation La mise en place d’un ratio de randomisation différent de 1:1 a comme objectif d’engendrer un déséquilibre intentionnel entre les groupes de traitement. Un ratio de 2:1 signifie que 2/3 des patients seront randomisés dans un groupe et 1/3 dans l’autre groupe. Cela peut se justifier, afin de diminuer le coût d’un essai thérapeutique en cas de comparateur trop cher par exemple. Techniques pour améliorer la comparabilité des groupes La comparabilité des groupes au début de l’étude (en nombre de patients et en caractéristiques) peut être imparfaite du fait du hasard (on peut gagner en jouant au casino !), surtout si le nombre de patients inclus est faible. Pour s’assurer que cela n’arrive pas, on peut utiliser les techniques suivantes. Ra n d o m isa tio n p ar blocs • But : obtenir le même nombre de patients dans chaque bras de randomisation. • Principe : exemple d’une randomisation par blocs de 4 patients entre deux traitements A et B. On tire au sort tous les 4 patients une des séquences suivantes : AABB I ABAB I BBAA I BABA I BAAB • Résultat : il y a donc autant de A que de B tous les 4 patients (6 pour des blocs de 6). Le déséquilibre maximum entre deux bras est de 2 patients (3 pour des blocs de 6). • Limites : si la taille des blocs est trop grande, le risque de déséquilibre est plus important. Si la taille des blocs est trop petite, les investigateurs peuvent deviner la séquence et le traitement du patient suivant. • Variantes : des blocs de taille variable permettent de maintenir l’aveugle (les investigateurs ne peuvent pas deviner la séquence puisque la taille des blocs change à chaque fois). ► Attention piège ! Une randomisation par blocs peut être individuelle (quand l’unité de randomisation est le patient) ou par clusters/grappes (on tire au sort des permutations de 4 écoles/hôpitaux). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Randomisation 115 Ra n d o m isa tio n stratifié e • But : forcer la comparabilité des groupes pour des caractéristiques données (âge > 50 ans, par exemple). • Principe : on tire au sort l’allocation du traitement dans chaque sous-groupe (< 50 ans et > 50 ans). En pratique, il y a une liste de tirage au sort pour chaque sous-groupe. On peut également appliquer la technique des blocs à chaque tirage au sort : chez les moins de 50 ans, le nombre de traitements A et de traitements B est équilibré tous les 4 patients (blocs de 4), de même chez les plus de 50 ans. • Résultat : - il y a 50 % de traitements A et B dans chaque strate ; - il y a le même pourcentage de < 50 ans et > 50 ans dans chaque groupe de traitement ; - randomisation stratifiée sur les facteurs pronostiques importants (en cancérologie, si on a plus de patients métastatiques dans un bras, et que le traitement semble plus efficace dans l’autre, on ne peut pas interpréter l’essai) ; - randomisation stratifiée sur le centre : il faut que la proportion de patients en provenance de chaque centre soit la même dans les deux bras pour éviter un « effet centre ». Elle est recommandée dans les essais multicentriques. Parfois, il est spécifié qu’il existe une liste de tirage au sort par centre = cela correspond à une randomisation stratifiée sur le centre. ► Attention piège ! Ne pas confondre la stratification de la randomisation avec la stratification de l’analyse (= analyse en sous-groupe). La stratification de la randomisation a pour but de forcer la comparabilité des groupes sur des caractéristiques choisies. Les analyses en sous-groupe ont comme objectif de mettre en évidence une ou des populations particulières pour lesquelles le traitement pourrait être plus efficace ou plus délétère. Ra n d o m isa tio n m ini m isée • But et résultat : identique à celui de la randomisation stratifiée. • Principe : un algorithme attribue le traitement à chaque patient en fonction des caractéristiques de tous ceux qui ont été inclus auparavant de manière à « forcer » la comparabilité des groupes. Utile lorsque l’on souhaite équilibrer la randomisation sur beaucoup de caractéristiques. Autres critères de qualité de la randomisation Ra n d o m isa tio n ce n tralisé e L’allocation aléatoire des traitements est effectuée par un centre unique qui est contacté au fur et à mesure des inclusions par les différents investigateurs. Ra n d o m isa tio n in d é p e n d a n t e La randomisation doit être indépendante de l’équipe d’investigation. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 116 Essais cliniques Im pré visibilité d e la ra n d o m isa tio n C’est un critère de qualité important de la randomisation, a fortiori dans un essai ouvert. L’imprévisibilité de la randomisation signifie qu’il est impossible pour l’investigateur de deviner le bras dans lequel le prochain patient inclus sera tiré au sort. Sinon, l’investigateur pourrait décider d’inclure ou de ne pas inclure le patient du fait de sa connaissance « à l’avance » du résultat de la randomisation. Les conséquences pourraient être un biais de sélection, par noninclusion de certains patients qui auraient pu participer à l’étude (par exemple, on pourrait ne pas proposer à un patient de participer à une étude sachant qu’il a plus de chance d’être dans le bras placebo). Une randomisation centralisée avec vérification des critères d’inclusion/exclusion avant tirage au sort est le meilleur moyen de s’assurer de cette imprévisibilité. Dans le cas d’une randomisation par blocs dans un essai en double aveugle, l’utilisation de blocs de taille aléatoire permet également de favoriser l’imprévisibilité en cas d’effets indésirables reconnaissables. Tableau de description des patients après randomisation Le tableau 1 correspond généralement au premier tableau de la partie des résultats des essais randomisés dans lequel sont décrites les caractéristiques de la population d’étude (âge, sexe, caractéristiques sociodémographiques, comorbidités, traitements médicamenteux, stades de la maladie, etc.). Etant donné que les résultats sont présentés de manière à disposer d’une colonne par groupe comparé, il a comme intérêt notable de permettre la vérification de la bonne qualité de la randomisation. Une randomisation de bonne qualité distribue les différentes caractéristiques de façon très proche entre les deux groupes du fait du hasard (distribution d’âge similaire, un sexe-ratio similaire, un pourcentage de comorbidités similaire, etc.). Cela est un témoin indirect de la distribution aléatoire des facteurs de confusion. Est-il nécessaire de disposer d’analyses statistiques comparatives dans ce type de tableau avec une p-value en regard de chaque caractéristique pour s’assurer de l’absence de différence entre les deux groupes ? La réponse est habituellement non dans un essai clinique randomisé. En effet, si l’on tire au sort l’allocation des traitements, toute différence observée entre les groupes sera liée au hasard. La p-value (probabilité que la différence soit liée au hasard) n’a donc pas d’intérêt. C’est la pertinence clinique de la différence observée et sa potentialité à modifier l’effet du traitement qui nous intéresse. ► Attention ! La situation est très différente au cours des études observationnelles (voir fiche 24 sur la confusion dans les études observationnelles), que ce soit au cours des études cas-témoins ou exposés-non exposés, car les groupes comparés n’ont pas été constitués par randomisation. La différence observée entre les groupes n’est donc probablement pas liée au hasard ! Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Randomisation 117 En pra tique Ex e m ple 1 (ED N 2017) Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML, Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D, Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D. Levosimendan for the prévention of acute organ dysfunction in sepsis. N Engl J Med 2016; 375: 1638-48. Enrollment, randomization, and data collection were performed by means of an online System (InForm, Oracle). Patients were assigned in a 1:1 ratio to receive levosimendan or placebo, with the use of variable block sizes of four and six and computer-generated random numbers and with stratification according to recruitment center. The randomization sequence was prepared by an independent statistician. Dans cette étude, l’allocation aléatoire des traitements est réalisée : Commentaires Il aurait fallu cocher... De manière indépendante De manière centralisée Indépendamment des investigateurs De manière à ce que le déséquilibre maximum entre les bras soit de 3 patients De manière à limiter le déséquilibre d’effectif entre les groupes La randomisation est indépendante car elle est réalisée par un statisticien indépendant de l’équipe clinique. Elle est centralisée car réalisée par un système en ligne qui collecte les informations en provenance de tous les centres La randomisation est réalisée par blocs de taille aléatoire : 4 ou 6. Le déséquilibre maximum d’effectif entre les 2 groupes est donc de 3 patients De manière à limiter « l’effet centre » De manière à ce que le pourcentage de patients inclus dans chaque centre soit le même dans les deux bras Ces propositions définissent la randomisation stratifiée sur le centre De manière à ce que le ratio 1:1 soit assuré dans tous les centres De manière individuelle Par opposition à une randomisation par grappes ou clusters Il n’aurait pas fallu cocher... Commentaires Par blocs de 4 ou de 6 selon le centre Ce distracteur était proposé dans l’épreuve de l’EDN. La formulation peut prêter à confusion, mais according to recruitment center se rapporte à stratification uniquement. Par définition, les blocs de taille aléatoire permettent d’éviter de deviner la séquence. Cet avantage est perdu si les blocs sont de même taille dans un centre donné Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 118 Essais cliniques Il n’aurait pas fallu cocher... Commentaires Par clusters de 4 ou 6 centres Ne pas confondre cluster et bloc Pour s’assurer que l’échantillon d’étude est représentatif de la population source Le fait que les groupes de traitement soient comparables ne garantit pas que tous les patients éligibles aient été inclus Pour respecter les règles éthiques Si une étude est faite pour prouver qu’un traitement apporte un bénéfice sans toxicité majeure, c’est bien parce que ce n’est pas démontré à ce jour. Il est donc éthique de proposer l’un ou l’autre des deux traitements Ex e m ple 2 Roy PM, Rachas A, Meyer G, Le Gai G, Durieux P, El Kouri D, Honnart D, Schmidt J, Legall C, Hausfater P, Chrétien JM, Mottier D, and PREVENU study group. Multifaceted intervention to prevent venous thromboembolism in patients hospitalized for acute medical illness: a multicenter cluster-randomized trial. PLoS One 2016 ; 11(5) : e0154832. We prospectively enrolled ail consecutive patients over 40 years old presenting to the emergency department of the participating sites for acute medical illness and requiring hospitalization in a medical ward. A random number table was used to assign hospitals to either the intervention or standard practice group (control group). Randomization was stratified in order to include the same number of academie hospitals and centers using a computerized medical file in each group. À propos de la randomisation, il est vrai que : Il aurait fallu cocher... Commentaires Il s’agit d’une randomisation par grappes ou clusters C’est forcément une randomisation par clusters car l’intervention est assignée de manière aléatoire aux hôpitaux et non aux patients Les hôpitaux étaient tirés au sort pour recevoir l’intervention ou la pratique standard La randomisation a été réalisée de manière à limiter l’effet du type de centre (académique ou non) sur la mesure de l’efficacité de l’intervention C’est la définition de la stratification sur le caractère académique ou non des centres La proportion de centres académiques a été équilibrée entre les 2 groupes Il n’aurait pas fallu cocher... Il s’agit d’une randomisation équilibrée par blocs Il s’agit d’une randomisation individuelle par blocs Commentaires Ne pas confondre bloc et cluster. Une randomisation individuelle ou par clusters peut être équilibrée par des blocs Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Randomisation Il n’aurait pas fallu cocher... Commentaires Les patients se présentant consécutivement dans chaque centre ont été tirés au sort pour recevoir l’intervention ou un traitement standard Ce sont les hôpitaux et non pas les patients qui sont tirés au sort Elle permet de maintenir l’aveugle pendant la durée de l’étude C’est faux dans l’absolu. La randomisation ne permet pas de maintenir l’aveugle, ni de garantir que le suivi ou la mesure du critère de jugement soit comparable. Seule la procédure d’aveugle apporte cette garantie. De plus, il est fort probable que cette étude soit ouverte même si non précisé (intervention en général difficile à cacher aux patients et aux médecins !) Elle permet de s’assurer que le suivi a été le même dans les deux bras Elle garantit que le critère de jugement a été mesuré de la même manière dans les deux bras 119 Ex e m ple 3 (é preuve t est 2018) Fleshner NE, Lucia MS, Egerdie B, Aaron L, Eure G, Nandy I, Black L, Rittmaster RS. Dutasteride in localised prostate cancer management: the REDEEM randomised, double-blind, placebo-controlled trial. Lancet 2012; 379: 1103-11. We aimed to assess whether treatment with dutasteride decreased the rate of prostate cancer progression compared with placebo in men with low-risk, localised disease who would otherwise undergo active surveillance. We randomly allocated participants in a one-to-one ratio with GlaxoSmithKline’s central registration and médication ordering System (RAMOS) to receive dutasteride 0.5 mg or matching placebo once daily for 3 years. Randomisation was done by site with a block size of four. Concernant l’allocation aléatoire (randomisation) du traitement à l’étude dutastéride versus placebo : Il aurait fallu cocher... Commentaires Vise à constituer 2 groupes comparables pour les facteurs de confusion potentiels La randomisation permet de rendre les groupes initialement comparables (la seule différence entre les groupes est le traitement) Repose sur une liste de tirage au sort établie pour chaque site d’étude La randomisation a été faite « par site avec des blocs de quatre ». Ceci indique qu’une liste de randomisation a été établie pour chaque centre. En d’autres termes, la randomisation est stratifiée sur le centre, ce qui permet de s’assurer de l’équilibre de l’effectif (dutastéride + surveillance/placebo + surveillance) dans chaque centre Utilise des blocs de taille fixe La taille des blocs est fixée à 4 patients > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 120 Essais cliniques Il aurait fallu cocher... Commentaires Est équilibrée One-to-one ratio (1:1) indique que la randomisation est équilibrée Est centralisée L’utilisation d’un système centralisé (RAMOS) est précisée, ce qui n’est pas incompatible avec l’établissement d’une liste par centre Vise à limiter l’influence d’un biais potentiel quant au choix du traitement pour chaque patient Le traitement reçu est tiré au sort et non pas décidé par le clinicien ou le patient dont la décision aurait pu être influencée par des caractéristiques particulières pouvant interférer avec le critère de jugement Il n’aurait pas fallu cocher... Commentaires Vise à limiter les fluctuations d’échantillonnage La randomisation ne limite pas les fluctuations d’échantillonnage. Les 2 groupes constitués peuvent différer en raison du hasard Vise à augmenter la puissance statistique de l’essai La puissance statistique de l’essai dépend essentiellement du nombre de sujets inclus Vise à contrôler le risque d’erreur statistique de lre espèce (alpha) Le risque a est fixé a priori et augmente lorsque l’on multiplie les tests, il n’est pas influencé par la randomisation Vise à maintenir la comparabilité des 2 groupes tout au long de l’essai La randomisation ne suffit pas à maintenir la comparabilité des groupes pendant le suivi. C’est la procédure d’aveugle qui remplit ce but (dans un essai randomisé en ouvert, le suivi des patients peut différer en fonction du groupe de traitement) Est stratifiée sur les antécédents de traitement chirurgical de la prostate Aucune mention n’est faite d’une stratification sur ces facteurs Ex e m ple 4 (ED N 2019) Galimberti V, Cole BF, Zurrida S, Viale G, Luini A, Veronesi P, et al. Axillary dissection versus no axillary dissection in patients with sentinel-node micrometastases (IBCSG 23-01): a phase 3 randomised controlled trial. Lancet Oncol avr 2013 ; 14(4) : 297-305. We designed IBCSG trial 23-01 to détermine whether no axillary dissection was non-inferior to axillary dissection in patients with one or more micrometastatic (< 2 mm) sentinel nodes and tumour of maximum 5 cm. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Randomisation 121 Randomisation and masking: Patients were randomly allocated (in a 1:1 ratio) to either axillary dissection or no axillary dissection. Randomisation was done with permuted blocks generated by a congruence algorithm. Randomisation was stratified by participating centre and menopausal status. After confirming eligibility, participating centre staff accessed the central randomisation System via the internet and entered required information including stratification factors. The randomisation System assigned a patient identification number, treatment group, and date of randomisation via the computer screen with a follow-up email. The IBCSG data management centre developed and maintains the randomisation System. Masking was not done in this surgical trial. The patient, participating centre staff, trial management staff, and others were aware of the assigned treatment. À propos des modalités de randomisation dans cette étude {une ou plusieurs réponses possibles) : Il aurait fallu cocher... Commentaires La randomisation est imprévisible La centralisation de la randomisation garanti l’imprévisibilité de celle-ci La randomisation est centralisée Oui : participating centre staff accessed the central randomisation System via the internet and entered required information including stratification factors Il y a une liste de tirage au sort par centre Cette proposition correspondant à la stratification sur le centre La randomisation est stratifiée sur le statut ménopausal pour contrôler ce facteur pronostique connu La stratification sur des facteurs pronostiques connue permet de forcer la comparabilité des groupes sur ce facteur en particulier Il n’aurait pas fallu cocher... La randomisation a lieu juste avant le consentement du patient Commentaires La randomisation doit se faire après la vérification des critères d’éligibilité et après le consentement du patient. Dans le cas contraire, des patients randomisés pourrait être exclus dès le début de l’étude, ce qui pourrait entraîner un déséquilibre de certaines caractéristiques entre les groupes et donc une perte de l’intérêt de la randomisation Quelles informations peut-on tirer du tableau 1 {une ou plusieurs réponses possibles) ? Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 122 Essais cliniques Patient characteristics and adjuvant thérapies. Axillary dissection (n=464) No axillary dissertation (n=467) 53 (28-81) 54 (26-81) 323 (70%) 131 (28%) 10 (2%) 0 320 (69%) 135 (29%) 11 (2%) 1 (<1%) 17 (4%) 447 (96%) 453 (97%) 14 (3%) 44 (9%) 420 (91%) 10/420 (2%) 410/420 (98%) 79/420 (19%) 293/420 (70%) 36/420 (9%) 2/420 (<1%) 42 (9%) 425 (91%) 12/425 (3%) 413/425 (97%) 80/425 (19%) 297/425 (70%) 35/425 (8%) 1/425 (<1%) 441 (95%) 292 (63%) 42 (9%) 107 (23%) 451 (97%) 315 (67%) 33 (7%) 103 (22%) General characteristics Age (years) Médian (range) Sentinel-node tumour size < 1 mm 1.1-2 mm > 2 mm Unknown Axillary dissection performed No Yes Local treatment* Masectomy Breast-conserving surgery Without radiotherapy With radiotherapy Intraoperative radiotherapy only Postoperative radiotherapy only Combination radiotherapy Unspecified radiotherapy Systemic therapy Any systemic therapy Hormonal therapy only Chemotherapy only Combination therapy Data are number of patients (%) unless otherwise indicated. *Percentages for type of surgery are based on entire population, those for radiotherapy (no or yes) and for the type of radiotherapy are based on only the breast-conserving subpopulation. Il aurait fallu cocher... Commentaires Plus de 50 % des participantes sont âgées de plus de 50 ans Oui, car la médiane d’âge est supérieure à 50 ans dans les 2 groupes La taille de la tumeur est inférieure ou égale à 1 mm sur la biopsie de ganglion sentinelle, pour la majorité des participantes Oui pour environ 70 % d’entre elles Il ne semble pas exister de déséquilibre apparent de la prévalence des traitements associés entre les deux bras de l’essai Globalement les pourcentages associés à chaque thérapeutique sont similaires entre les 2 groupes de randomisation Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Randomisation Il aurait fallu cocher... 123 Commentaires La différence de chimiothérapie seule (9 % vs 7 %) entre les 2 groupes est probablement liée au hasard Oui, si la randomisation est bien faite, les seules différences observées entre les groupes (hormis l’assignation de l’intervention) sont liées au hasard L’absence de différence apparente entre la distribution des caractéristiques démographiques et cliniques des patients à l’inclusion s’explique le plus vraisemblablement par l’assignation de la modalité de traitement par tirage au sort La randomisation a comme objectif de constituer des groupes comparables pour les caractéristiques recueillies à l’inclusion Il n’aurait pas fallu cocher... Commentaires L’absence de p-value ne permet pas de conclure formellement à la comparabilité des caractéristiques à l’inclusion entre les deux bras de l’essai On rappelle que la réalisation de tests statistiques pour comparer les caractéristiques initiales des groupes comparés dans les essais randomisés n’est pas nécessaire et n’a pas beaucoup de sens. Mais attention : cela est différent pour les études observationnelles au cours desquelles les groupes comparés ne sont pas constitués par randomisation La différence d’hormonothérapie seule (63 % rs 67 %) entre les 2 groupes doit faire suspecter le non-respect de la procédure de randomisation par les investigateurs Cette légère différence peut tout à fait être expliquée par le hasard induit par l’assignation aléatoire des traitements Le déséquilibre observé concernant la réalisation du curage ganglionnaire axillaire (axillary dissection) entre les deux bras de l’essai est probablement lié à un échec de la randomisation Ce n’était pas l’objectif de la randomisation puisque le curage ganglionnaire était l’intervention tirée au sort. En revanche, on remarque que certains patients ont reçu la stratégie pour laquelle ils n’avaient pas été tirés au sort, sinon on aurait dû constater 100 % de réalisation de curage dans le bras « curage » et 0 % dans le bras « absence de curage » Ex e m ple 5 (ED N 2021) Cappuzzo F, Ciuleanu T, Stelmakh L, Cicenas S, Szczésna A, Juhâsz E, et al. Erlotinib as maintenance treatment in advanced non-small-cell lung cancer : a multicentre, randomised, placebo-controlled phase 3 study. Lancet Oncol juin 2010; 11(6): 521-9. We designed the phase 3, placebo-controlled Sequential Tarceva in Unresectable NSCLC study to assess use of erlotinib as maintenance therapy in patients with non-progressive disease following first-line platinum doublet chemotherapy. Randomisation was done using a 1:1 adaptive randomisation Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 124 Essais cliniques method (using minimisation) via a third-party interactive voice response System. Patients were stratified by EGFR immuno histo chemistry status (positive; négative; indeterminate), disease stage (IIIB; IV), ECOG performance status (0; 1), chemotherapy regimen (cisplatin and gemcitabine; carboplatin and docetaxel; other), smoking history (current; former; never smokers) and région (North America, South America, western Europe, eastern Europe, southeast Asia, and Africa). Dans cette étude, la randomisation est : Il aurait fallu cocher... Commentaires Basée sur une procédure de minimisation La randomisation par minimisation consiste à forcer la comparabilité des groupes sur des caractéristiques données grâce à un algorithme informatique. C’est un équivalent de stratification qui est utile lorsque l’on souhaite stratifier la randomisation sur de nombreuses caractéristiques Centralisée Un système dit « de tierce partie » correspond à une centralisation de la randomisation Imprévisible Une randomisation est imprévisible lorsqu’il est impossible pour l’investigateur de deviner le résultat de la randomisation pour le prochain patient inclus dans l’étude. Une randomisation centralisée favorise l’imprévisibilité A été stratifiée sur le statut tabagique car il s’agit d’un facteur pronostique connu pour lequel on souhaitait une équi-répartition entre les 2 groupes Un facteur pronostique important qui serait réparti de manière inégale entre les 2 groupes entraînerait un risque important de biais de confusion Il n’aurait pas fallu cocher... Réalisée avant le début du traitement de lre ligne Commentaires Les patients qui ont été randomisés sont ceux qui ont reçu 4 cycles complets de chimiothérapie sans signe de progression de la maladie. La randomisation doit être réalisée au plus près du début du traitement à l’étude, sinon on risque de perdre le bénéfice de la randomisation qui est l’équilibre des facteurs de confusion entre les groupes. En randomisant avant le début des 4 cycles de chimiothérapie, les patients décédés avant le début du traitement à l’étude ne pourront pas participer à l’étude. Comme ces patients sont certainement très différents de ceux non décédés, les facteurs de confusion ne seront plus distribués de manière aléatoire entre les 2 groupes Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Randomisation Il n’aurait pas fallu cocher... 125 Commentaires Stratifiée sur l’erlotinib Les facteurs sur lesquels la randomisation est stratifiée sont présentés dans le paragraphe sur la randomisation. Cependant, cette proposition est fausse à la première lecture car on ne stratifie jamais sur le traitement à l’étude A été stratifiée sur le statut tabagique car il s’agit d’un facteur pronostique connu pour lequel on souhaitait 1/3 de fumeurs actuels, 1/3 fumeurs passés et 1/3 de non-fumeurs On souhaite qu’il y ait autant de fumeur actuel, de fumeurs passés et de non-fumeurs dans chacun des 2 groupes A été stratifiée sur le statut tabagique car il s’agit d’un facteur pronostique connu pour lequel on souhaitait tester une interaction avec l’effet traitement sans inflation du risque alpha Le but de la stratification de la randomisation est d’équilibrer la répartition du facteur de confusion entre les groupes. Attention à ne pas confondre la stratification de la randomisation avec la stratification de l’analyse en sous-groupe qui s’accompagne quoi qu’il arrive d’une inflation du risque alpha Ex e m ple 6 (ED N 2020) Hofmann R, James SK, Jernberg T, Lindahl B, Erlinge D, Witt N, et al. Oxygen Therapy in Suspected Acute Myocardial Infarction. N Engl J Med 28 sept 2017; 377(13): 1240-9. De manière générale, les éléments en faveur de l’imprévisibilité de la randomisation sont : Il aurait fallu cocher... Une procédure centralisée La génération de la liste de tirage au sort par un programme informatique L’utilisation de blocs de taille variable Commentaires Une randomisation est imprévisible si l’investigateur ne peut pas deviner le traitement que va recevoir le prochain patient qu’il va inclure. En pratique, cet écueil est évitable si la procédure est centralisée. Dans le cas d’une randomisation par bloc, l’utilisation de blocs de taille aléatoire est également souhaitable pour éviter à l’investigateur de pouvoir deviner la séquence si les effets secondaires du traitement sont facilement identifiables Il n’aurait pas fallu cocher... Commentaires La stratification sur le site d’étude La stratification sur le site permet d’équilibrer le ratio entre les deux bras de traitements dans tous les centres, mais n’améliore pas l’imprévisibilité Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 13 Procédure d’aveugle et effet placebo D é finitio ns La procédure d’aveugle a pour objet de maintenir l’ignorance d’un ou de plusieurs participants d’une étude sur l’appartenance des patients à l’un ou l’autre des groupes de randomisation. La procédure d’aveugle fait partie des critères de qualité d’une étude. On distingue : • les essais en ouvert (op en-label study) : le patient et le médecin investigateur connaissent le groupe dans lequel le patient a été randomisé, il n’y a pas de procédure d’aveugle ; • les essais en simple insu (ou simple aveugle, single-blind) : seul le médecin investigateur connaît le groupe de randomisation du patient ; • les essais en double insu (ou double aveugle, double-blind) : ni le patient, ni le médecin ne connaissent le groupe dans lequel le patient a été randomisé. Q uels so n t les pro blè m es p osés p ar un essai en o u vert ? Les essais ouverts sont parfois indispensables, notamment quand la réalisation d’un double insu est impossible. L’évaluation du critère et le suivi dans le cadre de l’étude souffrent alors d’une subjectivité en lien avec la connaissance de l’appartenance à tel ou tel groupe de traitement. Biais de mesure différentiel La connaissance du bras de traitement influence la mesure du critère de jugement de manière différente en fonction du bras. Par exemple, on réalise un essai comparant 15 jours à 7 jours de traitement par fluoroquinolone dans la pyélonéphrite aiguë de la femme. Le critère de jugement principal est la guérison bactériologique (examen cytobactériologique des urines ou ECBU) et clinique (absence de symptôme). Si l’essai est maintenu en ouvert après le 7e jour, pour des symptômes identiques (brûlures urinaires), les patientes du groupe non traité auront plus facilement tendance à consulter que les patientes qui prennent des antibiotiques. Ceci augmente le taux de La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 128 Essais cliniques rechute dans le bras placebo et le réduit dans le bras traité. On observe donc une différence entre les groupes qui peut être liée uniquement à l’erreur de mesure et pas à l’effet du traitement. Biais de performance Même avec un critère de jugement objectif, comme le décès, les patients peuvent être soumis à une prise en charge différente en raison du bras de traitement (surveillance plus rapprochée par exemple, menant à un dépistage plus rapide des complications). Ces différences peuvent agir sur le critère de jugement et modifier les résultats de l’essai indépendamment de l’effet du traitement. Non-comparabilité du suivi en rapport avec la connaissance du traitement La connaissance de la stratégie thérapeutique peut amener à une recherche plus active du critère de jugement ou de la toxicité dans un bras (par exemple, dans un essai clinique comparant une nouvelle thérapie ciblée + le traitement de référence versus le traitement de référence seul dans le cancer avec la rechute radiologique comme critère : la connaissance du traitement reçu par le patient peut entraîner une recherche plus active et/ou fréquente de la rechute par le radiologue chez les patients ayant eu le traitement de référence seul). L'effet placebo/nocebo est différent entre les deux bras L’effet placebo/nocebo est l’écart positif (placebo) ou négatif (nocebo) entre ce qui est attendu compte tenu de la pharmacologie et l’effet réellement observé. Il comprend des mécanismes psychologiques et biochimiques qui ne sont pas liés directement à la pharmacologie du médicament. Dans un essai ouvert, cet effet peut conduire à une conclusion d’efficacité d’un médicament (liée notamment aux attentes d’efficacité plus forte avec le nouveau traitement) ou au contraire de toxicité non liée à l’effet pharmacologique propre. L’utilisation du double insu et le recours à un placebo dans une étude permettent de prendre en compte cet effet placebo. Dans un essai en double insu, l’effet placebo est le même entre les deux bras. À retenir Le double insu permet de garantir : un suivi identique entre les groupes de traitement et l'absence de biais de performance ; une évaluation objective et identique du critère de jugement dans les deux groupes de traitement ; l'absence de biais de mesure différentiel sur le critère de jugement principal ; un effet placebo identique dans tous les groupes de traitement. Alors que la randomisation permet de : rendre les groupes comparables en termes de caractéristiques initiales ; s'affranchir d ’ éventuels facteurs de confusion. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Procédure d’aveugle et effet placebo 129 Q u elles m esures p e u t-o n pren dre p o ur m ain t enir la procé d ure d'aveu gle t o u t au lon g d'un essai ? • Technique du double placebo : lorsque deux traitements comparés ont deux voies d’administration différentes, le maintien du double insu peut s’avérer difficile (ex. : voie sous-cutanée versus voie per os). La technique du double placebo permet de maintenir le double insu en administrant à chaque groupe de traitement le placebo de l’autre groupe (ex. : donner un placebo sous-cutané au groupe « voie per os » et un placebo per os dans le groupe « voie souscutanée »). • Monitorer les effets indésirables reconnaissables par un comité indépendant. • Utiliser un placebo indistinguable (taille, forme, goût, couleur, galénique identique). Q u elles m esures p e u t-o n pren dre p o ur li m iter les biais liés à la na t ure o uverte d'un essai ? • Utiliser un critère de jugement objectif (par exemple, le décès : la définition n’est donc pas influencée par la connaissance du bras de traitement), ce qui limite le biais de mesure différentiel sur le critère de jugement principal. • Faire adjudiquer (= décider) les événements par un comité de suivi indépendant en aveugle du bras de traitement. • Standardiser la procédure de suivi, c’est-à-dire imposer des visites de suivi à des temps donnés avec des examens complémentaires prédéfinis (imposer la recherche de rechute de cancer par des examens définis à l’avance à intervalles réguliers, par exemple). • Standardiser la mesure du critère de jugement principal = le rendre le plus objectif possible en définissant très précisément ce qui constitue un événement (modalité de lecture de l’imagerie, seuil de positivité d’un marqueur, etc.). À retenir Le double aveugle est parfois impossible (par exemple, dans le cadre de l’ évaluation d'une technique chirurgicale par rapport à un traitement médical). Le double aveugle est parfois difficile à maintenir (par exemple, en raison d'effet secondaire caractéristique d'un traitement, comme l'alopécie induite par certaines chimiothérapies, la coloration des urines sous rifampicine, etc.). On parle alors d'aveugle « illusoire ». Dans un essai ouvert, un comité d'adjudication en aveugle du bras de randomisation ne fait pas de cet essai un essai en simple ou en double aveugle. Seule la connaissance du traitement par les patients et les investigateurs est prise en compte pour définir un essai ouvert ou en aveugle. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 130 Essais cliniques Asp ects é t hiq u es La levée d’insu est autorisée et prévue par une procédure en cas de situations d’urgence pendant lesquelles la connaissance du traitement réellement pris par le patient doit être possible sans délai (ex. : surdosage accidentel ou volontaire). ► Attention ! Il n’est pas éthique d’évaluer un traitement contre placebo s’il existe déjà un traitement de référence dans la maladie étudiée, ou alors l’évaluation du traitement doit se faire en plus de l’application du traitement de référence (le traitement de référence est alors appliqué à tout le monde et la randomisation consiste à former un groupe dit « traitement de référence + nouveau traitement » et un autre groupe dit « traitement de référence + placebo »). En pra tique Ex e m ple 1 (ED N 2017) Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML, Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D, Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D. Levosimendan for the prévention of acute organ dysfunction in sepsis. N Engl J Med 2016; 375: 1638-48. Levosimendan is a calcium-sensitizing drug with inotropic and other properties that may improve outcomes in patients with sepsis. We conducted a double-blind, randomized clinical trial to investigate whether levosimendan reduces the severity of organ dysfunction in adults with sepsis. Patients were assigned to receive a blinded infusion of either levosimendan or placebo for 24 hours in addition to standard care. The administration of levosimendan or placebo was started at a rate of 0.1 pg per kilogram of body weight per minute and, in the absence of rate-limiting side effects, was increased after 2 to 4 hours to 0.2|Llg per kilogram per minute for a further 20 to 22 hours. If the patient had rate limiting side effects - either hypotension or severe tachycardia - at the dose of 0.2pg per kilogram per minute, then the infusion rate was reduced to O.lpg per kilogram per minute. Concernant les procédures d’aveugle : Il aurait fallu cocher... Commentaires Elles sont justifiées par l’effet placebo potentiel du lévosimendan Tout traitement a un effet propre (pharmacologique pour un médicament) et un effet placebo. Il faut un groupe comparateur avec le même effet placebo Le personnel soignant était en aveugle du traitement Dans l’idéal, il faut préciser qui est en aveugle, la mention double aveugle permet de considérer que les soignants sont en aveugle au même titre que les patients Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Procédure d’aveugle et effet placebo 131 Il aurait fallu cocher... Commentaires Des éléments cliniques en cours d’administration pourraient rompre l’insu Il est noté dans les méthodes if the patient had rate limiting side effects - either hypotension or severe tachycardia résultats... ce qui indique des effets indésirables reconnaissables pouvait faire craindre un « aveugle illusoire » Elles ont pour but d’assurer la comparabilité des procédures de suivi pendant toute la durée de l’étude C’est en effet un des objectifs de la procédure d’aveugle Il n’aurait pas fallu cocher... Commentaires Les auteurs ont utilisé un double placebo pour assurer l’aveugle de cette étude 11 n’y a pas de double placebo, mais un seul placebo similaire au traitement par lévosimendan Elles permettent d’assurer la comparabilité initiale des groupes C’est le rôle de la randomisation et pas de la procédure d’aveugle Le caractère multicentrique de l’étude a permis de s’affranchir du double aveugle Le caractère multicentrique n’a rien à voir avec la procédure d’aveugle. Il permet de recruter plus de patient et de s’affranchir d’un effet centre et donc d’augmenter la validité externe d’une étude Ex e m ple 2 (é preuve t est 2018) Fleshner NE, Lucia MS, Egerdie B, Aaron L, Eure G, Nandy I, Black L, Rittmaster RS. Dutasteride in localised prostate cancer management : the REDEEM randomised, double-blind, placebo-controlled trial. Lancet 2012; 379: 1103-11. We aimed to assess whether treatment with dutasteride decreased the rate of prostate cancer progression compared with placebo in men with low-risk, localised disease who would otherwise undergo active surveillance. We randomly allocated participants in a one-to-one ratio to receive dutasteride 0.5mg or matching placebo once daily for 3 years. Participants attended follow-up visits every 3 months for the first year and every 6 months thereafter. Participants also received a follow-up téléphoné call 4 months after their last dose of study drug. We measured sérum prostatespecific antigen concentrations at screening and subséquent follow-up visits; actual prostate-specific antigen concentrations were reported to the investigator and patients. Overall incidence of adverse events, serious adverse events, and adverse events leading to study withdrawal was much the same between treatment groups. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 132 Essais cliniques Les auteurs ont utilisé un placebo : Il aurait fallu cocher... Commentaires Pour maintenir les participants en aveugle du groupe de randomisation Donner un placebo identique au groupe contrôle est en effet indispensable pour maintenir l’aveugle Pour s’affranchir de l’effet placebo du traitement par dutastéride Le groupe contrôle avec placebo permet de compenser l’effet placebo du traitement par dutastéride Car il n’existe pas de traitement de référence d’efficacité démontrée pour le cancer localisé de la prostate Si on considère que la surveillance active n’est pas un « traitement », alors l’absence de traitement actuellement validé dans cette indication justifie la comparaison à un placebo Il n’aurait pas fallu cocher... Commentaires Pour augmenter les chances de l’étude de conclure à une différence statistiquement significative L’utilisation d’un placebo et la procédure d’aveugle ont plutôt tendance à défavoriser le traitement, une étude ouverte aurait plutôt tendance à induire un biais différentiel en faveur du traitement Pour comparer l’efficacité du dutastéride à la surveillance active Dans cette étude, l’utilisation de dutastéride n’est pas comparée à la surveillance active puisque cette surveillance active est pratiquée dans les 2 groupes La réalisation du double aveugle a probablement été rendue inefficace par le fait que : Il aurait fallu cocher... Commentaires Les résultats du dosage périodique du PSA (prostate-specific antigeri) étaient communiqués aux patients et aux investigateurs Il est bien connu (et rappelé dans l’article) que les inhibiteurs de la 5-alpha-réductase diminuent le PSA, ce qui permet de deviner le bras de randomisation Il n’aurait pas fallu cocher... Commentaires Les patients ont bénéficié d’une biopsie prostatique transrectale à 18 mois et 36 mois de suivi Dans cet essai, la date de point est à 3 ans. Si on connaît la progression avant 3 ans, on peut imaginer que le patient est dans le groupe placebo plutôt que dans le groupe traité. Néanmoins, la formulation « probablement rendue inefficace » est trop formelle. Le fait qu’il y ait ou non un cancer ne permet pas d’affirmer que le patient est sous placebo ou dutastéride Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Procédure d’aveugle et effet placebo Il n’aurait pas fallu cocher... 133 Commentaires Les comprimés de placebo étaient différents des comprimés de dutastéride L’expression matched placebo indique qu’il s’agit d’un placebo identique Les modalités de suivi étaient différentes entre les deux bras de l’essai Les modalités de suivi différentes sont une conséquence et pas une cause de l’inefficacité de la procédure d’aveugle Les effets indésirables étaient plus fréquents sous traitement par dutastéride Les effets indésirables n’étaient pas plus importants sous dutastéride Ex e m ple 3 (é preuve t est 2017) Hugosson J, Carlsson S, Aus G, Bergdahl S, Khatami A, Lodding P, Pihl CG, Stranne J, Holmberg E, Lilja H. Mortality results from the Gôteborg Randomised Prostate Cancer Screening Trial. Lancet Oncol 2010; 11(8): 725-32. The European Randomized Study of Screening for Prostate Cancer (ERSPC) compares a group of men invited for prostate cancer screening based on prostate-specific antigen (PSA) to a control group without any active intervention. Causes of death for men diagnosed with prostate cancer were determined by an independent COD (Cause of Death) committee. The committee performed a blinded review of ail cases diagnosed with prostate cancer. Masking of group assignment was only done for the Cause of Death committee. Les auteurs on fait appel à un comité d’adjudication (COD committee) pour statuer sur la cause des décès en aveugle du groupe de randomisation. On peut en déduire que : Il aurait fallu cocher... Le biais de classement ou d’évaluation sur le critère de jugement principal a été minimisé Il n’aurait pas fallu cocher... Commentaires En effet, cette mesure améliore l’objectivité de la mesure du critère de jugement Commentaires L’étude est en double aveugle Cette étude est par définition ouverte. Le comité d’adjudication est justement mis en place pour éviter le biais de mesure sur le critère de jugement principal Le critère de jugement sur la mortalité liée au cancer de la prostate est un critère composite puisqu’il repose sur deux évaluations : l’avis du comité et la déclaration de décès Ce n’est pas la définition d’un critère composite. Un critère composite est composé de deux conditions simultanées qui donnent une seule mesure : par exemple, survie sans progression (événement : décès ou progression), décès ou événement cardiovasculaire majeur, etc. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 134 Essais cliniques Il n’aurait pas fallu cocher... Commentaires Le biais de suivi est minimisé Le biais de suivi est lié au fait que les 2 groupes ne sont pas suivis de la même manière. Ceci est essentiellement lié à l’absence d’aveugle Les investigateurs ont souhaité limiter les biais de confusion C’est la randomisation qui remplit ce rôle Ex e m ple 4 (é preuve t est 2021) Eriksson BI, Huisman MV, Muehlhofer E. Rivaroxaban versus Enoxaparin for Thromboprophylaxis after Hip Arthroplasty. N Engl J Med. 2008; 11. This phase 3 trial compared the efficacy and safety of rivaroxaban, an oral direct inhibitor of factor Xa, with those of enoxaparin for extended thromboprophylaxis in patients undergoing total hip arthroplasty. In this randomized, double-blind study, we assigned 4,541 patients to receive either 10 mg of oral rivaroxaban once daily, beginning after surgery, or 40 mg of enoxaparin subcutaneously once daily, beginning the evening before surgery, plus a placebo tablet or injection. L’efficacité et la sécurité du rivaroxaban n’ont pas été évaluées contre placebo car : Il aurait fallu cocher... Commentaires Un traitement de référence existait dans cette indication Le traitement de référence est le traitement par héparine. On souhaite donc comparer le rivaroxaban au traitement de référence. Il ne serait pas acceptable de comparer un traitement face à un placebo s’il existe un traitement de référence bien établi dans la pathologie étudiée Une telle étude aurait posé des problèmes éthiques Les patients chez qui il est réalisé une arthroplastie de hanche ont une indication claire à recevoir une thromboprophylaxie post-opératoire du fait d’un risque élevé de maladie thromboembolique veineuse. Comparer le rivaroxaban a un placebo exposerait donc les patients du groupe placebo à un risque inutile Il n’aurait pas fallu cocher... Il n’existait pas de placebo disponible pour le rivaroxaban Il n’existait pas de placebo de l’énoxaparine Commentaires Cette étude a utilisé la technique du double placebo afin de maintenir l’aveugle dans l’assignation des traitements. Les patients prenant le rivaroxaban prenaient en même temps un placebo d’héparine et vice-versa > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Procédure d’aveugle et effet placebo Il n’aurait pas fallu cocher... 135 Commentaires L’efficacité du rivaroxaban avait déjà été démontrée dans cette indication On réalise cette étude justement car l’efficacité du rivaroxaban n’a pas été démontrée dans cette indication Le rivaroxaban était forcément plus efficace qu’un placebo On imagine que le rivaroxaban est plus efficace qu’un placebo pour prévenir le risque thrombo-embolique veineux dans cette indication, mais il existe un traitement de référence dans cette indication Ex e m ple 5 (é preuve t est 2019) The EINSTEIN-PE Investigators. Oral Rivaroxaban for the Treatment of Symptomatic Pulmonary Embolism. N Engl J Med 5 avr 2012; 366(14): 1287-97. The standard therapy for most patients with pulmonary embolism has been the administration of heparin, overlapped and followed by a vitamin K antagonist. In a randomized, open-label, event-driven, noninferiority trial involving 4,832 patients who had acute symptomatic pulmonary embolism with or without deep-vein thrombosis, we compared rivaroxaban (15 mg twice daily for 3 weeks, followed by 20 mg once daily) with standard therapy with enoxaparin followed by an adjusted-dose vitamin K antagonist for 3, 6, or 12 months. The primary efficacy outcome was symptomatic récurrent venous thromboembolism. In the case of suspected venous thromboembolism, the protocol required objective testing. A central committee whose members were unaware of the study-group assignments adjudicated the results of ail baseline lung-imaging tests and ail suspected outcome events. An independent data and safety monitoring board periodically reviewed the study outcomes. An independent dose confirmation committee reviewed the incidence of the composite outcome of symptomatic récurrent venous thromboembolism and asymptomatic détérioration on repeat lung imaging. Dans cet essai, l’efficacité et la sécurité du rivaroxaban pour le traitement de l’embolie pulmonaire n’ont pas été évaluées contre placebo car : Il aurait fallu cocher... Commentaires Il existe un traitement de référence de l’embolie pulmonaire La présence d’un traitement de référence impose toujours d’évaluer le nouveau traitement contre ce traitement de référence. Il ne serait pas éthique d’administrer un placebo seul à des patients souffrant d’embolie pulmonaire Il n’aurait pas fallu cocher... Il n’existe pas de placebo pour l’énoxaparine Commentaires C’est tout à fait possible de prévoir un placebo pour ces deux traitements que soit en gélule pour le rivaroxaban ou par voie sous-cutanée pour l’énoxaparine et de construite un essai avec un double placebo (voir question suivante) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 136 Essais cliniques Commentaires Il n’aurait pas fallu cocher... Il n’existe pas de placebo pour le rivaroxaban L’efficacité et la sécurité du rivaroxaban ont été démontrées contre placebo auparavant Ce n’est pas le cas et il existe déjà un traitement de référence Pour quelle(s) raison(s) pratique(s) était-il difficile de conduire cette étude en double aveugle ? Il aurait fallu cocher... Commentaires Un double placebo aurait été nécessaire Le groupe « rivaroxaban » aurait eu en plus un placebo d’énoxaparine et le groupe « traitement standard » aurait reçu un placebo de rivaroxaban La dose d’antagoniste de la vitamine K doit être ajustée en fonction de la valeur de l’INR C’est la principale raison pour laquelle l’aveugle n’a pas été utilisée. Cela induit forcément une différence de suivi entre les 2 groupes Commentaires Il n’aurait pas fallu cocher... Il s’agit d’un essai de noninfériorité Un essai de non-infériorité peut tout à fait être réalisé en double aveugle Maintenir les patients et les médecins dans l’ignorance du traitement alloué n’aurait pas été éthique Il n’y a pas de raison éthique à ne pas mettre en place une procédure de double aveugle. S’il existe un problème éthique, on ne peut pas conduire l’essai, qu’il soit ouvert ou en aveugle Il n’existait pas d’antidote du rivaroxaban au moment de l’étude En cas d’événement indésirables il existe des procédures qui permettent de lever l’aveugle pour ne faire perdre aucune chance au patient Quelle(s) précaution(s) a (ont) été prise(s) pour surmonter les inconvénients du caractère ouvert de l’étude dans l’évaluation du critère de jugement principal d’efficacité ? Il aurait fallu cocher... Mise en place d’un comité central d’adjudication des événements Adjudication des événements en aveugle du groupe d’étude Commentaires A central committee whose members were unaware of the study-group assignments adjudicated the results of ail baseline lung-imaging tests and ail suspected outcome events. En revanche cela ne permet bas de s’affranchir du biais induit par la différence de suivi par le clinicien entre les 2 groupes du fait de la surveillance de l’INR dans un groupe et pas dans l’autre Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Procédure d’aveugle et effet placebo Il aurait fallu cocher... Confirmation des suspicions d’événements thrombo-emboliques veineux par des tests diagnostiques objectifs 137 Commentaires In the case of suspected venous thromboembolism, the protocol required objective testing. Cela limite le biais d’information (ou de classement) Il n’aurait pas fallu cocher... Commentaires La mise en place d’un comité indépendant des données de sécurité Ce comité est là pour intervenir en cas de danger pour les patients (surrisque hémorragique important dans un des groupes par exemple) et a le pouvoir de stopper l’inclusion des patients le cas échéant. Il ne doit pas être confondu avec le comité d’adjudication Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 14 Plan expérimental In tro d uctio n Le design correspond au schéma de l’étude. Dans certains articles, on peut trouver ce schéma décrit sous la forme d’une figure, notamment lorsqu’il est complexe ou lorsque l’administration du médicament est fractionnée (par exemple, au cours des cures de chimiothérapie afin d’indiquer sur une frise les jours de perfusion). Il existe plusieurs types de design dont les trois rencontrés le plus fréquemment sont décrits ci-dessous. Essai en gro u p es p arallèles • Schéma le plus classique. • Deux groupes de patients sont constitués par tirage au sort, l’un recevant le traitement étudié et l’autre recevant soit un placebo, soit le traitement de référence. • Le critère de jugement est mesuré dans les deux bras de traitement de manière identique. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 140 Essais cliniques Essai en cross-o ver • Deux groupes de patients sont constitués par tirage au sort. • L’un des groupes reçoit le traitement étudié puis le placebo (ou le traitement de référence), l’autre groupe reçoit le placebo (ou le traitement de référence) puis le traitement étudié. • Deux périodes d’études sont ainsi formées et le critère de jugement est évalué à la fin de chacune des deux périodes. • Selon ce schéma, chaque sujet est pris comme son propre témoin, on parle aussi d’essai intra-individuel. l'efficacité l'efficacité Avantages • Augmente la puissance et diminue le nombre de sujets nécessaires à inclure par rapport à un schéma en groupe parallèle : ceci constitue un intérêt pour les maladies à faible potentiel de recrutement. • Assure une forte comparabilité des groupes étant donné que chaque sujet est pris comme son propre témoin. Inconvénients • Pas d’application possible en cas de critère de jugement définitif comme la guérison ou le décès. L’état clinique doit être le même avant l’administration du premier et du deuxième traitement. • Entraîne un allongement de la période d’observation, donc un risque de perdus de vue plus important. • Effet carry-over : poursuite de l’efficacité du premier traitement après arrêt de celui-ci. Cela nécessite une période de wash-out entre les deux traitements. • Effet ordre : biais entraînant une différence d’efficacité entre les deux périodes indépendamment de l’effet du traitement (par exemple, par effet d’apprentissage lors de l’application répétée d’un questionnaire à un même patient ou en cas d’évolution de la maladie vers l’aggravation ou l’amélioration spontanée). • L’interprétation des résultats est plus complexe. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Plan expérimental 141 Conclusion Ce type de schéma est adapté aux maladies chroniques relativement stables, dont le critère de jugement d’efficacité n’est pas définitif, et à l’étude de traitements dont l’efficacité est rapide et qui ne perdurent pas trop longtemps après leur arrêt (médicaments à demi-vie courte, par exemple). Plans f act oriels • Quatre groupes de patients sont formés par tirage au sort. • Deux traitements sont testés simultanément afin de rechercher s’il existe une potentialisation de l’effet des deux traitements ou au contraire une incompatibilité. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 15 Suivi de l’étude et diagramme de flux Le diagramme de flux (flow chart) résume sous forme d’organigramme le suivi des patients en détaillant les différentes étapes comme l’inclusion et la randomisation. Il permet généralement de repérer les effectifs de la population ITT et de la population per-protocole (voir fiche 16). La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 144 Essais cliniques Elé m e n ts i m p ort an ts à re p érer • Nombre d’inclusions : - le nombre total de sujets nécessaires est-il atteint ? - si non : risque d’un manque de puissance ; - manque de puissance = risque de ne pas réussir à mettre en évidence une différence qui existe vraiment = inflation du risque p. • Nombre de patients exclus avant randomisation et raison de ces exclusions : - patients exclus car ne répondant pas aux critères d’inclusion ou présentant des critères d’exclusion : cela reste logique et ne pose pas de problème a priori^ hormis le fait que la généralisation des résultats dans la vraie vie ne pourra être possible que chez des patients avec des caractéristiques identiques ; - patients exclus pour refus de participation : risque de biais de sélection (les patients refusant de participer présentent peut-être des caractéristiques particulières). • Équilibre des groupes après randomisation : - le déséquilibre dans l’effectif des groupes est-il lié à des sorties de l’étude pour des raisons particulières ? - si oui, ces raisons modifient-elles la comparabilité initiale des groupes ? - si les groupes ne sont plus comparables, on perd le bénéfice de la randomisation et on voit potentiellement apparaître l’effet de certains facteurs de confusion. • Nombre de perdus de vue et raison de ces perdus de vue : - si le nombre de sujets perdus de vue est faible (< 10 %) et équilibré entre les deux groupes, le biais d’attrition (biais de suivi) est a priori faible ; - si le nombre de sujets perdus de vue est élevé (> 10 %) et déséquilibré entre les deux groupes, le biais d’attrition (biais de suivi) est a priori non négligeable ; - les raisons des pertes de suivi et des arrêts de suivi sont si possible précisées : une perte de suivi liée à l’évolution de la maladie ou à des effets indésirables du traitement est susceptible d’entraîner un biais dans l’évaluation finale du traitement. Biais d'a t tritio n Définition : biais en rapport avec les sorties d’études. Au cours d’un essai clinique, l’attrition pose deux problèmes : • si les sorties d’étude sont réparties différemment entre les groupes, l’attrition détruit le bénéfice de la randomisation, rendant les groupes de traitement non comparables (habituellement, on a plus de sorties dans le groupe traitement que dans le groupe placebo, et le profil des sorties d’étude est en faveur des patients les plus fragiles) ; • la population d’analyse est sélectionnée si on a trop de sorties d’étude, la généralisation des résultats devient alors délicate. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Suivi de l’étude et diagramme de flux 145 En pra tique Ex e m ple 1 (ED N 2018) Bonjer HJ, Deijen CL, Abis GB, Cuesta MA, van der Pas MHGM, de Lange-de Klerk ESM, Lacy AM, Bemelman WA, Andersson J, Angenete E, Rosenberg J, Fuerst A, Haglind E, for the COLOR II Study Group. A randomized trial of laparoscopie versus open surgery for rectal cancer. N Engl J Med 2015; 372: 1324-32. From January 2004 through May 2010, a total of 1,103 patients with rectal cancer underwent randomization. Of these patients, 739 were assigned to undergo laparoscopie surgery and 364 to undergo open surgery. After the exclusion of 59 patients following randomization, 1,044 patients (699 in the laparoscopic-surgery group and 345 patients in the open-surgery group) were included in the analysis (Fig. 1). In total, 1,036 patients were included in the long-term analyses. At the 3-year follow-up, data were available for 771 patients (74%) regarding locorégional récurrence, 923 (89%) regarding disease-free survival, and 903 (87%) regarding overall survival. Enrollment and Outcomes. À propos du flux des patients dans l’étude : Il aurait fallu cocher... Commentaires Le recrutement des patients a été réalisé entre janvier 2004 et mai 2010 C’est ce qui est précisé dans le texte, entre janvier 2004 et mai 2010, 1 103 patients ont été randomisés L’information sur le critère de jugement principal à 3 ans n’était pas disponible pour 26 % des patients randomisés À 3 ans, 74 % des patients avaient des données disponibles permettant d’estimer la récidive locorégionale, soit 26 % de données manquantes Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 146 Essais cliniques Il aurait fallu cocher... Commentaires 697 patients ont été inclus dans le groupe laparoscopie dans l’analyse en traitement reçu Dans le groupe laparoscopie, selon le diagramme de flux, 699 patients ont été analysés dans l’analyse principale (intention de traiter modifiée), alors que seulement 692 ont réellement eu une laparoscopie (699 — 7 qui ont eu une chirurgie ouverte). Mais 5 patients du groupe chirurgie ouverte ont eu finalement une laparoscopie. Ces 5 patients ont été analysés dans le groupe laparoscopie dans l’analyse en traitement reçu, soit au total 5 + 692 = 697 patients analysés dans l’analyse en traitement reçu dans le groupe laparoscopie (voir fiche 10 pour plus d’informations sur l’analyse en traitement reçu) L’information sur les patients éligibles manque à ce diagramme En effet, il manque le nombre de patients évalués pour éligibilité et la raison des non-inclusions Il n’aurait pas fallu cocher... Commentaires La figure de l’exemple 1 suggère qu’il s’agissait d’un essai en cross-over L’essai est en groupes parallèles et non en cross-over 692 patients du bras laparoscopie ont été inclus dans l’analyse en intention de traiter (intention to treat ou ITT) Dans le groupe laparoscopie, selon le diagramme de flux, 699 patients ont été analysés dans l’analyse en ITT Le strict principe de l’ITT était respecté dans cette étude Il existe des patients randomisés qui n’ont pas été inclus dans l’analyse finale. Le principe strict de l’ITT n’a pas été respecté Il n’y a pas d’attrition dans cette étude Des patients inclus ne sont pas analysés, il existe donc des sorties d’étude Ex e m ple 2 (ED N 2017) Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML, Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D, Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D. Levosimendan for the prévention of acute organ dysfunction in sepsis. N Engl J Med 2016; 375: 1638-48. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Suivi de l’étude et diagramme de flux 147 > Selon le diagramme de flux, dans cet essai : Il aurait fallu cocher... Commentaires Sur les 259 patients randomisés dans le bras lévosimendan, un patient a retiré son consentement et a été exclu de l’analyse principale C’est précisé dans la 3e case à gauche en partant du haut 2 patients sont décédés avant de recevoir le lévosimendan 4 patients n’ont pas reçu de lévosimendan. Parmi eux, 2 sont décédés Dans cette étude, la population as-treated comprend l’ensemble des patients ayant effectivement reçu le traitement assigné par randomisation Les auteurs ont en effet considéré comme la population as-treated les malades ayant reçu le traitement assigné par randomisation, ce qui correspond plutôt à une analyse « per-protocole ». Dans une analyse en traitement reçu, le patient ayant reçu du lévosimendan dans le groupe placebo aurait dû être analysé dans le groupe lévosimendan, et les patients du groupe lévosimendan n’en ayant pas reçu dans le groupe placebo Un patient du groupe placebo a reçu du lévosimedan Un patient a reçu du lévosimendan en ouvert > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 148 Essais cliniques Il n’aurait pas fallu cocher... Commentaires Les patients du groupe lévosimendan n’ayant pas reçu de lévosimendan ont été exclus de l’analyse principale Non, la seule exclusion concerne un patient ayant retiré son consentement (on pourrait parler de modified intention to treat ou mITT pour la population principale d’analyse) Tous les patients randomisés ont été pris en compte dans l’analyse principale Dans le groupe lévosimendan, 1 patient a été exclu de l’analyse principale Ex e m ple 3 (é preuve t est 2017) Griffin D, Parsons N, Shaw E, Kulikov Y, Hutchinson C, Thorogood M, Lamb SE; UK Heel Fracture Trial Investigators. Operative versus non-operative treatment for closed, displaced, intra-articular fractures of the calcaneus: randomised controlled trial. BMJ 2014; 349: g4483. > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Suivi de l’étude et diagramme de flux 149 Concernant le flux des participants dans l’étude : Il aurait fallu cocher... Commentaires Plus de la moitié des patients éligibles ont refusé de participer principalement en raison d’une préférence pour l’un des deux traitements En effet, 351 patients sur les 502 éligibles ont refusé de participer dont 146 +144 = 190 en raison d’une préférence L’exclusion de 351 patients éligibles ne nuit pas à la comparabilité des groupes Les non-inclusions survenant avant la randomisation ne nuisent en effet pas à la comparabilité des groupes, même si elles sont à l’origine d’un biais de sélection Le strict principe de l’ITT {intention to treat) a été respecté dans cette étude Les 151 patients randomisés ont été analysés. On peut supposer que pour atteindre ce but, les données non disponibles ont été imputées (c’est-à-dire remplacées) Il n’aurait pas fallu cocher... Commentaires Tous les patients randomisés ont reçu l’intervention allouée par la randomisation 5 patients du groupe chirurgie n’ont pas été opérés, mais ils ont quand même été analysés dans le groupe chirurgie 3 patients du groupe traitement médical ont été opérés et ont été analysés dans le groupe traitement médical Le critère de jugement principal était manquant chez 4 patients dans le bras opératoire et ces patients ont été exclus de l’analyse Effectivement, le critère de jugement principal n’était pas disponible à 2 ans pour 4 patients du groupe opératoire. Pour autant, selon le flow chart, il y a autant de patients analysés que randomisés donc ils n’ont pas été « exclus » mais analysés 2 patients randomisés dans le bras traitement opératoire ont changé d’avis et ont été analysés dans le bras traitement non opératoire 2 patients randomisés dans le groupe opératoire n’ont pas été opérés, mais ils sont restés dans le groupe opératoire pour l’analyse 3 patients randomisés dans le bras traitement non opératoire ont changé d’avis et ont été exclus de l’analyse 3 patients randomisés dans le groupe traitement médical ont été opérés, mais ils ont été analysés dans le groupe traitement médical L’exclusion de patients avant la randomisation ne pose pas de problème de biais de sélection Les groupes restent comparables, mais l’exclusion de patients éligibles sélectionne l’échantillon (qui devient moins représentatif de la population source) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 16 Population d’analyse (ITT et per-protocole) En complément V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l ’ I T T e t l e P e r-P r o t ocol e : h t t ps: / / y o u t u. b e / v o G p gJh T Z 9 A Po p ula tio n p o ur l'analyse en in t e n tio n d e trait er (intention to tre a t ou ITT) L’analyse en intention de traiter : • consiste à prendre en compte chaque patient dans son groupe de randomisation initial, même s’il n’a pas reçu le bon traitement ou s’il est sorti d’étude (déviation du protocole) ; • nécessite que tous les malades soient suivis jusqu’à la fin de l’essai. Sinon, il faut imputer les résultats = attribuer une valeur arbitraire pour le critère de jugement à un patient ; • diminue la différence entre les groupes = défavorable à la démonstration de la supériorité/favorable à la démonstration de la non-infériorité. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 152 Essais cliniques Si on garde tous les patients dans leur groupe d’origine, sans tenir compte du fait qu’ils aient réellement pris ou non le traitement alloué par la randomisation, il faut imaginer que l’on « mélange » les groupes. Ils deviennent plus « proches » pour le critère de jugement principal : on diminue l’effet dans le groupe traitement, on augmente l’effet dans le groupe placebo. En ITT, il est plus difficile de montrer la supériorité = c’est l’analyse la plus conservatrice dans les essais de supériorité (= si l’essai est significatif en ITT, on a réellement confiance dans les résultats). L’analyse en ITT est le seul moyen de préserver le bénéfice de la randomisation = groupes comparables en début d’essai. L’ITT permet de se rapprocher de « la vraie vie » dans laquelle tous les patients ne prennent pas leur traitement de façon parfaite (oublis, arrêt pour effets secondaires, arrêt en cas de maladies intercurrentes, etc.). En résumé, l’analyse en ITT : • limite le biais d’attrition : ce biais est présent quand l’exclusion de certains patients par perte de suivi avantage un des groupes de traitement en termes d’efficacité. Par exemple, si les patients ayant dévié du protocole en raison d’un manque d’efficacité du traitement étudié ne sont pas inclus dans l’analyse, on risque de conclure à tort à une efficacité du traitement ; • diminue la différence entre les groupes et rend plus difficile le fait de montrer une différence qui existe vraiment. Gestion des perdus de vue dans l'analyse en ITT : l'imputation Par définition, un perdu de vue est un sujet dont on ne connaît pas les données finales d’évaluation. Or, on a vu précédemment que ces individus étaient tout de même pris en compte dans une analyse en ITT afin de limiter le biais d’attrition. On dispose alors de différentes techniques pour inclure ces sujets dans l’analyse. Le principe est d’attribuer une valeur arbitraire au critère de jugement lorsqu’il n’est pas disponible : on parle d’imputation. Im p u ta tio n p ar l'h y p o t h èse d u biais m a xi m u m Cette technique consiste, en présence d’une donnée manquante, d’attribuer aux patients perdus de vue la valeur du critère de jugement la plus défavorable au traitement étudié. On classera alors un perdu de vue comme étant en échec s’il fait partie du bras « traitement » et comme succès s’il fait partie du bras « contrôle ». Dans ce cas, un résultat significatif sera digne de confiance, un résultat non significatif ne permettra pas de conclure. Im p u t atio n m ultiple On attribue une valeur pour le critère de jugement en estimant la probabilité que le traitement soit un succès à partir des données des autres patients (par exemple, si 90 % des hommes de plus de 65 ans présentant certaines caractéristiques ont été un succès, on attribue un succès à un patient manquant présentant les mêmes caractéristiques). En résumé, la valeur attribuée aux perdus de vue est estimée à partir des données disponibles. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Population d’analyse (ITT et per-protocole) 153 Im p u t atio n p ar la d ernière v ale ur co nn u e (l ast observ a tion c a rried forw a rd o u LO CF) Dans ce cas, on attribue aux patients perdus de vue ou retirant leur consentement la dernière valeur connue pour le critère de jugement au cours du suivi. À retenir Le biais maximum est la méthode d'imputation la plus conservatrice ( = on a moins de chances de conclure à tort à l'efficacité) pour l'analyse des données dans un essai de supériorité. Remplacement des sujets manquants Les patients perdus de vue ou ayant retiré leur consentement peuvent également être remplacés par l’inclusion et la randomisation de nouveaux patients, pour peu que cette possibilité soit prévue par le protocole de l’étude. Analyse en ITT modifiée (modified intention to treat ou mITT) • Remplace parfois l’analyse en ITT standard. • Consiste à exclure néanmoins certains patients de l’analyse finale. • Les patients exclus sont souvent les perdus de vue ou les patients ayant retiré leur consentement. C’est une situation acceptable quand leur nombre est faible pour éviter d’avoir recours à des techniques d’imputation. Po p ula tion p o ur l ’ analyse p er-pro t ocole (PP) L’analyse per-protocole : • consiste à exclure les patients avec des « déviations au protocole », c’est- à-dire ceux étant sortis de l’étude, les perdus de vue, les inclus à tort, les erreurs de randomisation, etc. ; • augmente la différence entre les groupes = défavorable à la démonstration de la non-infériorité/favorable à la démonstration de la supériorité ; • peut détruire le bénéfice de la randomisation : les déviations au protocole ne sont ni aléatoires, ni réparties de manière égale entre les groupes. Ce type d’analyse est donc à considérer avec la plus grande prudence. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 154 Essais cliniques Si on exclut tous les patients qui n’ont pas respecté le protocole, on augmente l’effet dans le groupe traitement, on diminue l’effet dans le groupe placebo. On augmente donc la différence entre les groupes pour le critère de jugement, c’est plus facile de montrer que les groupes sont différents (supériorité), mais plus difficile de montrer qu’ils sont similaires (hypothèse de non-infériorité ou équivalence). En PP, il est plus difficile de montrer la non-infériorité = c’est l’analyse la plus conservatrice dans les essais de non-infériorité (si l’essai est significatif en PP, on a réellement confiance dans les résultats). L’analyse en ITT est le seul moyen de préserver le bénéfice de la randomisation. L’analyse PP est toujours une analyse secondaire (ou analyse de sensibilité), même si elle est indispensable pour tirer une conclusion conservatrice dans un essai de non-infériorité. Po p ula tio n p o ur l'analyse en traite m e n t reçu (as tre a ted} L’analyse en traitement reçu : • consiste à analyser les résultats d’un patient en fonction du traitement qu’il a réellement reçu (ce qui peut conduire à analyser des patients dans le groupe A, même s’ils ont été randomisés dans le groupe B). Les autres déviations au protocole peuvent être soit exclues, soit conservées dans le groupe de randomisation ; • est plus proche de la réalité de l’effet propre du traitement étudié ; • augmente la différence entre les groupes = défavorable à la démonstration de la non-infériorité/favorable à la démonstration de la supériorité ; • peut détruire le bénéfice de la randomisation : les erreurs de traitement n’ont aucune raison d’être aléatoires et également réparties entre les groupes. Ce type d’analyse est donc à considérer avec la plus grande prudence. Critère de jugement Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Population d’analyse (ITT et per-protocole) 155 En résumé : Si un patient reçoit le traitement... En ITT, il sera dans le bras Et que le traitement réellement alloué est... A A A A B A En PP, il sera dans le bras En traitement reçu, il sera dans le bras A A B Po p ula tion p o ur l'analyse « d e sécurit é » (sa fety a n a lysis) Ici, l’objectif est de ne pas sous-estimer les effets secondaires des traitements. On inclut tous les patients ayant reçu au moins une dose de traitement dans chaque bras. Syn t h èse Il est indispensable de repérer dans le flow chart de l’analyse sur quel groupe de patients est réalisée une analyse, afin d’en interpréter correctement les résultats. ITT PP As treated Safety analysis Principe Chaque patient est analysé dans son bras de randomisation d’origine Les patients présentant une déviation au protocole sont exclus Les patients ayant reçu le mauvais traitement sont changés de bras pour l’analyse On ne garde que les patients ayant reçu au moins une dose du traitement dans chaque bras Utilisation Conclusion principale d’un essai de supériorité Conclusion principale d’un essai de non-infériorité (si concordant avec l’ITT) Analyse secondaire dans un essai de supériorité Parfois analyse de la tolérance Conclusion principale de certains essais de non-infériorité (si concordant avec l’ITT) Analyse secondaire dans un essai de supériorité Parfois analyse de tolérance Conclusion principale de tolérance dans un essai de supériorité et de non-infériorité Astuce Comporte toujours plus de patients que le PP Comporte toujours moins de patients que l’ITT Seule situation où l’on peut ne pas respecter le traitement alloué par la randomisation Il est possible que la conclusion d’efficacité et de tolérance ne repose pas sur les mêmes patients Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 156 Essais cliniques En pra tique Ex e m ple 1 (ED N 2016) Deslée G, Mal H, Dutau H, Bourdin A, Vergnon JM, Pison C, Kessler R, Jounieaux V, Thiberville L, Leroy S, Marceau A, Laroumagne S, Mallet JP, Dukic S, Barbe C, Bulsei J, Jolly D, Durand-Zaleski I, Marquette CH, for the REVOLENS Study Group. Lung volume réduction coil treatment vs usual care in patients with severe emphysema: The REVOLENS Randomized Clinical Trial .JAMA 2016 ; 315(2) : 175-84. Multicenter 1:1 randomized superiority trial comparing coils with usual care at 10 university hospitals in France. Patients randomized to usual care (n = 50) received réhabilitation and bronchodilators with or without inhaled corticosteroids and oxygen; those randomized to bilateral coil treatment (n = 50 received usual care plus additional therapy). The primary outcome was improvement of at least 54 min the 6-minute walk test at 6 months (1-sided hypothesis test). The statistical power to demonstrate a superior success rate (1-sided hypothesis test) in the primary endpoint for the coil group vs the usual care group was anticipated to be 90% with a significance of a = .05 at a total sample size of 100 patients, based on the hypothesis of a 37% end-point achievement in the coil group and 5% in the usual care group and with 30% of patients unable to perform the 6-minute walk test or lost to follow-up at 6 months. For the primary endpoint, intention-to-treat analyses were conducted using a multiple imputation method for missing data. A logit model was used to impute the outcome for participants who did not perform the 6-minute walk test at 6 months, based on the parameters of FEV, FVC, RV, St George’s Respiratory Questionnaire total score, modified MRC dyspnea scale, and Baseline Dyspnea Index/Transition Dyspnea Index. Ten imputations were performed. Bivariable logistic models were then fitted with the imputed values using treatment group as the predictor variable. An additional maximum bias analysis considering patients who did not perform the 6-minute walk test to be non responders for the primary end point was also conducted. Les auteurs indiquent avoir réalisé une analyse supplémentaire selon l’hypothèse du biais maximum. Théoriquement, dans ce type d’analyse, un patient qui n’a pas effectué le test de marche de 6 minutes était considéré comme : Il aurait fallu cocher... Un échec pour le critère de jugement principal, dans le groupe « spirales » Un succès pour le critère de jugement principal, dans le groupe « soins habituels » Commentaires Ces deux propositions sont conformes à la définition de l’hypothèse du biais maximum Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Population d’analyse (ITT et per-protocole) 157 Il n’aurait pas fallu cocher... Commentaires Exclu de l’analyse du critère de jugement principal, quel que soit son groupe dans l’essai C’est ce qui serait fait dans une analyse per-protocole Un succès pour le critère de jugement principal, dans le groupe « spirales » Ces deux propositions ne seraient pas conservatrices Un échec pour le critère de jugement principal, dans le groupe « soins habituels » On attribue au patient une valeur estimée par un modèle statistique d’imputation multiple C’est le principe de l’imputation multiple et pas du biais maximum À propos de l’analyse en intention de traiter (ITT) d’un essai clinique : Il aurait fallu cocher... Commentaires L’analyse en ITT concerne toujours plus de patients que l’analyse per-protocole En effet, on n’exclut personne de l’analyse en ITT L’analyse en ITT est plus conservatrice que l’analyse per-protocole dans les essais de supériorité Le risque de conclure à tort à l’efficacité est moindre, c’est la définition d’une analyse conservatrice L’application du strict principe de l’ITT peut nécessiter la réalisation d’une imputation Lorsque les données ne sont pas disponibles, il est parfois nécessaire d’imputer L’analyse en ITT limite le biais d’attrition Le principe même de l’ITT est d’analyser tous les patients pour conserver le bénéfice de la randomisation Il n’aurait pas fallu cocher... Commentaires L’analyse en ITT est toujours l’analyse la plus conservatrice d’un essai de non-infériorité Dans ce cas, c’est le per-protocole qui est le plus conservateur Les patients sortis de l’étude pour intolérance du traitement sont exclus de l’analyse en ITT Aucun patient n’est exclu de l’ITT D’autres exercices sur les populations d’analyse sont proposés dans la fiche 10. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 158 Essais cliniques Ex e m ple 2 (é preuve t est 2020) Bracard S, Ducrocq X, Mas JL, Soudant M, Oppenheim C, Moulin T, et al. Mechanical thrombectomy after intravenous alteplase versus alteplase alone after stroke (THRACE): a randomised controlled trial. Lancet Neurol oct 2016; 15(11) : 1138-47. Analyses of primary outcome were done in the modified intention-to-treat population (ie, patients lost to foliow up and those with missing data were excluded) and in the per-protocol population (ie, ail patients who did not foliow the protocol of their randomisation group precisely were excluded from the analysis). The safety endpoints were analysed in the per-protocol population. IVT = intravenous thrombolysis. IVTMT = intravenous thrombolysis plus mechanical thrombectomy. *Because of poor clinical évolution, eight patients had thrombectomy eventually. fBecause of problems with the catheterisation. Quelle(s) est(sont) la(les) proposition(s) exacte(s) concernant les patients randomisés (figure ci-dessus) : Il aurait fallu cocher... Commentaires Tous les patients randomisés ont été analysés, à l’exception des patients perdus de vue, des patients ayant retiré leur consentement et des patients avec des informations manquantes pour les critères de jugement Parmi 414 patients randomisés, 2 ont retiré leur consentement, 2 + 2 = 4 ont été perdus de vue, 4 + 2 = 6 avaient des données manquantes. Ce qui fait au total 202 + 200 = 402 patients inclus dans l’analyse d’efficacité Le nombre de patients perdus de vue est similaire dans les 2 groupes Oui, 2 patients perdus de vue dans chaque groupe ce qui correspond à une proportion identique La proportion de patients ayant reçu le traitement à l’étude est supérieure dans le groupe IVT (thrombolyse) 200/208 patients du groupe thrombolyse seule (IVT) ont reçu le traitement prévu par le bras dans lequel ils avaient été randomisés alors seulement 145/204 patients du groupe thrombolyse + thrombectomie (IVTMT) ont reçu la thrombectomie Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Population d’analyse (ITT et per-protocole) 159 Il n’aurait pas fallu cocher... Commentaires La proportion de patients ayant reçu le traitement médical est supérieure dans le groupe IVT (thrombolyse) Le traitement médical (la thrombolyse) était prévu dans les 2 bras de l’essai donc les 59 patients du groupe thrombectomie n’ayant pas reçu la thrombectomie ont bien reçu la thrombolyse Un potentiel biais de suivi peut être exclu Cette proposition est trop catégorique pour être cochée, d’autant plus que l’essai est réalisé en ouvert du fait de la nature de l’intervention Dans cette étude, 59 patients randomisés dans le groupe IVTMT (thrombolyse et thrombectomie mécanique) n’ont pas bénéficié de la thrombectomie mécanique. Quelle(s) est (sont) la (les) conséquence(s) de ce phénomène ? Il aurait fallu cocher... Commentaires Ces patients ont été traités comme ceux du groupe IVT (thrombolyse), ce qui entraîne une perte de puissance de l’étude Si les patients du groupe « traité » n’ont pas pu bénéficier de l’intervention étudiée (la thrombectomie), cela diminue l’efficacité de l’intervention. Le calcul de puissance a priori est fait pour une efficacité donnée. Si cette efficacité n’est pas atteinte, la puissance a posteriori est moindre Une analyse en traitement reçu détruirait le bénéfice de la randomisation L’analyse en traitement reçu consisterait à analyser ces 59 patients dans le groupe IVT (thrombolyse seule), ce qui n’est pas le groupe dans lequel ils ont été randomisés à la base L’analyse en intention de traiter consiste à analyser ces 59 patients dans le groupe IVTMT L’analyse en ITT consiste à analyser tous les patients dans leur groupe de randomisation peu importe les écarts au protocole Une analyse en traitement reçu serait favorable à la démonstration de la supériorité L’analyse en traitement reçu est favorable à la démonstration de la supériorité car elle analyse les patients en fonction de ce qu’ils ont réellement reçu comme traitement et non en fonction de leur groupe de randomisation initial L’analyse qui consiste à analyser ces 59 patients dans le groupe IVTMT permettrait de garder le bénéfice de la randomisation Cela correspond à l’analyse en ITT dont le principe est d’analyser tous les patients dans leur groupe de randomisation initial L’analyse per-protocole n’a inclus que les patients ayant bénéficié du traitement alloué et pour lesquels le protocole a été respecté = définition littérale de l’analyse per-protocole Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 160 Essais cliniques Il aurait fallu cocher... Commentaires L’analyse per-protocole peut induire un déséquilibre dans la distribution des caractéristiques à l’inclusion entre les 2 groupes de l’essai Oui, car l’exclusion des patients ayant présenté des déviations au protocole peut faire perdre le bénéfice de la randomisation qui est l’équilibre des différentes caractéristiques à l’inclusion entre les groupes L’analyse per-protocole a exclu plus de patients du groupe IVTMT que du groupe IVT Oui, étant donné que beaucoup plus de patients ont dévié du protocole dans le groupe IVTMT Il n’aurait pas fallu cocher... Commentaires Ce phénomène a pu entraîner une perte de chance pour les patients du groupe thrombectomie mécanique On ne sait pas si c’est le cas a priori car l’objectif de l’essai est justement de montrer s’il existe un bénéfice à associer la thrombectomie à la thrombolyse. On pourrait très bien se trouver dans une situation où il n’y a aucun bénéfice à la thrombectomie voire même que la thrombectomie fasse moins bien que la thrombolyse seule Comme le score de Rankin modifié à 3 mois n’a pas pu être évalué chez ces patients, le résultat est probablement biaisé Ces patients ne sont pas des perdus de vue. Ils n’ont pas reçu le traitement qui leur avait été alloué par tirage au sort mais ils ont pu être suivis dans le temps et on a pu recueillir le critère de jugement principal L’étude manque de robustesse en l’absence d’une analyse sous l’hypothèse du biais maximal L’analyse sous l’hypothèse du biais maximum est utile en cas de perdus de vue et donc de données manquantes pour le critère de jugement. Dans la situation présente, ces 59 patients ne sont pas perdus de vue et donc l’information concernant le critère de jugement n’est pas manquante pour ces patients. On rappelle que la situation du biais maximum consisterait à imputer la situation la plus défavorable aux données manquantes du critère de jugement du groupe intervention et la situation la plus favorable aux données manquantes du critère de jugement du groupe contrôle L’effet de la thrombectomie mécanique est probablement majoré pour le critère de jugement principal Si la thrombectomie apporte réellement un bénéfice aux patients, le fait que ces 59 ans patients n’aient pas reçu de thrombectomie irait plutôt dans le sens d’une diminution de l’effet (pour rappel = l’analyse en ITT est défavorable à la démonstration de la supériorité) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Population d’analyse (ITT et per-protocole) Il n’aurait pas fallu cocher... Commentaires L’analyse en per-protocole inclurait ces 59 patients dans l’analyse Le principe de l’analyse en per-protocole est d’exclure les patients qui ont présenté des déviations au protocole L’analyse en per-protocole favoriserait la démonstration de la non-infériorité Non c’est l’inverse, l’analyse protocole favorise la démonstration de la supériorité et est défavorable à la démonstration de la non-infériorité Le résultat non significatif de l’analyse per-protocole rend discutable le résultat de l’analyse en intention de traiter L’analyse en per-protocole est ici une analyse secondaire du critère d’efficacité 161 Ex e m ple 3 (ED N 2020) Hofmann R, James SK, Jernberg T, Lindahl B, Erlinge D, Witt N, et al. Oxygen Therapy in Suspected Acute Myocardial Infarction. N Engl J Med 28 sept 2017 ; 377(13) : 1240-9. Enrollment, Randomization, and Analysis. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 162 Essais cliniques Qu’est-ce qui explique la différence d’effectifs entre le groupe oxygénothérapie (n = 3 014 participants) et le groupe air ambiant (n = 3 212 participants) dans l’échantillon d’analyse per-protocole ? Il aurait fallu cocher... Commentaires L’interruption prématurée du traitement Si l’on se réfère au diagramme de flux, les raisons de déviation au protocole sont les motifs d’interruption prématurée du suivi indiquées dans le 4e carré en partant du haut : abandon d’étude, sortie précoce, modification des circonstances cliniques, difficultés techniques ou de communication, raison inconnue Les retraits volontaires de participation Il n’aurait pas fallu cocher... Commentaires L’administration d’oxygène en dehors du protocole de l’essai Si l’on regarde le groupe « oxygène », sur 3 311 patients randomisés, 297 n’ont pas participé jusqu’à la fin de la période de suivi et ont été exclus de l’analyse per-protocole (3 311 -297 = 3 014). Les 62 patients ayant reçu de l’oxygène en dehors de l’étude n’ont pas été exclus de l’analyse per protocole) Les décès La mortalité est le critère de jugement. Les patients décédés ne sont pas exclus de l’analyse per-protocole L’exclusion des patients avec un diagnostic autre qu’un infarctus du myocarde Ce n’est pas indiqué dans le diagramme de flux Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 17 Essais de non-infériorité et d’équivalence En complément V o us p o u v e z co ns u l t e r c e t t e v i d é o s u r l e s e ss a is d e n o n -i n f é riori t é : h t t ps: / / y o u t u . b e / a 5 D N v m U k t cs Princip e Pourquoi réaliser un essai de non-infériorité ou d’équivalence ? Il y a trois conditions : 1. le traitement de référence existe et a démontré son efficacité contre placebo ; 2. il n’y a pas de supériorité attendue du nouveau traitement par rapport au traitement de référence ; 3. le nouveau traitement apporte un bénéfice autre comme : • une galénique plus adaptée, • une meilleure tolérance attendue, • des bénéfices pour la société (diminution des coûts, des résistances aux antibiotiques, etc.). Pour ces nouveaux traitements, il faut alors montrer que les avantages apportés ne le soient pas au détriment de leur efficacité grâce à la réalisation d’essai de non-infériorité ou d’équivalence. N o tio ns st a tistiq u es Seuil de non-infériorité et bornes d'équivalence • Aucun test statistique ne permet de conclure à une efficacité identique entre deux traitements. • On définit donc a priori un seuil de non-infériorité qui correspond à la perte d’efficacité cliniquement acceptable et négligeable (situation unilatérale). • Dans certaines situations, on souhaite en plus être sûr que le nouveau traitement ne soit pas plus efficace que le traitement de référence pour différentes La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 164 Essais cliniques raisons (par exemple, traitement antidiabétique qui induirait une hypoglycémie, ou traitement anti-HTA qui induirait une hypotension). On peut alors définir des bornes d’équivalence (situation bilatérale). • La question posée par un essai de non-infériorité est : la différence entre les deux traitements est-elle significativement inférieure à la marge de non-infériorité ? Situation unilatérale ou bilatérale Sit u a tio n u nila t érale Définition d’un seuil de non-infériorité ; l’intervalle de confiance (IC) du risque relatif (RR) ne doit pas comprendre ce seuil pour conclure à la non-infériorité. î —!-------- — i i IC comprenant 1 -^supériorité non démontrée i i IC comprenant le seuil de non-infériorité non-infériorité non démontrée IC ne comprenant pas le seuil de non-infériorité IC ne comprenant pas 1 -> supériorité démontrée ■ -» non-infériorité démontrée ii ii -*---------‘-------- > —;-------------- » 0,9 RR = 1 Essai de supériorité RR = 1 Essai de non-infériorité Sit u atio n bila t érale Définition de bornes d’équivalence ; l’intervalle de confiance (IC) du risque relatif (RR) doit se situer entre ces deux bornes sans les inclure pour conclure à l’équivalence. IC comprenant une borne d'équivalence -à équivalence non démontrée IC comprenant une borne d'équivalence —> équivalence non démontrée —*---------- ■----------- ■---- » 0,9 RR = 1 IC ne comprenant aucune des 2 bornes -à équivalence démontrée 1,1 Essai d'équivalence Ex e m ples Pour s’y retrouver dans un essai de non-infériorité, il faut faire un dessin : 1. tracer le trait représentant la différence d’efficacité entre les deux traitements avec le 0 au milieu pour une différence attendue en risque absolu (ou le 1 si la différence attendue est en risque relatif) ; 2. placer la différence observée (résultat principal de l’étude) ; 3. à partir de la différence observée et du taux de réponse dans chaque bras, vous pouvez placer le traitement de référence et le nouveau traitement à droite et à gauche, ou l’inverse ; 4. placer la marge de non-infériorité du côté du traitement de référence ; 5. placer les bornes de l’intervalle de confiance ; 6. conclure en comparant les bornes de l’intervalle de confiance à la marge de non-infériorité : - si la borne est comprise dans l’intervalle, on ne peut pas accepter la noninfériorité, Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Essais de non-infériorité et d’équivalence 165 - si la borne supérieure (ou inférieure) est inférieure (ou supérieure) à la marge, on peut conclure à la non-infériorité : la perte d’efficacité est significativement inférieure à la marge. Pour s’y retrouver dans le sens de la différence, il faut regarder la valeur du critère de jugement dans chaque bras. Ex e m ple 1 On compare l’antibiothérapie par voie intraveineuse (IV) - traitement de référence - à l’antibiothérapie per os (PO) dans l’endocardite infectieuse. Le critère de jugement principal est un composite de décès, ré-hospitalisations et complications. La marge de non-infériorité (NI) fixée est de 10 points de pourcentage (on accepte de perdre au maximum 10 % d’efficacité avec le traitement PO). Le calcul d’effectif est fait pour un test de non-infériorité unilatéral avec un risque oc à 0,025. Le taux de mortalité/ré-hospitalisations/complications est de 23,1 % sous traitement IV et de 20 % sous traitement PO. La différence absolue est + 3,1 en faveur du traitement PO (IC95 : — 3,4 à + 9,6), p-value pour la NI : 0,002. IV meilleur <---------- Marge de NI -10 o/o PO meilleur '3-4 Différence observée + 3,1 o/o ----------- » 0% Voici comment on peut formuler la conclusion de cette étude : • le traitement PO est non inférieur au traitement IV ; • la perte d’efficacité liée au traitement PO, si elle existe, est significativement inférieure à 10 % ; • il y a 2,5 % de chances que la perte d’efficacité réelle liée au traitement PO soit de plus de 3,4 %. Ex e m ple 2 On compare la chirurgie ouverte (traitement de référence) à la chirurgie laparoscopique dans le cancer du rectum. Le critère de jugement principal est la récidive locorégionale. La marge de non-infériorité fixée est de 5 points de pourcentage (on accepte de perdre au maximum 5 % d’efficacité avec le traitement laparoscopique). Le calcul d’effectif est fait pour un test de non-infériorité unilatéral avec un risque a à 0,05. Le taux de récidive est de 5 % dans les deux bras. La différence absolue est de 0 point de pourcentage (IC95 : — 2,6 à + 2,6), p-value pour la non-infériorité : 0,01. Type of Lésion and Surgery Locorégional Récurrence in Intention-to-Treat Population Rate % Between-Group Différence 1 percentage points (90 % Cl) Ail lésions Laparoscopie surgery 5.0 Open surgery 5.0 0.0 (-2.6 to 2.6) Source : Bonjer HJ, Deijen CL, Abis GB, et al., for the COLOR II Study Group. A randomized trial of laparoscopie versus open surgery for rectal cancer. N Engl J Med 2015 ; 372 : 1324-32. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 166 Essais cliniques Différence de toux de récidive en points de °/o Marge de NI : 5o/o Chir ouverte meilleure Laparoscopie meilleure 0% 5 °/o -2,6 o/o + 2,6 0/0 La conclusion de cette étude peut être formulée de la façon suivante : • le traitement laparoscopique est non inférieur à la chirurgie ouverte ; • la perte d’efficacité liée au traitement laparoscopique, si elle existe, est significativement inférieure à 5 % ; • il y a 5 % de chances que la perte d’efficacité réelle liée au traitement laparoscopique soit de plus de 2,6 %. Ici, c’est un intervalle de confiance bilatéral à 90 %, il y a donc 5 % de chances que la valeur vraie de l’estimateur soit supérieure à la borne supérieure (la seule qui nous intéresse). Ex e m ple 3 Reprenons la même étude avec les résultats suivants : • chirurgie laparoscopique : 6 % de récidive ; • chirurgie ouverte : 3 % de récidive ; • Différence absolue : 3 % (IC90 % : 0,4 à 5,4). Différence de taux de récidive en points de °/o Marge de NI : 50/0 Laparoscopie meilleure La conclusion de cette étude est la suivante : • on ne peut pas conclure à la non-infériorité du traitement laparoscopique ; • la perte d’efficacité liée au traitement laparoscopique n’est pas significativement inférieure à 5 % ; • il y a 5 % de chances que la perte d’efficacité dépasse 5,4 %. Compte tenu du risque oc choisi, on ne peut pas exclure que la perte d’efficacité réelle soit de plus de 5 %. Ch oix d e l'analyse st a tistiq u e : in t e n tio n d e trait er ou p er-pro t ocole / e n trait e m en t reçu ? Dans un essai de non-infériorité ou d’équivalence, l’analyse en per-protocole ou en traitement reçu est plus conservatrice contrairement aux essais de supériorité (voir fiche 16). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Essais de non-infériorité et d’équivalence 167 L’analyse en intention de traiter (ITT) doit tout de même être réalisée, car elle seule conserve le bénéfice de la randomisation. En résumé, l’analyse du résultat d’un essai de non-infériorité doit faire apparaître une analyse per-protocole (ou traitement reçu selon les études) et une analyse en ITT que l’on espère concordantes pour conclure. À retenir Piè ges classiq u es à co n n aître L'absence de significativité sur un test de supériorité ne permet pas de dire « les traitements sont équivalents » ou « un traitement est non-inférieur à l'autre ». La définition du seuil de non-infériorité doit reposer sur des arguments cliniques. Dans les essais de non-infériorité, seul le critère d'efficacité fait l'objet d'une analyse de type « non-infériorité ». Pour les critères de tolérance, on réalise des hypothèses de supériorité ! (L'idée est bien de montrer que le nouveau traitement est mieux toléré, sinon à quoi bon mettre sur le marché un traitement non inférieur sur l'efficacité ?) En pra tique Ex e m ple 1 (ED N 2018) Bonjer HJ, Deijen CL, Abis GB, Cuesta MA, van der Pas MHGM, de Lange-de Klerk ESM, Lacy AM, Bemelman WA, Andersson J, Angenete E, Rosenberg J, Fuerst A, Haglind E, for the COLOR II Study Group. A randomized trial of laparoscopie versus open surgery for rectal cancer. N Engl J Med 2015 ; 372 : 1324-32. In this international trial conducted in 30 hospitals, we randomly assigned patients with a solitary adenocarcinoma of the rectum within 15 cm of the anal verge, not invading adjacent tissues, and without distant métastasés to undergo either laparoscopie or open surgery in a 2:1 ratio. The primary end point was locorégional récurrence 3 years after the index surgery. Laparoscopie surgery was considered to be non inferior to open surgery if the one-sided 95% confidence interval for the différence in locorégional récurrence rates excluded an absolute différence of 5 percentage points or more. With 1,000 patients who could be evaluated at a ratio of 2:1, the power of the noninferiority test was 80% at a locorégional récurrence rate of 10% in the open-surgery group. Ail analyses were performed on an intention to-treat basis. In addition, we performed as-treated analyses for locorégional récurrence, disease-free survival, and overall survival. We used the Kaplan-Meier method to compare rates of récurrence, disease-free survival, and overall survival at 3 years. The one sided 95% confidence interval for the between group différence in locorégional récurrence corresponds to the upper limit of the two-sided 90% confidence interval for this différence. For survival rates, twosided 95% confidence inter intervals were calculated. At 3 years, the rate of disease-free survival was 74.8% in the laparoscopicsurgery group and 70.8% in the open-surgery group (différence, 4.0 percentage points; 95% CI, -1.9 to 9.9). In patients with stage I or II rectal cancer, rates of disease-free survival were similar in the two groups, whereas Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 168 Essais cliniques in patients with stage III disease, the rate of disease-free survival was 64.9% in the laparoscopic-surgery group and 52.0% in the open-surgery group (différence, 12.9 percentage points; 95% CI, 2.2 to 23.6). Involved Circumferential Resection Margin and Locorégional Récurrence. Involved Circumferential Type of Resection Margin* Lésion and Surgery Patients with Finding! no./total no. ( %) BetweenGroup Différence* percentage points (95 % Cl) Locorégional Récurrence in Intentionto-Treat Population Rate% Locorégional Récurrence in As-Treated Population BetweenGroup Différence* percentage points (90 % CI) Rate% BetweenGroup Différence* percentage points (90 % CI) 0.0 (-2.6 to 2.6) 4.3 -2.0 (-4.7 to 0.7) Ail lésions Laparosco- 56/588 (10) -0.5 (-4.9 pie surgery to 3.5) 5.0 Open surgery 5.0 30/300 (10) 6.3 Upper rectal lésion Laparoscopie surgery 18/196 (9) -0.1 (-8.2 to 6.4) 3.5 Open surgery 9/ 97 (9) 2.9 0.6 (-2.9 to 4.1) 3.0 -0.9 (-4.6 to 2.8) 3.9 Middle rectal lésion Laparosco- 22/228 (10) 6.2 (0.1 to 11.2) pie surgery 6.5 Open surgery 2.4 4/115 (3) 4.1 (0.7 to 7.5) 5.7 1.6 (-2.3 to 5.5) 4.1 Lower rectal lésion Laparoscopie surgery 15/164 (9) -12.4 (-23.2 to -3.0) 4.4 Open surgery 17/79 (22) 11.7 -7.3 (-13.9 to -0.7) 3.8 -8.9 (-15.6 to -2.2) 12.7 * An involved circumferential resection margin was defined as the presence of tumor cells within 2 mm of the latéral surface of the mesorectum. This finding is a risk factor for locorégional récurrence (i.e., récurrence in the pelvic or périnéal area). f The denominator for the percentage calculation in this category was the number of patients without complété remission. f: Between-group différences were calculated by subtracting the percentage of patients with the finding in the open-surgery group from the percentage in the laparoscopic-surgery group. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Essais de non-infériorité et d’équivalence > 169 Quelle(s) est (sont) la(les) caractéristique(s) de l’analyse statistique du critère de jugement principal ? Il aurait fallu cocher... Commentaires La marge de non-infériorité était fixée à 5 points de pourcentage pour la différence d’incidence du critère de récidive locorégionale de la chirurgie laparoscopique par rapport à la chirurgie ouverte C’est bien la formulation de la marge de non-infériorité Le calcul du nombre de sujets nécessaires effectué a priori était égal à 1 000 Comme indiqué dans le texte L’estimation ponctuelle de la différence d’incidence du critère de récidive locorégionale est encadrée d’un intervalle de confiance unilatéral à 95 % Il s’agissait bien d’un intervalle de confiance unilatéral à 95 %, ce qui équivaut à utiliser un intervalle de confiance bilatéral à 90 % et à ne s’intéresser qu’à une de ces bornes (tableau ci-dessus) L’analyse principale a été réalisée en intention de traiter (ITT) Bien que ce ne soit pas l’analyse la plus conservatrice, c’est celle qui préserve le bénéfice de la randomisation. Les auteurs indiquent clairement avoir analysé les résultats en ITT La chirurgie laparoscopique est non inférieure à la chirurgie ouverte La borne supérieure de l’IC exclut la valeur 5, on peut donc faire cette conclusion La perte d’efficacité liée au traitement laparoscopique, si elle existe, est | significativement inférieure à 5 % C’est une autre manière de formuler la conclusion de non-infériorité Il n’aurait pas fallu cocher... Commentaires Une analyse supplémentaire a été réalisée en per-protocole L’analyse additionnelle a été réalisée en traitement reçu et pas en per-protocole On ne peut pas conclure à la noninfériorité car l’intervalle de confiance de la différence absolue d’efficacité contient la valeur 0 La question n’est pas « y a-t-il une différence significative entre les traitements ? », mais « la différence entre les deux traitements estelle significativement inférieure à 5 % ? » Le « 0 » n’est d’aucune utilité pour répondre à cette question Les résultats entre l’analyse en ITT et l’analyse en traitement reçu ne sont pas cohérents La conclusion est la même pour tous les critères. La différence d’efficacité pour le critère de jugement principal est significativement inférieure à 5 %. Les résultats sont donc cohérents entre les deux analyses > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 170 Essais cliniques En analyse en intention de traiter : Il aurait fallu cocher... Commentaires L’estimation ponctuelle de l’incidence de la récidive locorégionale à 3 ans était de 5 % dans les deux bras de l’essai Le taux de 5 % est en effet un estimateur ponctuel L’estimation ponctuelle de la différence d’incidence de la récidive locorégionale à 3 ans entre les deux bras de l’essai était de 0 point de pourcentage C’est le sens de between-group différence Pour plus d’informations sur le terme « estimateur ponctuel », voir la fiche 5 La borne supérieure de l’intervalle de confiance bilatéral à 90 % de la différence d’incidence de la récidive locorégionale à 3 ans entre les deux bras de l’essai était de 2,6 points de pourcentage Ce qui veut dire que cette différence à 5 % de chances d’être supérieure à 2,6 points de pourcentage Il n’aurait pas fallu cocher... Commentaires L’estimation ponctuelle de l’incidence de la récidive locorégionale à 3 ans dans le bras laparoscopie était égale à la marge de noninfériorité (5 points de pourcentage) de l’essai C’est faux car on ne peut pas comparer une différence de point de pourcentage à l’estimation ponctuelle du taux de récidive dans un bras L’incidence de la récidive locorégionale à 3 ans observée dans le bras laparoscopie (31 patients) est double de celle observée dans le bras de chirurgie ouverte (15 patients) Ne jamais oublier qu’il y a 2 fois plus de patients opérés par laparoscopie selon le principe de la randomisation en 2:1. Donc 31 patients versus 15, cela correspond bien à la même incidence de 5 % dans chaque groupe Ex e m ple 2 Cooper N, Clark J, Middleton L, Diwakar L, Smith P, Denny E, Roberts T, Stobert L, Jowett S, Daniels J. Outpatient versus inpatient uterine polyp treatment for abnormal uterine bleeding: randomised controlled non-inferiority study. BMJ 2015 ; 350 : hl398. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Essais de non-infériorité et d’équivalence 171 Margin of non-inferiority (0.75) Intention to treat ■ Six months > ------- ■------- One year i --------» Two years ! ----- *■ — Per protocol J Six months [ ■ --------- ■-------- One year • ------ *----- Two years i ------ ■------ 0.7 0.5 <----------- 1 Relative risk (95% Cl) Favours inpatient polypectomy Primary outcome (successful treatment, determined by the women’s assessment of their bleeding at six months) compared with margin of non-inferiority. La figure ci-dessus représente les résultats d’un essai de non-infériorité comparant la polypectomie utérine sous anesthésie générale nécessitant une hospitalisation complète (traitement de référence) à une prise en charge ambulatoire sous anesthésie locale sur le risque de récidive de saignements utérins. La marge de non-infériorité est une différence relative de 25 % du taux de récidive de saignement (ce qui correspond à un risque relatif de 0,75). Que pouvez-vous tirer de cette figure ? Il aurait fallu cocher... Commentaires La perte d’efficacité relative sur les saignements utérins liés à la procédure ambulatoire est significativement inférieure à 25 % Dire que le risque relatif est significativement supérieur à 0,75 équivaut à dire que la perte d’efficacité relative est significativement moindre que 25 %. Ce résultat est donné par l’intervalle de confiance du risque relatif qui exclut la valeur 0,75 Les auteurs avaient prévu de conclure à la non-infériorité si le risque relatif de récidive des saignements avec la procédure en hospitalisation complète était significativement supérieur à 0,75 Cette phrase équivaut à dire que la perte d’efficacité relative doit être significativement inférieure à 25 % La procédure ambulatoire est noninférieure à la procédure classique (inpatient polypectomy} C’est une autre manière de formuler les deux phrases précédentes Il n’aurait pas fallu cocher... Commentaires L’essai est négatif, car l’intervalle de confiance du risque relatif de récidive des saignements comprend la valeur 1 Dans ce cas, on ne compare pas la valeur du risque relatif à 1, mais à la marge de non-infériorité Compte tenu du type d’étude, il n’était pas légitime de réaliser une analyse perprotocole Il est utile de réaliser une analyse en perprotocole dans un essai de non-infériorité car c’est la plus conservatrice Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 172 Essais cliniques Ex e m ple 3 (é preuve t est 2017) Griffin D, Parsons N, Shaw E, Kulikov Y, Hutchinson C, Thorogood M, Lamb SE; UK Heel Fracture Trial Investigators. Operative versus non-operative treatment for closed, displaced, intra-articular fractures of the calcaneus: randomised controlled trial. BMJ 2014 ; 349 : g4483. We performed a large, pragmatic, randomised controlled trial in the UK National Health Service to assess whether operative care leads to better outcomes than non-operative care in patients with typical, closed, displaced intraarticular calcaneal fractures over two years after in jury. The current situation is one of uncertainty. Some orthopaedic surgeons are enthusiastic about this surgery for calcaneal fractures, and recommend it to patients. Others consider the operations to be complex, expensive, risky, and without proved benefit, and so recommend non-operative care. Pour quelles raisons les auteurs ont-ils choisi de réaliser un essai de supériorité plutôt qu’un essai de non-infériorité ? Il aurait fallu cocher... Commentaires Il n’existe pas de traitement de référence dans cette indication En l’absence de traitement de référence défini, il est légitime et éthique de réaliser un essai de supériorité Il n’aurait pas fallu cocher... Commentaires L’essai de supériorité a plus de chances d’être publié De nos jours, de plus en plus d’essais de noninfériorité sont publiés afin de comparer des traitements n’apportant pas de bénéfice sur l’efficacité mais une meilleure tolérance Le nombre de patients à inclure dans un essai de non-infériorité aurait été trop important C’est souvent numériquement vrai, mais ce n’est pas une raison valable pour ne pas faire ce type d’essai Evaluer la non-infériorité d’un traitement chirurgical n’est pas éthique C’est parfaitement éthique s’il n’y a pas d’hypothèse de supériorité Il y avait une forte préférence des chirurgiens pour l’une des stratégies Ce n’est pas un argument scientifique pour choisir le design de l’essai Ex e m ple 4 (é preuve t est 2019) The EINSTEIN-PE Investigators. Oral Rivaroxaban for the Treatment of Symptomatic Pulmonary Embolism. N Engl J Med 5 avr 2012 ; 366(14) : 1287-97. The primary efficacy outcome was symptomatic récurrent venous thromboembolism. The principal safety outcome was major or clinically relevant nonmajor bleeding. Rivaroxaban was non-inferior to standard therapy (non-inferiority margin, 2.0; P = 0.003) for the primary efficacy outcome, with 50 events in the rivaroxaban group (2.1%) versus 44 events in the standard-therapy group (1.8%) (hazard ratio, 1.12; 95% confidence interval [CI], 0.75 to 1.68). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Essais de non-infériorité et d’équivalence 173 The principal safety outcome occurred in 10.3% of patients in the rivaroxaban group and 11.4% of those in the standard therapy group (hazard ratio, 0.90; 95% CI, 0.76 to 1.07; P = 0.23). Major bleeding was observed in 26 patients (1.1%) in the rivaroxaban group and 52 patients (2.2%) in the standard-therapy group (hazard ratio, 0.49; 95% CI, 0.31 to 0.79; P = 0.003). Rates of other adverse events were similar in the two groups. Le rapport de risques instantanés {hazard ratio) de récidive d’événements thromboemboliques veineux est de 1,12 (intervalle de confiance à 95 %, 0,75 à 1,68) pour le groupe « rivaroxaban » comparativement au groupe « prise en charge conventionnelle ». Ce résultat permet de conclure à la non-infériorité du rivaroxaban pour le critère principal d’efficacité car : Il aurait fallu cocher... Commentaires Le degré de signification du test de non-infériorité est de 0,003 Un test de non-infériorité statistiquement significatif permet de conclure à la non-infériorité La borne supérieure de l’intervalle de confiance à 95 % du rapport de risques instantanés est inférieure à 2,00 Le hazard ratio représente ici le rapport entre le risque instantané de récidive d’événement thromboembolique du groupe « rivaroxaban » sur ce même risque dans le groupe « prise en charge conventionnelle ». Le choix d’une marge de non-infériorité à 2,00 (noninferiority margiri) signifie que si la borne supérieure de l’intervalle de confiance du hazard ratio ne va pas au-delà de cette marge, on pourra conclure à la non-infériorité (voir figure ci-dessous) Le plus simple pour s’y retrouver dans les études de non-infériorité est de faire un schéma Borne inf IC95-0.75 HR”1'12 Borne sup IC95-1.68 Borne de nnn infériorité HR = 1 HR = 2 I I <---------------------- ------------------------------ > Réduction du risque sous rivaroxaban par rapport à la PEC conventionnelle Augmentation du risque sous rivaroxaban par rapport à la PEC conventionnelle Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 174 Essais cliniques Il n’aurait pas fallu cocher... Commentaires Les bornes de l’intervalle de confiance à 95 % du rapport de risques instantanés incluent la valeur 1,00 Le hazard ratio vaut 1 si les risques de survenue de l’événement sont les mêmes dans les 2 groupes. C’est par rapport à cette valeur que l’on conclut sur un jugement de supériorité Le test de supériorité est non significatif (valeur de p = 0,57) Un test de supériorité permet de conclure sur la supériorité et non pas sur la non-infériorité L’estimation ponctuelle du rapport de risques instantanés (1,12) est comprise entre les bornes de son intervalle de confiance à 95 % Une estimation ponctuelle est par définition toujours comprise entre les bornes de son intervalle de confiance Le rapport de risques instantanés (hazard ratio) d’événement hémorragique majeur est de 0,49 (intervalle de confiance à 95 %, 0,31 à 0,79, valeur de p < 0,003) pour le groupe « rivaroxaban » comparativement au groupe « prise en charge conventionnelle ». Ce résultat peut s’expliquer par : Il aurait fallu cocher... Commentaires Le risque d’erreur statistique de première espèce Ces deux propositions renvoient aux raisons possibles d’une résultat significatif (voir fiche 19). Un résultat peut être significatif soit en raison du hasard (risque de première espèce), soit en raison d’un biais, soit car il existe une réelle association Une réduction du risque hémorragique sous rivaroxaban comparativement à la prise en charge conventionnelle dans la population dont est issu l’échantillon d’étude Il n’aurait pas fallu cocher... Commentaires Un défaut de puissance statistique Un défaut de puissance statistique pourrait expliquer un résultat non significatif La valeur choisie pour la marge de non-infériorité (2,00) Cette question a été choisie pour illustrer cette fiche pour bien faire comprendre qu’une analyse de tolérance (qui fait généralement partie des objectifs secondaires) est toujours une analyse de supériorité même au cours d’une étude dont l’objectif principal est évalué sous l’hypothèse de non-infériorité. Donc, la borne de non-infériorité n’intervient pas dans l’interprétation de l’analyse de tolérance ici Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 18 Analyse en sous-groupes En complément V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l e s a n a l y s es d e so u s- g ro u p e : h t t ps: / / y o u t u .b e / SV yl _ A W Jz q Q o D éfinitio n e t princip e Dans un essai clinique, une analyse en sous-groupes consiste à étudier l’effet du traitement séparément dans plusieurs groupes correspondant aux différentes catégories d’une caractéristique donnée. Par exemple, on peut découper l’échantillon en deux classes de la caractéristique « âge » (< 65 ans et > 65 ans) ou encore en quatre classes de la caractéristique « stade de la maladie » (stade I, stade II, stade III et stade IV), etc. L’analyse statistique de l’effet du traitement appliquée dans ces sous-groupes a pour objectif de mettre en évidence des populations particulières pour lesquelles le traitement paraîtrait particulièrement efficace ou au contraire particulièrement délétère. L’analyse en sous-groupes permet également la formulation d’hypothèses quant aux raisons expliquant qu’un essai soit négatif ou positif : • en cas d’essai négatif (résultat non significatif sur le critère de jugement principal), on cherche à mettre en évidence une population pour laquelle le traitement paraît bénéfique, ce qui permettrait éventuellement de réaliser un nouvel essai exclusivement avec ce type de population ; • en cas d’essai positif (résultat significatif sur le critère de jugement principal), on s’attache à regarder dans quels sous-groupes le traitement paraît le plus efficace. De plus, on regarde dans quels sous-groupes le traitement paraît délétère malgré la positivité de l’essai, ce qui entraînera un signal de prudence dans une population particulière. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 176 Essais cliniques Il s’agit donc d’analyses exploratoires permettant une ouverture ou la formulation d’hypothèses, mais la conclusion principale d’un essai ne repose jamais sur les résultats de ces analyses en sous-groupes. L’analyse en sous-groupe de l’effet du traitement est habituellement représentée dans un essai clinique par une figure appelée diagramme en forêt ou forest plot, permettant de visualiser l’effet du traitement dans tous les sous-groupes. Co m m e n t in t erpré t er une analyse en so us-gro u p es ? Existe-t-il une homogénéité entre les sous-groupes ? On dit que l’effet du traitement est homogène entre les différents sous-groupes des différentes classes lorsqu’ils ont tous la même tendance (risques relatifs globalement tous inférieurs à 1 ou tous supérieurs à 1, différences de moyennes globalement toutes inférieures à 0 ou toutes supérieures à 0, etc.). Si ce n’est pas le cas, on dit que les résultats sont hétérogènes. Le traitement a-t-il un effet particulier au sein d'un sous-groupe ? On raisonne de la même manière que pour l’analyse du critère de jugement principal en regardant l’intervalle de confiance (IC) à 95 % de la mesure d’association utilisée : • pour un risque relatif (RR) ou un hazard ratio (HR), l’association est significative si l’IC95 % ne comprend pas la valeur 1 ; • pour une différence absolue de moyenne ou de pourcentage, l’association est significative si l’IC95 % ne comprend pas la valeur 0. On retrouve dans certains articles en face de chaque ligne de chaque sousgroupe un p de signification [p-value) qui correspond à un test statistique (un test par sous-groupe) dont les résultats concordent avec les résultats de l’intervalle de confiance à savoir : • IC95 % d’un RR ne comprenant pas la valeur 1 : p < 0,05 ; • IC95 % d’un RR comprenant la valeur 1 : p > 0,05. L'effet du traitement est-il significativement différent entre les sous-groupes d'une même caractéristique ? Il est nécessaire pour cela de regarder les résultats du test d’hétérogénéité (ou test d’interaction). Un test d’interaction compare les résultats entre les sous-groupes d’une même caractéristique. À la différence des tests de significativité [p-value) de la mesure d’association dans chaque sous-groupe, il n’y a qu’un seul test (et donc une seule p-value) pour l’ensemble des catégories de la variable (un test pour les hommes et un test pour les femmes = test de significativité chez les hommes et les femmes ; un seul test pour la variable « sexe » = test d’interaction) : • si le p du test d’interaction est inférieur à 0,05, cela signifie que le traitement a de manière significative une efficacité différente entre les modalités d’une variable. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse en sous-groupes 177 On peut ainsi qualifier le sous-groupe en question de modificateur de l’effet du traitement ; • si le p du test d’interaction est supérieur à 0,05, cela signifie qu’il n’y a pas de différence d’efficacité significative entre les sous-groupes de la caractéristique correspondante (et ce, même si l’IC95 % d’une des RR ne prend pas la valeur 1), il n’y a donc pas de modification de l’effet en fonction du sousgroupe. En pratique Ex e m ple 1 On compare ici un nouveau traitement, le romosozumab, à l’alendronate dans le traitement de l’ostéoporose. Favor Romosozumab Favor Alendronate P for interaction OVERALL >70 years <70 years BMI>30 BMI<30 Previous treatment No Previous treatment 0.08 North Europe South Europe Africa America Relative Risk for chmcal fracture BMI : body mass index. Le critère de jugement principal est la survenue d’une fracture osseuse. L’analyse en sous-groupes de l’étude est la suivante : • la ligne verticale grise représente un RR de fracture égale à 1 ; • les losanges orange clair représentent le RR de chaque sous-groupe positionné par rapport à la ligne grise représentant le RR = 1 ; • les carrés orange représentent les bornes des IC95 % de chaque RR ; • un RR < 1 est en faveur du romosozumab, le groupe « alendronate » étant choisi comme groupe témoin ; • la ligne Overall (ou souvent notée aussi Ail patients) correspond au résultat principal de l’étude, car elle prend en compte tous les patients (ce n’est donc pas un sous-groupe). Ici, on remarque que le RR < 1 et son IC95 % ne comprend pas la valeur 1. Donc le résultat principal de l’étude est positif en montrant une supériorité significative du romosozumab par rapport à l’alendronate ; Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 178 Essais cliniques • on retrouve ici quatre variables - âge, indice de masse corporelle ou IMC (body mass index ou BMI), notion de traitement antérieur, origine ethnique elles-mêmes stratifiées en plusieurs sous-groupes (les catégories de la variable) ; • les valeurs à droite correspondent bien à des tests d’interaction, car on n’en retrouve seulement une par variable et non pas une à chaque ligne de résultat ; • on remarque que les résultats sont homogènes, en faveur du romosozumab puisque la majorité des RR sont inférieurs à 1 ; • au sein de la caractéristique « âge », le romosozumab a une efficacité statistiquement supérieure à l’alendronate dans le sous-groupe des patients de plus de 70 ans, car l’IC95 % du RR ne comprend pas la valeur 1. L’association n’est par contre pas significative dans le sous-groupe des patients de moins de 70 ans. Par contre la valeur du p d’interaction montre qu’il n’y a pas de différence d’efficacité entre ces deux sous-groupes car il est supérieur à 0,05 (p = 0,43) ; • au sein de la caractéristique IMC, il semble que l’analyse de l’effet du RR du sous-groupe des patients avec un IM > 30 manque de puissance, l’IC95 % du RR étant très large. Le nombre de patients avec un IMC > 30 doit être très faible dans cette étude ; • l’utilisation ou non d’un traitement antérieur ne semble pas influencer l’efficacité du romosozumab comparé à l’alendronate. Le p d’interaction est supérieur à 0,05, donc pas de différence d’efficacité entre les deux sous-groupes ; • en revanche, le traitement par romosozumab est significativement plus efficace en comparaison avec l’alendronate chez les patients d’Europe du Nord et du continent américain, le p d’interaction étant inférieur à 0,05 (p = 0,03). Il y a une interaction significative entre l’effet du traitement et l’origine géographique. Ex e m ple 2 Subgroup Placebo Traitement P Value for Interaction Hazard Ratio (95% Cl) no. ofeve'nts/total no. Overall Age <65 yr >65 yr PSA <10 ng/ml >10 ng/ml 245/367 223/364 |------ -1 0.84(0.70-1.01) l_ 78/131 167/236 58/122 |------- --------- ÿ |-------- 1-| 165/242 151/241 93/125 140/238 |------- H 83/126 |---------------- |J 0.56 0.73 (0.52-1.02) 0.88 (0.71-1.09) i 0.06 «-------------- -------------- > Treatment bettter Placebo better 0.91 (0.72-1.14) 0.73 (0.54-0.98) Source : Wilt TJ, Jones KM, Barry MJ, et al. Follow-up of prostatectomy versus observation for early prostate cancer. N Engl J Med 2017 ; 377 : 132-42. • Dans cet exemple, on peut dire que l’effet global du traitement n’est pas significatif : l’intervalle de confiance du HR pour la ligne Overall comprend la valeur 1. • Concernant l’âge : - l’effet du traitement n’est pas significatif dans le groupe « < 65 ans » ni dans celui « > 65 ans » (l’intervalle de confiance de ces deux catégories comprend la valeur 1) ; Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse en sous-groupes 179 - l’effet du traitement n’est pas significativement différent entre les deux catégories d’âge (p = 0,56), ou encore, il n’y a pas d’interaction significative entre l’âge et l’effet du traitement. L’âge n’est pas un modificateur de l’effet du traitement. • Concernant le prostate-specific antigen (PSA), l’effet du traitement est significatif dans le groupe des patients avec un PSA >10 ng/mL, mais pas chez les patients avec un PSA <10 ng/mL. Pour autant, le traitement n’est pas significativement plus efficace chez les patients avec un PSA > 10. Il n’y a pas d’interaction significative entre le traitement et le dosage de PSA. Ex e m ple 3 No. of Patients No. of Events 1 I I I 12-mo 36-mo 12-mo 36-mo Group Group Group Group A<9!^ HR (95o/o Cl) Favors 36 mo of Imatinib >65 121 78 135 63 45 39 32 18 0.47 (0.30-0.74) 0.49 (0.28-0.85) —■— Tumor mutation site KIT exon 9 KIT exon 11 Wild type Other 12 129 19 28 14 127 14 23 8 55 9 6 8 28 3 4 0.61 (0.22-1.68) 0.35 (0.22-0.56 0.41 (0.11-1.51 0.78 (0.22-2.78) ---------- ■— —■— Favors 12 mo of Imatinib P Value <.001 <.00 --- ■--- .34 <.001 .17 .70 ■----- 0'1 1. 0 1'0 Source : Joensuu H, Eriksson M, Sundby Hall K, et al. One vs three years of adjuvant imatinib for opérable gastrointestinal stromal tumor: a randomized trial. JAMA 2012 ; 307(12) : 1265-72. Dans cet exemple, il existe une p-value pour chaque catégorie. Il est donc implicite que ce qui est testé est la significativité du HR (information concordante avec celle donnée par l’intervalle de confiance) et non l’interaction entre l’effet du sous-groupe et l’effet du traitement. Il faut faire attention à bien faire la différence entre le p d’interaction et la p-value : • p d’interaction : - teste la différence d’efficacité entre plusieurs sous-groupes d’une même caractéristique, - un seul test par caractéristique (= un test toutes les deux à trois lignes de résultats en fonction du nombre de sous-groupes au sein de chaque caractéristique) ; • p-value : - teste si l’effet du traitement au sein d’un sous-groupe est significatif ; - un test par sous-groupe (= un test par ligne de résultat). Limit es d e l'analyse en so us-gro u p es • Il s’agit seulement d’une analyse exploratoire : il est tout à fait possible de dire que le traitement a sur le plan statistique une meilleure efficacité au sein d’un sous-groupe, mais les résultats principaux de l’étude ne peuvent en aucun cas reposer sur ce résultat. Si un traitement semble délétère dans un sous-groupe donné, ceci peut en revanche inciter à la prudence. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 180 Essais cliniques • Inflation du risque oc : à chaque réalisation d’un test, on rappelle qu’il existe 5 % de risque (risque a) de conclure à tort à une différence. Une analyse en sous-groupes a comme conséquence de multiplier le nombre de tests statistiques et donc de multiplier par la même occasion ce risque. • Inflation du risque [3 (= manque de puissance) : en découpant l’échantillon en plusieurs sous-groupes pour réaliser ce type d’analyse, on diminue le nombre de sujets par groupe. Or l’effectif de l’étude n’a pas été calculé en prenant en compte toutes ces analyses. Il existe donc une perte de puissance statistique ce qui correspond également à une inflation du risque p (rappel : puissance = 1 — P). On diminue le risque de conclure à une différence qui existe réellement. On remarque généralement les sous-groupes qui manquent le plus de puissance par la largeur plus importante de leur intervalle de confiance. En pra tique Ex e m ple 1 (é preuve t est 2017) Griffin D, Parsons N, Shaw E, Kulikov Y, Hutchinson C, Thorogood M, Lamb SE; UK Heel Fracture Trial Investigators. Operative versus non-operative treatment for closed, displaced, intra-articular fractures of the calcaneus: randomised controlled trial. BMJ 2014 ; 349 : g4483. We performed a large, pragmatic, randomised controlled trial to assess whether operative care leads to better outcomes than non-operative care in patients with typical, closed, displaced intra-articular calcaneal fractures over two years after injury. Patients who consented to participate were randomised 1:1 to receive operative or non-operative care, using a mimimisation algorithm for centre, smoking status, diabètes, bilaterality, and Sanders classification. The table shows estimated treatment effects for subgroups according to Sanders classification; a formai interaction test in the régression analysis showed no evidence (P = 0.697) that the effect of surgery was affected by fracture severity (Sanders classification). Différence (95 % Cl) Non-operative Operative Outcomes No Ail participants 69 69.8 (21.8) 74 65.7 (23.7) 4.1 0.0 (-7.1 0.993 to 7.0) Sanders 2 33 74.3 (20.4) 34 70.3 (24.9) 4.0 1.0 (-8.9 0.842 to 10.9) Sanders 3 or 4 34 66.1 (21.9) 38 63.0 (22.2) 3.3 3.1 (—7.6 0.571 to 13.8) Values No Values Raw Adjusted P value Primary outcome (Kerr-Atkins score) Subgroups Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse en sous-groupes 181 Concernant les analyses en sous-groupes : Il aurait fallu cocher... Commentaires Le test d’interaction évalue si l’effet traitement diffère significativement selon la classification de Sanders Ce test permet de savoir si l’effet du traitement évalué est différent selon le sous-groupe considéré, ici la sévérité initiale de la fracture selon la classification de Sanders On peut interpréter le résultat pour la classification de Sanders car cette analyse était planifiée On peut tout « interpréter » que ce soit planifié ou non... Il n’y a pas d’interaction significative entre le traitement et la classification de Sanders Ce résultat est donné par le test d’interaction dans le texte (p = 0,967) L’effet du traitement est homogène entre les catégories de la classification de Sanders Ce résultat est donné par le test d’interaction Il n’aurait pas fallu cocher... Commentaires On peut interpréter le résultat pour la classification de Sanders, car la randomisation par minimisation a permis de limiter des déséquilibres sur ce critère La randomisation (minimisée sur la classification de Sanders) a vocation à équilibrer le type d’atteinte selon la classification de Sanders entre les groupes. La question de l’évaluation du critère de jugement dans chacun des sousgroupes Sanders est indépendante de cette randomisation Les auteurs auraient dû multiplier les analyses en sous-groupes pour augmenter la probabilité d’observer des différences significatives En multipliant les analyses en sous-groupes, ils augmentent effectivement la probabilité d’observer des différences significatives, mais ils ne « devaient » pas le faire On peut affirmer qu’il n’y a pas d’interaction significative entre la classification de Sanders et l’effet du traitement car les p-values pour les deux sous-groupes étudiés sont de 0,842 et 0,571 C’est le test d’interaction qui permet de faire cette affirmation et non le test de l’effet de la mesure d’association dans chacune des catégories L’effet du traitement n’était pas significatif dans le groupe Sanders 2, ce qui est cohérent avec l’intervalle de confiance qui comprend la valeur 1 Il s’agit ici d’une différence absolue (car elle peut prendre des valeurs négatives) du score de Kerr-Atkins. On s’intéresse donc à la valeur neutre 0 et pas au 1 comme pour un risque relatif > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 182 Essais cliniques Ex e m ple 2 Atroshi I, Flondell M, Hofer M, Ranstam J. Méthylprednisolone injections for the carpal tunnel syndrome: a randomized, placebo-controlled trial. Ann Intern Med 2013 ; 159(5) : 309-17. Le tableau ci-dessous est issu d’un essai clinique comparant l’injection locale de méthylprednisolone à un placebo dans le traitement du canal carpien sur la variation d’un score de symptôme de 0 à 10. Prespecified Subgroup Analyses of the CTS Symptom Severity Score at 10 Weeks. Subgroup Méthylprednisolone''^ Placebo* Différence in Score Change (95 % Cl)* P Value for Interaction Duration of symptoms >1 y -1.02 (0.97) -0.22 (066) -0.81 (-1.20 to -0.43) <ly -1.19(1.0) -0.78 (0.53) -0.41 (- 1.51 to 0.69) Moderately or severely abnormal -1.16 (097) -0.31 (0.70) -0.87 (-1.25 to -0.48) Normal or mildly abnormal -0.49 (0.85) -0.23 (0.54) -0.26 (-1.26 to 0.75) 0.47 Nerve conduction tests <0.001 Baseline CTS symptom severity score >3.0 -1.33 (1.06) -0.30(0.72) 1.02 (-1.54 to -0.51) <3.0 -0.68 (0.71) -0.29 (0.62) -0.38 (-0.82 to 0.05) <0.001 CTS = carpal tunnel syndrome. * Values are mean (SD) changes from baseline. fPatients who received méthylprednisolone were combined into 1 group because of relatively small number of patients in the prespecified subgroups. fMixed-model analysis of change in symptom severity score from baseline to 10 weeks, adjusting for the baseline score. Il est vrai que : Il aurait fallu cocher... Commentaires L’effet de la méthylprednisone n’est pas significatif dans le groupe des patients avec des symptômes datant de moins de 1 an Ce résultat est donné par la lecture de l’intervalle de confiance de la différence dans ce groupe qui exclut la valeur 0 (différence absolue) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse en sous-groupes Il aurait fallu cocher... 183 Commentaires La durée des symptômes n’a pas d’influence significative sur l’efficacité du traitement C’est la signification du test d’interaction non significatif (p = 0,47) Dans le groupe « score CTS à baseline < 3 », l’effet de la méthyprednisolone n’était pas significatif Ce résultat est donné par l’intervalle de confiance du sous-groupe considéré qui inclut la valeur 0 (- 0.82 to 0.05) Il existe une interaction significative entre la valeur du score CTS à baseline et l’effet de traitement par méthyprednisolone C’est attesté par le p d’interaction < 0,05 L’absence d’effet du traitement dans le sous-groupe des symptômes < 1 an est possiblement liée à un manque de puissance L’étude n’ayant pas été conçue pour cette comparaison, il est tout à fait possible que l’analyse dans ce sous-groupe souffre d’un défaut de puissance (pas assez de patients dans ce groupe) Il n’aurait pas fallu cocher... Commentaires Le traitement est significativement plus efficace chez les patients avec des symptômes plus anciens que chez les autres L’interaction entre le traitement et la durée des symptômes n’est pas significative (p - 0,47), on ne peut donc pas faire cette conclusion quand bien même l’effet du traitement est significatif dans un groupe et pas dans l’autre L’effet du traitement est homogène dans les catégories de la variable « anomalies de la conduction nerveuse » C’est une autre manière de formuler le fait que le test d’interaction soit négatif (ou > 0,05) Les résultats dans chaque sous-groupe sont montrés sous la forme d’une différence relative d’amélioration des symptômes C’est une différence absolue de score (voir fiche 5) Ce traitement ne doit pas être recommandé chez les patients avec un score CTS < 3 La conclusion principale de l’essai porte sur le résultat global, pas sur le résultat d’un sous-groupe Ex e m ple 3 (ED N 2021) Cappuzzo F, Ciuleanu T, Stelmakh L, Cicenas S, Szczésna A, Juhâsz E, et al. Erlotinib as maintenance treatment in advanced non-small-cell lung cancer: a multicentre, randomised, placebo-controlled phase 3 study. Lancet Oncol juin 2010; 11(6): 521-9. We designed the phase 3, placebo-controlled Sequential Tarceva in Unresectable non-small-cell lung cancer study to assess use of erlotinib as maintenance therapy in patients with non-progressive disease following first-line platinum doublet chemotherapy. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 184 Essais cliniques HR (95«* d) B N Ail 889 I-- ---- 1 0.81 (0.70-0.95) IIIB 225 664 —f I------ •--|--- £-- 1 0.81 (0.59-1.11) IV I----- •— ----- 1 I--- •-- 1 0.86(0.65-1.13) Stage 0.81 (0.68-0.97) ECOG PS 0 280 1 609 0.78 (0.65-0.94) Smoking status Never smoker 152 Former smoker 244 Current smoker 493 H I----- ♦-----I---- •--I—• -I 0.69(0.45-1.05) 0.75 (0.56-1.00) 0.88(0.72-1.08) Age <65 years 590 >65 years 299 I-- •-- 1 I--- •— ------ 1 0.78 (0.65-0.95) 0.88(0.68-1.15) Ethnie origin White 746 Asian 131 f 0.86 (0.73-1.01) -| I------- •------- 0.66(0.42-1.05) Sex Male 659 Female 230 H 0.88(0.74-1.05) I----- •----- 1 0.64 (0.46-0.91) Histology Squamous-cell 360 Adenocarcinoma 403 I--- •— —| I—•--- 1 0.4 0.6 Favours erlotinib 0.8 1.0 0.86(0.68-1.10) 0.77 (0.61-0.97) 1.2 1.4 Favours placebo Subgroup analyses of overall survival. For progression-free survival, only the interactions between treatment effect and ethnie origin (p=0.01) and treatment effect and sex (p=0.04) were significant. For overall survival, only the interaction between treatment effect and ethnie origin (p=0.03) was significant. The size of the circles are proportional to the number of patients in each group. HR= hazard raio. ECOG = Eastern Cooperative Oncology Group. À propos de la figure B concernant la survie globale (une ou plusieurs propositions attendues) : Il aurait fallu cocher... Commentaires On ne peut pas exclure que le statut tabagique soit un modificateur de l’efficacité de l’erlotinib sur la survie globale Dans la légende de la figure 3, il est précisé que seul l’effet d’interaction entre le traitement et l’origine ethnique était significatif. Cependant, on remarque une tendance à une diminution de l’effet de l’erlotinib en fonction de la gradation du statut tabagique avec un HR à 0,69 pour les non-fumeurs, à 0,75 pour les anciens fumeurs et à 0,88 pour les fumeurs actifs. Il y a une sorte d’effet dose qui laisse supposer que l’effet de l’erlotinib pourrait être modifié par le statut tabagique. Le test d’interaction non significatif pourrait s’expliquer par un manque de puissance et un test non significatif ne permet pas d’exclure une association. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse en sous-groupes 185 Il aurait fallu cocher... Commentaires Le bénéfice de l’erlotinib en matière de survie globale pourrait être d’autant plus important que les patients sont d’origine asiatique Le test de l’interaction entre origine ethnique et effet du traitement est significatif et l’effet du traitement semble un peu plus important au sein de la population asiatique par rapport à la population caucasienne (HR à 0,66 vs 0,86) même si les deux intervalles de confiance comprennent la valeur 1. L’intervalle de confiance correspondant à la population asiatique est très large du fait d’un faible effectif et il manque donc une puissance suffisance pour montrer un effet significatif dans ce sous-groupe Il n’aurait pas fallu cocher... Commentaires Il n’y a pas d’inflation du risque alpha car tous les sous-groupes ont été prédéfinis Que les tests en question soient prévus à l’avance ou non ne modifie aucunement ce risque statistique Seuls les sous-groupes ayant servi à la stratification de la randomisation peuvent être testés Il ne faut pas confondre la stratification de la randomisation, dont l’objectif est de forcer la comparabilité des groupes sur certaines caractéristiques initiales, et la stratification de l’analyse en sous-groupes. L’une est indépendante de l’autre L’erlotinib est efficace sur la survie globale uniquement chez les patients avec un stade IV L’effet du traitement chez les patients avec un stade IIIB correspond à un HR à 0,81 avec un IC à 95 % incluant la valeur 1 alors que l’effet du traitement chez les patients avec un stade IV correspond à un HR à 0,81 avec un IC à 95 % excluant la valeur 1. Cependant, il n’y a pas d’interaction significative entre le stade du cancer et le traitement (le stade du cancer n’est pas un modificateur de l’effet du traitement). Un manque de puissance explique très probablement le fait que l’intervalle de confiance à 95 % de l’effet du traitement des patients au stade IIIB inclut la valeur 1 car ces patients sont sous-représentés par rapport aux stades IV (l’IC est beaucoup plus large) > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 186 Essais cliniques Ex e m ple 4 (ED N 2019) Galimberti V, Cole BF, Zurrida S, Viale G, Luini A, Veronesi P, et al. Axillary dissection versus no axillary dissection in patients with sentinel-node micrometastases (IBCSG 23-01): a phase 3 randomised controlled trial. Lancet Oncol avr 2013 ; 14(4) : 297-305. HR (Cl) Events/N AD No AD <2 cm 42/316 33/322 0.77 (0.42-1.39) 2-2.9 cm 21/106 16/112 0.73 (0.31-1.72) >3 cm 6/35 6/28 0.99 (0.21-4.70) Tumour size Oestrogen-receptor status Négative 11/51 11/40 1.14(0.37-3.44) Positive 58/409 44/425 0.73 (0.44-1.22) Progesterone-receptor status Négative 20/108 23/115 1.12 (0.51-2.46) Positive 49/352 32/350 0.66 (0.37-1.18) 0.39 (0.13-1.17) Tumour grade Grade 1 18/118 5/90 Grade II 22/214 24/241 1.03 (0.48-2.22) Grade III 29/129 26/135 0.78 (0.39-1.57) Type of surgery Mastectomy 6/44 3/42 0.52 (0.09-3.10) Breast-conserving 63/420 52/425 0.81 (0.50-1.32) AH patients 69/464 55/467 0.78 (0.55-1.11) 99o/o Cl 95% Cl o.25 Favours no AD 0.5 0.75 1.5 2 Favours AD Analysis of subgroups defined by tumour size, oestrogen-receptor status, progesterone-receptor statustumour grade and type of surgery by intention-to-treat (n= 931) HRs compare no axillary dissection versus axillary dissection among subgroups of the intention-to-treat population. Each subgroup HR is shown as a black square being inversely proportional to the variance of the corresponding log-HR estimate (ie, larger squares indicate lower variability in the estimate). The Hr for ail patients is shown as a diamond. The horizontal axis is displayed on a logarithmic scale. À propos de la figure ci-dessus {une ou plusieurs réponses possibles) : Il aurait fallu cocher... Commentaires Des intervalles de confiance à 99 % ont été utilisés pour chaque sous-groupe afin d’être conservateur compte-tenu de la multiplicité des tests Les auteurs prennent en compte l’inflation du risque alpha qui est typique des analyses en sous-groupe du fait de la multiplicité des tests. Ils fixent donc le risque de lre espèce à 1 % au lieu de 5 % Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse en sous-groupes Il aurait fallu cocher... Commentaires Il ne semble pas exister de modificateurs de l’effet de l’absence de curage ganglionnaire sur la survie sans récidive Il n’y a pas eu de tests d’interaction réalisés mais visuellement les résultats des sous-groupes de la catégorie correspondante semblent homogènes Il n’aurait pas fallu cocher... Commentaires La non-infériorité n’est démontrée pour aucune taille de tumeur, rendant l’étude non concluante en réalité Les analyses en sous-groupe sont exploratoires. On ne conclut pas avec ce type d’analyse qui manquent de puissance et dont l’interprétation est limitée par l’inflation du risque de lre espèce Des intervalles de confiance à 99 % ont été utilisés pour chaque sous-groupe afin de tenir compte du défaut de puissance statistique La seule manière d’augmenter la puissance de ce type d’analyse serait d’augmenter la taille de l’échantillon L’effet du curage ganglionnaire axillaire sur la survie sans récidive varie en fonction de la présence de récepteurs à la progestérone Il existe peut-être un essai visuel mais on ne peut pas l’affirmer catégoriquement du fait de l’absence de test d’interaction réalisé 187 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 19 Conclusion de l’étude et critique des résultats Résulta ts sur le crit ère de ju g e m e n t principal • On rappelle que le critère de jugement principal permet de répondre à la question posée par la formulation de l’objectif principal. • Chaque essai est censé avoir été construit avec une puissance suffisante pour espérer montrer une différence significative sur le critère de jugement principal. • Donc il faut que l’essai soit significatif sur le critère de jugement principal pour qu’il soit considéré comme positif. • Afin de le retrouver de manière certaine, c’est le critère sur lequel se sont basés les auteurs pour calculer le nombre de sujets nécessaires. Résult ats sur les crit ères d e ju g e m e n t seco n d aires • On rappelle que les critères de jugement secondaires permettent de répondre aux questions posées par la formulation des objectifs secondaires. • On a le droit de conclure sur la significativité d’un critère de jugement secondaire avec les mêmes exigences sur le plan statistique. • Mais ce ne sont pas sur ces résultats que va reposer la conclusion principale de l’essai. V alidit é in t ern e / validit é e x t ern e Une fois le résultat d’un essai obtenu, il est nécessaire de se poser la question de la valeur de ce résultat. Validité interne La validité interne renvoie à la notion de rigueur méthodologique. La validité interne correspond à la fiabilité des résultats à l’intérieur de l’échantillon d’étude. On se pose la question suivante : les résultats présentés sont-ils fiables (justes ? exacts ?) au sein de notre échantillon ? Les essais avec la validité interne la plus forte sont ceux répondant aux critères de bonne qualité méthodologique : La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 190 Essais cliniques • l’essai est-il randomisé ? Contre placebo ou groupe contrôle ? En double insu ? • les groupes sont-ils initialement comparables et suivis de manière identique ? • les perdus de vue ne sont-ils pas trop nombreux et sont-ils pris en compte dans l’analyse finale par une technique adéquate ? • les éventuels biais de confusion sont-ils bien identifiés et bien pris en compte ? • la mesure du critère de jugement principal est-elle objective, bien définie et réalisée en aveugle de façon identique dans les deux groupes ? Validité externe La validité externe correspond à la possibilité ou non de généraliser les résultats à la population cible. On se pose la question de savoir si les résultats sont fiables au sein d’une population plus large que celle de notre échantillon. Evaluer la validité externe d’une étude consiste également à mettre en perspective les résultats avec ceux déjà publiés dans la littérature sur le même sujet. Cela permet de vérifier ainsi qu’il existe ou non une cohérence bibliographique. Des résultats reproductibles confèrent une force supplémentaire à la généralisation des résultats. Gé n éralisa tio n d es résult ats On a vu que la généralisation des résultats correspond à la validité externe de l’étude. Les résultats sont-ils fiables à l’extérieur de l’échantillon d’étude ? Ce qui revient à dire : peut-on généraliser les résultats à une population plus grande ? Autrement dit, y a-t-il un biais de sélection ? Dans les essais cliniques, la généralisation des résultats peut être parfois difficile, notamment lorsque l’on sélectionne des populations très particulières. L’échantillon d’étude devient alors moins représentatif de la population cible. On pourra alors souvent généraliser les résultats seulement aux patients présentant les mêmes critères d’inclusion et d’exclusion de notre échantillon. De la même manière, le choix de la population source peut limiter la généralisation lorsqu’on choisit une population elle-même avec des caractéristiques particulières (exemple : recrutement en centre de référence versus recrutement dans les cabinets de médecine générale). De plus, la perte de suivi de certains patients peut aggraver la perte de représentativité (biais d’attrition). Pertin e nce cliniq u e du résulta t Quel est l’impact des résultats sur la prise en charge des patients ? Le caractère significatif sur le plan statistique ne préjuge en rien de l’importance du bénéficie du traitement attendu pour le patient. On se pose alors principalement les questions suivantes : • cet effet a-t-il une signification clinique importante ? • le critère de jugement principal est-il cliniquement pertinent ? • l’efficacité obtenue est-elle cliniquement intéressante ? Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Conclusion de l’étude et critique des résultats 191 Exemples : • diminution de 20 % de mortalité à 1 an = impact clinique important, avec efficacité très intéressante portant sur un critère de jugement cliniquement pertinent ; • amélioration de 10 mètres du périmètre de marche à 6 mois = faible impact pour le patient, critère de jugement cliniquement pertinent mais efficacité pas très intéressante cliniquement ; • diminution plus rapide du taux de C-reactive protein (CRP) sans amélioration de la mortalité et du temps d’hospitalisation = aucun impact pour le patient, critère de jugement non cliniquement pertinent. Raiso ns p ossibles d'un essai p ositif ou d'un essai n é g a tif • Un essai peut être positif parce que : - l’effet du traitement est réel (situation idéale) ; - il existe un biais de mesure différentiel (lié à l’absence d’aveugle, par exemple) entraînant une surestimation de l’effet du traitement ; - les groupes ne sont pas comparables (échec de la randomisation), un facteur de confusion explique la différence entre les groupes (patients moins graves dans le groupe « traitement », par exemple) ; - le résultat est lié aux fluctuations d’échantillonnage (on se retrouve dans les 5 % de chances de conclure à tort à une différence, ce qui correspond au risque oc). • Un essai peut être négatif parce que : - l’effet du traitement est réellement inexistant ; - l’effet existe, mais il est masqué par la présence de biais entraînant une erreur systématique de classification du critère de jugement principal avantageuse dans le groupe contrôle (biais de mesure différentiel), ou une erreur systématique de classification du critère de jugement principal de manière équivalente dans les deux groupes (bais de mesure non différentiel) ; - l’effet existe mais les groupes ne sont pas comparables, un facteur de confusion masquant l’effet du traitement (patients dans le groupe « traitement » avec une maladie plus grave initialement par exemple) ; - l’essai manque de puissance, c’est-à-dire que le nombre de sujets nécessaires et/ou le nombre d’événements attendus n’ont pas été atteints. Il faut se reporter à l’analyse statistique et au calcul du nombre de sujets nécessaires pour vérifier cela. En pra tique Ex e m ple 1 (é preuve t est 2017) Griffin D, Parsons N, Shaw E, Kulikov Y, Hutchinson C, Thorogood M, Lamb SE; UK Heel Fracture Trial Investigators. Operative versus non-operative treatment for closed, displaced, intra-articular fractures of the calcaneus: randomised controlled trial. BMJ 2014; 349: g4483. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 192 Essais cliniques We performed a large, pragmatic, randomised controlled trial in the UK National Health Service to assess whether operative care leads to better outcomes than non-operative care in patients with typical, closed, displaced intraarticular calcaneal fractures over two years after injury. We recruited participants from 22 UK hospitals in 2007-09. Ail were régional referral centres for calcaneal fractures, and the surgeons were ail recognised as specialists in the treatment of these injuries. Of the 502 eligible patients, 151 consented to participate and were randomised to the operative (n= 73) and non-operative (n= 78) groups, with a médian of 5 (interquartile range 4-8) participants per centre. Quels éléments sont en faveur de la bonne validité externe de cette étude ? Il aurait fallu cocher... Commentaires Le nombre important de centres recrutés Le caractère multicentrique de l’essai Le grand nombre de centres indique une bonne représentativité de la population source par rapport à la population cible Le choix de l’intervention chirurgicale de référence pour le bras traitement chirurgical L’utilisation du traitement le plus répandu rendra plus facile la comparaison avec les autres études Il n’aurait pas fallu cocher... Commentaires La randomisation par minimisation C’est un critère de validité interne La participation exclusive de chirurgiens reconnus dans le traitement des fractures du calcanéum Au contraire, ceci fait plutôt craindre un biais de sélection, donc une diminution de la validité externe Le taux d’acceptation du protocole parmi les patients éligibles Le taux d’acceptation est faible ici (151/502) et les patients inclus risquent d’être différents des patients initialement ciblés dans l’essai Ex e m ple 2 (ED N 2017) Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML, Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D, Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D. Levosimendan for the prévention of acute organ dysfunction in sepsis. N Engl J Med 2016; 375: 1638-48. We conducted a double-blind, randomized clinical trial to investigate whether levosimendan reduces the severity of organ dysfunction in adults with sepsis. Enrollment, randomization, and data collection were performed by means of an online System (InForm, Oracle). Patients were assigned in a 1:1 ratio to receive levosimendan or placebo, with the use of variable block sizes of four and six and computer-generated random numbers and with stratification Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Conclusion de l’étude et critique des résultats 193 according to recruitment center. The randomization sequence was prepared by an independent statistician. The primary analysis was unadjusted in the intention-to-treat population, and reported the différence in mean SOFA scores between the two trial groups. The trial protocol, available with the full text of this article at NEJM.org, was designed by the trial management committee and has been published previously. The trial was funded by the National Institute for Health Research and Tenax Therapeutics and sponsored by Impérial College London. Data management and analysis were performed by the Impérial Clinical Trials Unit. The funders, the sponsor, and Orion Pharma had no rôle in designing the trial, gathering or analyzing the data, writing the manuscript, or making the decision to submit the manuscript for publication. Quels sont les éléments en faveur d’une bonne validité interne de cette étude ? Il aurait fallu cocher... Commentaires L’administration du traitement en aveugle Evite le biais de mesure différentiel sur le critère de jugement L’analyse en intention de traiter Limite le risque de conclure à tort à l’efficacité du traitement La description de la méthode de randomisation Dans cette étude, la procédure de randomisation est décrite et de bonne qualité Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 194 Essais cliniques Il n’aurait pas fallu cocher... Commentaires Le fait que le protocole soit disponible Ces deux propositions sont à mettre au crédit de l’étude mais ne préjugent pas de la validité interne (le protocole peut être disponible mais de mauvaise qualité) La déclaration de la source de financement et des liens d’intérêt Quels sont les éléments en faveur d’une bonne généralisabilité des résultats de cette étude ? Il aurait fallu cocher... Commentaires Le recrutement multicentrique Le caractère multicentrique permet d’avoir des patients et des pratiques plus divers et favorise la généralisabilité (les résultats de l’étude sont applicables à une population plus large) L’absence d’effet centre attestée par la stratification de la randomisation La stratification par centres permet d’éviter un effet centre, donc a priori les résultats obtenus sont bien indépendants du centre, ce qui améliore la généralisabilité L’attrition (voir flow chart) L’attrition (réduction de l’effectif analysé par rapport à l’effectif randomisé) est mineure dans cette étude. Dans l’hypothèse où beaucoup de patients sortent d’une étude et/ou ne sont pas analysés, cela implique que les résultats ne prennent pas en compte ces patients Une prise en charge pour les traitements associés proche de la vraie vie dans cette étude Plus les procédures de l’étude sont proches de la pratique, plus on peut généraliser les résultats Il n’aurait pas fallu cocher... Commentaires Le taux de mortalité est plus faible que dans d’autres études sur le lévosimendan Cet élément n’est pas en faveur de la validité externe puisque discordant avec les autres études Ex e m ple 3 (ED N 2020) Hofmann R, James SK, Jernberg T, Lindahl B, Erlinge D, Witt N, et al. Oxygen Therapy in Suspected Acute Myocardial Infarction. N Engl J Med 28 sept 2017; 377(13): 1240-9. In this registry-based randomized clinical trial, we used nationwide Swedish registries for patient enrollment and data collection. Patients with suspected myocardial infarction and an oxygen saturation of 90% or higher were randomly assigned to receive either supplémentai oxygen (6 liters per minute for 6 to 12 hours, delivered through an open face mask) or ambient air. The 1-year total mortality among patients with myocardial infarction was estimated to be 14.4%. A clinically relevant effect of supplémentai oxygen was Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Conclusion de l’étude et critique des résultats 195 defined as a 20% lower relative risk of death from any cause within 1 year in the oxygen group than in the ambient-air group. With the chisquare test, to be able to reject the null hypothesis at a significance level of 0.05 (two-sided) with a power of 0.90, a total of 2,856 patients per group were needed. To control for patients Crossing over or not completing the trial, the planned sample size was increased to 3,300 patients per group, which resulted in a total of 6,600 patients. A total of 6,629 patients were enrolled. The médian duration of oxygen therapy was 11.6 hours, and the médian oxygen saturation at the end of the treatment period was 99% among patients assigned to oxygen and 97% among patients assigned to ambient air (p< 0.001). The primary end point of death from any cause within 1 year after randomization occurred in 5.0% of patients (166 of 3,311) assigned to oxygen and in 5.1% of patients (168 of 3,318) assigned to ambient air (hazard ratio, 0.97; 95% confidence interval [CI], 0.79 to 1.21; P = 0.80). The corresponding 1-year mortality in the per-protocol population was 4.7% (141 of 3,014) and 5.1% (163 of 3,212), respectively (hazard ratio, 0.91; 95% CI, 0.72 to 1.14; P = 0.40). Data on Procedures, Médication, and Complications during Hospitalization.* Ambient-Air Group (N-3318) Oxygen Group (N-3311) Variable Value among Patients with Data Available Value among No. (%) of Patients with Patients with Data Missing Data. Available P Value No. (%) of Patients with Missing Data. Médian duration 11.64 (6.03- 243 (7.3) of oxygen therapy 12.02) (IQR) - hr - - 0 Received oxygen 62 (1.9) outside the protocol because of development hypoxemia - no. (%) 99 (97-100) 569 (17.2) Médian oxygen saturation at end of treatment period (!QR)-(%) 254 (7.7) 0 < 0.001 97 (95-98) 563 (17.0) < 0.001 Procedures - no. (%) Coronary angiography 2797 (84.5) 0 2836 (85.5) 0 0.26 PCI 2183 (65.9) 0 2246 (67.7) 0 0.13 CABG 96 (2.9) 24 (0.7) 110(3.3) 28 (0.8) 0.51 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 196 Essais cliniques Oxygen Group (N-3311) Variable P Value Value among Patients with Data Available No. (%) of Patients with Missing Data. 0 3.0 (0-95) 0 0.87 Value among No. (%) of Patients with Patients with Data Missing Data. Available Médian duration 3.0 (0-68) of hospital stay (range) - days Ambient-Air Group (N-3318) Médication - no. (%) Intravenous diuretic 309 (9.3) 30 (0.9) 322 (9.7) 38 (1.1) 0.58 Intravenous inotrope+ 46 (1.4) 33 (1.0) 70 (2.1) 42 (1.3) 0.02 Intravenous nitroglycerin 252 (7.6) 32 (1.0) 221 (6.7) 44 (1.3) 0.14 Aspirin 2758 (83.3) 54 (1.6) 2803 (84.5) 55 (1.7) 0.16 P2Y12 receptor 2445 (73.8) inhibitor 53 (1.6) 2463 (74.2) 54 (1.6) 0.62 Beta-blocker 2702 (81.6) 54 (1.6) 2752 (82.9) 52 (1.6) 0.13 Statin 2782 (84.0) 53 ( 1.6) 2765 (83.3) 55 (1.7) 0.46 ACE inhibitor or ARB 2586(78.1) 53 (1.6) 2557(77.1) 55 (1.7) 0.32 Calcium blocker 519 (15.7) 52 (1.6) 547(16.5) 54 (1.6) 0.36 Diuretic 607(18.3) 53 (1.6) 615 (18.5) 53 (1.6) 0.82 Complications - no. (%) Reinfarction 17(0.5) 34 (1.0) 15 (0.5) 33 (1.0) 0.72 New-onset atrial fibrillation 94 (2.8) 33 (1.0) 103 (3.1) 32 (1.0) 0.53 Atrioven46 (1.4) tricular block, second-degree or third degree 30 (0.9) 58 (1.7) 30 (0.9) 0.24 Cardiogenic shock 32 (1.0) 27(0.8) 37(1.1) 27 (0.8) 0.54 Cardiac arrest 79 (2.4) 28 (0.8) 63 (1.9) 28 (0.8) 0.17 Death 53 (1.6) 28 (0.8) 44 (1.3) 26 (0.8) 0.35 > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Conclusion de l’étude et critique des résultats 197 La saturation médiane en oxygène significativement plus élevée à la fin de la période de traitement sous oxygénothérapie qu’en air ambiant peut s’expliquer par : Il aurait fallu cocher... Commentaires L’administration d’oxygène prévue par le protocole de l’essai Réponse logique Le risque d’erreur statistique de première espèce (alpha) Une différence statistiquement significative peut toujours être liée au hasard Il n’aurait pas fallu cocher... Commentaires Une saturation médiane en oxygène plus élevée à l’inclusion Il n’y a pas de différence de saturation entre les 2 groupes à l’inclusion, ce paramètre a été équilibré entre les 2 groupes par la randomisation Une proportion de données manquantes différente entre les 2 groupes Le taux de données manquante est très proche dans les deux bras (17,2 % vs 17 %). Par ailleurs, les différences de caractéristiques entre les patients avec des données manquantes sont plus pertinentes à prendre en compte que le pourcentage des données manquantes en soi Un recours plus fréquent à une oxygénothérapie en dehors du protocole de l’essai Le recours à l’oxygène en dehors du protocole est par définition plus fréquent dans le groupe « air ambiant ». Cela contribuerait plutôt à réduire les différences entre les groupes Cet essai n’a pas mis en évidence de différence significative de la mortalité à 1 an entre les deux groupes comparés, en analyse en intention de traiter. Quelle est la principale raison expliquant ce résultat ? Il aurait fallu cocher... Commentaires Une augmentation de 2 points de pourcentage de la saturation médiane en oxygène est insuffisante pour réduire significativement la mortalité Cette question, compte tenu de sa formulation, n’attend qu’une seule réponse correcte. Cette réponse apparaît la plus convaincante car même si la puissance prévue initialement n’est pas atteinte (taux de décès plus faible que prévu au nombre de sujets nécessaires), la différence entre les 2 groupes est numériquement très faible Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 198 Essais cliniques Il n’aurait pas fallu cocher... Commentaires 297 (9 %) patients sous oxygénothérapie n’ont pas complété la période d’oxygénothérapie prévue par le protocole de l’essai Ces 2 propositions vont dans le sens d’une diminution de la différence entre les 2 groupes. Néanmoins, la formulation de la question n’attend qu’une seule réponse correcte et la concordance entre les analyses per-protocole et en ITT semble indiquer que les déviations n’impactent pas beaucoup les résultats 254 (7 %) patients sous air ambiant ont bénéficié d’une oxygénothérapie en dehors du protocole de l’essai 1 619 (25 %) participants à l’essai avaient une pathologie autre qu’un infarctus du myocarde La population-source de l’étude est bien constituée des patients suspects d’infarctus et pas des patients avec un infarctus avéré. De plus, les patients avec un autre diagnostic ont été équilibrés entre les 2 groupes par la randomisation Le hasard Le hasard peut expliquer un résultat négatif, néanmoins la formulation de la question n’attend qu’une seule réponse vraie et dans cette situation, la raison principale ne semble pas être celle-ci Pour un patient avec une saturation en oxygène supérieure à 90 % à la phase aiguë d’un infarctus du myocarde, cet essai : Il aurait fallu cocher... Commentaires Ne met pas en évidence de bénéfice significatif de l’oxygénothérapie comparativement à la ventilation en air ambiant pour la mortalité à 1 an Il s’agit du résultat principal de l’essai présenté par la formulation correcte d’un résultat d’un essai de supériorité négatif Il n’aurait pas fallu cocher... Commentaires Démontre la non-infériorité de la ventilation en air ambiant comparativement à l’oxygénothérapie pour la mortalité à 1 an Un essai de supériorité négatif ne permet jamais de démontrer la non-infériorité Démontre l’innocuité de l’oxygénothérapie comparativement à la ventilation en air ambiant L’absence de différence significative en matière d’effet secondaire n’est pas une démonstration d’innocuité Démontre la supériorité de l’oxygénothérapie comparativement à la ventilation en air ambiant pour l’épargne thérapeutique en médicaments inotropes intraveineux Un résultat sur un critère de jugement secondaire n’est pas la conclusion d’un essai thérapeutique Démontre l’absence d’effet de l’oxygénothérapie comparativement à la ventilation en air ambiant sur la mortalité à 1 an L’absence d’effet significatif ne signifie pas « l’absence d’effet ». L’effet peut être existant, mais inférieur aux hypothèses des auteurs Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Conclusion de l’étude et critique des résultats 199 Quel(s) élément(s) supporte(nt) la validité interne des résultats de cet essai ? Il aurait fallu cocher... Commentaires Le critère de jugement principal était objectif Ceci est très souhaitable dans un essai ouvert pour limiter les biais de mesure sur le critère de jugement principal Les caractéristiques des patients à l’inclusion étaient comparables entre les 2 bras de l’essai Ceci indique que la randomisation est correctement réalisée et qu’il n’y a pas de biais de confusion Les conclusions étaient similaires en analyse en intention de traiter et en analyse per-protocole Ceci indique que l’effet des déviations au protocole n’influence pas beaucoup les résultats de l’étude Il n’aurait pas fallu cocher... Commentaires L’essai a été conduit en ouvert La nature ouverte de l’essai augmente le risque de biais de mesure différentiel et de biais de performance Les hypothèses formulées a priori pour le calcul du nombre de sujets nécessaire ont été vérifiées lors de la réalisation de l’essai Dans le calcul du nombre de sujets nécessaire, il est précisé que le taux de mortalité attendu à 1 an est de 14,4 %. Dans cette étude, la mortalité observée est de 5 % dans les 2 bras ce qui indique que la puissance calculée a priori n’a pas été atteinte Les arguments en faveur de la validité externe des résultats de cet essai pour les patients occidentaux actuels incluent : Il aurait fallu cocher... Commentaires Le caractère multicentrique de l’essai L’inclusion de plusieurs centres améliore la représentativité de la populationsource par rapport à la population cible La participation à l’essai d’environ 50 % des 69 hôpitaux recevant des patients avec un infarctus À l’échelle d’un pays, une telle participation est remarquable, la population-source a plus de chance d’être représentative de la population-cible si les patients sont répartis dans la moitié des centres du pays plutôt que dans quelques centres uniquement Le recrutement des patients sur une période récente Les pratiques changent au fil des années et un essai récent permet de s’assurer que les patients sont pris en charge avec les pratiques les plus à jour, ce qui permet plus facilement de généraliser les résultats à la population-cible Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 200 Essais cliniques Il n’aurait pas fallu cocher... Commentaires La conduite de l’essai dans un seul pays Les résultats d’un essai sont d’autant plus généralisables à une population plus large s’il est réalisé dans plusieurs pays L’inclusion dans l’essai de 21,9 % des patients avec un infarctus du myocarde identifiés dans le registre SwedeHeart Cette proportion apparaît faible et ne permet pas de s’assurer que l’échantillon est représentatif de la population-source Ex e m ple 4 (ED N t est 2019) The EINSTEIN-PE Investigators. Oral Rivaroxaban for the Treatment of Symptomatic Pulmonary Embolism. N Engl J Med 5 avr 2012; 366(14): 1287-97. In a randomized, open-label, event-driven, noninferiority trial involving 4,832 patients who had acute symptomatic pulmonary embolism with or without deep-vein thrombosis, we compared rivaroxaban (15 mg twice daily for 3 weeks, followed by 20 mg once daily) with standard therapy with enoxaparin followed by an adjusted-dose vitamin K antagonist for 3, 6, or 12 months. The primary efficacy outcome was symptomatic récurrent venous thromboembolism. The principal safety outcome was major or clinically relevant nonmajor bleeding. Rivaroxaban was noninferior to standard therapy (noninferiority margin, 2.0; P= 0.003) for the primary efficacy outcome, with 50 events in the rivaroxaban group (2.1%) versus 44 events in the standard-therapy group (1.8%) (hazard ratio, 1.12; 95% confidence interval [CI], 0.75 to 1.68). Dans cet essai, quel(s) facteur(s) ont pu contribuer à la non-infériorité du rivaroxaban comparativement à la prise en charge conventionnelle pour le critère principal d’efficacité ? Il aurait fallu cocher... Commentaires La valeur choisie pour la marge de noninfériorité (2,00) Par exemple, une marge de non-infériorité choisie à 1,50 n’aurait pas permis de conclure à la non-infériorité car la borne supérieure de l’intervalle de confiance du HR est à 1,68. On voit bien que le choix que l’on fixe a priori conditionne en grande partie la conclusion de l’étude. À noter ici que le choix de la marge de non-infériorité est très large puisqu’on tolère un doublement des récidives thromboemboliques sous rivaroxaban par rapport à la prise en charge standard Le risque d’erreur statistique de première espèce (alpha) Le risque alpha peut toujours expliquer en partie un résultat significatif (= du fait du simple hasard ou = du fait des fluctuations d’échantillonnage) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Conclusion de l’étude et critique des résultats Il n’aurait pas fallu cocher... Un défaut de puissance statistique Le risque d’erreur statistique de 2e espèce (bêta) 201 Commentaires Un défaut de puissance pourrait expliquer les résultats d’un essai négatif L’absence d’aveugle à l’origine d’une fréquence plus élevée de suspicions de récidives dans le groupe « rivaroxaban » Une fréquence plus élevée de récidive dans le groupe « rivaroxaban » serait en défaveur de la non-infériorité car le hazard ratio aurait tendance à augmenter et donc la borne supérieure de son intervalle de confiance pourrait dépasser la borne de non-infériorité Une différence de la prévalence de la thrombophilie connue à l’inclusion entre les 2 groupes Il n’y a pas de différence de prévalence de thrombophilie entre les groupes car la randomisation a permis d’équilibrer correctement les patients atteints de thrombophilie entre les 2 groupes. On voit ici l’importance du tableau de description des patients après randomisation dans l’interprétation des résultats L’utilisation d’un critère composite associant des événements de gravité hétérogène La nature du critère de jugement n’a aucune influence sur le sens que pourrait prendre la relation dans un sens ou dans un autre Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Pa r t ie III Études de performances diagnostiques Pl a n Fiche 20 Fiche 21 Fiche 22 Performances diagnostiques Objectifs et méthodologie des études de performance diagnostique Courbe ROC et choix d’un seuil 205 219 235 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 20 Performances diagnostiques En complément V o us p o u v e z co ns u l t e r c e t t e v i d é o s u r l e s p e r f o r m a n c es d i a g n ost i q u es : h t t ps: / / y o u t u .b e / m g 7 g Q gs k r Y g Classement de référence défini par le gold standard (test de référence) Malade Non malade Total TEST + VP = vrais positifs FP = faux positifs Nombre total de tests positifs = VP + FP TEST - FN = faux négatifs VN = vrais négatifs Nombre total de tests négatifs = FN + VN Total Nombre total de Nombre total de sujets malades sujets non malades selon le gold selon le gold standard = VP + FN standard = FP + VN VP Sensibil it é ’v p Tf n Soit la probabilité qu'un test soit positif chez un malade VP Valeur prédictive positive = \/p+pp Soit la probabilité qu'un individu soit malade en cas de test positif Valeur prédictive négative = Nombre total de participants = VP + FP + FN + VN VN \//\j +pn Soit la probabilité qu'un individu ne soit pas malade en cas de test négatif SPéciflcité=ffW Soit la probabilité qu'un test soit négatif chez un non-malade Caract éristiq u es in trinsè q u es du t est = se nsibilit é e t sp écificité On parle de performances intrinsèques car la sensibilité et la spécificité ne dépendent que de la qualité du test et ne sont pas influencées par la prévalence de la maladie dans la population sur laquelle ce test est appliqué : • sensibilité (Se) = probabilité d’obtenir un test positif chez un sujet malade (dénominateur = tous les malades) ; • spécificité (Sp) = probabilité d’obtenir un test négatif chez un sujet non malade (dénominateur = tous les non-malades). Il s’agit donc d’une probabilité comprise entre 0 et 1 souvent exprimée en pourcentage (de 0 à 100 %). La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 206 Études de performances diagnostiques Une sensibilité de 0,5 (ou 50 %) signifie que chez une personne malade, le test a une chance sur deux d’être positif. Une spécificité de 0,5 (ou 50 %) signifie que chez une personne non malade, le test a une chance sur deux d’être négatif. Donc un test ayant une sensibilité et une spécificité de 0,5 est inutile en pratique puisqu’il reviendrait à tirer à pile ou face pour prouver le diagnostic. Plus le test est de bonne qualité, plus la spécificité et la sensibilité se rapprochent de 1 (ou 100 %). • Indice de Youden = Se + Sp - 1 Il associe sensibilité et spécificité en une grandeur unique. La sensibilité et la spécificité étant chacune comprise entre 0,5 et 1, l’indice de Youden peut prendre des valeurs variant de 0 à 1. Un test « parfait » avec une Se = 1 et une Sp = 1 a donc un indice de Youden qui vaut 1. ► Remarques : ■ chez les malades : Se = pourcentage de vrais positifs ; (1 — Se) = pourcentage de faux négatifs ; ■ chez les non-malades : Sp = pourcentage de vrais négatifs ; (1 — Sp) = pourcentage de faux positifs. Pour affirmer un diagnostic, on a besoin d’un test spécifique, donc avec peu de faux positifs. Exemple du signe de Babinsky : • un signe de Babinsky affirme un syndrome pyramidal ; • on peut avoir un syndrome pyramidal sans signe de Babinsky ; • spécificité = taux de vrais négatifs = 100 % : le signe est pathognomonique ; • taux de faux positifs (1 - Sp) = 0 %. Pour éliminer un diagnostic, on a besoin d’un test sensible, donc avec peu de faux négatifs. Exemple du dosage des D-dimères dans l’embolie pulmonaire : • une embolie pulmonaire a (presque) toujours des D-dimères positifs ; • on peut avoir des D-dimères positifs en l’absence d’embolie pulmonaire ; • sensibilité = taux de vrais positifs = 98 % ; • taux de faux négatifs (1 — Sp) = 2 %. Plutôt que de faire des formules, pensez D-dimères et Babinsky ! Caract éristiq u es e x trinsè q u es (vale urs pré dictives = pro b a bilités p ost-t est) Définition On parle de caractéristiques extrinsèques car les valeurs prédictives positives (VPP) et négatives (VPN) sont liées à : • la qualité propre du test (représentée par la sensibilité et la spécificité) ; • la probabilité pré-test d’être atteint de la maladie (c’est-à-dire la prévalence de la maladie). La VPP et la VPN sont aussi des calculs de probabilités comprises entre 0 et 1 et sont souvent exprimées en pourcentage (entre 0 et 100 %) : Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Performances diagnostiques 207 • VPP = probabilité que le patient soit malade si le test est positif = probabilité post-test de maladie (dénominateur = tous les tests positifs) ; • VPN = probabilité que le patient soit indemne si le test est négatif = probabilité post-test d’absence de maladie (dénominateur = tous les tests négatifs). La VPP et la VPN sont utiles au lit du malade où on ne connaît pas le statut du patient pour la maladie recherchée mais où l’on dispose des résultats du test diagnostique. In flu e nce d e la prévale nce sur les caract éristiq u es e x trinsè q u es La sensibilité et la spécificité sont des caractéristiques intrinsèques au test ne dépendant que de la qualité de celui-ci. La VPP et la VPN sont quant à elles dépendantes de la qualité du test mais aussi de la prévalence de la maladie de la population dans laquelle on applique le test. L’évolution de la VPP et de la VPN en fonction de la prévalence sont représentées dans la figure ci-dessous : En d’autres termes : • la VPP augmente quand la prévalence augmente, quel que soit le test : « plus une maladie est fréquente, plus on a de chances de l’affirmer » ; • à l’inverse, la VPN augmente quand la prévalence diminue : « plus une maladie est rare, plus on a de chances de l’éliminer » ; • la VPP et la VPN n’ont de sens que si la prévalence de la maladie au sein de l’échantillon est la même que la prévalence de la maladie au sein de la population cible. Estim a t e ur p o nct uel d es caract éristiq u es du t est e t in t ervalle d e co n fia nce • Dans l’échantillon d’étude, la sensibilité, la spécificité et les valeurs prédictives du test sont des estimateurs ponctuels de la valeur réelle de ces paramètres dans la population cible. • L’intervalle de confiance permet d’interpréter cet estimateur ponctuel. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 208 Études de performances diagnostiques • Si l’intervalle de confiance des caractéristiques intrinsèques exclut la valeur 50 %, le test est plus performant que le hasard. • Si l’intervalle de confiance de la VPP (ou de la VPN) exclut la fréquence de la maladie (ou 1-fréquence de la maladie), le test augmente signifîcativement la probabilité diagnostique. • Un test est meilleur que le hasard si : - ses caractéristiques intrinsèques sont significativement supérieures à 50 % ; - sa VPP est significativement supérieure à la probabilité pré-test. Ex e m ple Vous souhaitez évaluer l’apport d’un nouveau test diagnostique de l’infection tuberculeuse latente. Vous décidez d’appliquer ce même test à deux populations différentes en termes de prévalence de tuberculose. La prévalence de la population A est de 10 % et la prévalence de la population B est de 50 %. Vous tirez alors au sort un échantillon de 1 000 personnes dans chaque population pour réaliser votre étude. Les résultats vous sont présentés ci-dessous : • Résultats de l’échantillon provenant de la population A (prévalence 10 %) : T Malade Test + 70 Test - Total Non malade Total 90 160 30 810 840 100 900 1 000 z . nombre total de malades 100 . ~ n/ prevalence —----------------------------------- —------- —10 /o effectif de l'échantillon 1000 Se = Sp = VPP = 70 100 810 900 70 160 = 70 % (IC95 % : 0,67 - 0,73) = 90 %(IC95 % : 0,88 - 0,92) = 43,7 % (IC95 % : 0,41 - 0,47) VPN = — = 96,4 %(IC95 % : 0,95-0,98) 840 Résultats de l’échantillon provenant de la population B (prévalence 50 %) : T Test + Malade Non Malade Total 350 50 400 Test - 150 450 600 Total 500 500 1 000 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Performances diagnostiques prévalence = nombre total de malades 500 effectif de l’échantillon 1000 209 = 50% Se = — = 70 % (IC95 % : 0,67 - 0,73) 500 Sp = 4S0 = 90 %(IC95 % : 0,88-0,92) 3S0 VPP = —— = 87,5 %(IC95 % : 0,85-0,90) 400 v 7 450 VPN = — = 75 % (IC95 % : 0,72 - 0,78) 600 k 7 Ce test est relativement performant pour affirmer une tuberculose, car : • le taux de vrais négatifs (Sp) est de 90 % ; • le taux de faux positifs est de 10 % (1 — Sp). Pourtant, dans une population où la tuberculose est rare, la VPP (probabilité post-test) n’est que de 43,7 %, ce qui est cependant relativement élevé au regard de la probabilité pré-test de la maladie (10 %). Ce test est de qualité médiocre pour éliminer une tuberculose car : • le taux de vrais positifs (Se) n’est que de 70 % ; • le taux de faux négatifs est élevé (30 %). Pourtant, dans une population ou la tuberculose est rare, la VPN est de 96,4 %, ce qui est faible au regard de la probabilité pré-test d’absence de maladie (90 %). Ra p p orts d e vraise m blance (li kelihood ra tio) Les rapports de vraisemblance (RV) font la synthèse entre la spécificité et la sensibilité sous la forme d’un même indicateur grâce aux formules suivantes : Rapport de vraisemblance en cas de test positif : „TT sensibilité % vrais positifs RV+ =-------- — = —7------ - ------ ~T 1 - spécificité % fauxs positifs Le RV+ varie entre 1 et l’infini. Rapport de vraisemblance en cas de test négatif : RV- = 1 - sensibilité % faux négatifs spécificité % vrais négatifs Le RV— varie entre 0 et 1. On peut envisager l’interprétation du RV comme celle du risque relatif de test positif en présence de la maladie (RV+) ou d’absence de maladie (RV-). Si on étudie le lien entre le test et la maladie, entre 0 et 1, si on est indemne, c’est un « facteur protecteur d’avoir un test positif ». Entre 1 et plus l’infini, la maladie est un facteur de risque de test positif. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 210 Études de performances diagnostiques • Probabilité pré-test : probabilité d’avoir la maladie en présence de certains facteurs (prévalence, signes cliniques, score de prédiction clinique). • Probabilité post-test : probabilité d’avoir la maladie après résultats du test. Cela correspond aux valeurs prédictives. • Un RV à 1 équivaut à une probabilité post-test identique à la probabilité prétest, le test n’apporte aucune information supplémentaire. • Un RV + > 10 augmente fortement la probabilité post-test d’être atteint de la maladie en cas de test positif, c’est-à-dire augmente la VPP. • Un RV— <0,1 diminue fortement la probabilité post-test d’être atteint de la maladie en cas de test négatif, c’est-à-dire augmente la VPN. RV- RV+ < 0,1 Excellente performance pour éliminer une maladie 0,1-0,2 Performances modérées > 0,2 Performances médiocres > 10 Excellente performance pour affirmer une maladie 5-10 Performances modérées <5 Performances médiocres Exemple 1. Reprenons l’exemple du test de dépistage de la tuberculose évoqué plus haut (voir p. 144), qui avait une sensibilité de 0,7 et une spécificité de 0,9 : • un RV+ de 0,7/(l — 0,9) = 7,0 (performance modérée pour affirmer un diagnostic) ; • un RV- de (1 - 0,7)/0,9 = 0,33 (performance médiocre pour éliminer un diagnostic). Exemple 2. Prenons l’exemple du dosage des D-dimères dans l’embolie pulmonaire, le RV+ est faible (entre 1,5 et 2) et le RV- est fort (< 0,1). En pratique, cela signifie que c’est un excellent examen pour rejeter le diagnostic s’il est négatif, mais un très mauvais pour l’affirmer s’il est positif : • probabilité pré-test faible dans le cas d’une patiente de 50 ans sans facteur de risque particulier et sans antécédents, consulte aux urgences pour une douleur thoracique non spécifique : - D-dimères négatifs : probabilité post-test quasi-nulle -> diagnostic réfuté, - D-dimères positifs : probabilité post-test non modifiée et qui reste donc toujours faible ; Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Performances diagnostiques 211 • probabilité pré-test élevée dans le cas d’une patiente de 70 ans hospitalisée en chirurgie orthopédique suite à la pose d’une prothèse de hanche, douleur basithoracique brutale, dyspnéique, tachycardie, auscultation pulmonaire normale : - D-dimères négatifs : probabilité post-test fortement diminuée, - D-dimères positifs : probabilité post-test non modifiée mais qui reste toujours élevée, ne permet pas d’affirmer le diagnostic. N o m o gra m m e d e Fa g an Il permet la détermination de la valeur prédictive (probabilité post-test) à partir de la prévalence (probabilité pré-test) et du rapport de vraisemblance, par lecture graphique. La probabilité post-test donnée à droite est : • la VPP si on passe par le RV+ ; • 1-VPN (c’est-à-dire la probabilité de maladie si le test est moins) si on passe par RV-. Nomogramme permettant d'utiliser le rapport de vraisemblance pour obtenir la valeur prédictive positive d’un examen diagnostique en fonction des données de prévalence. Prévalence Rapport de vraisemblance Valeur prédictive Nomogramme permettant d’utiliser le rapport de vraisemblance pour obtenir la valeur prédictive positive d’un examen diagnostique en fonction des données de prévalence et des caractéristiques informationnelles intrinsèques. Source : Fagan TJ. Nomogram for Baye’s theorem. N Engl J Med 1975; 293(5): 257. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 212 Études de performances diagnostiques Si on applique notre exemple du test antituberculeux sur le nomogramme de Fagan ci-dessus, on note l’influence de la prévalence sur la valeur prédictive : • en cas de probabilité pré-test (prévalence) de 10 % et de RV+ de 7, une probabilité post-test de 43 % (VPP de 43 %) : flèche en pointillé ; • en cas de probabilité pré-test de tuberculose (prévalence) de 50 % et de RV- de 0,33, une probabilité post-test de maladie si le test est négatif de 25 % (1-VPN : 25 %) : flèche pleine. En pra tique Ex e m ple 1 (ED N 2018) Perrotti A, Chenevier-Gobeaux C, Ecarnot F, Bardonnet K, Barrucand B, Flicoteaux G, Lassalle P, Chocron S. Is endocan a diagnostic marker for pneumonia after cardiac surgery? The ENDOLUNG Study. Ann Thorac Surg 2017; 105(2): 535-41. Ce tableau est issu d’une étude de performances diagnostiques évaluant l’intérêt du dosage d’une endotoxine, l’endocan, pour le diagnostic de pneumopathie de réanimation après une chirurgie cardiaque. Le dosage était réalisé avant la chirurgie et 6 heures après : Endocan Preop Endocan 6H Sensitivity 65% 71% Specificity 72% 75% Cut off 3.7 ng/mL 12.1 ng/mL Quelle information manque pour l’interprétation des estimations ponctuelles des caractéristiques informationnelles intrinsèques de l’endocan dans le tableau ci-dessus ? Il aurait fallu cocher... Commentaires Les intervalles de confiance à 95 % C’est l’information indispensable pour comparer les performances intrinsèques au hasard, c’est-à-dire à 50 % Il n’aurait pas fallu cocher... Commentaires Les écarts types Cette information pourrait être utile, mais ne permet pas de vérifier que la sensibilité et la spécificité sont significativement supérieures à 50 % Les rapports de vraisemblance du test positif Cette affirmation ne répond pas à la question posée La prévalence de la pneumonie postopératoire Les caractéristiques intrinsèques ne sont pas dépendantes de la prévalence Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Performances diagnostiques 213 Il n’aurait pas fallu cocher... Commentaires Les valeurs prédictives négatives La proposition est de toute façon hors sujet puisqu’on discute des performances intrinsèques Une concentration d’endocan inférieure à 12,1 ng/mL à la 6e heure postopératoire a une faible valeur décisionnelle pour le diagnostic d’exclusion de la pneumonie postopératoire car : Il aurait fallu cocher... Commentaires La sensibilité est de 71 % Pour exclure un diagnostic, il faut un test sensible (voir plus haut l’exemple du dosage des d-dimères). Les auteurs de la question partent du postulat que ce test n’est pas utile pour éliminer un diagnostic, ils considèrent donc que la sensibilité est trop faible Le taux de faux négatif est de 29 % Pour exclure un diagnostic, il faut un faible taux de faux négatifs, ce qui veut dire exactement la même chose qu’une forte sensibilité Il n’aurait pas fallu cocher... Commentaires Le rapport de vraisemblance négatif est inférieur à 0 Un rapport de vraisemblance ne peut pas prendre une valeur inférieure à 0 Le taux de faux positifs est de 25 % Le taux de faux positifs (1 — Sp) est en effet de 25 %, mais ce n’est pas un argument pour dire que le test n’est pas utile pour exclure un diagnostic La spécificité est de 75 % Cette proposition est fausse car on ne s’intéresse pas à la spécificité, mais à la sensibilité Une concentration d’endocan supérieure ou égale à 12,1 ng/mL à la 6e heure postopératoire a une faible valeur décisionnelle pour le diagnostic positif de pneumonie postopératoire car : Il aurait fallu cocher... Commentaires La spécificité est de 75 % Pour affirmer un diagnostic, il faut un test spécifique, comme le signe de Babinsky. Si les auteurs partent du postulat que le test est peu utile, l’argument est une faible spécificité Le taux de faux positifs est de 25 % Le taux de faux positifs vaut 1 — Sp. Il est trop important pour que l’on puisse utiliser le test pour affirmer le diagnostic Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 214 Études de performances diagnostiques Il n’aurait pas fallu cocher... Commentaires Le taux de faux négatif est de 29 % Le taux de faux négatif (1 — Se) est bien de 29 %, mais ce n’est pas un argument pour ne pas utiliser le test pour exclure un diagnostic Le rapport de vraisemblance positif ne peut pas être calculé Il peut être calculé (sensibilité/1 - Sp) = 2,84, ce qui indique bien une performance médiocre La sensibilité est de 71 % La faible sensibilité est un argument en faveur de la médiocrité du test pour éliminer un diagnostic Ex e m ple 2 (ED N 2019) Kumar P, Mardon M, Bradley M, Gray G, Swinkels A. Assessment of glenohumeral subluxation in poststroke hemiplegia: comparison between ultrasound and fingerbreadth palpation methods. Phys Ther 2014; 94(11): 1622-31. Flow diagram illustrating comparison between the ultrasound method and the fingerbreadth palpation method based on cut-off point of >0.2 cm acromion-greater tuberosity différence. GHS = glenohumeral subluxation. Glenohumeral subluxation (GHS) is a common poststroke complication. Treatment of GHS is hampered by the lack of objective, real-time clinical measurements. The aims of this study were: (1) to compare an ultrasound method of GHS measurement with the fingerbreadth palpation method using a receiver operating characteristic curve (ROC) and (2) to report the sensitivity and specificity of this method. A prospective study was conducted. The study was conducted in local hospitals and day centers in the Southwest of England. One hundred five patients who had one-sided weakness following a first-time stroke (51 men, 54 women; mean âge 71 years, SD 11) and who gave informed Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Performances diagnostiques 215 consent were enrolled in the study. Ultrasound measurements of acromion-greater tuberosity (AGT) distance were used for the assessment of GHS. Measurements were undertaken on both shoulders by a research physical therapist trained in shoulder ultrasound with the patient seated in a standardized position. Fingerbreadth palpation assessment of GHS was undertaken by a senior clinical physical therapist based at the hospital, who also visited the day centers. À partir de la figure ci-dessus, quels paramètres pourrait-on estimer concernant la procédure échographique par comparaison à l’examen clinique par palpation ? (Une ou plusieurs réponses possibles.) Il aurait fallu cocher... Commentaires La sensibilité et la spécificité Si l’on considère la palpation clinique comme l’examen de référence, on pouvait reconstituer à partir de ce diagramme de flux le nombre de vrais positifs, faux positifs, vrais négatifs et faux négatifs de l’échographie, on pouvait donc calculer les performances intrinsèques et extrinsèques La valeur prédictive positive et la valeur prédictive négative La prévalence de la subluxation glénohumérale en postaccident vasculaire cérébral Si l’on considère cet échantillon comme représentatif, et l’examen clinique comme l’examen de référence, on peut calculer la prévalence comme le taux de positifs selon l’examen clinique Le pourcentage de patients non évaluables Le nombre de patients non évaluables est nul, compte tenu des données de ce graphique (tous les patients inclus sont évalués) Il n’aurait pas fallu cocher... Commentaires L’aire sous la courbe ROC (AUROC) La légende de la figure de l’exemple 2 indique que cette figure est donnée pour un cut-off de 0,2 cm, on ne peut donc calculer qu’une sensibilité et une spécificité pour ce cut-off et non pas une valeur pour chaque cut-off Sensitivity and Specificity With 95 % Cl for Ultrasound Method (AGT Distance Measurement Différence Between Affected and Unaffected Shoulders )a. Cut-off Point Sensitivity 95% CI Specificity 95% CI >0.5 40% 28%, 52% 89% 73%, 96% >0.4 47% 33%, 57% 83% 69%, 95% >0.3 55% 39%, 63% 74% 62%, 91% >0.2 68% 51%, 75% 62% 47%, 80% >0.1 76% 57%, 80% 50% 38%, 73% a 95% CI = 95% confidence interval, AGT = acromion-greater tuberosity. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 216 Études de performances diagnostiques Dans cette étude, par comparaison à l’examen clinique par palpation (tableau ci-dessus ; une ou plusieurs réponses possibles) : Commentaires Il aurait fallu cocher... 68 % des patients avec une subluxation glénohumérale ont une mesure échographique > 0,2 cm C’est la définition de la sensibilité 38 % des patients sans subluxation glénohumérale ont une mesure échographique > 0,2 cm C’est le taux de faux positifs qui est décrit ici, soit 1 — Sp La probabilité d’une mesure échographique < 0,2 cm en l’absence de subluxation glénohumérale n’est pas significativement supérieure à 50 % L’intervalle de confiance à 95 % de la spécificité comprend la valeur 50 % Le taux de faux négatifs est de 24 % pour le seuil > 0,1 cm Le taux de faux négatifs est bien de 1 — Se Commentaires Il n’aurait pas fallu cocher... La probabilité de subluxation glénohumérale est de 68 % si la mesure échographique est > 0,2 cm C’est la définition de la VPP, qui n’est pas donnée dans le tableau ci-dessus 62 % des subluxations glénohumérales ont une mesure échographique > 0,2 cm C’est la définition de la sensibilité, qui est de 68 % pour ce seuil Le diagnostic de subluxation glénohumérale est confirmé dans 62 % des cas si la mesure échographique est > 0,2 cm C’est la définition de la VPP qui n’est pas donnée ici Les auteurs rapportent un coefficient de corrélation de Pearson égal à 0,52 entre la mesure échographique et la mesure clinique (P < 0,001). Ce résultat {une ou plusieurs réponses possibles) : Il aurait fallu cocher... Commentaires Suggère que la corrélation entre les deux mesures ne résulte pas de fluctuations d’échantillonnage En effet, le coefficient de corrélation linéaire est significativement supérieur àO Il n’aurait pas fallu cocher... Commentaires Reflète le fait que les deux méthodes mesurent la même distance On peut parfaitement corréler la mesure de deux paramètres différents avec un coefficient de corrélation, sans préjuger qu’ils évaluent la même chose (corrélation taille/poids, par exemple) Objective une concordance élevée entre les deux mesures La concordance indique que les deux mesures sont égales (ou concordantes). Cette notion est mesurée par le coefficient kappa (pour deux variables qualitatives) ou un coefficient de corrélation intraclasse (pour deux variables quantitatives) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Performances diagnostiques 217 Il n’aurait pas fallu cocher... Commentaires Montre que 52 % des valeurs sont concordantes entre les deux méthodes Ce n’est pas la signification du coefficient de corrélation linéaire (corrélation concordance). Voir fiche 5 pour plus d’information sur la corrélation et la concordance Montre que 52 % de la variabilité de la mesure échographique est expliquée par la variabilité de la mesure clinique Le pourcentage de variabilité expliquée correspond au coefficient de corrélation au carré (R2) ► Remarque : le coefficient de corrélation linéaire n’est pas un indicateur de performance diagnostique. C’est la racine carrée de la part de variabilité de la mesure échographique expliquée par la mesure clinique, si la relation entre les deux est linéaire. Un coefficient de corrélation à 0 indique l’absence de relation (ou une relation non linéaire). Un coefficient de corrélation à 1 indique une relation linéaire avec une équation de type y = ax + b. La p-value associée au coefficient teste l’hypothèse (le coefficient de corrélation est égal à 0). Ici, cette hypothèse est rejetée avec un risque d’erreur < 0,001. Donc, le coefficient de corrélation est significativement supérieur à 0. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 21 Objectifs et méthodologie des études de performance diagnostique Principe On cherche à évaluer la validité d’un test ou examen diagnostique dont l’objectif est de classer les sujets en malades ou non malades. Ce test peut prendre la forme d’une question, d’un signe clinique ou, le plus souvent dans le cadre des études de performance diagnostique, d’un examen complémentaire. Il est également possible d’évaluer des scores diagnostiques combinant plusieurs tests (ex. : taux de D-dimères + douleur thoracique + signes cliniques de thrombose veineuse profonde pour faire le diagnostic d’embolie pulmonaire). Le test idéal est théoriquement : • non invasif ; • peu coûteux ; • très sensible et très spécifique. Ty p es d e t ests On distingue les tests qualitatifs des tests quantitatifs. Tests qualitatifs (qualitative tests) Il s’agit le plus souvent de tests binaires (positif/négatif) qui classent le sujet en malade ou non malade. Exemple : bandelette urinaire positive en leucocytes pour poser le diagnostic d’infection urinaire. Tests quantitatifs (quantitative tests) Ils sont fondés sur le calcul d’une moyenne et nécessitent donc la détermination d’un seuil pour classer le patient en malade/non malade. Exemple : mesure quantitative du taux de D-dimères pour le diagnostic d’embolie pulmonaire. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 220 Études de performances diagnostiques La variation du seuil entraîne une variation de la sensibilité et de la spécificité. Par exemple, on évalue la mesure de la C-reactive protein (CRP) pour diagnostiquer une infection : • dans le cas du choix d’un seuil très bas (par exemple 8 mg/L), la CRP est un marqueur très sensible mais peu spécifique. Il est très sensible car tous les patients infectés auront un test positif, mais il est peu spécifique car beaucoup de patients non infectés auront également un test positif ; • dans le cas d’un seuil très haut (par exemple 400 mg/L), la CRP est un marqueur peu sensible mais très spécifique. Il est peu sensible car beaucoup de patients vraiment infectés auront un test négatif, mais il est très spécifique car beaucoup de patients non infectés auront également un test négatif. O bjectifs du t est Principe Dans l’idéal, un test doit être le plus acceptable possible par la société et par le patient (peu coûteux et non invasif), avec une sensibilité et une spécificité les meilleures possibles. Mais comme le test idéal n’existe pas, il est nécessaire de faire quelques concessions en fonction de l’objectif final du test. Il est donc essentiel de déterminer si le test est évalué dans un objectif de dépistage ou dans un objectif de diagnostic avant d’analyser les résultats de ce type d’étude. Tests de dépistage (screening tests) • Ce sont des tests appliqués chez des sujets sains ne présentant aucun symptôme. On utilise donc généralement ces tests à un nombre important de sujets (ex. : test immunologique de recherche de sang dans les selles pour le dépistage de masse du cancer du côlon). • Acceptabilité : ils doivent être faciles à accepter pour les patients (peu invasifs) et faciles à accepter pour la société (peu coûteux). • Performances diagnostiques : - sensibilité élevée : l’objectif est de ne pas ignorer un sujet véritablement atteint par la maladie. Le nombre de faux négatifs doit donc être faible ; - la forte sensibilité est au prix d’une faible spécificité : un test peu spécifique comporte de nombreux faux positifs, mais cela n’est pas grave car ils seront reclassés correctement par un test diagnostique plus spécifique dans un second temps (coloscopie par exemple). Tests diagnostiques (diagnosis tests) • Ce sont des tests appliqués à des personnes malades présentant des symptômes. On utilise donc généralement ces tests à un nombre restreint de sujets. • Acceptabilité : on accepte que le test soit plus invasif et qu’il soit plus cher car l’on suspecte fortement la maladie dans cette situation. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Objectifs et méthodologie des études de performance diagnostique 221 • Performances diagnostiques : la spécificité est cette fois-ci plus élevée. L’objectif est de confirmer le diagnostic chez les sujets vraiment malades, le nombre de faux positifs doit donc être faible. Schéma d’une étude de performance diagnostique. D éfinitio n d e la p o p ula tio n so urce Cette étape vise à limiter le biais de sélection = échantillon non représentatif de la population source ou population source non représentative de la population cible (voir fiche 2). Dans une étude de performance diagnostique, le biais de sélection pose deux problèmes : • la difficulté d’extrapoler les résultats à la population cible ; • la modification potentielle de la probabilité pré-test, qui change considérablement les valeurs prédictives du test (voir fiche 20). La sélection des cas suspects peut impliquer un score de probabilité clinique (comme le score de Wells pour la thrombose). Dans l’idéal, la population source est celle à laquelle on va appliquer le test, par exemple « l’ensemble des patients se présentant aux urgences pour une douleur thoracique ». Test d e ré f ére nce (g old st an d ard) Afin d’évaluer les performances d’un test, il faut adjudiquer (valider) le statut des sujets (malades ou non malades) par l’application d’un test de référence (gold standard). Le gold standard classe les patients en malades ou non malades dans le cadre de l’étude, sa nature détermine donc les performances diagnostiques des examens évalués. Le gold standard choisi doit être le meilleur test disponible selon les connaissances actuelles. Parfois, il n’existe pas d’examen de référence ou il n’est pas réalisable en pratique (autopsie pour la maladie de Creutzfeldt-Jakob, par exemple). Dans ce cas, on a parfois recours à un comité d’experts ou à un expert qui adjudique ou non la maladie en fonction de l’ensemble des éléments cliniques et paracliniques à disposition (sauf l’examen évalué idéalement). L’examen de référence doit être évalué en aveugle du test réalisé quand cela est possible. Par exemple, on cherche à évaluer les performances diagnostiques de l’échographie pour le diagnostic de grossesse en considérant l’hormone Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 222 Études de performances diagnostiques chorionique gonadotrophique (ou P-HCG) comme examen de référence. L’échographie doit être réalisée en aveugle des résultats de P-HCG, sans quoi les performances de celle-ci seront artificiellement améliorées (risque de recherche moins attentive si P-HCG négative et plus poussée si P-HCG positive). Attention : réaliser l’examen « en aveugle » du gold standard ne fait pas de l’étude une étude en double aveugle ! Cette terminologie est réservée aux essais cliniques. L’examen de référence doit être réalisé chez tous les patients inclus pour le calcul de la sensibilité et de la spécificité. C’est la seule manière de classer les patients en vrais positifs (VP), vrais négatifs (VN), faux positifs (FP), faux négatifs (FN). L’examen de référence doit être réalisé dans des conditions standardisées, c’est-à-dire reproductibles et identiques pour tous les patients. Par définition, on ne peut pas calculer la sensibilité et la spécificité de l’examen de référence dans une étude de performance diagnostique, puisqu’il s’agit, pour cette étude, de « la vérité », c’est-à-dire de la définition des malades et non-malades. ► Remarque : certaines études pilotes sont parfois réalisées uniquement chez les malades (positifs au gold standard), on peut alors obtenir les VP, FN, et les malades (VP + FN). On peut donc calculer la sensibilité : VP/(VP + FN), mais pas la spécificité ni les valeurs prédictives. Si on applique le test seulement aux non-malades, on peut obtenir les VN, FP et les non-malades (VN +FP), calculer la spécificité : VN/(VN + FP) mais pas la sensibilité ni les valeurs prédictives. A p plica tio n du t est é t u dié, n o tio n de re pro d uctibilité (ou fia bilit é) Pour calculer la sensibilité et la spécificité, il est indispensable d’appliquer le test gold standard et le test étudié à tous les sujets. Avant d’étudier la sensibilité et la spécificité, il est souhaitable de connaître la reproductibilité (fiabilité ou reliability) du test : • reproductibilité inter-observateur dnter~rater) : Ie test administré au même patient par deux observateurs différents aura-t-il le même résultat ? • reproductibilité intra-observateur dntra~rater) : Ie test administré au même patient par le même observateur à deux moments différents aura-t-il le même résultat ? L’outil statistique de la reproductibilité est : • pour les tests qualitatifs (scanner positif/négatif, douleur thoracique oui/non, etc.), le coefficient kappa (k ) de concordance : - k = 0 si la concordance entre les deux mesures est juste liée au hasard, - K = 1 si le ou les observateurs sont d’accord pour toutes les mesures, - On donne habituellement les valeurs suivantes : Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Objectifs et méthodologie des études de performance diagnostique <0 223 Désaccord plus important que le hasard 0,0-0,20 Accord très faible 0,21-0,40 Accord faible 0,41-0,60 Accord modéré 0,61-0,80 Accord fort 0,81-1,00 Accord presque parfait • pour les tests quantitatifs (taux de CRP, valeur de la troponine, clairance de la créatinine, etc.), le coefficient de corrélation intra-classe : il s’agit d’une mesure entre 0 et 1. Un coefficient de corrélation intraclasse à 1 indique une relation de type y = x entre les deux mesures. La reproductibilité est améliorée par la standardisation des conditions de passation du test : les consignes définissant les modalités de réalisation et d’interprétation du test doivent être définies, précises et les mêmes pour tous les patients inclus dans l’étude. Les données sur la reproductibilité (fiabilité OU reliability) sont indispensables, car un test peu reproductible a une erreur de mesure qui parasite les performances diagnostiques et n’est pas applicable en pratique. E n p r a t iq u e Ex e m ple 1 (ED N 2018) Perrotti A, Chenevier-Gobeaux C, Ecarnot F, Bardonnet K, Barrucand B, Flicoteaux G, Lassalle P, Chocron S. Is endocan a diagnostic marker for pneumonia after cardiac surgery? The ENDOLUNG Study. Ann Thorac Surg 2017 ; 105(2) : 535-41. Introduction The development of postoperative pneumonia is a frequent complication after cardiac surgery and is associated with increased in-hospital morbidity and mortality. Cardiac surgery and cardiopulmonary bypass trigger an acute and nonspecific inflammatory reaction. In this context, the diagnosis of infection is challenging, because conventional clinical and biological signs may be misleading. Early détection of postoperative pneumonia makes it possible to initiate appropriate therapy more quickly in these patients. Recent studies hâve underlined the usefulness of endocan as an early predictor of acute lung injury or respiratory failure after major trauma and in septic shock patients. The aim of the présent study was to assess whether endocan can be used as a diagnostic marker for postoperative pneumonia in patients undergoing cardiac surgery. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 224 Études de performances diagnostiques The aim of the présent study was to assess whether endocan can be used as a diagnostic marker for postoperative pneumonia in patients undergoing cardiac surgery. Methods The prospective Endocan Prédictive Value in Postcardiac Surgery Acute Respiratory Failure (ENDOLUNG) study was conducted in the Department of Cardiac Surgery of Besançon University Hospital between January and July 2016. The inclusion criteria were adult patients (aged more than 18 years) scheduled to undergo cardiac surgery and who provided written informed consent. Exclusion criteria were patients aged less than 18 years; emergency surgery; patients with ongoing pulmonary infection, inflammation, or cancer; pregnancy; patient refusai; and adults under legal protection. Blood samples for endocan measurements were collected in 5 mL ethylenediaminetetraacetic acid tubes at five timepoints, namely, at induction of general anesthésia (baseline), and at 6, 24, 48, and 72 hours after the end of surgery. Procalcitonin (PCT)and C-reactive protein (CRP) collected at 24 and 72 hours after the end of surgery. The diagnosis of postoperative pneumonia was suspected on the basis of new détection of lung infiltrâtes on chest radiograph associated with at least two of the following features : fever more than 38.8 °C; leukocytosis (> 11,000 cells/mm3) or leucopenia (< 3,000 cells/mm3); or purulent sécrétion; and confirmed by microbiologie analysis using bronchoalveolar lavage with fiber-optic bronchoscopy. Results Endocan, Procalcitonin, and C-Reactive Protein Levels in Study Population at Different Measurement Timepoints. Variable Total POP Group No-POP Group p Value Endocan, ng/mL Preoperative 3.9 ±2.9 5.3 ± 3.6 3.8 ±2.8 0.030 6 hours 10.5 ± 7.9 142 ± 9.4 10.0 ± 7.6 0.013 24 hours 10.9 ± 9.4 14.6 ± 11.7 10.5 ±9.0 0.065 48 hours 8.2 ± 6.5 10.7 ± 7.8 7.9 ± 6.3 0.083 72 hours 7.1 ±4.9 8.6 ±5.9 6.9 ± 4.9 0.154 24 hours 1.1 ±22 1.9 ±2.3 1.0 ±2.1 0.078 72 hours 1.0 ±2.4 1.9 ± 1.8 0.9 ± 2.4 <0.01 7.2 ± 13.5 12.7 ± 18.4 6.5 ± 12.7 0.012 24 hours 153.6 ±52.6 192.3 ± 57.4 148.7 ± 50.1 0.003 72 hours 225.5 ± 68.6 275.1 ±52.9 220.0 ± 68.2 0.004 Procalcitonin, ng/mL C-reactive protein, mg/L Preoperative Values are mean ± SD. Endocan preoperative (n = 155), 6 hours (n = 155), 24 hours (n = 155), 48 hours (n = 149), 72 hours (n = 141) ; procalcitonin 24 hours (n = 147), 72 hours (n = 137) ; C-reactive protein preoperative (n = 149), 24 hours (n = 150), 72 hours (n = 140). POP = postoperative pneumonia. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Objectifs et méthodologie des études de performance diagnostique 225 Le rationnel de cette étude repose sur le fait que : Il aurait fallu cocher... La concentration d’endocan est prédictive d’atteinte respiratoire aiguë dans le choc septique Commentaires L’ensemble des propositions ci-contre sont formulées dans l’introduction Le diagnostic précoce de pneumonie postopératoire permettrait de raccourcir le délai d’initiation de l’antibiothérapie Les tests biologiques diagnostiques actuellement disponibles peuvent être mis en défaut dans les 2 premiers jours postopératoires La pneumonie postopératoire est une complication fréquente de la chirurgie cardiaque La concentration d’endocan dans le sang circulant augmente en cas de sepsis Il n’aurait pas fallu cocher... Commentaires L’endocan est un marqueur prédictif avéré de la pneumopathie infectieuse postopératoire d’une chirurgie cardiaque C’est un des buts de cette étude de le démontrer L’endocan est un marqueur qui permettrait d’orienter le type d’antibiothérapie probabiliste en cas d’atteinte pulmonaire au cours du choc septique ou après un traumatisme Aucun élément de l’introduction ne permet de faire cette affirmation Il s’agit d’une étude : H aurait fallu cocher... Commentaires Diagnostique Cette étude a pour objectif d’évaluer les performances diagnostiques de l’endocan, c’est donc une étude de performance diagnostique De cohorte prospective L’étude est longitudinale (suivi des patients dans le temps avec plusieurs mesures) et prospective. C’est donc bien une étude de cohorte Unicentrique L’étude est bien conduite dans un seul service Longitudinale Les patients sont suivis de la chirurgie à la survenue (ou pas) d’une pneumopathie Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 226 Études de performances diagnostiques Il n’aurait pas fallu cocher... Commentaires Randomisée Les groupes « POP » et « no-POP » sont autodéterminés, il n’y a évidemment pas de randomisation Transversale L’étude est longitudinale De type cas-témoins Une étude cas-témoins est par nature rétrospective La population cible de l’étude est constituée de patients adultes avec : Il aurait fallu cocher... Une chirurgie cardiaque programmée Il n’aurait pas fallu cocher... Commentaires La population cible est la population à laquelle on souhaite appliquer les résultats. L’inclusion de tous les patients majeurs bénéficiant de chirurgie cardiaque et l’utilisation d’un prélèvement à l’induction anesthésique indiquent clairement que l’étude a pour objet d’évaluer les performances diagnostiques de l’endocan pour prédire une pneumopathie bactérienne chez tous les patients bénéficiant d’une chirurgie programmée, et pas seulement ceux pour lesquels une pneumopathie est suspectée à l’issue de la chirurgie Commentaires Une suspicion de pneumonie postopératoire au décours d’une chirurgie cardiaque programmée Non. L’objectif d’utiliser l’endocan comme un marqueur prédictif de pneumopathie indique bien que la population cible est plus large Une valeur anormale d’endocan à la 6e heure postopératoire d’une chirurgie cardiaque programmée Les patients inclus n’ont pas tous un endocan anormal à la 6e heure Une pneumonie postopératoire confirmée au décours d’une chirurgie cardiaque programmée Les patients inclus n’ont pas tous une pneumopathie Une valeur normale d’endocan avant une chirurgie cardiaque programmée Ce n’est pas un critère d’inclusion Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Objectifs et méthodologie des études de performance diagnostique 227 Les tests diagnostiques de pneumonie postopératoire évalués dans cette étude incluent : Il aurait fallu cocher... Commentaires La concentration sanguine de la C-reactive protein mesurée à la 24e heure postopératoire Nous considérons qu’un test est évalué à partir du moment où il a été confronté à l’examen de référence. Ces trois propositions répondent à cette définition (le tableau de l’exemple 1 les compare entre les groupes « POP » et « no-POP » définis par l’examen de référence) La concentration sanguine d’endocan mesurée à la 6e heure postopératoire La concentration sanguine de la procalcitonine mesurée à la 24e heure postopératoire H n’aurait pas fallu cocher... La radiographie pulmonaire L’analyse microbiologique du liquide de lavage broncho-alvéolaire Commentaires Gold standard = infiltrats radiologiques + 2 critères parmi : fièvre, hyperleucocytose ou leucopénie, sécrétion purulente avec confirmation bactériologique La radiographie pulmonaire et le lavage broncho-alvéolaire font partie de l’examen de référence, ce ne sont donc pas des tests évalués Dans cette étude, il manque une comparaison des performances en discrimination de l’endocan à celles : Il aurait fallu cocher... De la procalcitonine (PCT) De la C-reactive protein (CRP) Commentaires Il serait intéressant de comparer l’AUC (area under curve) de la courbe ROC (receiver operating characteristic) obtenue avec l’endocan avec celles des autres marqueurs habituellement utilisés pour le diagnostic de pneumopathie postopératoire, comme la CRP et la PCT afin d’évaluer l’apport de ce marqueur Il n’aurait pas fallu cocher... Commentaires Des hémocultures réalisées en préopératoire Les hémocultures en périopératoire ne répondent pas tout à fait au même objectif : « diagnostiquer précocement une pneumopathie » D’un modèle de prédiction clinique L’existence d’un modèle de prédiction clinique (score permettant d’évaluer la probabilité clinique de pneumopathie postopératoire) n’est pas évoquée dans l’article De l’analyse microbiologique du liquide de lavage broncho-alvéolaire L’analyse du lavage broncho-alvéolaire fait partie de l’examen de référence et ne peut pas à ce titre être comparé à l’endocan Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 228 Études de performances diagnostiques Quelle(s) information(s) manque(nt) à la description de la stratégie pour établir le diagnostic de référence de pneumonie postopératoire ? Il aurait fallu cocher... Commentaires L’adjudication par un comité indépendant Compte tenu de l’implication de l’équipe de cette étude monocentrique dans cette recherche, il serait en effet souhaitable que le gold standard soit évalué par un comité indépendant de l’étude, afin de garantir l’objectivité de l’évaluation de l’examen de référence. Cette information n’est pas donnée dans le texte L’expertise par plusieurs évaluateurs Des variations inter-observateur possibles de l’évaluation de l’existence d’une pneumopathie (subjectivité de la lecture de l’imagerie par exemple) pourraient justifier l’expertise par plusieurs observateurs L’adjudication en aveugle de la concentration sanguine d’endocan Il est indispensable que l’évaluation de l’examen de référence soit faite en aveugle de l’examen évalué (endocan), ce qui n’est pas précisé dans le texte La durée de suivi des patients La durée de suivi des patients est une information indispensable. Il n’est pas précisé jusqu’à quelle date après la chirurgie une pneumopathie était prise en compte. Cette information est pourtant capitale, car il est clair que plus les événements tardifs sont pris en compte, plus les performances diagnostiques des marqueurs sont mauvaises Il n’aurait pas fallu cocher... Commentaires L’adjudication en aveugle de la concentration sanguine de C-reactive protein (CRP) La CRP fait partie des examens réalisés en routine appartenant à l’arsenal diagnostique à disposition des cliniciens pour effectuer le diagnostic de pneumopathie. Le test principalement évalué dans cette étude étant l’endocan, il ne semblait pas indispensable ou légitime que le diagnostic de pneumopathie soit retenu en aveugle de la CRP ou de la procalcitonine Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Objectifs et méthodologie des études de performance diagnostique > 229 Ex e m ple 2 (ED N 2019) Kumar P, Mardon M, Bradley M, Gray G, Swinkels A. Assessment of glenohumeral subluxation in poststroke hemiplegia: comparison between ultrasound and fingerbreadth palpation methods. Phys Ther 2014 ; 94(11) : 1622-31. Introduction Glenohumeral subluxation (GHS) is a common poststroke complication. The aims of this study were: (1) to compare an ultrasound method of Glenohumeral subluxation (GHS) measurement with the fingerbreadth palpation method using a receiver operating characteristic curve (ROC) and (2) to report the sensitivity and specificity of this method. The fingerbreadth palpation method lacks the sensitivity to detect early signs of GHS or minor subluxations. There is a concern that without treatment, subluxation can progress to an uncorrectable level over time. Radiographs are considered to be objective and hâve high reliability and validity, but problems relating to cost, time involved, and risks inhérent to exposure to radiation limit their utility in the clinical setting. The ultrasound method is currently being investigated and developed for the assessment of GHS in these patients; however, it is not routinely used in clinical settings. Methods Using a large, static ultrasound machine, a study reported high intrarater reliability (intraclass corrélation coefficient [ICC] = .979) of ultrasound measurements of GHS. Patients over 50 years of âge who had stroke resulting in one-sided weakness and who were able to sit upright were eligible to participate. Diagnosis or presence of GHS was not a requirement to be able to participate in the study. The therapist undertaking clinical assessment of GHS was blinded to ultrasound measurements of AGT distance, and the therapist undertaking ultrasound measurements was blinded to clinical assessment. Clinical assessment of GHS by a senior clinical physical therapist using the fingerbreadth palpation method. A standardized protocol was used. Patients were seated in a chair or wheelchair with both feet fiat on the ground or on a footrest. Ultrasound measurements of acromion-greater tuberosity (AGT) distance by the chief researcher. For ultrasound measurements of AGT distance, each patient was placed in the standardized position to allow measurement of AGT distance. The AGT distance was recorded on the frozen image using an onscreen caliper that automatically calculâtes distances. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 230 Études de performances diagnostiques À propos du rationnel de cette étude sur le diagnostic de la subluxation glénohumérale {une ou plusieurs réponses possibles) : Il aurait fallu cocher... Commentaires La radiographie est une méthode diagnostique valide et reproductible mais coûteuse et exposant aux radiations Une méthode existe déjà pour faire le diagnostic de luxation glénohumérale (la radiographie). On cherche ici à améliorer ce qui existe déjà en évaluant un test qui coûte moins cher et avec une meilleure sécurité Il est à noter que la radiographie reste néanmoins sûre et parmi les examens complémentaires les moins coûteux sur le marché En l’absence de diagnostic, la subluxation glénohumérale peut évoluer défavorablement et devenir non curable L’objectif d’un test est en priorité de faire le diagnostic d’une maladie pour laquelle il existe une sanction thérapeutique qui permette d’en enrayer l’évolution défavorable Il n’aurait pas fallu cocher... Commentaires L’examen clinique par palpation est connu pour avoir trop de faux positifs pour la détection précoce de la subluxation glénohumérale L’examen clinique manque de sensibilité : lacks the sensitivity. Un manque de sensibilité revient à dire qu’il y a trop de faux négatifs par rapport au nombre de vrais positifs Trop de faux positifs reviennent à dire que la spécificité est mauvaise Une étude antérieure a objectivé la discordance entre l’examen clinique par palpation et la radiographie pour le diagnostic de la subluxation glénohumérale Ce n’est pas précisé ici et la réponse paraît fausse d’emblée. Pourquoi irait-on évaluer un test dont les résultats ne concordent pas avec le meilleur examen à disposition ? L’examen ultrasonographique a une reproductibilité inter-opérateur élevée pour le diagnostic de subluxation glénohumérale L’échographie a de manière générale une reproductibilité inter-opérateur moyenne (examen opérateur-dépendant), de plus il est précisé ici que c’est la reproductibiltié intra-opérateur qui est élevée {intrarater reliability) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Objectifs et méthodologie des études de performance diagnostique 231 À propos de l’examen clinique par palpation ou fingerbreadtb palpation {une ou plusieurs réponses possibles} : Il aurait fallu cocher... Commentaires La palpation est utilisée comme méthode de référence par les auteurs C’est en effet ce qui a permis de classer les malades dans cette étude, puisque les performances diagnostiques de l’examen échographique sont données par rapport à l’examen clinique La palpation est opérateur-dépendante Malgré la standardisation, il est évident que l’examen clinique est partiellement subjectif Le protocole d’examen clinique par palpation était standardisé Ceci est précisé dans le texte La palpation par un investigateur expérimenté posait le diagnostic final de subluxation glénohumérale Ceci est indiqué par l’adjectif senior Il n’aurait pas fallu cocher... Commentaires La palpation discrimine sans erreur les patients avec versus sans subluxation glénohumérale Le fait que ce soit l’examen de référence pour cette étude ne permet pas d’affirmer qu’il est exempt de toute erreur À propos de la procédure diagnostique échographique {une ou plusieurs réponses possibles} : Il aurait fallu cocher... L’échographie a été réalisée par un opérateur expérimenté qui a reçu une formation spécifique Commentaires Ceci est précisé dans le texte Les mesures sur l’écran de l’appareil d’échographie étaient masquées La distance entre le bord latéral de l’acromion et la marge supérieure de la grande tubérosité est la variable mesurée en échographie Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 232 Études de performances diagnostiques Il n’aurait pas fallu cocher... Commentaires Il s’agit de la méthode diagnostique de référence (gold standard) C’est la palpation manuelle La différence de position du bras entre l’échographie et l’examen clinique par palpation rend la comparaison ininterprétable Non, ce sont des pré-requis techniques de chaque examen Quelles mesures ont été prises pour limiter les biais potentiels dans cette étude ? (Une ou plusieurs réponses possibles.) Il aurait fallu cocher... Commentaires Les évaluateurs effectuant l’examen clinique étaient en aveugle des mesures échographiques C’est ce qui est indiqué par blinded. Cela évite que les performances diagnostiques de l’examen échographique soient artificiellement améliorées par la connaissance du résultat de l’examen de référence L’opérateur réalisant l’échographie était en aveugle des résultats de l’évaluation clinique Tous les patients ont eu l’échographie quel que soit le résultat de l’examen clinique Il n’aurait pas fallu cocher... Commentaires L’ordre de réalisation des examens (palpation versus échographie) était tiré au sort Ce n’est pas précisé dans le texte, bien que cela serait souhaitable L’échographie était réalisée par un opérateur unique La phrase ultrasound measurements of acromion - greater tuberosity (AGT) distance by tbe cbief researcber indique que l’investigateur principal de l’étude a conduit tous les examens échographiques Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Objectifs et méthodologie des études de performance diagnostique 233 Ex e m ple 3 (é preuve t est 2021) Hoffmann MHK, Shi H, Schmitz BL, Schmid FT, Lieberknecht M, Schulze R, et al. Noninvasive coronary angiography with multislice computed tomography. JAMA 25 mai 2005 ; 293(20) : 2471-8. Conventionnal invasive coronary angiography is currently the diagnostic criterion standard for clinical évaluation of known or suspected coronary artery disease (CAD). One recently developed modality that may potentially complément invasive coronary angiography is multislice computed tomography (MSCT), which may achieve a high level of reliability and accuracy in the visualization of the coronary tree. We therefore sought to assess the diagnostic accuracy of 16-slice MSCT, scanning in a large cohort of patients with known or suspected coronary heart disease. À propos des examens complémentaires réalisés dans cette étude : Il aurait fallu cocher... Le scanner multicoupe 16 barrettes était le test dont les performances diagnostiques étaient évaluées Le diagnostic de référence était établi par la coronarographie conventionnelle sélective Il n’aurait pas fallu cocher... Commentaires La réponse est clairement formulée dans l’introduction. Dans une étude de performance diagnostique, on doit repérer immédiatement : le test évalué (ici, le scanner multicoupe) et le test de référence qui sert de comparateur (ici, la coronarographie conventionnelle) Commentaires La coronarographie conventionnelle sélective était le test dont les performances diagnostiques étaient évaluées Ce test est le comparateur (ou gold standard/ou diagnostic de référence) L’épreuve d’effort était le test dont les performances diagnostiques étaient évaluées Ces tests n’interviennent pas dans l’évaluation dont il est question dans l’article Le diagnostic de référence était établi par la scintigraphie myocardique de stress La troponine T était un marqueur utilisé pour définir les patients atteints de coronaropathie obstructive Le diagnostic de référence était établi par le recueil prospectif des événements coronariens Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 22 Courbe ROC et choix d’un seuil En complément V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l a c o u r b e R O C : h t t ps: / / y o u t u .b e / El a W l k J-M Vc In tro d uctio n Cette fiche concerne le cas particulier de l’évaluation des tests de nature quantitative pour lesquels les résultats ne sont pas de nature binaire mais correspondent à une valeur numérique : par exemple, valeur de la procalcitonine (PCT) pour le diagnostic d’infection bactérienne, valeur des D-dimères pour le diagnostic d’embolie pulmonaire, valeur de la troponine pour le diagnostic d’infarctus du myocarde, etc. Le choix d’un seuil est alors nécessaire afin de définir le test comme étant positif ou négatif. Il existe donc dans cette situation une sensibilité (Se) et une spécificité (Sp) pour chaque seuil possible : par exemple, Se et Sp calculées pour des valeurs de PCT à 0,1 ng/L, 0,2 ng/L, 0,3 ng/L, etc. La représentation graphique de toutes ces valeurs est possible grâce à la construction d’une courbe ROC. La co urb e RO C (receiver o p era tin g ch aract eristic) La courbe ROC représente graphiquement toutes les valeurs de sensibilité et de spécificité d’un test en fonction des différentes valeurs du seuil choisi pour discriminer le test comme positif ou négatif. On représente sur l’axe des ordonnées la sensibilité et sur l’axe des abscisses la valeur de « 1 — Spécificité ». Cela revient à dire que l’axe des ordonnées La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 236 Études de performances diagnostiques représente la proportion de vrais positifs et que l’axe des abscisses représente la proportion de faux positifs. Chaque point sur cette courbe représente une valeur seuil du test et se positionne sur le graphique selon sa propre spécificité et sensibilité. On dispose donc une multitude de points correspondant à autant de valeurs seuils et formant finalement une courbe ROC. On comprend alors qu’un test de bonne qualité se rapproche le plus possible de la valeur 1 sur l’axe des ordonnées (sensibilité) et de la valeur 0 sur l’axe des abscisses (1 — Spécificité), ce qui est en fait le point le plus en haut à gauche sur le graphique. Autrement dit, on recherche pour un test le seuil pour lequel on a le plus de vrais positifs et le moins de faux positifs. Point correspondant à la valeur seuil du test pour laquelle la sensibilité est de 90 % et la spécificité de 25 % Point théorique correspondant à une sensibilité et une spécificité de 50 % A ire so us la co urb e RO C L’aire sous la courbe {area under curve ou AUC) permet une évaluation globale des performances en discrimination du test utilisé. Il s’agit d’une valeur entre Oet 1 : • une AUC à 0,5 équivaut à tirer au hasard le résultat d’un test à pile ou face. On retrouve par ailleurs sur cette courbe la valeur seuil pour laquelle la sensibilité et la spécificité sont toutes les deux de 50 % ; • une AUC à 1 correspond au test parfait. On retrouve dans cette situation un seuil pour lequel la sensibilité et la spécificité sont toutes les deux de 100 % (correspondant au point en haut à gauche). De manière schématique, on peut considérer la performance d’un test en fonction de l’AUC de cette façon : • AUC - [0,90-1,00] —> très bonne performance ; • AUC = [0,80-0,90] bonne performance ; • AUC = [0,70-0,80] —» performance moyenne ; • AUC = [0,50-0,70] -à performance médiocre. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Courbe ROC et choix d’un seuil 237 Ch oix d'un seuil Un gain de sensibilité s’accompagnant toujours d’une perte de spécificité et vice-versa, le choix du meilleur seuil revient généralement à choisir le meilleur compromis entre sensibilité et spécificité grâce à la courbe ROC. Le meilleur compromis correspond au seuil dont le point se situe le plus « en haut à gauche » sur la courbe ROC. Ce point le plus proche de l’angle supérieur est celui pour lequel l’indice de Youden est maximal (pour rappel, indice de Youden = Se + Sp - 1). De plus, en fonction de l’objectif du clinicien, il est possible de choisir un autre seuil que ce compromis : • si l’on souhaite gagner en sensibilité, on peut choisir un seuil correspondant à un point situé plus en haut à droite ; • si l’on souhaite gagner en spécificité, on peut choisir un seuil correspondant à un point situé plus en bas à gauche. Pour un test qui augmente la probabilité diagnostique lorsque sa valeur augmente (ex. : CRP, D-dimères, troponine, etc.), les valeurs seuils les plus élevées se situent toujours en bas à gauche de la courbe (bonne spécificité) et celles les plus basses en haut à droite (bonne sensibilité). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 238 Études de performances diagnostiques Par exemple, vous souhaitez évaluer le dosage de la CRP pour le diagnostic d’appendicite chez les patients se présentant aux urgences pour une douleur de la fosse iliaque droite. Vous obtenez la courbe ROC suivante : Le meilleur compromis est de choisir un seuil de CRP à 60 mg/L, seuil pour lequel la sensibilité et la spécificité sont de 80 % chacune (indice de Youden à 0,6). Si l’on décide de diminuer le seuil, on gagnera en sensibilité mais on perdra en spécificité. C’est le cas pour le choix d’un seuil à 6 mg/L : • sensibilité à 98 % : - forte proportion de vrais positifs, - peu de faux négatifs, - le test est utile pour éliminer une appendicite aiguë ; • spécificité à 25 % : - peu de vrais négatifs, - forte proportion de faux positifs, - le test ne permet pas d’affirmer une appendicite aiguë. Si l’on décide, au contraire, d’augmenter le seuil, on perdra en sensibilité mais on gagnera en spécificité. C’est le cas pour le choix d’un seuil à 600 mg/L : • sensibilité à 25 % : - faible proportion de vrais positifs, - beaucoup de faux négatifs, - le test ne permet pas d’éliminer une appendicite aiguë ; Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Courbe ROC et choix d’un seuil 239 • spécificité à 98 % : - forte proportion de vrais négatifs, - peu de faux positifs, - le test est utile pour affirmer une appendicite aiguë. ► Remarque : si la valeur du test est d’autant plus basse que la probabilité diagnostique est élevée (albumine pour le diagnostic de dénutrition, consommation du complément pour le diagnostic de lupus, etc.), les valeurs les plus élevées se situent en haut à droite et celles les plus basses en bas à gauche. En pra tique Ex e m ple 1 (ED N 2018) Perrotti A, Chenevier-Gobeaux C, Ecarnot F, Bardonnet K, Barrucand B, Flicoteaux G, Lassalle P, Chocron S. Is endocan a diagnostic marker for pneumonia after cardiac surgery? The ENDOLUNG Study. Ann Thorac Surg 2017; 105(2) : 535-41. The aim of the présent study was to assess whether endocan can be used as a diagnostic marker for postoperative pneumonia in patients undergoing cardiac surgery. Blood samples for endocan measurements were collected in 5 mL ethylenediaminetetraacetic acid tubes at five timepoints, namely, at induction of general anesthésia (baseline), and at 6, 24, 48, and 72 hours after the end of surgery, in accordance with preanalytical recommendations. Procalcitonin (PCT) and C-reactive protein (CRP) collected at 24 and 72 hours after the end of surgery. The diagnosis of postoperative pneumonia was suspected on the basis of new détection of lung infiltrâtes on chest radiograph associated with at least two of the following features: fever more than 38.8 °C; leukocytosis (> 11,000 cells/ mm3) or leucopenia (< 3,000 cells/mm3); or purulent sécrétion; and confirmed by microbiologie analysis using bronchoalveolar lavage with fiberoptic bronchoscopy. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 240 Études de performances diagnostiques 0.0 0.2 0.6 0.4 0.8 1.0 1 - Specificity Endocan Preop Endocan 6H AUC 0.675 0.702 Sensitivity 650/0 71o/o Specificity 72o/o 75o/o Cut off 3.7 ng/mL 12.1ng/mL Receiver-operating characteristic curves at preoperative (Preop) induction of anesthésia (grey line) and 6 hours (6H) after surgery (orange line). (AUC = area under the curve.) À propos de la courbe présentée dans la figure ci-dessus, il est vrai que : Il aurait fallu cocher... Commentaires L’axe des abscisses représente le taux de faux positifs C’est la signification de 1 - Spécificité L’axe des ordonnées représente le taux de patients avec une pneumopathie bien classés par le test C’est la définition de la sensibilité Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Courbe ROC et choix d’un seuil 241 Il aurait fallu cocher... Commentaires La valeur la plus basse de l’endocan se situe en haut à droite de la courbe Le test augmente la probabilité diagnostique, donc les valeurs les plus basses sont les plus sensibles et les moins spécifiques. Elles se situent bien en haut à droite Pour les valeurs élevées d’endocan, le test à 6 heures est plus spécifique que le test préopératoire On remarque que la courbe orange (correspondant à l’endocan à 6 heures) est au-dessus de la courbe « Endocan_preop » pour les valeurs les plus à gauche, donc les plus élevées Il manque l’intervalle de confiance de l’AUC pour affirmer que le test est significativement plus performant en discrimination que le hasard Pour affirmer que l’AUC est significativement supérieure à 0,5, il serait utile de disposer de l’intervalle de confiance Il n’aurait pas fallu cocher... Commentaires L’AUC de la courbe ROC de l’endocan préopératoire n’est pas significativement supérieure à 0,5 car elle croise la bissectrice La lecture graphique ne permet pas de faire cette affirmation. Seul l’intervalle de confiance de l’estimateur ponctuel de l’AUC le permettrait La courbe suivante a été obtenue pas la méthode de Kaplan-Meier Même si l’aspect de la courbe ressemble à une courbe de survie cumulée, elle n’a aucun rapport avec la méthode de Kaplan-Meier 70,2 % des patients évalués par l’endocan à 6 heures ont été bien classés L’AUC n’a pas cette signification La valeur la plus élevée de l’endocan se situe en haut à droite de la courbe Les valeurs en haut à droite correspondent à des seuils très sensibles et peu spécifiques, ce sont donc les valeurs les plus faibles L’AUC de l’endocan à 6 h a une sensibilité de 71 % et une spécificité de 75 % 71 % et 75 % sont les valeurs de sensibilité et de spécificité de l’endocan à 6 h pour un cut-off choisi à 12,1 ng/mL Une AUC n’a pas de valeur propre de sensibilité et spécificité Ex e m ple 2 (ED N 2019) Kumar P, Mardon M, Bradley M, Gray G, Swinkels A. Assessment of glenohumeral subluxation in poststroke hemiplegia: comparison between ultrasound and fingerbreadth palpation methods. Phys Ther 2014 ; 94(11) : 1622-31. Glenohumeral subluxation (GHS) is a common poststroke complication. The aims of this study were: (1) to compare an ultrasound method of GHS measurement with the fingerbreadth palpation method using a receiver operating characteristic curve (ROC) and (2) to report the sensitivity and specificity of this method. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 242 Études de performances diagnostiques 1 - Specificity Receiver operating characteristic (ROC) curve with area under the receiver operating characteristic (AUROC) curve value of 0.73 (95% confidence interval == 0.63-0.83). Curved line shows sensitivity and specificity varied around different cutoff points. Straight line indicates AUROC curve <0.5 (test not useful). Cutoff points >0.1 to >0.5 cm correspond to sensitivity and specificity. Optimal cutoff point of >0.2 cm indicates 68% sensitivity and 62% specificity. À propos de la courbe ROC et de son interprétation (figure ci-dessus ; une ou plusieurs réponses possibles) : Il aurait fallu cocher... Commentaires La courbe ROC représente la relation entre la sensibilité et (1 — Spécificité) pour chaque seuil de la méthode échographique C’est la définition de la courbe ROC Les différentes mesures exprimées en centimètres correspondent aux seuils fixés arbitrairement par les auteurs pour estimer la sensibilité et la spécificité de l’échographie Un seuil de 0,5 cm est à privilégier pour confirmer le diagnostic par rapport à un seuil de 0,1 cm Le seuil de 0,5 cm est plus spécifique, c’est donc un test plus utile pour affirmer le diagnostic Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Courbe ROC et choix d’un seuil Il aurait fallu cocher... 243 Commentaires Plus de 5 seuils ont été utilisés pour construire la courbe ROC Chaque « marche d’escalier » dans la courbe ROC représente un seuil L’axe des abscisses représente la probabilité d’un diagnostic positif en échographie et négatif à l’examen clinique L’examen de référence étant l’examen clinique dans cette étude, l’axe des abscisses, avec le taux de faux positifs (1-Sp), répond bien à cette définition Il n’aurait pas fallu cocher... Commentaires La diagonale représente les performances diagnostiques de l’examen clinique La diagonale, ou bissectrice, représente une AUC de 0,5, c’est-à-dire les performances diagnostiques d’un test équivalent au hasard L’axe des ordonnées représente la proportion de patients positifs à l’examen clinique parmi les patients positifs en échographie Si l’examen de référence est l’examen clinique, c’est la valeur prédictive positive qui est définie ici et pas la sensibilité Ex e m ple 3 (é preuve t est 2021) Hoffmann MHK, Shi H, Schmitz BL, Schmid FT, Lieberknecht M, Schulze R, et al. Noninvasive coronary angiography with multislice computed tomography. JAMA 25 mai 2005 ; 293(20) : 2471-8. The AUC for identification of patients with sténoses eligible for revascularization was 0.97 (95% CI, 0.91-1.00; complété study cohort). Conducting the same analysis after exclusion of patients who had undergone percutaneous coronary intervention rendered the same AUC value of 0.97, with minimal widening of the confidence bounds (95% CI, 0.90-1.00). Applying conventional invasive angiography stenosis thresholds of greater than 50%, greater than 60%, and greater than 70% resulted in AUC values of 0.97 (95% CI, 0.91-0.99), 0.92 (95% CI, 0.84-0.96), and 0.97 (95% CI, 0.92-1.00), respectively. Threshold optimization for identifying patients appropriate for revascularization occurred at greater than 66% of MSCT stenosis quantification (100% sensitivity, 76.5% specificity). Optimization of both parameters occurred at greater than 76% MSCT stenosis grading (91.4% sensitivity, 91.2% specificity). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 244 Études de performances diagnostiques Le seuil de sténose de 76 % déterminé à l’aide de la courbe ROC du scanner multicoupe 16 barrettes correspond au seuil pour lequel : Il aurait fallu cocher... Commentaires L’évaluation des performances diagnostiques du scanner multicoupe 16 barrettes était optimale Ce seuil de sténose à 76 % permet d’optimiser la sensibilité et la spécificité à 91,4 % et 91,2 % ce qui semble correspondre au meilleur compromis entre la sensibilité et la spécificité. Cela correspond au point le plus proche de l’angle supérieur gauche de la courbe ROC qui est aussi le point pour lequel l’indice de Youden est maximal (pour rappel indice de Youden = Se + SP - 1) Il n’aurait pas fallu cocher... Commentaires L’indice de Youden était maximal Le scanner multicoupe 16 barrettes était plus performant que la coronarographie conventionnelle sélective La coronarographie est l’examen établissant le diagnostic de référence. Il n’y a donc théoriquement pas d’examen plus performant La spécificité était maximale Il n’est pas donné dans le texte le seuil pour lequel la spécificité était maximale La sensibilité était maximale Le seuil pour lequel la sensibilité est maximale est le seuil de 66 % (sensibilité à 100 %). Cela signifie que tous les patients pour lesquels une revascularisation est appropriée ont une sténose évaluée au-delà de 66 % en scanner multicoupe. Cette forte sensibilité est contrebalancée par une perte de spécificité qui est alors de 76,5 % Concernant, l’aire sous la courbe ROC de 0,97 (intervalle de confiance à 95 %, 0,90-1,00) du scanner multicoupe dans le diagnostic de coronaropathie obstructive, quelles sont les réponses vraies ? Il aurait fallu cocher... Commentaires Cet examen a de très bonnes performances diagnostiques dans le diagnostic de coronaropathie obstructive Plus l’aire sous la courbe est proche de 1, plus les performances diagnostiques du test sont les meilleurs. Une AUC = 1 correspond à une spécificité et une sensibilité de 100 % Cet examen a un très bon pouvoir de discrimination dans le diagnostic de coronaropathie obstructive Une autre manière de définir la signification de l’AUC est celle du pouvoir de discrimination. Un test qui a un excellent pouvoir de discrimination permet de bien faire le tri entre les non-malades et les malades. Une AUC = 1 correspond à une sensibilité de 100 % (tous les malades sont classés comme malades) et à une spécificité de 100 % (tous les non-malades sont classés comme non-malades). Une AUC = 1 permet donc de discriminer parfaitement les malades des non-malades Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Courbe ROC et choix d’un seuil 245 Il n’aurait pas fallu cocher... Commentaires Le scanner multicoupe réduirait les coûts associés à la prise en charge des patients avec une suspicion de coronaropathie comparativement à la coronarographie conventionnelle sélective C’est une possible retombée attendue de la mise en place de cet examen aux urgences mais ce n’est pas ce que démontre l’étude. Il faut faire la distinction entre ce que démontre l’étude et les retombées attendues des résultats Le scanner multicoupe pourrait être recommandé comme test diagnostique initial en cas de suspicion de syndrome coronarien aigu avec sus-décalage du segment ST Les patients suspects de SCA avec un sus-décalage du segment-ST ont une indication à la réalisation d’une coronarographie diagnostique et thérapeutique pour revascularisation en urgence. Ces patients n’étaient pas inclus dans l’étude et ne font donc pas partie de la population cible La valeur de l’aire sous la courbe ROC est plus élevée que celle de la coronarographie conventionnelle sélective La coronarographie correspond au test diagnostique de référence. Il n’y a jamais de courbe ROC construite pour l’examen de référence Le scanner multicoupe pourrait réduire de 16 jours le délai moyen d’attente d’un examen d’imagerie pour les patients avec une suspicion de coronaropathie Idem, c’est une retombée attendue ou espérée, non pas ce qui est démontré par l’étude La valeur de l’aire sous la courbe risque d’être fortement modifiée si l’on considérait une population avec une prévalence de coronaropathie obstructive différente La courbe ROC est construite grâce aux valeurs de sensibilité et spécificité estimées pour chacun des seuils d’un test diagnostique de nature quantitative. Contrairement aux valeurs prédictives, la sensibilité et la spécificité sont des caractéristiques intrinsèques du test qui ne sont pas influencées par la prévalence de la maladie dans l’échantillon Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Pa r t ie IV Études observationnelles (analytiques) Pl a n Fiche 23 Fiche 24 Fiche 25 Fiche 26 Fiche 27 Fiche 28 Fiche 29 Objectifs de l’étude Confusion dans les études observationnelles Principes généraux des études cas-témoins et des études de cohorte Etudes cas-témoins : sélection des participants et définition de la maladie Etudes de cohorte : sélection des participants et mesure de l’exposition Recueil des données Analyse des résultats et évaluation de la causalité 249 251 269 279 287 293 303 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 23 Objectifs de l’étude Et u d es o bserva tio n n elles d escrip tives Elles comprennent : • les études transversales de prévalence : étude de la fréquence d’un problème de santé au sein d’une population à un moment donné. On y calcule une proportion exprimée généralement par un nombre de cas divisé par le nombre de sujets appartenant à la population d’étude. Cette proportion correspond à la prévalence de la maladie au sein de la population étudiée. Exemple : prévalence du diabète de type 2 en France estimée à 4,5 % en 2021 (3 millions de patients pour une population de 67 millions d’habitants) ; • les études longitudinales d’incidence : étude de la survenue d’un phénomène au cours d’une période de temps. On calcule un taux d’incidence qui s’exprime en nombre de nouveaux cas rapporté à l’effectif de la population d’étude selon la durée de suivi considérée. Ce taux s’exprime en personnes-années. Exemple : taux d’incidence du cancer du sein chez les femmes en 2015 en France estimé à 243 pour 100 000 personnes-années (c’est-à-dire 243 nouveaux cas de cancer pour 100 000 femmes indemnes de la maladie suivies pendant 1 an). Leur objectif est de décrire l’ampleur d’un phénomène de santé ainsi que son évolution au sein d’une population. Le but peut être d’orienter par la suite les politiques de santé publique en ciblant par des actions concrètes les pathologies les plus fréquentes ou celles dont l’incidence augmente. De plus, grâce à ce type d’étude, on orientera potentiellement le champ de la recherche ultérieure après avoir procédé à une étape de description, notamment avec la réalisation d’études analytiques ou interventionnelles. Par exemple, une étude observationnelle longitudinale retrouve une incidence plus élevée de cancers au sein d’un département ; il sera intéressant de construire par la suite une étude observationnelle analytique afin de mettre en évidence des facteurs de risque de survenue de cancer présents spécifiquement au sein de ce département. Ét u des o bserva tio n n elles analytiq u es Il existe deux grands types d’études : • l’étude cas-témoins : - on compare l’exposition à un facteur de risque d’un groupe de sujets atteints de la maladie à l’exposition d’un groupe de sujets sains. Le recueil de l’exposition est alors réalisé de manière rétrospective, La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 250 Études observationnelles (analytiques) - exemple : étude de l’association entre myélodysplasie et exposition aux alkylants en comparant l’exposition passée aux alkylants entre un groupe de patients atteints par la maladie et un groupe de patients non malades ; • l’étude de cohorte de type exposés/non exposés : - on suit dans le temps un groupe de sujets exposés à un facteur de risque que l’on compare à un groupe de sujets non exposés. On recueille alors la survenue de la maladie de manière prospective, - exemple : étude de l’association entre myélodysplasie et exposition aux alkylants en comparant l’apparition de la maladie entre un groupe de patients ayant reçu une chimiothérapie à base d’alkylants et un groupe de patients n’en ayant pas reçu. L’objectif est d’évaluer une relation entre une exposition et une maladie. Cette relation peut être : • étiologique : - on recherche alors un ou des facteurs de risque, c’est-à-dire un ou des éléments entraînant une augmentation du risque de déclarer la maladie. On recherchera éventuellement des facteurs protecteurs qui sont eux associés à un moindre risque de déclarer la maladie, - exemple : étude observationnelle étiologique examinant la relation entre tabagisme et survenue de cancer du poumon ; • pronostique : - on recherche ici un ou des éléments associés à une augmentation ou une diminution de la gravité ou du pronostic d’une maladie chez des malades, - exemple : étude observationnelle analytique étudiant les facteurs pronostiques de mortalité des patients atteints d’un cancer du poumon. Dans tous les cas, des mesures d’association entre le facteur de risque et la maladie étudiée - comme le risque relatif (RR), hazard ratio (HR) et Vodds ratio (OR) - sont calculées (voir partie I). Co nsid éra tio ns é t hiq u es La méthodologie serait plus robuste grâce à la réalisation d’études interventionnelles dans lesquelles l’exposition au facteur de risque serait contrôlée par l’investigateur. Mais cela n’est le plus souvent pas possible en raison d’un manque de faisabilité ou parce que l’éthique ne l’accepterait pas. Par exemple, si l’on cherche à connaître l’influence du tabac sur le poids de naissance des nourrissons, il serait éthiquement inacceptable de construire une étude interventionnelle dans laquelle on comparerait le poids de naissance des nourrissons de deux groupes de patientes dont l’un serait encouragé à fumer pendant la grossesse et l’autre non. On mettra plutôt en place une étude castémoins où l’on recueillera de manière rétrospective l’exposition au tabac pendant la grossesse entre deux groupes de nourrissons (groupe avec un petit poids de naissance versus groupe avec un poids de naissance normal). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 24 Confusion dans les études observationnelles En complément V o u s p o u v e z co ns u l t e r c e t t e v i d é o s u r le b i a is d e co n f u sio n d a n s l e s é t u d e s o bs e r v a t io n n ell e s : h t t ps: / / y o u t u .b e / 2 B 2 assz 8 u a k Positio n du pro blè m e Dans un essai clinique randomisé, les patients exposés au médicament sont parfaitement comparables aux patients non exposés au médicament.. La seule différence entre les deux groupes est le traitement. Dans une étude observationnelle analytique : • les cas ne sont pas comparables aux témoins ; • les exposés ne sont pas comparables aux non-exposés. L’absence de randomisation de l’exposition rend extrêmement difficile l’interprétation du lien entre l’exposition et la maladie. Les fumeurs ne sont évidemment pas comparables aux non-fumeurs, les agriculteurs exposés à l’utilisation de glyphosates ne sont pas comparables à ceux qui refusent de l’utiliser, etc. En particulier, ces groupes ne sont pas comparables pour les autres facteurs de risque de la maladie. C’est la raison pour laquelle une étude observationnelle, même très bien conduite, ne permet jamais de conclure formellement à la causalité contrairement aux études expérimentales. Tout l’enjeu de la constitution de l’échantillon et de l’analyse sera donc d’essayer de prendre en compte les différences entre les groupes et de les interpréter au mieux. D éfinitio n d e la co n f usio n (v oir fich e 2) Le biais de confusion (confounding bias) survient en présence d’un ou de plusieurs facteurs de confusion (confounding factors). Un facteur de confusion est La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 252 Études observationnelles (analytiques) une variable associée à la fois à la maladie et à l’exposition et ne faisant pas partie de la chaîne causale entre l’exposition et la maladie. On parle de biais de confusion lorsque le lien apparemment observé entre un facteur de risque (exposition au café) et une maladie (le cancer du poumon) est pour tout ou partie dû à un autre facteur (le facteur de confusion : les gros consommateurs de café sont plus souvent fumeurs ; c’est l’exposition au tabac qui explique le lien apparent entre café et cancer du poumon). Prenons l’exemple d’une étude observationnelle qui examine le lien entre vaccination antigrippale et décès chez des patients insuffisants cardiaques : • les patients vaccinés meurent plus souvent ; • les patients les plus graves sont plus souvent vaccinés ; • les patients graves meurent plus souvent. Le lien entre vaccin et décès est uniquement expliqué par la gravité des malades. La gravité de l’insuffisance cardiaque est un facteur de confusion dans l’étude du lien entre la vaccination et le décès. Si on ajuste l’effet de la vaccination sur la gravité de la maladie, le vaccin devient protecteur. La confusion est un biais dont la prise en compte est essentielle dans les études observationnelles. La prise en compte d’un facteur de confusion peut modifier considérablement les mesures d’association : risque relatif (RR), hazard ratio (HR), odds ratio (OR). A nalyse du t a bleau d escrip tif de la p o p ula tio n (co m p aran t les cas e t les t é m oins ou les ex p osés e t les non ex p osés) Contrairement aux essais cliniques randomisés, dans lesquels le premier tableau descriptif permet de vérifier l’équilibre des caractéristiques entre les groupes obtenus par randomisation (rendant les tests de signification peu utiles, voir fiche 12 sur la randomisation), les groupes étudiés ne sont habituellement pas comparables dans une étude observationnelle. Le tableau descriptif a comme principal intérêt d’identifier les différences entre les groupes (et donc les facteurs de confusion potentiels). L’utilisation de tests statistiques peut trouver ici son utilité, les différences observées n’était pas, a priori, liées au hasard. ► Attention ! Dans les études observationnelles de forte puissance (plusieurs milliers de patients), des différences minimes/non cliniquement pertinentes entre les groupes peuvent être néanmoins significatives (p < 0,05). Dans ce cas, la pertinence clinique de la différence (la taille de l’effet) est plus intéressante que le niveau de significativité. Par exemple, dans une étude portant sur les facteurs prédictifs du décès en hospitalisation chez 100 000 patients hospitalisés, une différence de CRP de 0,2 mg/L (taille de l’effet : 0,2 mg/L) est significative (degré de signification p < 0,0001), mais n’a aucune pertinence clinique. La réponse au QCM « la p-value est peu informative du fait de la grande taille de l’échantillon » est souvent vraie dans ce cas. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Confusion dans les études observationnelles 253 Co m m e n t pren dre en co m p t e les f act eurs d e co n f usio n d ans les é t u d es analytiq u es ? Pour cette partie, nous prendrons pour exemple le lien entre fente labiopalatine (FLP) et consommation de café pendant la grossesse. Le tabagisme est plus fréquent chez les grandes consommatrices de café et est associé aux fentes labiopalatines. On cherche à prendre en compte l’effet du facteur de confusion « tabagisme ». Au moment de la planification de l'étude • Restriction de population : - cette technique consiste à restreindre l’étude aux patients pour lesquels le facteur de confusion n’est pas observé. On limite l’étude (ou l’analyse) aux patientes non fumeuses. L’association observée entre café et FLP ne peut donc pas être liée au tabac ; - inconvénients : l’échantillon est sélectionné de fait et on ne pourra pas étudier l’effet du tabac ni l’interaction entre le tabac et le café sur le risque de FLP. • Appariement {matcbing) : - il s’agit de rendre artificiellement comparables les cas et les témoins (ou les exposés et les non-exposés) pour un ou plusieurs facteurs de confusion ; - dans le cas d’une étude cas-témoins, pour chaque cas fumeur, on inclut un témoin fumeur {idem pour les non-fumeurs). On a donc exactement la même proportion de fumeurs et de non-fumeurs chez les cas et les témoins ; - inconvénient : on ne peut pas étudier l’effet du tabac sur la FLP car par définition, il y a autant de fumeurs chez les cas et les témoins (l’effet du tabac s’annule). Au moment de l'analyse de l'étude • Stratification {stratification) : - on réalise l’analyse selon différents niveaux (correspondant aux différentes strates du facteur de confusion). Cela revient à réaliser une analyse en sousgroupes. Dans notre exemple, cela reviendrait à étudier l’effet de la consommation de café dans chaque strate de la variable tabac, c’est-à-dire chez les fumeurs et les non-fumeurs séparément ; - avantage : on peut estimer l’effet chez les fumeurs et les non-fumeurs (le café est peut-être plus délétère chez les mères fumeuses, on parle alors de modificateur de l’effet ou de facteur d’interaction) ; - inconvénient : on ne peut plus étudier l’effet de la variable de stratification (car il y a un groupe avec seulement des fumeurs et un avec seulement des non-fumeurs). • Ajustement {adjustment) : cette technique permet par l’intermédiaire d’une analyse multivariée de calculer des mesures d’association (RR, OR, HR ou moyenne estimée) ajustées {adjusted en anglais, par opposition aux coefficients dits bruts ou crude ou unadjusted en anglais) permettant de prendre en compte le lien entre tabac et FLP. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 254 Études observationnelles (analytiques) C'est q u oi, m a t hé m a tiq u e m en t, une analyse m ultivariée ? C’est une équation qui fournit la probabilité d’une variable qualitative (comme le décès ou l’apparition d’une maladie) ou la valeur d’une variable quantitative (comme le nombre de jours passés en réanimation) en fonction de tous les facteurs de risque et de tous les facteurs de confusion. L’équation se présente comme suit : Probabilité (fente labiopalatine) = a (si consommation de café) + b (si sexe masculin) + c (si tabac) + d (si supplémentation vitaminique) • La maladie est la variable dépendante (ou à expliquer) ; • la consommation de café, le sexe, le tabac et la supplémentation vitaminique sont les variables indépendantes (ou explicatives) ; • la consommation de café est l’exposition d’intérêt ; • le sexe, le tabac et la consommation vitaminique sont des variables d’ajustement, facteurs de confusion potentiels. Ce modèle permet d’étudier le lien entre le café et la FLP, indépendamment de toutes les autres variables. a, b, c, et d sont les coefficients associés à chaque variable, on peut calculer, à partir de leur valeur, des HR, RR, OR ou moyennes ajustées selon le type de modèle utilisé. Chaque coefficient est estimé indépendamment de l’effet des autres (c’est pour cela que l’on parle de variables indépendantes). ► Remarque : on peut réaliser une analyse multivariée dans chaque strate d’une analyse stratifiée. Cas p articulier d'ajuste m e n t / a p p arie m e n t : le score d e pro pensio n Un score de propension est une variable qui estime la probabilité d’être exposé ou d’être non exposé, en fonction de toutes les variables associées à l’exposition. Pour rendre les exposés et les non-exposés comparables le plus possible, on peut ensuite soit apparier les exposés et les non-exposés sur le score de propension, soit ajuster l’analyse de la relation entre l’exposition et la maladie sur le score de propension. Prenons l’exemple d’une étude observationnelle évaluant le risque hémorragique en fonction de la reprise on non des anticoagulants après une hémorragie digestive. Cette étude n’est pas randomisée, ce sont les médecins qui décident quel patient reçoit le traitement anticoagulant : • un patient âgé ayant déjà fait plusieurs épisodes hémorragiques sans antécédent cérébrovasculaire ischémique a un score de propension très faible (probabilité de reprise des anticoagulants faible) ; • un patient ayant une embolie pulmonaire récente a un score de propension très élevé. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Confusion dans les études observationnelles 255 L’ajustement sur le score de propension se fait en ajoutant, dans l’équation du modèle multivarié, la valeur du score de propension comme variable indépendante. En ce qui concerne l’appariement sur le score de propension, pour chaque patient ayant reçu des anticoagulants avec un score de propension faible, on apparie un autre patient n’en ayant pas reçu et ayant aussi un score faible. Les exposés et les non-exposés sont donc plus ou moins comparables... Malheureusement, cet exercice demande de très grandes cohortes de malades, car il y a très peu de malades ayant reçu des anticoagulants avec un score de propension faible, et très peu n’en ayant pas reçu avec un score de propension élevé. Ex e m ple Une étude cas-témoins s’intéresse à la relation entre consommation d’alcool et cancer de la vessie. L’OR brut calculé est : OR = 2,5 (IC95 % : 1,8-3,2). L’interprétation du résultat brut est de conclure que la consommation d’alcool est associée à la survenue du cancer de la vessie étant donné que OR > 1 et que l’intervalle de confiance (IC) de l’OR ne comprend pas la valeur 1. Mais les résultats présentés ainsi sont difficiles à interpréter car le facteur de confusion « tabagisme » n’a pas été pris en compte. Les différentes stratégies possibles de prise en compte du biais de confusion dans cette étude sont présentées ci-dessous : • restriction de population : la restriction de population consisterait à exclure chez les témoins et les cas tous les patients consommant du tabac. On pourrait ainsi évaluer l’association entre l’alcool et le cancer de vessie en s’affranchissant de l’effet de confusion lié au tabac. L’inconvénient de cette technique est qu’elle exclut une partie des patients, ce qui rend la population d’étude moins représentative de la population cible ; • appariement : l’appariement consisterait à sélectionner un témoin fumeur pour chaque cas fumeur et un témoin non-fumeur pour chaque cas nonfumeur. Le facteur de confusion « tabac » serait alors équilibré entre les deux groupes. Cette technique nécessiterait que l’on prenne en compte l’importance Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 256 Études observationnelles (analytiques) du tabagisme (pour ne pas associer un témoin avec une consommation de 50 paquets-années à un cas avec une consommation de 5 paquets-années) ; • stratification : la stratification consisterait ici à calculer un OR dans des groupes différents (un groupe de sujets fumeurs et un groupe de sujets nonfumeurs, par exemple). Cela permet d’interpréter les résultats dans chacune des strates du facteur de confusion afin d’en effacer l’effet. En général, les auteurs présentent un tableau par strate avec l’effet du facteur de risque étudié : - strate 1 : tabagisme actif Analyse univariée : OR brut (IC95 %) 0,97 (0,7-1,24) Consommation d’alcool - strate 2 : tabagisme sevré et non-fumeurs Analyse univariée : OR brut (IC95 %) Consommation d’alcool 1,04 (0,90-1,18) On lit dans ce tableau que la consommation d’alcool n’entraîne pas de surrisque de cancer de vessie après stratification selon la consommation de tabac, les OR étant proches de 1 ; • ajustement : il consisterait, à l’aide d’une analyse multivariée, à calculer un OR ajusté qui prendrait en compte le facteur de confusion en « effaçant » son effet sur l’analyse. Analyse univariée : OR brut (IC95 %) Consommation d’alcool 2,5 (1,8-3,2) Analyse multivariée : OR ajusté (IC95 %) 1,41 (0,88-1,94) Ce tableau indique le risque de survenue du cancer de vessie en cas de consommation d’alcool en analyse univariée et multivariée. L’OR est donné après ajustement sur la consommation de tabac, l’âge et le sexe. On remarque que la consommation d’alcool n’est pas associée significativement à la survenue du cancer de vessie après analyse multivariée car l’IC à 95 % de l’OR comprend la valeur 1. On dit que l’OR ajusté correspond à l’effet de l’alcool indépendamment de la consommation de tabac. En pra tique Ex e m ple 1 (ED N 2016) Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai consumption of coffee and caffeine-containing beverages and oral clefts: a population-based case-control study in Norway. Am J Epidemiol 2009 ; 169 : 1216-22. Introduction: Orofacial clefts are among the most common birth defects, and the prevalence in Norway (2.2 per 1,000 livebirths) is particularly high. The etiology of clefts is complex and largely unknown. The high risk of récurrence Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Confusion dans les études observationnelles 257 of clefts among first-degree relatives (as much as 56 times the background prevalence) suggests a strong genetic component. However, environmental factors such as maternai nutrition, vitamin supplément, smoking, and binge alcohol consumption also appear to contribute. Methods: There were 676 women in Norway who delivered infants requiring surgery for orofacial clefts during 1996-2001. We excluded 24 mothers who did not speak Norwegian or whose infant died after birth, leaving 652 eligible mothers. Of these, 88% (n = 573) agreed to participate. We randomly selected 1,022 control mothers of livebirths via the national Medical Birth Registry within 6 weeks of delivery. After excluding 16 who were not Norwegian speakers or whose infant died, 1,006 mothers of Controls were eligible, of whom 76% (n = 763) agreed to participate. Pourquoi, dans cette étude, le tabagisme actif est-il un facteur de confusion potentiel de l’association observée entre la consommation de café au cours du premier trimestre de grossesse et le diagnostic de fente labiopalatine à la naissance ? Il aurait fallu cocher... Commentaires Le tabagisme est un facteur de risque de fente labiopalatine identifié dans la littérature Un facteur de confusion est par définition lié à la maladie et à l’exposition sans relation de chaîne causale entre les deux. Le tabagisme est bien un facteur de risque de fente labiopalatine comme souligné dans l’introduction, ce facteur est donc lié à la maladie Car il est possible que les femmes fumeuses consomment plus de café que les non-fumeuses De plus, il est tout à fait possible qu’il existe un lien entre la consommation de tabac et la consommation de café, ce qui indique que le tabac est potentiellement lié à l’exposition Il n’aurait pas fallu cocher... Commentaires Car la prévalence du tabagisme actif au premier trimestre de grossesse diffère entre les cas et les témoins dans cette étude Il s’agit d’une conséquence de la relation entre le tabac et la survenue de fentes labiopalatines et ça ne justifie donc pas la prise en compte a priori du tabac comme facteur de confusion potentiel Car l’information sur le tabagisme a été recueillie rétrospectivement par questionnaire dans cette étude C’est un choix méthodologique qui n’a aucun rapport avec l’identification des facteurs de confusion potentiels Car le tabagisme passif et l’absence de tabagisme ont été regroupés au sein d’une seule et même catégorie dans cette étude C’est un choix méthodologique qui n’a aucun rapport avec l’identification des facteurs de confusion potentiels Statistical analysis: The risk of delivering offspring with an orofacial cleft was estimated by odds ratios with 95% confidence intervals in unconditional logistic régression models. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 258 Études observationnelles (analytiques) Adjustments were made for potential confounders (factors associated with clefts in other studies, most of which were also associated in our study), namely, dietary vitamin A (quartiles), dietary folate (quartiles), folie acid supplément (400 Ig/day, yes or no), vitamin supplément use (yes or no), consumption of alcohol in early pregnancy (number of drinks per sitting), smoking (ordinal linear with 5 categories: none; passive only; and 1-5, 6-10, and >11 cigarettes a day), nausea during the first trimester (yes or no), employment in early pregnancy (yes or no), éducation (ordinal linear with 6 categories), father’s income (ordinal linear with 3 categories), and year of birth. Results: The association between coffee consumption and cleft palate persisted among nonsmokers (among whom there would presumably be no residual confounding by smoking) and among mothers of isolated cleft cases. Quelle(s) stratégie(s) les auteurs ont-ils utilisée(s) pour s’affranchir, dans cette étude, de l’effet du facteur de confusion « tabagisme actif au cours du premier trimestre de grossesse » ? Il aurait fallu cocher... Commentaires La restriction aux mères non fumeuses La restriction de population a consisté ici à s’intéresser au sein d’une analyse en sous-groupes aux mères non fumeuses permettant de s’affranchir de l’effet du tabac dans cette population L’ajustement à l’aide d’un modèle de régression logistique multivariée non conditionnelle Les modèles d’analyse statistique multivariée permettent de calculer des OR ajustés (contrairement aux OR bruts des analyses univariées) qui représentent la relation entre l’exposition et la maladie en s’affranchissant de l’effet des facteurs de confusion inclus dans le modèle Il n’aurait pas fallu cocher... Commentaires L’estimation d’OR bruts Les OR bruts correspondent aux résultats de l’analyse univariée qui ne prend par définition pas en compte l’implication d’éventuels facteurs de confusion Un test de tendance sur la consommation de café L’intérêt d’un test de tendance est la recherche d’une relation dose-effet entre l’exposition et la maladie (voir fiche 29) L’appariement de témoins à chaque cas L’appariement sur le facteur de confusion « tabagisme » aurait consisté à inclure un témoin avec tabagisme pour un cas avec tabagisme permettant ainsi d’équilibrer la distribution du facteur de confusion dans les 2 groupes. Mais cela n’a pas été le cas ici Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Confusion dans les études observationnelles 259 Discussion: There is no known mechanism by which coffee intake might increase the risk of CLP. Effects on homocystéine is one potential pathway. Evidence suggests that maternai hyperhomocysteinemia may be linked to increased risk of CLP. Coffee intake increases the plasma concentration of homocystéine, as does smoking, a well-established risk factor for CLP. [...] Folie acid suppléments are consistently associated with reduced risk of CLP, and such suppléments reduce plasma homocystéine. Women may reduce their coffee consumption as they develop pregnancy symptoms of nausea and vomiting. Given that closure of the lip and palate occurs relatively late in the first trimester (8-12 weeks after the last menstrual period), it is possible that reported coffee intake is greater than actual consumption at the crucial stage of embryonic development. Sur la base des informations données dans cet article, quel(s) facteur(s) de confusion potentiel(s) supplémentaire(s) les auteurs auraient-ils pu prendre en compte ? Il aurait fallu cocher... Commentaires Les antécédents familiaux Les antécédents familiaux sont décrits dans l’introduction comme étant un facteur de risque de fente labiopalatine mais ne sont pas pris en compte dans l’analyse statistique ajustée Il n’aurait pas fallu cocher... Commentaires La consommation de café au deuxième trimestre Ce n’est pas une variable d’ajustement judicieuse à prendre en compte car la fermeture labiopalatine intervient entre 8 et 12 semaines d’aménorrhée, c’està-dire au cours du premier trimestre L’homocystéinémie chez la mère Impossible à recueillir dans une étude rétrospective, ce facteur interviendrait en outre dans la « chaîne causale » entre consommation de café et développement d’une fente labiopalatine L’âge gestationnel Réponse fausse pour la même raison que la consommation de café au deuxième trimestre L’activité physique La relation entre l’activité physique et les fentes labiopalatines ou la consommation de café n’est pas mentionnée dans l’article Ex e m ple 2 (ED N 2017) Fondell E, Fitzgerald KC, Falcone GJ, O’Reilly EJ, Ascherio A. Early-onset alopecia and amyotrophie latéral sclerosis: a cohort study. Am J Epidemiol 2013 ; 178(7) : 1146-9. We explored the association of early-onset alopecia and ALS in the Health Professionals Follow-up Study, a large cohort of 51,529 US men. In 1992, the participants (then aged 46-81 years) were asked to report their hair line pattern at âge 45 years. There are few established risk factors for either alopecia Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 260 Études observationnelles (analytiques) or ALS (Amyotrophie Latéral Sclerosis). Smoking has been suggested to increase the risk of ALS, as well as alopecia. High premorbid body mass index (weight (kg)/height (m)2) and vitamin E intake hâve been reported to be associated with a lower ALS risk. However, these variables are not known to be associated with alopecia and were therefore included in secondary analysis only. In a subanalysis, we excluded users of finasteride, a drug that blocks dihydrotestosterone production and that is used to treat enlarged prostate and alopecia; in this subanalysis, we used as baseline the date of return of the 1996 questionnaire, which was the first to inquire about finasteride use. To avoid the potential influence of alopecia-associated drug use, we excluded finasteride users in a secondary analysis (2 cases among 716 users). Relative Risk of Amyotrophie Latéral Sclerosis by Level of Balding In Men In the Health Professionals Follow-up Study, 1992-2008. Multivariate Relative Riska 95 % CI Multivariate Relative Riskb 95 % CI Referent 1.00 Referent 1.00 Referent 1.45 0.71, 2.97 1.47 0.72, 2.99 1.44 0.71, 2.95 2.69 1.20, 6.01 2.74 1 23, 6.13 2.75 1.23, 6.15 Level of Balding No.of ALS Cases Age95 % CI Adjusted Relative Risk No alopecia 13 1.00 Moderate alopecia 18 Extensive alopecia 11 Pfrend 0.020 0.018 0.018 Abbreviations: ALS, amyotrophie latéral sclerosis; Cl, confidence interval. a Adjusted for âge (in single years) and smoking status (current, previous, or never). b Adjusted for âge (in single years), smoking status (current, previous, or never), body mass index (weight (kg)/height (m)2) (in categories of underweight, normal, overweight, and obese), and vitamin E supplément use (yes or no). Pourquoi le tabagisme aurait pu constituer un facteur de confusion expliquant, en partie, l’association observée entre l’alopécie et la survenue d’une sclérose latérale amyotrophique dans cette étude ? Il aurait fallu cocher... Commentaires Le tabagisme est un facteur de risque potentiel de sclérose latérale amyotrophique (SLA) rapporté dans la littérature Un facteur de confusion est par définition lié à la maladie et à l’exposition sans relation de chaîne causale entre les deux Le tabagisme est un facteur de risque de SLA, ce facteur est donc lié à la maladie Le tabagisme est associé à un risque accru d’alopécie dans la littérature Comme souligné dans le texte, le tabagisme est un facteur de risque d’alopécie, ce facteur est donc lié à l’exposition Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Confusion dans les études observationnelles 261 Il n’aurait pas fallu cocher... Commentaires L’information recueillie sur le tabagisme est de nature déclarative dans cette étude La manière de recueillir un facteur de confusion n’a aucun rapport avec les relations éventuelles qu’il pourrait avoir avec la maladie et l’exposition L’ajustement sur le tabagisme en analyse multivariée modifie peu l’estimation ponctuelle du risque relatif L’ajustement permet de gommer l’effet d’un facteur de confusion sur l’évaluation de la relation entre l’exposition et la maladie. Donc au contraire, une analyse multivariée modifierait davantage l’estimation du risque relatif si le tabagisme était un vrai facteur de confusion La prévalence du tabagisme décroît avec la sévérité de l’alopécie C’est le contraire dans cette étude, et la réponse paraît fausse à la première lecture car si le tabagisme était un facteur de confusion, on s’attendrait plutôt à une augmentation de la prévalence Quelle(s) stratégie(s) emploient les auteurs pour s’affranchir de l’effet de l’utilisation de finastéride dans l’analyse de l’association entre l’alopécie et la sclérose latérale amyotrophique ? Il aurait fallu cocher... Commentaires La restriction de l’analyse aux non-utilisateurs de finastéride Les auteurs ont exclu 2 cas de SLA ayant consommé du finastéride. La restriction de population consiste ici à exclure tous les individus ayant consommé ce médicament, permettant ainsi de s’affranchir de l’effet de ce possible facteur de confusion dans l’évaluation de l’association entre alopécie et SLA Il n’aurait pas fallu cocher... Commentaires L’ajustement à l’aide d’un modèle multivarié Un modèle multivarié a bien été mis en place mais celui-ci ne prend pas en compte l’utilisation de finastéride (voir les annotations en bas du tableau de résultats : ajustement sur l’âge, tabagisme, body mass index et supplémentation en vitamine E) La stratification sur la prise ou non de finastéride Une stratification aurait consisté à réaliser une analyse en sous-groupes et donc à calculer un risque relatif chez les utilisateurs de finastéride et un risque relatif chez les non-utilisateurs de finastéride. Cela n’aurait de toute façon pas été possible vu le faible nombre d’individus (à savoir deux) avec SLA parmi les consommateurs de finastéride > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 262 Études observationnelles (analytiques) Il n’aurait pas fallu cocher... Commentaires L’appariement des cas et des témoins sur l’utilisation de finastéride Il s’agit d’une étude de cohorte prospective, non d’une étude cas-témoins. L’appariement aurait consisté à recruter pour chaque cas de SLA ayant utilisé du finastéride un témoin ayant également utilisé du finastéride, et de recueillir de manière rétrospective l’exposition « alopécie à 45 ans ». La répartition du facteur de confusion aurait donc été équilibrée entre les 2 groupes La standardisation sur la prise de finastéride La standardisation est une technique utilisée généralement au cours d’études épidémiologiques descriptives. Elle permet par exemple de comparer des taux de mortalité de deux populations qui ne sont pas comparables à la base sur un facteur donné (l’âge le plus souvent) Ex e m ple 3 (ED N 2018) Perrotti A, Chenevier-Gobeaux C, Ecarnot F, Bardonnet K, Barrucand B, Flicoteaux G, Lassalle P, Chocron S. Is endocan a diagnostic marker for pneumonia after cardiac surgery? The ENDOLUNG Study. Ann Thorac Surg 2017; 105(2) : 535-41. Multivariate Analysis of Predictors of Acute Lung Injury Before Surgery and at 6 Hours. Variables p Value OR (95 % CI) Preoperative 0.06 Body mass index > 27 kg/m2 3.34 (0.96-11.65) Intervention duration, minutes 0.03 1.01 (1.00-1.02) Preoperative endocan >3.67 ng/mL 0.01 4.38 (1.35-14.25) 0.02 4.91 (1.32-18.33) At 6 hours after surgery Body mass index > 27 kg/m2 Intervention duration, minutes 0.048 1.01 (1.00-1.02) Endocan at 6 hours >12.1 ng/mL 0.001 7.36 (2.16-25.07) Cl = confidence interval; OR = odds ratio. L’indice de masse corporelle supérieur à 27 kg/m2 et la durée d’intervention ont été introduits dans le modèle d’analyse multivariée (tableau ci-dessus) pour : Il aurait fallu cocher... Commentaires S’affranchir de l’effet de ces deux facteurs de confusion potentiels D’une manière générale, l’analyse multivariée permet de contrôler l’effet des facteurs de confusion lorsque les 2 groupes comparés (pneumopathie postopératoire et pas de pneumopathie postopératoire) ne sont pas comparables. Les facteurs significativement associés à la maladie en analyse multivariée le sont indépendamment des autres facteurs introduits dans le modèle Identifier les prédicteurs indépendamment associés à la pneumonie postopératoire Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 263 Confusion dans les études observationnelles > Il n’aurait pas fallu cocher... Commentaires Déterminer le seuil optimal de la concentration sanguine d’endocan (3,67 ng/mL) en période préopératoire Le seuil de 3,67 a été fixé avant cette analyse par l’analyse de la courbe ROC (une analyse multivariée ne permet pas de fixer un seuil pour un marqueur diagnostique) Contrôler les fluctuations aléatoires d’échantillonnage L’analyse multivariée ne permet pas de limiter les fluctuations d’échantillonnage Corriger le biais lié à la subjectivité du diagnostic de référence de pneumonie postopératoire L’analyse multivariée ne permet pas de corriger les erreurs de classement éventuelles sur la définition de la pneumopathie (la mesure des variables est déjà faite au moment de l’analyse !) Ex e m ple 4 (ED N 2020) Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for Pancreatic Cancer in China: A Multicenter Case-Control Study. J Epidemiol 2016 ; 26(2) : 64-70. We assessed risk factors of pancreatic cancer in China. A case-control study design was conducted using data from four hospital-based cancer registries. A total of 646 participants were recruited, including 323 pathologically verified cancer cases and 323 Controls selected from family members of other inpatients in the same hospital who did not hâve pancreatic cancer. Cases and control were 1:1 matched by gender and âge; 110 pairs were recruited from Henan Provincial Cancer Hospital, 105 from Beijing Cancer Hospital, 73 from Hebei Cancer Hospital, and 35 from the Cancer Institute &C Hospital of the Chinese Academy of Medical Sciences. Characteristics of 323 pancreatic cancer cases and 323 Controls Controls3 Cases3 Variables n X2 P 0.000 1.000 n % 110 (34.1) Beijing Cancer Hospital 105 (32.5) 105 (32.5) Hebei Cancer Hospital 73 (22.6) 73 (22.6) CICAMSb 35 (10.8) 35 (10.8) Male 181 (56.0) 181 (56.0) Female 142 (44.0) 142 (44.0) 0.000 1.000 Age, yearsc 58.7 (11.2) 58.0 (11.2) 0.790 0.430 % Center Henan Cancer Hospital 110 (34.1) Sex Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 264 Études observationnelles (analytiques) À propos de l’appariement sur l’âge : Il aurait fallu cocher... Commentaires Il vise à contrôler le biais de confusion lié à la différence d’âge entre les cas et les témoins Le but de l’appariement est de contrôler le biais de confusion. Mais attention, l’appariement contrôle le biais de confusion qui concerne seulement le ou les facteurs sur lesquels on réalise l’appariement. Il ne fait donc pas aussi bien qu’une randomisation qui a comme objectif d’équilibrer les groupes sur tous les facteurs de confusion connus et inconnus La différence d’âge moyen observée après appariement entre les cas et les témoins s’explique par un intervalle d’appariement de ± 5 ans Dans le tableau, il existe une petite différence d’âge entre les cas et les témoins (58,7 ans en moyenne pour les cas et 58 ans pour les témoins). Cette différence est faible et s’explique tout à fait par l’intervalle d’appariement spécifié (pour un cas de 51 ans, on prend un témoin entre 50 et 55 ans) Il n’aurait pas fallu cocher... Commentaires Il permet d’augmenter la précision de l’estimation de Vodds ratio de cancer du pancréas associé à l’âge L’estimation d’un odds ratio pour l’âge est inutile car par définition les cas et les témoins ont le même âge. L’objectif de l’appariement est de supprimer l’effet de l’âge sur le risque de cancer du pancréas afin de limiter le biais de confusion lié à l’âge. S’il était calculé il serait donc proche de 1 Il consiste à associer à chaque cas masculin de cancer du pancréas un cas féminin de cancer du pancréas d’âge identique à ± 5 ans Non, l’appariement sur l’âge consiste à associer pour chaque cas de cancer du pancréas un témoin du même âge. Pour le sexe, il consiste à associer à chaque cas masculin de cancer du pancréas, un témoin masculin indemne de cancer du pancréas Ex e m ple 5 (ED N 2021) von Ehrenstein OS, Ling C, Cui X, Cockburn M, Park AS, Yu F, et al. Prénatal and infant exposure to ambient pesticides and autism spectrum disorder in children: population based case-control study. B MJ 20 mars 2019 ; 364 : 1962. Objective: To examine associations between early developmental exposure to ambient pesticides and autism spectrum disorder. Design: Population based case-control study. 2,961 individuals with a diagnosis of autism spectrum disorder, were identified through records maintained at the California Department of Developmental Services and linked to their birth records. Controls derived from birth records were matched to cases 10:1 by sex and birth year. Data from California State mandated Pesticide Use Reporting were integrated into a géographie information System tool to estimate prénatal and infant exposures to pesticides. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Confusion dans les études observationnelles > 265 Study population characteristics by autism spectrum disorder status and population Controls in the Central Valley, CA* ASD (ail ; n=2961) ASD with ID (n=445) ASD without ID (n=2516) Controls (n=35 370) 2403 (81.2) 558 (18.8) 354 (79.6) 91 (20.4) 2049 (81.4) 467(18.6) 29 255 (82.6) 6145 (17.4) 1033 (34.9) 1928 (65.1) 243 (54.6) 202 (45.4) 790 (31.4) 1726 (68.6) 14 390 (40.7) 20 980 (59.3) 233 (7.9) 808 (27.3) 884 (29.9) 592 (20.0) 443 (15.0) 1 (0.0) 38 (8.5) 136 (30.6) 117(26.3) 96 (21.6) 58 (13.0) 195 (7.8) 672 (26.7) 767 (30.5) 469 (19.7) 385 (15.3) 1 (0.0) 4931 (13.9) 10 253 (29.0) 9779 (27.6) 6712 (19.0) 3964 (10.4) 1 (0.0) 1100 (37.1) 166 (37.3) 934 (37.1) 9943 (28.1) 1424 (48.1) 149 (5.0) 205 (46.1) 33 (7.4) 1219 (48.4) 116 (4.6) 20 802 (58.8) 1562 (4.4) 214 (7.2) 74 (2.5) 35 (7.9) 6(1.3) 179 (7.1) 68 (2.7) 2155 (6.1) 908 (2.6) 2133 (72.0) 828 (28.0) 314 (70.6) 131 (29.4) 1819 (72.3) 697 (27.7) 22 152 (62.6) 13 209 (37.3) 9 (0.0) 174 (5.9) 435 (14.7) 34 (7.6) 69 (15.5) 140 (5.6) 366 (14.5) 4518 (12.8) 7583 (21.4) 937(31.6) 152 (34.2) 785 (31.2) 10 909 (30.8) 923 (31.2) 455 (15.4) 37(1.2) 131 (29.4) 48 (10.8) 11 (2.5) 792 (31.5) 407(16.2) 26 (1.0) 7854 (22.2) 3925 (11.1) 581 (1.6) Sex Males Females Year of birth 1998-2004 2005-2010 Maternai âge < 19 20-24 25-29 30-34 > 35 Missing data Maternai race or ethnicity White to nonHispanic Hispanic to any race Black Asian/Pacific Islanders Others US born Yes No Missing data Maternai éducation Less than 8th grade 9th to 12th grade High School graduate Some degrees less than college College or more Missing data ASD - autism spectrum disorder; ID - intellectual disability. Data are number (%) or individuals. * Central Valley counties include San Joaquin, Stanislaus, Merced, Madera, Fresno, Kings, Tulare and Kern. . > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 266 Études observationnelles (analytiques) À propos du tableau ci-dessus (une ou plusieurs réponses attendues) : Il aurait fallu cocher... Commentaires Le niveau d’éducation des mères des enfants avec un trouble du spectre autistique pourrait être un facteur de confusion car il est plus élevé que celui des mères des témoins Environ 20 % des mères des cas ont un niveau d’éducation inférieur à celui du lycée alors qu’il est à presque 35 % chez les mères des témoins Il n’aurait pas fallu cocher... Commentaires 81,2 % des enfants de sexe masculin ont un trouble du spectre autistique La formulation juste est : 81,2 % des cas de troubles du spectre autistique sont de sexe masculin Le degré de signification (valeur de p) des tests statistiques de comparaison n’est pas nécessaire dans ce type d’étude Contrairement aux essais randomisés au cours desquels le degré de signification n’est pas nécessaire dans la comparaison des 2 groupes de randomisation, dans le cadre d’études observationnelles les différences entre les différents groupes de comparaison ne sont probablement pas liées au hasard La majorité des enfants avec un trouble du spectre autistique ont un déficit intellectuel Parmi 2 961 enfants avec un troubles du spectre autistique, seulement 445 ont un déficit intellectuel associé Les différences observées entre les cas et les témoins pour les caractéristiques sociodémographiques résultent de l’exposition aux pesticides ambiants d’origine agricole On suppose plutôt que l’exposition aux pesticides ambiants d’origine agricole pourrait être différente selon les caractéristiques démographiques considérées. Il y a donc un risque de confusion des caractéristiques sociodémographiques dans la relation entre pesticides et troubles du spectre autistique Randomly selected Controls from birth records were matched to each case 10:1 by birth year and sex. From the statewide sample (n= 33,921 cases, n = 339 210 Controls), we excluded 3,401 (10%) case records and 42,519 (12.5%) control records with missing, implausible, or non-viable gestational âges (included range 147-322 days) or birth weights (included range 5006,800 g), and non-singleton births. We also excluded 1,296 (0.4%) Controls who died before âge 6 (identified by linkage to the California death registry). We restricted our sample to the eight major agricultural counties; 38,331 participants (2,961 cases and 35,370 Controls) resided here at the time of birth and diagnosis. En dépit de l’appariement sur l’année de naissance, la proportion d’enfants nés entre 2005 et 2010 diffère entre les cas (65,1%) et les témoins (59,3%) (tableau 1). Quelle est l’explication la plus probable à ce déséquilibre entre les deux groupes d’étude (une seule réponse attendue) ? Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Confusion dans les études observationnelles 267 Il aurait fallu cocher... Commentaires La restriction de l’échantillon aux comtés ruraux après appariement Les auteurs ont d’abord réalisé un appariement sur le sexe et sur l’année de naissance en appariant 10 témoins pour un cas (ce qui correspond à 33 921 cas et 339 210 témoins), puis dans un second temps ils ont exclu un certain nombre de sujet (ceux décédés avant 6 ans, ceux avec des données manquantes, etc.) et ont restreint l’analyse aux sujets provenant des 8 régions agricoles majeures. Cette sélection de l’échantillon réalisée après appariement entraîne ici une exclusion très importante de sujets surtout pour le groupe contrôle (plus de 200 000 sujets exclus). On perd donc en grande partie l’intérêt de l’appariement, ce qui entraîne une perte de comparabilité des groupes sur les variables d’appariements Il n’aurait pas fallu cocher... Commentaires La surreprésentation masculine dans l’échantillon d’étude Il s’agit d’une étude en population, la surreprésentation masculine de l’échantillon des cas est donc probablement le reflet de la réalité épidémiologique. Pour l’échantillon des témoins, sélectionnés par appariement sur le sexe, la proportion de sujets masculins du groupe témoin est donc très proche de celle du groupe des cas Un problème technique lors de l’appariement sur l’année de naissance et le sexe Les auteurs ont sélectionné leur échantillon d’étude après avoir réalisé l’appariement. Il s’agit là d’une limite importante de l’étude puisque le souhait de forcer la comparaison entre les cas et les témoins sur l’âge et le sexe n’est pas respecté La surmortalité des témoins avant l’âge de 6 ans La proportion de témoins exclues en raison d’un décès avant l’âge de 6 ans est très faible (1 296 sujets soit 0,4 % de l’échantillon), cela a donc peu d’impact sur le déséquilibre induit après l’appariement en regard du nombre de sujets exclus du fait de la restriction de la population des zones agricoles rurales (+ de 200 000 sujets exclus) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 25 Principes généraux des études cas-témoins et des études de cohorte Ce type d’étude a pour but de faire le lien entre : • un facteur de risque et une maladie chez des sujets initialement indemnes (études à visée étiologique). Exemple : consommation de café pendant la grossesse et risque de fente labiopalatine ; • un facteur pronostique et une complication chez des sujets malades (études à visée pronostique). Exemple : lien entre C-reactive protein (CRP) élevée et risque de thrombose au cours des cancers digestifs. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 270 Études observationnelles (analytiques) Études cas-témoins Études de cohorte de type exposés/non exposés Principe Début de l'étude Début de l'exposition Début de l'exposition Fin du suivi II Il Cohorte prospective EXPOSITION EXPOSITION Début de l'exposition Début de l'étude Début de l'étude : - identification des cas - appariement de témoins - recueil de l'exposition Fin du suivi Cohorte historicoprospective EXPOSITION Fin du suivi Début de l'exposition Début de l'étude Cohorte rétrospective EXPOSITION - Des patients indemnes de la maladie étudiée exposés ou non à un facteur de risque sont suivis au cours du temps : • suivi prospectif • suivi historicoprospectif (tout ou partie de l’exposition est recueillie dans le passé) • étude rétrospective (ou cohorte historique) : on recueille l’information dans le passé, ou bien on va la chercher dans des systèmes de recueils (dans ce cas, le recueil est prospectif, mais l’étude reste rétrospective, car elle est planifiée après la fin du suivi) - Le recueil de la survenue de la maladie est prospectif grâce à un suivi dont la durée est définie en avance - On part toujours de l’identification des cas (à l’aide d’un registre, de l’interrogation des cliniciens, des bases de données médico-administratives, etc.) - On apparie aux cas des témoins qui doivent être issus de la même population source que les cas - On recueille des informations sur l’exposition : • le plus souvent de manière rétrospective (questionnaire ou interview) • parfois de manière prospective (base de données médico-administratives permettant l’enregistrement continu de certaines expositions) - Que le recueil de l’exposition soit prospectif ou rétrospectif, une étude cas-témoins est toujours une étude rétrospective, car l’étude est planifiée après le début de la maladie Durée de l’étude Longue (dépendante de la durée nécessaire d’exposition pour déclencher la maladie) Brève : limitée au recueil de l’exposition Biais de sélection - Si étude en population à partir de bases de données : potentiellement aucun - Sinon, dépend du taux de refus de participation et des critères de sélection de l’étude - Cas : les cas inclus dans l’étude doivent être représentatifs des cas de la population cible - Témoins : ils doivent être issus de la même population source que les cas. Difficile +++ et problème des refus de participation Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Principes généraux des études cas-témoins et des études de cohorte Études de cohorte de type exposés/non exposés 271 Études cas-témoins Recueil des données Données sur l’exposition recueillies de manière prospective ou rétrospective, mais le plus souvent l’enregistrement des données sur l’exposition est fait sans connaissance de la maladie (car chronologiquement impossible) Recueil de l’exposition réalisé de manière rétrospective, donc pouvant souffrir d’un biais de mémorisation (biais de classement) Biais de mesure différentiel Il n’y a pas de risque d’erreur différentielle sur la mesure de l’exposition si elle est recueillie rétrospectivement. En revanche, risque d’erreur différentielle sur la mesure de la maladie si elle est recueillie/recherchée en fonction de l’exposition Le risque d’erreur différentielle sur l’exposition (pouvant modifier la mesure d’association dans le sens de l’augmentation de la différence) est très important si l’on recueille l’exposition en connaissance du statut malade ou non-malade Maladie rare et exposition rare Adaptée pour les expositions rares et peu adaptée aux maladies rares Adaptée aux maladies rares et peu adaptée pour les expositions rares Délai entre exposition et maladie Plus facile à mettre en place lorsque le délai entre l’exposition et la survenue de la maladie est court Adaptée aux maladies avec un long délai d’apparition depuis l’exposition Possibilité d’étudier plusieurs expositions/plusieurs maladies - Étude de plusieurs expositions : possible - Étude possible de la survenue de plusieurs maladies au cours du temps - Étude possible de plusieurs expositions par recueil rétrospectif de ces expositions - Étude d’une seule maladie possible en même temps Perdus de vue D’autant plus nombreux que l’étude est longue, prospective, que le délai de survenue de la maladie après exposition est long et que le suivi est difficile Pas de perdu de vue par définition étant donné qu’il n’y a pas de suivi dans le temps des patients Mesures d’association - Possibilité de calculer l’incidence de la maladie dans chacun des groupes « exposés » et « non exposés » permettant le calcul d’un risque relatif (RR) - NB : on peut également calculer et utiliser un odds ratio pour des raisons techniques statistiques - Rappel : le RR reflète le surrisque de déclarer la maladie en cas d’exposition au facteur de risque (ex. : RR = 3 signifie que l’on a 3 fois plus de risque de déclencher la maladie) - Le calcul de l’incidence de la maladie n’est pas possible et donc le calcul du risque relatif (RR) non plus. On calcule un rapport de côte ou odds ratio (OR) - Rappel : l’OR permet seulement d’évaluer si l’exposition est associée à une augmentation de la survenue de la maladie sans en estimer l’importance (ex. : OR = 3 ne signifie pas que l’on a 3 fois plus de risque de déclencher la maladie en cas d’exposition). Cependant lorsque la maladie étudiée est rare (< 10 % de l’échantillon), l’OR est une bonne estimation du RR Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 272 Études observationnelles (analytiques) Études cas-témoins Études de cohorte de type exposés/non exposés Causalité (voir critères de Bradford-Hill, fiche 29) Plus de critères pour évaluer la causalité : - la chronologie entre exposition et maladie peut être étudiée précisément - la force de l’association peut être évaluée par le RR Moins de critères pour évaluer la causalité : - la chronologie entre exposition et survenue de la maladie ne peut pas être étudiée précisément (il est souvent difficile d’affirmer que l’exposition a précédé la maladie) - la force de l’association n’est pas évaluée par l’OR Niveau de preuve Niveau de preuve maximal des études de cohorte = niveau 2, pouvant entraîner la mise en place de recommandations de niveau B (présomption scientifique) Niveau de preuve maximal des études cas-témoins = niveau 3, pouvant entraîner la mise en place de recommandations de niveau C (faible niveau de preuve scientifique) Mise en œuvre Nécessité d’effectifs souvent importants Coût plus élevé Effectifs moins importants et moindre coût Parfois la seule méthodologie réalisable En pra tique Ex e m ple 1 (ED N 2016) Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai consumption of coffee and caffeine-containing beverages and oral clefts: a population-based case-control study in Norway. Am J Epidemiol 2009 ; 169 : 1216-22. We aimed to evaluate the association of maternai consumption of coffee and caffeinated beverages in early pregnancy with the risk of delivering an infant with an orofacial cleft. Ail infants born with facial clefts in Norway are treated at government expense in surgical centers at university hospitals located in Oslo and Bergen. In collaboration with these 2 centers, we identified ail babies born from 1996 to 2001 who were referred for treatment for either cleft lip with or without cleft palate (CLP) or cleft palate only (CPO). Controls were recruited during the same period by randomly selecting approximately 4 births per 1,000 from the National Medical Birth Registry (which includes ail births in the country). These births served as Controls for both case groups, with the target of 2 Controls per case of CLP (nearly 4 Controls for each case of CPO). Both cases and Controls were recruited during their first weeks of life. Mothers completed a 32-page questionnaire covering démographie characteristics, reproductive history, and exposures during pregnancy (including smoking, alcohol consumption, coffee intake, médication use, and occupational and household exposures). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Principes généraux des études cas-témoins et des études de cohorte 273 Le choix d’une étude de type cas-témoins a été guidé par le ou les faits suivants : Il aurait fallu cocher... Commentaires La prévalence de la fente labiopalatine à la naissance est faible Les études cas-témoins sont, de manière générale, adaptées aux maladies rares et aux expositions fréquentes. Par ailleurs Vodds ratio qui est calculé dans les études cas-témoins est un bon estimateur du risque relatif lorsque la prévalence de la maladie est faible (< 10 %) La consommation de café au cours du premier trimestre de grossesse est fréquente Une étude prospective aurait nécessité des effectifs beaucoup plus importants Etant donné la rareté de la pathologie étudiée, le nombre de femmes enceintes nécessaires à suivre dans une étude prospective devrait être très élevé, afin que le nombre de naissance d’enfants malades soit suffisant pour permettre le calcul d’un risque relatif fiable Il n’aurait pas fallu cocher... Commentaires Ce type d’étude permet de montrer une relation causale Ce type d’étude permet en général de suggérer une association entre une exposition et une maladie. Cependant le caractère causal est difficile à démontrer du fait de la présence habituelle de nombreux biais et de la difficulté d’établir une séquence temporelle fiable à cause du caractère rétrospectif du recueil de l’exposition Ce type d’étude ne présente généralement pas de biais Les études cas-témoins sont généralement entachées de nombreux biais : - biais de sélection des cas et des témoins par refus de participation ou difficulté de recrutement - biais de confusion par l’absence de contrôle de tiers facteurs interférant dans l’association étudiée (les groupes ne sont pas randomisés !) - biais de classement par difficulté du recueil rétrospectif de l’exposition Le niveau d’exposition aux facteurs de risque étudiés peut être déterminé précisément La déclaration de consommation de café par questionnaire est soumise à deux types de biais de classement dans cette étude : - biais de classement non différentiel par biais de mémorisation - biais de classement différentiel lié à la connaissance de la présence ou non de la maladie chez l’enfant qui peut sous- ou surestimer la déclaration de consommation de café par la mère > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 274 Études observationnelles (analytiques) Quels sont les biais potentiels de cette étude ? Commentaires Il aurait fallu cocher... Biais de sélection des populations étudiées On parle de biais de sélection lorsque les cas ou les témoins ne sont pas représentatifs de la population cible, ou lorsque les témoins ne sont pas issus de la même population que les cas. Ici, tous les cas et tous les témoins potentiels de la population source ont été sélectionnés pour participer à l’étude, et les témoins ont été tirés au sort à partir de la même population que celle des cas (l’ensemble des enfants nés en Norvège entre 1996 et 2001). Néanmoins, on note que seulement 88 % des cas identifiés et 76 % des témoins tirés au sort ont accepté de participer à l’étude. Il est probable que les mères ayant refusé de participer à l’étude aient des caractéristiques particulières, ce qui définit un biais de sélection. De plus, les mères ne parlant pas norvégien ont été exclues, de même que les mères d’un enfant décédé Biais lié à la présence de facteurs de confusion Le biais de confusion est toujours un problème dans les études observationnelles car les groupes comparés ne sont pas randomisés Biais de classement sur l’exposition, lié à l’absence de souvenir Le recueil rétrospectif de l’information sur la consommation de café expose à un biais de classement sur ce paramètre. En revanche, l’inclusion des cas référés dans un des deux centres de référence pour la chirurgie des fentes labiopalatines rend le risque d’erreur de classement sur la définition des cas peu vraisemblable Il n’aurait pas fallu cocher... Commentaires Biais de classement sur les critères définissant les cas L’inclusion des cas référés dans un des deux centres de référence pour la chirurgie des fentes labiopalatines rend le risque d’erreur de classement sur la définition des cas peu vraisemblable Biais d’attrition des populations étudiées C’est un biais de sélection qui survient lorsque l’échantillon perd en représentativité de la population cible, car le nombre de perdus de vue est trop important au cours du suivi. Il n’y a, par définition, pas de perdus de vue dans cette étude Biais de classement non différentiel lié à la connaissance du statut malade de l’enfant lors de la déclaration de la consommation de café par la mère La connaissance du statut malade ou non malade de l’enfant par la mère peut entraîner un biais de classement différentiel par surestimation de l’exposition chez les mères qui ont un enfant malade Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Principes généraux des études cas-témoins et des études de cohorte 275 Ex e m ple 2 (ED N 2017) Fondell E, Fitzgerald KC, Falcone GJ, O’Reilly EJ, Ascherio A. Early-onset alopecia and amyotrophie latéral sclerosis: a cohort study. Am J Epidemiol 2013 ; 178(7) : 1146-9. Amyotrophie latéral sclerosis (ALS) is a neurodegenerative disease with a médian survival of 1.5-3 years after diagnosis. The cause of ALS is largely unknown, and there is no effective treatment to date. Several observations suggest a link between early balding (alopecia) and ALS. The Health Professionals Follow-up Study is a longitudinal study of 51,529 male health professionals, aged 40-75 years at enrollment, who completed a mailed questionnaire about lifestyle and medical history in 1986 and similar biennial questionnaires since then. In 1992, participants reported their balding status at âge 45 years by choosing from 5 crown-view pictograms based on Norwood’s classification of malepattern baldness (Norwood’s I, III, IV, V, and VII). In each biennial follow-up questionnaire, participants were asked to report a spécifie list of medically diagnosed conditions and “any other major illness”. ALS was added to the list of spécifie conditions beginning in 2000. Person-time was calculated from the date of return of the 1992 questionnaire until the date of first onset of ALS symptoms (37 cases), death from ALS or any other cause (5 cases), or the end of follow-up (December 31, 2008). De quel type d’étude s’agit-il ? Commentaires Il aurait fallu cocher... Epidémiologique On s’intéresse à un phénomène de santé au sein d’une population Observationnelle Il n’y a pas d’intervention, le facteur d’exposition (alopécie) n’est pas contrôlé par l’étude À visée étiologique L’objectif est de rechercher s’il existe un lien entre alopécie et SLA Prospective Il existe un suivi par questionnaires sur plusieurs années Analytique Oui, le but est de faire le lien entre un facteur de risque (l’alopécie) et une maladie (la SLA) Il n’aurait pas fallu cocher... Commentaires Etude cas-témoins nichée dans une cohorte L’information est recueillie de manière prospective, alors que dans une étude cas-témoins nichée dans une cohorte, les participants sont sélectionnés au sein d’une cohorte déjà existante et l’exposition est recueillie rétrospectivement Etude transversale Une telle étude étudie un phénomène de santé à un instant T, comme dans une étude de prévalence. Ce n’est pas le cas ici, il y a un suivi Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 U6 Études observationnelles (analytiques) Il n’aurait pas fallu cocher... Commentaires Étude de cohorte historique Dans une cohorte historique, le début de l’étude est postérieur au début de la maladie (on parle aussi de cohorte rétrospective) Étude descriptive Une étude descriptive décrit un phénomène de santé (étude de prévalence/d’incidence), ici on recherche des liens entre facteur de risque éventuel et survenue d’une maladie (= étude analytique) Étude interventionnelle Le facteur d’exposition n’est pas contrôlé par l’étude. Un essai clinique est une étude interventionnelle, on décide le plus souvent par randomisation qui aura le traitement A et qui aura le traitement B (ou le placebo) Quel plan d’étude alternatif aurait pu être proposé pour répondre à cette question ? Il aurait fallu cocher... Commentaires Une étude cas-témoins comparant un groupe de patients atteints de sclérose latérale amyotrophique et un groupe de témoins indemnes de cette pathologie Une étude cas-témoins aurait été adaptée ici, notamment du fait de la rareté de la pathologie étudiée Une étude de cohorte prospective en population générale comparant l’incidence de la sclérose latérale amyotrophique en fonction de la présence ou non d’une alopécie Correspond à une étude de type exposés/ non exposés. Ce schéma aurait été possible mais extrêmement lourd à mettre en place. Du fait de la rareté de la maladie et du délai long entre exposition et survenue de la maladie, beaucoup d’individus seraient nécessaires avec un suivi de plusieurs années, voire de plusieurs dizaines d’années Il n’aurait pas fallu cocher... Commentaires Une étude évaluant la prévalence de l’alopécie chez les patients atteints de sclérose latérale amyotrophique Une étude de prévalence fait partie des études épidémiologiques descriptives et n’est donc pas adaptée pour identifier des facteurs de risque de maladie Une étude cas-témoins comparant un groupe de patients atteints d’alopécie et un groupe de témoins indemnes d’alopécie Cette étude n’est pas pertinente puisque la pathologie d’intérêt est la sclérose latérale amyotrophique et non l’alopécie. L’alopécie est l’exposition d’intérêt dans cette étude Une étude rétrospective à partir d’un registre spécifique des patients atteints de sclérose latérale amyotrophique Cette étude ne met pas à disposition des patients indemnes de la maladie et ne permet donc pas de comparer l’exposition entre des malades et des non-malades Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Principes généraux des études cas-témoins et des études de cohorte 277 Ex e m ple 3 (ED N 2020) Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for Pancreatic Cancer in China: A Multicenter Case-Control Study. J Epidemiol 2016 ; 26(2) : 64-70. Despite having one of the highest mortality rates of ail cancers, the risk factors of pancreatic cancer remain unclear. We assessed risk factors of pancreatic cancer in China. A case-control study design was conducted using data from four hospital-based cancer registries. Quel(s) élément(s) a (ont) conduit les auteurs à choisir un schéma d’étude « cas témoin » ? Commentaires Il aurait fallu cocher... L’incidence du cancer du pancréas est faible Même si l’incidence augmente, la maladie reste (heureusement) peu fréquente Une étude cas témoin permet d’explorer plusieurs expositions simultanément Oui et c’est le cas ici avec le tabac, l’alcool, l’obésité, le diabète, les antécédents familiaux Le temps d’apparition du cancer du pancréas peut durer plusieurs années C’est un problème de faisabilité car pour une étude de cohorte prospective de type exposé-non exposé il faudrait certainement plusieurs dizaines d’années pour conclure Il n’aurait pas fallu cocher... Commentaires Le taux de mortalité par cancer du pancréas est élevé Le critère de jugement est ici l’apparition du cancer et pas la mortalité Les études cas témoin sont moins propices aux biais que les études de cohorte C’est faux, principalement en raison du caractère rétrospectif du recueil des facteurs d’exposition Ex e m ple 4 (é preuve t est 2019) Liperoti R, Pedone C, Lapane KL, Mor V, Bernabei R, Gambassi G. Venons Thromboembolism Among Elderly Patients Treated With Atypical and Conventional Antipsychotic Agents. Arch Intern Med 12 déc 2005 ; 165(22) : 2677. The aim of this study was to estimate the effect of atypical and conventional antipsychotic agents on the risk of hospitalization for Venous Thromboembolism (VTE) among elderly patients. We conducted a rétrospective cohort study on nursing home residents in 5 States. We used data from the Minimum Data Set to identify 19,940 new users of antipsychotic agents and 112,078 nonusers. Hospitalization with VTE as primary discharge diagnosis was determined during a 6-month follow-up period using Medicare inpatient daims. Cox proportional hazards models provided estimâtes of effect adjusted for confounders. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 278 Études observationnelles (analytiques) Par rapport à cette étude de cohorte historique analytique : Il aurait fallu cocher... Commentaires Une étude cas-témoins aurait aussi été adaptée pour estimer l’association entre les traitements antipsychotiques et le risque d’événements thromboemboliques veineux On aurait pu réaliser une étude cas témoins en comparant les antécédents d’exposition aux antipsychotiques de patients ayant présenté un épisode thromboembolique à des témoins n’en ayant pas présenté Une étude cas-témoins aurait permis de limiter l’effectif de l’échantillon d’étude Il s’agit d’un avantage pratique des études cas-témoins par rapport aux études exposés-non exposés. Dans les études de cohorte exposés-non exposés, il faut suivre un nombre important de patients pour recueillir un nombre d’événements suffisant afin d’avoir la puissance nécessaire pour conclure, ceci d’autant plus si la maladie est rare Une étude cas-témoins n’aurait pas permis d’estimer le taux d’incidence d’événements thromboemboliques veineux Dans les études cas-témoins, le ratio cas/témoins (donc la fréquence de la maladie dans l’échantillon) étant fixé par les auteurs, on ne peut donc estimer ni incidence, ni prévalence Il n’aurait pas fallu cocher... Commentaires Une étude monocentrique aurait amélioré la représentativité de la population étudiée C’est le caractère multicentrique qui permet une meilleure représentativité de la population-source par rapport à la population-cible Une étude randomisée aurait été plus adaptée pour estimer le risque d’événements thromboemboliques sous antipsychotiques Une telle étude ne serait ni éthique, ni faisable Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 26 Etudes cas-témoins : sélection des participants et définition de la maladie D éfinitio n d e la m aladie Elle doit être la plus précise, standardisée et objective possible. Elle ne doit idéalement pas pouvoir être influencée par l’exposition. La définition de certaines maladies peut évoluer au cours du temps (critères diagnostiques, amélioration des méthodes diagnostiques). La période de prise en compte des cas doit être précisée et un changement éventuel de définition au cours de l’étude explicitée. Sélectio n d es cas Le recrutement des cas se doit d’être le plus exhaustif possible parmi l’ensemble des patients atteints de la pathologie étudiée pour une région géographique et une période de temps données. L’objectif principal est de minimiser le risque de biais de sélection. Le meilleur choix est d’utiliser un registre de maladie recensant tous les cas au sein d’une région, mais ce n’est pas toujours possible. Un recrutement fondé sur un « appel à observation » a beaucoup plus de risque de sélectionner des patients particuliers et d’induire un biais de sélection. Préférer l’inclusion de cas incidents sur les cas prévalents : • dans une étude cas-témoins, il est toujours préférable d’inclure les cas incidents que les cas prévalents : - les cas incidents sont les nouveaux cas apparus pendant une période donnée (par exemple, 1 an), - les cas prévalents sont tous les cas connus à un moment donné (par exemple, le 1er décembre 2019) ; • les cas prévalents sont sélectionnés, car ce sont les survivants un jour donné (dans le cas d’une maladie rapidement létale, comme le cancer du pancréas par exemple, les cas les moins graves avec une meilleure survie seront surreprésentés dans les cas prévalents) ; La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 280 Études observationnelles (analytiques) • en cas d’inclusion des cas prévalents : - il existe un biais de sélection car a priori les cas prévalents sont en moins mauvaise santé, les plus graves étant décédés au moment de l’inclusion, - il existe un biais de mesure sur le facteur de risque en lien avec des changements d’habitudes et notamment des modifications concernant d’éventuelles expositions depuis le diagnostic de la maladie. Sélectio n d es t é m oins • Pour limiter le biais de mesure (biais de classement), il faut s’assurer que les témoins n’ont pas la maladie étudiée (c’est-à-dire classés dans le bon groupe). • Pour limiter le biais de sélection, il faut s’assurer que : - les témoins sont issus de la même population source que les cas ; - tous les témoins potentiels ont la même probabilité d’être inclus ; - le fait d’être exposé ou non n’influence pas la probabilité d’être choisi comme témoin (en cas d’appel à volontaires, des témoins fumeurs pourraient être plus tentés de participer à une enquête concernant les risques liés au tabac) ; - les témoins ayant refusé de participer à l’étude ont les mêmes caractéristiques que ceux qui y ont participé (en pratique rarement vrai). • Le recrutement peut se faire en population générale ou dans certaines populations particulières. Chaque situation a ses avantages et ses inconvénients. Il faut toujours se demander quelles sont les caractéristiques des patients éligibles et s’ils ont des rapports particuliers avec l’exposition : - les témoins sur les listes électorales : doivent être inscrits sur les listes (majeurs, souvent situation sociale stable, citoyens français, etc.) ; - les témoins en milieu hospitalier : sont potentiellement plus exposés à certaines pathologies ; - les témoins issus du monde du travail : ont habituellement moins de problèmes de santé que le reste de la population (healty worker effect). Sommairement, si on compare des cas de lymphome recrutés dans un centre hospitalier à des témoins recrutés dans un service de médecine du travail de l’entreprise voisine, il est évident que le profil d’exposition aux différents facteurs de risque en rapport avec la maladie ne sera pas le même, rendant l’interprétation très délicate. A p p arie m e n t • Pour chaque cas, on inclut un ou plusieurs témoins (le nombre de témoins est toujours un multiple du nombre de cas). • L’appariement consiste à supprimer certains facteurs de confusion (classiquement au moins l’âge et le sexe) en recrutant pour chaque cas un ou plusieurs témoins ayant les mêmes caractéristiques pour les variables d’appariement (voir fiche 24). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Études cas-témoins : sélection des participants et définition de la maladie 281 • Si les variables d’appariement sont trop nombreuses ou trop liées à l’exposition, on parle de « surappariement » : les témoins et les cas sont trop proches et on ne peut plus montrer de lien sur le facteur d’exposition. Par exemple, on étudie le lien entre bronchiolite et tabagisme passif. Si l’on apparie chaque enfant avec son frère ou sa sœur, ils auront exactement le même niveau d’exposition à tous les facteurs de risque et notamment au tabagisme passif, et on ne pourra rien montrer. • L’appariement nécessite l’utilisation de techniques statistiques particulières (statistiques pour séries appariées, voir fiche 5). • Combien de témoins par cas ? - si l’exposition est rare, on peut augmenter le nombre de témoins afin d’augmenter le nombre de patients exposés au facteur de risque pour obtenir une puissance plus importante ; - pour un même nombre de cas, on a plus de puissance (c’est-à-dire risque de conclure à une différence qui existe vraiment) si on inclut par exemple trois témoins pour un cas au lieu d’un seul (étude avec 30 cas et 90 témoins plus puissante qu’une étude avec 30 cas et 30 témoins) ; - pour un même nombre de patients totaux, augmenter le nombre de témoins par nombre de cas n’augmente pas la puissance (une étude avec 100 cas et 100 témoins n’est pas plus puissante qu’une étude avec 50 cas et 150 témoins). Cas p articulier de l'é t u d e cas-té m oins nichée d ans u ne co h ort e (nested c ase-control study) Dans ce design, les cas et les témoins sont tous issus d’une cohorte. On isole les patients ayant développé la maladie, on leur apparie des patients ne l’ayant pas développée, et on étudie le lien avec un facteur de risque recueilli ou non pendant l’étude prmceps. Exemple : étude cas-témoins nichée dans une cohorte étudiant le lien entre consommation d’alcool et pathologie hépatique. On apparie aux patients cirrhotiques des patients n’ayant pas développé cette maladie et on étudie le lien avec des biomarqueurs prélevés en début d’étude et la consommation d’alcool également recueillie en début d’étude. L’avantage est que le recueil prospectif protège du risque de biais de mesure différentiel (il est impossible que la connaissance de la cirrhose influence le recueil de la consommation d’alcool, car l’information a été enregistrée avant la survenue de la maladie). E n p r a t iq u e Ex e m ple 1 (ED N 2016) Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai consumption of coffee and caffeine-containing beverages and oral clefts: a population-based case-control study in Norway. Am J Epidemiol 2009; 169:1216-22. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 282 Études observationnelles (analytiques) Coffee is a commonly consumed beverage among prégnant women, and even a small increase in malformation riskcould be a matter of concern. We used data from a population based case-control study to evaluate the association of maternai consumption of coffee and caffeinated beverages in early pregnancy with the risk of delivering an infant with an orofacial cleft. Ail infants born with facial clefts in Norway are treated at government expense in surgical centers at university hospitals located in Oslo and Bergen. In collaboration with these 2 centers, we identified ail babies born from 1996 to 2001 who were referred for treatment for either cleft lip with or without cleft palate (CLP) or cleft palate only (CPO). Controls were recruited during the same period by randomly selecting approximately 4 births per 1,000 from the National Medical Birth Registry (which includes ail births in the country). These births served as Controls for both case groups, with the target of 2 Controls per case of CLP (nearly 4 Controls for each case of CPO). Both cases and Controls were recruited during their first weeks of life. Concernant le recrutement des cas et des témoins dans cette étude : Il aurait fallu cocher... Commentaires Le recrutement des cas est représentatif de la population source Les auteurs ont recruté tous les enfants adressés pour une chirurgie de fente labiopalatine (FLP) dans les deux seuls centres norvégiens pratiquant cette chirurgie. On imagine que le nombre d’enfants avec une FLP n’ayant pas été adressés pour une chirurgie doit être négligeable La population source des témoins est la même que celle des cas Les témoins sont tous issus de la population générale (registre exhaustif des naissances). Si on considère que les cas sont recueillis exhaustivement, la population source est bien la même : l’ensemble de la population norvégienne. Cela limite le biais de sélection Le caractère exhaustif du recueil des cas limite le biais de sélection Un recueil exhaustif des cas permet un recrutement le plus représentatif possible de l’ensemble des enfants norvégiens nés avec une FLP Il n’aurait pas fallu cocher... Commentaires Il est responsable d’un biais de classement dans cette étude La définition de la maladie est claire ici et n’est pas soumise à l’interprétation d’un professionnel. Il semble donc impossible de classer un nouveau-né sain dans la catégorie des cas et vice-versa Il aurait été préférable de recruter les témoins seulement dans les deux hôpitaux pratiquant la chirurgie Les cas sont originaires de toute la Norvège, car seulement deux centres pratiquent la chirurgie en question dans le pays. Le recrutement parmi toutes les naissances norvégiennes permet a priori une sélection des témoins avec des caractéristiques sociodémographiques proches des cas Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Études cas-témoins : sélection des participants et définition de la maladie 283 Il n’aurait pas fallu cocher... Commentaires Les auteurs auraient dû apparier les cas et les témoins sur la consommation de café L’appariement sur un ou des facteurs de confusion peut être utile pour limiter le biais de confusion. La consommation de café correspond au facteur d’exposition d’intérêt. L’objectif est justement de rechercher une différence de consommation de café entre les cas et les témoins On peut garantir que les témoins inclus sont représentatifs de la population source En raison des refus de participation, il n’est pas possible de garantir cet aspect Dans cette étude, approximativement deux témoins ont été recrutés pour un cas de fente labiale (avec ou sans fente palatine) dans le but de : Il aurait fallu cocher... Commentaires Augmenter la puissance De manière générale, augmenter le nombre de participants augmente la puissance. Choisir un risque p très faible (c’est-à-dire une puissance forte car puissance = 1 — p) entraîne mathématiquement une augmentation du nombre de sujets nécessaires Augmenter les chances de mettre en évidence une différence entre les cas et les témoins Augmenter les chances de mettre en évidence une différence qui existe est synonyme d’une augmentation de la puissance Réduire la largeur de l’intervalle de confiance des odds ratios estimés En augmentant le nombre de sujets dans une étude, on diminue les fluctuations d’échantillonnage et on améliore la précision des estimations (ce qui revient à réduire la largeur des intervalles de confiance des estimateurs) Il n’aurait pas fallu cocher... Commentaires Limiter un potentiel biais de sélection lié aux sujets perdus de vue en cours de suivi Il n’y a pas de suivi dans une étude cas-témoins car le recueil des données est rétrospectif Calculer des risques relatifs Les risques relatifs ne sont pas calculables dans une étude cas-témoins, ils le sont seulement dans les études prospectives Procéder à un appariement sur les facteurs de confusion potentiels Aucun appariement n’a été réalisé ici et de toute façon ce n’est pas l’objectif. On peut très bien apparier un témoin pour chaque cas sans augmenter le nombre de témoins par cas Diminuer le risque a Le risque a n’est pas lié aux nombres de participants à une étude, contrairement au risque p > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 284 Études observationnelles (analytiques) Ex e m ple 2 (ED N 2020) Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for Pancreatic Cancer in China: A Multicenter Case-Control Study. J Epidemiol 2016 ; 26(2) : 64-70. We assessed risk factors of pancreatic cancer in China. A case-control study design was conducted using data from four hospital-based cancer registries. A total of 646 participants were recruited, including 323 pathologically verified cancer cases and 323 Controls selected from family members of non-pancreatic cancer patients in the same hospital. Cases and control were 1:1 matched by gender and âge; 110 pairs were recruited from Henan Provincial Cancer Hospital, 105 from Beijing Cancer Hospital, 73 from Hebei Cancer Hospital, and 35 from the Cancer Institute & Hospital of the Chinese Academy of Medical Sciences. Les témoins ont été sélectionnés parmi les membres de la famille de patients hospitalisés et indemnes de cancer du pancréas. Quel(s) principe(s) aurai(en)t guidé le choix de la population source des témoins ? Il aurait fallu cocher... Commentaires Des témoins sélectionnés parmi les patients hospitalisés ont une probabilité d’exposition à certains facteurs de risque étudiés plus élevée que les sujets non hospitalisés Des facteurs de risques comme le tabac, le diabète ou l’obésité sont plus fréquemment retrouvés chez des patients hospitalisés car sources de nombreuses complications. Il y aurait donc un risque de ne pas mettre en évidence une association qui existe entre ces facteurs de risque et la survenue de cancer du pancréas si on sélectionnait les témoins parmi une population de patients hospitalisés Des témoins sélectionnés parmi les membres de la famille des cas ont une probabilité d’exposition à certains facteurs de risque étudiés plus élevée que les sujets non apparentés aux cas Les habitudes de vie et les habitudes alimentaires de personnes de la même famille étant le plus souvent proches, il est donc possible de ne pas mettre en évidence certains facteurs de risque de cancer du pancréas qui seraient présents de manière identique chez les cas et les témoins Des témoins sélectionnés en population générale chinoise ont une probabilité d’exposition à certains facteurs de risque étudiés différente de la population du bassin de recrutement de l’hôpital des cas Sélectionner des témoins trop différents notamment en matière d’exposition environnementale entraîne un risque de biais trop important. Dans l’idéal, les témoins doivent être issus de la population-source des cas > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Études cas-témoins : sélection des participants et définition de la maladie 285 Il aurait fallu cocher... Commentaires Des témoins sélectionnés parmi les patients hospitalisés ont une probabilité d’exposition à certains facteurs de risque étudiés plus élevée que les cas Même principe que pour la première proposition. Dans la situation d’une exposition plus importante à un facteur de risque chez les témoins hospitalisés par rapport aux cas (le tabac, par exemple), on pourrait retrouver de manière biaisée une association statistique protectrice de ce facteur de risque sur le risque de survenue de cancer du pancréas Il n’aurait pas fallu cocher... Commentaires Des témoins sélectionnés parmi les patients hospitalisés ont une probabilité de cancer du pancréas authentifié histologiquement plus élevée que les sujets non-hospitalisés Les cas sont des sujets atteints d’un cancer du pancréas prouvé histologiquement et les témoins sont des sujets indemnes de cancer de pancréas. On ne va pas aller faire des biopsies du pancréas aux témoins afin d’être certains de l’absence de la maladie Ex e m ple 3 (ED N 2021) von Ehrenstein OS, Ling C, Cui X, Cockburn M, Park AS, Yu F, et al. Prénatal and infant exposure to ambient pesticides and autism spectrum disorder in children: population based case-control study. B MJ 20 mars 2019 ; 364:1962. Records of autism spectrum disorder cases were retrieved from the registry maintained at the California department of Developmental Services (DDS), based on diagnostic data collected by contracted régional centers. We included ail individuals with a primary diagnosis of autistic disorder (code 299.00) reported on the DDS client development évaluation report, which implements criteria of the Diagnostic and Statistical Manual of Mental Disorders, fourth édition, revised (DSM-IV-R)15 up to 31 December 2013 (“autistic disorder” is the most severe diagnosis of autism spectrum disorder under DSM-IV criteria). La surreprésentation des enfants de sexe masculin chez les cas s’explique le plus probablement par (une seule réponse attendue) : Il aurait fallu cocher... Commentaires La prévalence plus élevée des troubles du spectre autistique chez les sujets de sexe masculin Les cas ont été sélectionné sur la base d’un registre de population et il est précisé que tous les cas de trouble du spectre autistique ont été sélectionnés à partir de ce registre. La prédominance masculine est donc très probablement une réalité épidémiologique > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 286 Études observationnelles (analytiques) Il n’aurait pas fallu cocher... Commentaires Un biais de sélection lié au mode de recrutement des cas Il s’agit d’un recrutement en population sur la base d’un registre et il est d’autant plus précisé : We included ail individuals with a primary diagnosis of autistic disorder. Il n’y a donc pas de biais de sélection dans cette situation L’appariement des cas aux témoins Les modalités de sélection des témoins ne modifient pas les caractéristiques des cas L’effet des pesticides ambiants sur la différenciation sexuelle embryonnaire Aucun élément du texte ne permet de le supposer La réalisation de l’étude dans une zone rurale à prédominance masculine Même si cela avait été le cas, il n’y a pas de raison que cela influe sur le sex-ratio des enfants ! Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 27 Études de cohorte : sélection des participants et mesure de l’exposition Une cohorte est un groupe de patients possédant une caractéristique commune et suivis dans le temps. Cette caractéristique commune peut être de plusieurs types (une maladie, une origine géographique, une caractéristique socioéconomique, etc.). Exemples : cohorte de patients avec un diabète de type 2 ; cohorte de patients ayant consulté dans le même service de cardiologie ; cohorte de patients originaire d’un même département. O bje t d e l'é tu d e de co h ort e • Cohorte à visée étiologique : on étudie le lien entre un facteur de risque et une maladie chez des sujets initialement indemnes. • Cohorte à visée pronostique : on étudie le lien entre un facteur pronostique et la complication d’une maladie chez des patients tous atteints de cette maladie. M o d alit és de sélectio n d es p articip a n ts On distingue trois modalités de sélection des participants : • études de cohorte prospective : les sujets sont initialement tous indemnes et inclus prospectivement sans tenir compte de leur exposition au facteur de risque ; • études de cohorte exposés/non exposés : on constitue deux groupes en fonction de l’exposition ou non au facteur étudié. Dans ce cas, un appariement des sujets exposés et non exposés est possible ; • études de cohorte historique (ou « rétrospective ») : dans ce cas, la cohorte est reconstituée à partir de données recueillies dans le passé. L’étude est planifiée à partir des données déjà disponibles. Elle se distingue d’une étude cas-témoins, car on part des caractéristiques initiales de la cohorte (cohorte de patients travaillant dans l’industrie, cohorte de professionnels de santé, etc.) et pas des cas d’une pathologie donnée dont on veut étudier l’apparition. Biais d e sélectio n e t n o tio n de re présen t a tivit é (v oir fich e 2) Dans une étude de cohorte, le biais de sélection est essentiellement lié au fait que les patients inclus sont volontaires et que les refus d’étude ne sont évidemment pas aléatoires. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 288 Études observationnelles (analytiques) Une exception notable à cette règle est celle des études dites « en population » : • dans ce type d’étude, on utilise un système d’enregistrement exhaustif des individus constituant une cohorte (par exemple, registre de tous les patients atteints d’insuffisance cardiaque en Suède) ; • dans ce cas, l’échantillon est constitué par la population source. Dans les études de cohorte prospective, de type exposés/non exposés ou non, les perdus de vue au cours de l’étude sont à l’origine d’une perte de représentativité (sélection, on parle de biais d’attrition). Dans une étude rétrospective, il n’y a habituellement pas de problème lié au suivi (les patients non suivis ne sont pas inclus), il faut néanmoins se demander si l’échantillon est représentatif de la population source. En résu m é • Les critères de sélection d’une cohorte sont habituellement beaucoup plus larges que ceux d’un essai clinique, ce qui en facilite la généralisation, même si la validité interne de l’étude est moins forte (les résultats sont moins fiables, notamment à cause du biais de confusion, mais plus facile à généraliser). • Une étude en population est indemne de biais de sélection. • Les principales sources de biais de sélection sont : les refus de participation et les sorties d’étude. • Si les refus de participation ou les sorties d’étude sont liés à l’exposition, il existe un risque de biais différentiel pouvant impacter fortement les résultats de l’étude. E n p r a t iq u e Ex e m ple (é pre uve t est 2018) Johansson K, Cnattingius S, Nâslund I, Roos N, Trolle Lagerros Y, Granath F, Stephansson O, Neovius M. Outcomes of pregnancy after bariatric surgery. N Engl J Med 2015; 372: 814-24. Maternai obesity is associated with increased risks of gestational diabètes, largefor-gestational-age infants, preterm birth, congénital malformations, and stillbirth. The risks of these outcomes among women who hâve undergone bariatric surgery are unclear. We investigated the risks of gestational diabètes and adverse périnatal outcomes among women with a history of bariatric surgery as compared with women without such a history but with similar characteristics. We therefore conducted a population-based study using data from nation wide Swedish registries, including information on presurgery BMI among women who had undergone bariatric surgery. We investigated the risks of gestational diabètes and adverse périnatal outcomes among women with a history of bariatric surgery as compared with women without such a history but with similar characteristics. The Swedish Medical Birth Register includes information on more than 98% of ail births in Sweden since 1973. Information is prospectively collected from standardized prénatal, obstétrical, and néonatal records. We identified 627,693 singleton pregnancies in the Swedish Medical Birth Register from 2006 through 2011, of which 670 occurred in women who Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Études de cohorte : sélection des participants et mesure de l’exposition 289 had previously undergone bariatric surgery and for whom presurgery weight was documented. For each pregnancy after bariatric surgery, up to five control pregnancies were matched for the mother’s presurgery body-mass index (BMI; we used early-pregnancy BMI in the Controls), âge, parity, smoking history, educational level, and delivery year. We assessed the risks of gestational diabètes, large-for-gestational-age and small-for-gestational-age infants, preterm birth, stillbirth, néonatal death, and major congénital malformations. Identification of the Study Population and the Matched Control Population. The exclusions for multiple births and incorrect or missing maternai personal identification numbers do not sum to 22,783 because there were 80 exclusions for both a multiple birth and an incorrect or missing maternai personal identification number. BMI dénotés body-mass index, and SOReg Scandinavian Obesity Surgery Registry. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 290 Études observationnelles (analytiques) Il s’agit d’une étude : Il aurait fallu cocher... Commentaires Avec groupe contrôle Il s’agit d’une étude de type exposés/non exposés. La maladie étudiée est le diabète gestationnel et le facteur d’exposition la chirurgie bariatrique. L’information est recueillie prospectivement à l’aide de registres nationaux. Les exposés (patientes opérées) sont comparés à un groupe contrôle de patientes non opérées issues du registre national Observationnelle L’exposition (la chirurgie bariatrique) n’est pas randomisée, c’est donc une étude observationnelle De cohorte Les malades sont suivis dans le temps (par l’intermédiaire des registres). La caractéristique commune est la grossesse Analytique On cherche à étudier le lien entre un facteur de risque et une maladie, c’est donc bien une étude observationnelle Il n’aurait pas fallu cocher... Commentaires Randomisée L’exposition (la chirurgie bariatrique) n’est pas randomisée. Le tirage au sort de témoins ne fait pas de cette étude une étude randomisée ! Cas-témoins Dans cette étude, le recueil est prospectif. On ne part pas de cas de la maladie étudiée (le diabète gestationnel) pour les apparier à des témoins sans diabète. Ici, on part des malades exposés pour les apparier à des sujets non exposés Interventionnelle Non, puisqu’elle est observationnelle Descriptive Non, puisqu’elle est analytique Pourquoi l’effectif du groupe « contrôle » est-il très différent de l’effectif du groupe « chirurgie bariatrique » en dépit de l’appariement ? Il aurait fallu cocher... Commentaires Entre une à cinq naissances du groupe contrôle ont été appariées à chaque naissance du groupe « chirurgie bariatrique » Dans cette étude, le nombre d’exposés et de non-exposés (opérés et contrôles) est déséquilibré par construction. Cinq témoins sont tirés au sort dans le registre. Le nombre de témoins par patiente opérée dépend de la rareté de la combinaison des variables d’appariement. Pour chaque patiente opérée, on lui apparie une patiente de même âge, poids, etc. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Études de cohorte : sélection des participants et mesure de l’exposition Il n’aurait pas fallu cocher... 291 Commentaires On n’a pas trouvé de contrôle pour 74 naissances du groupe « chirurgie bariatrique » Les 74 exclusions n’expliquent pas le déséquilibre final, puisque les patientes non appariées sont exclues de l’analyse La randomisation était déséquilibrée avec un ratio 5 :1 Cette étude n’est pas randomisée L’effectif de naissances multiples différait entre les 2 groupes comparés Nous n’avons pas cette information. De toute façon, c’est un critère d’exclusion, donc aucune grossesse multiple ne doit être incluse quel que soit le groupe 1085 naissances du groupe « chirurgie bariatrique » ont été exclues du fait d’un poids maternel préopératoire non renseigné Ces exclusions ont lieu avant l’appariement Ex e m ple 2 (é preuve t est 2019) Liperoti R, Pedone C, Lapane KL, Mor V, Bernabei R, Gambassi G. Venous Thromboembolism Among Elderly Patients Treated With Atypical and Conventional Antipsychotic Agents. Arch Intern Med 12 déc 2005; 165(22): 2677. The aim of this study was to estimate the effect of atypical and conventional antipsychotic agents on the risk of hospitalization for VTE among elderly patients. We conducted a rétrospective cohort study on nursing home residents in 5 States. We used the Systematic Assessment of Gériatrie Drug Use via Epidemiology (SAGE) database, which contains data from the Minimum Data Set (MDS) to identify 19,940 new users of antipsychotic agents and 112,078 nonusers. Hospitalization with VTE as primary discharge diagnosis was determined during a 6-month follow-up period using Medicare inpatient daims. Il s’agit d’une étude de cohorte : Il aurait fallu cocher... Commentaires Historique Dans une étude de cohorte historique, le début de l’étude est postérieur au début de la maladie ou de l’évènement étudié, ce qui est bien le cas ici Sur base médico-administrative La base est citée par les auteurs : Gériatrie Drug Use via Epidemiology (SAGE) database Avec collecte prospective des données Les données ont déjà été collectées au moment de la réalisation cette étude Observationnelle Il n’y pas d’intervention Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 292 Études observationnelles (analytiques) Il n’aurait pas fallu cocher... De patients ayant comme caractéristique commune d’être traités par antipsychotique De patients ayant comme caractéristique commune d’avoir présenté un épisode thrombo-embolique veineux Commentaires La caractéristique commune des patients est d’être résidents en maison de retraite (nursing home résident). Certains sont traités par antipsychotique et d’autres non et certains ont présenté un épisode thromboembolique et d’autres non Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 28 Recueil des données Ex p ositio n • La mesure doit être objective et non biaisée, idéalement non influencée par la connaissance de la maladie. • Le ou les facteurs d’exposition (facteurs de risque ou facteurs pronostiques) peuvent être très variés : exposition environnementale, géographique, socioéconomique, biologique, médicamenteuse, etc. • L’exposition doit être mesurée de manière valide (appareils fiables, mesures objectives, reproductibles, etc.) : l’objectif est d’éviter des biais de mesures (ou biais de classement). • L’exposition doit être cliniquement pertinente : l’exposition telle qu’elle est définie dans l’étude doit avoir une plausibilité clinicobiologique d’entraîner la survenue de la maladie. • L’exposition doit être au mieux chronologiquement décrite : cela permet de vérifier que la séquence temporelle est cohérente entre l’exposition et la survenue de la maladie et que la durée d’exposition est suffisante pour entraîner la maladie. M aladie (ou évé n e m en t é t u dié) La définition de la maladie (embolie pulmonaire, infarctus du myocarde, etc.) ou de l’état de santé (amélioration de la qualité de vie, quotient intellectuel, etc.) doit être la plus précise, standardisée et objective possible. Elle ne doit idéalement pas pouvoir être influencée par l’exposition. La définition de certaines maladies peut évoluer au cours du temps (critères diagnostiques, amélioration des méthodes diagnostiques). La période de prise en compte des cas doit être précisée et un changement éventuel de définition au cours de l’étude explicitée. • Les événements ou les états de santé peuvent être (voir fiche 10) : - objectifs (décès, taux de C-reactive protein) ; - subjectifs (échelle de douleur, qualité de vie) ; - simples ou composites. La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 294 Études observationnelles (analytiques) • La mesure doit se faire : - quand c’est possible, en aveugle (insu) du facteur de risque étudié (ce qui ne fait pas des études analytiques des études en « double aveugle » ou « en aveugle » ; ce terme est réservé aux essais cliniques) ; - de la même manière pour tous les sujets (mêmes procédures diagnostiques, mêmes questionnaires), jusqu’à la fin du suivi, quel que soit le niveau d’exposition. D ans les é t u d es cas-té m oins Modalités du recueil Les données à recueillir concernent donc l’exposition. Différents modes de recueil sont possibles : dossiers médicaux, interrogatoires, autoquestionnaires. Le recueil de l’exposition étant rétrospectif, les informations à récupérer peuvent dater de plusieurs années, ce qui a pour conséquence des biais importants (notamment le biais de mesure lié à un biais de mémorisation). Biais de mesure ( = biais de classement, voir fiche 2) Le biais de mesure se manifeste principalement par un biais de mémoire concernant l’exposition. La fiabilité du recueil de données datant de plusieurs années est en cause. Ce biais est d’autant plus important que l’exposition est ancienne et qu’elle nécessite une quantification précise (se souvenir que l’on a bu de l’alcool la semaine dernière est plus facile que de se souvenir que l’on buvait exactement trois verres par jour il y a 10 ans). Le biais de classement (ou mesure) peut être différentiel ou non différentiel : il est défini comme non différentiel lorsqu’il affecte de la même façon les cas et les témoins, et comme différentiel dans la situation inverse. Un exemple classique de biais de classement différentiel dans les études cas-témoins est la surestimation de l’exposition par les cas se sachant atteints de la maladie. Ce type de biais de classement différentiel peut être à l’origine d’une surestimation de l’association entre le facteur de risque suspecté et la maladie. Comment limiter les biais dans le recueil de l'exposition ? • Recueillir les données selon le même mode opératoire chez les cas et les témoins. • Recueillir les données en « aveugle » du statut sain ou malade (cela est souvent difficile à mettre en place notamment pour le patient, au mieux l’investigateur ne connaîtra pas le statut cas ou témoin). • Utiliser des instruments de mesure de l’exposition standardisés les plus objectifs possible : données numériques (biologiques, environnementales, autres), questionnaires standardisés rédigés à l’avance laissant peu de place à l’interprétation, etc. • Les questionnaires peuvent être longs et conçus pour limiter la surestimation de l’exposition par les cas. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Recueil des données 295 Ét u d es de co h ort e d e t y p e ex p osés/ n o n ex p osés Modalités du recueil Le recueil des données concerne l’apparition de la maladie d’intérêt et s’effectue dans le cadre d’un suivi au cours du temps. Les modalités de suivi ainsi que sa durée doivent être définies à l’avance et appliquées de manière identique chez les exposés et les non-exposés : • durée de suivi : elle est définie selon le délai attendu entre l’exposition et la survenue de la maladie. Un délai attendu long nécessite une durée de suivi plus importante. La durée doit être identique entre les deux groupes, afin de permettre une comparabilité des résultats au final (une durée de suivi plus longue dans un des groupes entraînera une augmentation du nombre d’événements dans ce groupe) ; • modalités de suivi : les patients sont suivis grâce à plusieurs visites au cours du temps avec recueil de l’information recherchée à chaque fois. Il est nécessaire que le contenu et la fréquence des visites soient les mêmes dans les deux groupes. Par exemple, si les visites sont plus fréquentes dans un des deux groupes, cela entraînera une augmentation de la détection de la maladie dans ce groupe par rapport à l’autre. Sources de biais dans le suivi • Biais de mesure dans le recueil de l’information : une recherche plus attentive du diagnostic de la maladie étudiée peut être induite par la connaissance du statut exposé du sujet. Cela entraîne un biais de classement différentiel en faveur du groupe exposé et surestime ainsi l’association. Ce risque est d’autant plus important que la définition du critère de jugement (du statut malade ou autre condition) est subjective et mal précisée. • Perdus de vue : c’est un des principaux problèmes dans une étude de cohorte, d’autant plus important que le suivi est long et difficile. La diminution de la taille de l’échantillon provoque une perte de puissance (diminution du risque de conclure à une association qui existe vraiment). De plus, si la perte de suivi est liée au statut exposé ou non exposé, cela peut entraîner un biais dans la mesure d’association (biais de suivi ou biais d’attrition). Comment limiter les biais au cours du suivi dans les études de cohorte ? • Suivi défini à l’avance et appliqué de manière identique dans les deux groupes. • Visites réalisées en aveugle du statut exposé ou non exposé afin de ne pas rendre possible une part d’interprétation dans la mesure de la maladie. • Limiter autant que possible les perdus de vue et documenter les raisons ayant entraîné une perte de suivi. • Choisir un critère de jugement le plus objectif possible avec une définition claire, précise et définie à l’avance. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 296 Études observationnelles (analytiques) En pra tique Ex e m ple 1 (ED N 2016) Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai consumption of coffee and caffeine-containing beverages and oral clefts : a population-based case-control study in Norway. Am J Epidemiol 2009 ; 169 : 1216-22. Coffee is a commonly consumed beverage among prégnant women, and even a small increase in malformation risk could be a matter of concern. We used data from a population based case-control study to evaluate the association of maternai consumption of coffee and caffeinated beverages in early pregnancy with the risk of delivering an infant with an orofacial cleft. Mothers completed a 32-page questionnaire covering démographie characteristics, reproductive history, and exposures during pregnancy (including smoking, alcohol consumption, coffee intake, médication use, and occupational and household exposures). Médian time from delivery to completion of the questionnaire was 14 weeks for cases and 15 weeks for Controls. The questionnaire included items on maternai consumption of caffeine-containing beverages (coffee, tea, and soft drinks) during the first 3 months of pregnancy. For each beverage, there was 1 question with 5 response categories : none, number of cups per day, number of cups per week, number of cups per month, and number of cups per year (without specifying the size of the cup). Dans cet article, les facteurs d’exposition d’intérêt incluent : Il aurait fallu cocher... Commentaires La consommation de boissons contenant de la caféine au cours du premier trimestre de grossesse La consommation de café au cours du premier trimestre de grossesse Les facteurs d’exposition sont des facteurs que l’on suspecte comme favorisant l’apparition de la maladie étudiée. On les recherche de manière rétrospective dans les études cas-témoins. L’expression « exposition d’intérêt » dans l’énoncé suppose que l’on s’intéresse ici aux facteurs recherchés pour répondre à la question posée par l’étude Il n’aurait pas fallu cocher... Commentaires La consommation de thé au cours du troisième trimestre de grossesse Il est bien précisé que l’on s’intéresse à la consommation de boissons caféinées au cours des 3 premiers mois de grossesse. La raison de ce choix, exposée dans la discussion, est que la fermeture labiopalatine intervient entre 8 et 12 semaines d’aménorrhée, c’est-à-dire au cours du premier trimestre > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Recueil des données Il n’aurait pas fallu cocher... La supplémentation vitaminique, au cours du premier trimestre de la grossesse 297 Commentaires Cette question distingue les facteurs d’exposition d’intérêt permettant de répondre à la question posée et les facteurs d’exposition ayant un rôle de variable d’ajustement en tant que potentiels facteurs de confusion comme la supplémentation vitaminique et le tabagisme Le tabagisme au cours du premier trimestre de grossesse L’information sur la consommation quotidienne de café au cours du premier trimestre de grossesse : Il aurait fallu cocher... Commentaires A été de nature déclarative C’est souvent le cas dans les études cas-témoins, l’exposition survenant avant le début de l’étude. Cela pose un problème de biais de classement : - non différentiel d’une part : par biais de mémorisation, identique chez les cas et les témoins, la déclaration de l’exposition faisant appel à la mémoire des participants - différentiel d’autre part : par surestimation de l’exposition en faveur des cas en raison de la connaissance du statut malade (un sujet se connaissant malade aura tendance à surestimer l’exposition au facteur d’intérêt) A été quantifiée en nombre de tasses Avec toute l’imprécision que cela peut comporter Il n’aurait pas fallu cocher... Commentaires A été recueillie de manière prospective L’exposition est toujours recueillie de manière rétrospective dans une étude cas-témoins A été extraite de la base de données du registre national des naissances A été recueillie par questionnaire soumis aux mères participantes A été recueillie uniquement chez les mères de nouveau-nés avec une fente labiopalatine (FLP) Cela ne serait pas logique puisque l’on cherche à comparer la consommation de café entre les mères de nouveau-nés avec FLP et les mères de nouveau-nés sans FLP Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 298 Études observationnelles (analytiques) Ex e m ple 2 (ED N 2017) Fondell E, Fitzgerald KC, Falcone GJ, O’Reilly EJ, Ascherio A. Early-onset alopecia and amyotrophie latéral sclerosis: a cohort study. Am J Epidemiol 2013 ; 178(7) : 1146-9. The Health Professionals Foliow-up Study is a longitudinal study of 51,529 male health professionals (dentists, optometrists, osteopaths, podiatrists, pharmacists, andveterinarians), aged 40-75 years at enrollment, who completed amailed questionnaire about lifestyle and medical history in 1986 and similar biennial questionnaires since then. In 1992, participants reported their balding status at âge 45 years by choosing from 5 crown-view pictograms based on Norwood’s classification of malepattern baldness (Norwood’s I, III, IV, V, and VII). The original 5-category classification of alopecia was collapsed into 3 categories as follows: no alopecia (Norwood’s I), moderate alopecia (Norwood’s III or IV), and extensive alopecia (Norwood’s V or VII) for analysis purposes. This study was approved by the human subjects committee at the Harvard School of Public Health (Boston, Massachusetts). In each biennial follow-up questionnaire, participants were asked to report a spécifie list of medically diagnosed conditions and “any other major illness”. ALS was added to the list of spécifie conditions beginning in 2000. We requested permission to contact the treating neurologists for release of relevant medical records from participants who reported a diagnosis of ALS on the open question on major illnesses or on the spécifie question about ALS. L’information sur l’alopécie à l’âge de 45 ans est déclarative et recueillie de manière rétrospective en 1992, source potentielle d’erreur de classement. Cette erreur de classification ou de classement : II aurait fallu cocher... Commentaires Peut potentiellement biaiser l’estimation du risque relatif de survenue de sclérose latérale amyotrophique (SLA) S’il existe une erreur de classement sur le facteur d’exposition principal, cela peut entraîner une mauvaise estimation du risque relatif de SLA Est liée à la mémoire potentiellement défaillante des participants La mémoire des patients peut aggraver cette erreur Tendrait à rapprocher l’estimation du risque relatif de SLA de la valeur neutre 1 Le questionnaire sur l’alopécie n’a été envoyé qu’une fois en 1992, et il est indiqué dans la discussion que les patients n’avaient pas connaissance de la SLA, l’erreur est donc non différentielle Est susceptible de concerner davantage les participants plus âgés Pour des raisons de mémorisation, cette erreur est plus susceptible d’affecter les sujets les plus âgés Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Recueil des données 299 Il n’aurait pas fallu cocher... Commentaires Diffère selon la survenue d’une sclérose latérale amyotrophique (SLA) au cours du suivi Le questionnaire sur l’alopécie n’a été envoyé qu’une fois en 1992, et il est indiqué dans la discussion que les patients n’avaient pas connaissance de la SLA, l’erreur est donc non différentielle Ex e m ple 3 (ED N 2020) Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for Pancreatic Cancer in China: A Multicenter Case-Control Study. J Epidemiol 2016; 26(2) : 64-70. We assessed risk factors of pancreatic cancer in China. A case-control study design was conducted using data from four hospital-based cancer registries. Ail study subjects were asked to fill out a self-administered questionnaire, which was designed by experts. The questionnaire included questions assessing cigarette smoking, alcohol drinking, tea drinking, exposure to carcinogens, environmental factors, dietary habits, family history of pancreatic disease (pancreatitis, pancreatic cyst, cholecystitis, gallstone, peptic ulcer, or cancer), and psychological factors (personal characteristics and dépréssion). The recruitment period was between November 2011 and February 2013. Most questionnaires were filled out by the subjects themselves, although some (0.3%) were completed by their close relatives. The interviewers were trained on study aims, contents of the questionnaire, and interview skills. Ail questionnaires were cross-checked daily. Les caractéristiques méthodologiques de l’étude ayant pu biaiser la qualité de l’information sur les habitudes alimentaires incluent : Il aurait fallu cocher... Commentaires Le recueil rétrospectif des habitudes alimentaires Le caractère rétrospectif du recueil déclaratif des données est responsable d’un biais de mémorisation qui peut être différentiel La connaissance des objectifs de l’étude par les enquêteurs en interaction avec les patients L’absence d’aveugle des enquêteurs sur le statut cas ou témoins peut entraîner un biais de classement différentiel par une recherche plus attentive des facteurs de risque chez les cas par rapport aux témoins L’évaluation grossière des habitudes alimentaires par le questionnaire d’enquête Même si le questionnaire n’est pas disponible pour en juger, on imagine aisément qu’un questionnaire ne permet pas de mesurer avec exactitudes la consommation alimentaire passée (biais de classement) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 300 > Études observationnelles (analytiques) Commentaires Il n’aurait pas fallu cocher... L’appariement d’un témoin non-hospitalisé à chaque cas Le type d’appariement n’influence en aucune manière la qualité du recueil de l’information sur l’exposition Le contrôle de cohérence quotidien de la qualité du remplissage des questionnaires Le contrôle de cohérence quotidien a comme objectif d’améliorer la qualité du recueil de l’information et limite donc les erreurs de remplissage du questionnaire On peut suspecter que le biais concernant l’information recueillie sur les habitudes alimentaires : Il aurait fallu cocher... Commentaires Est différentiel entre les cas et les témoins Dans ce type d’étude les cas se sentent plus impliqués dans la recherche de facteurs de risque liés à leur maladie et ont tendance à rechercher de manière plus attentive certaines exposition voire à les surestimer par rapport aux cas. Le biais est donc différentiel car l’erreur est différente dans un groupe par rapport à l’autre et car elle est influencée par la connaissance de la maladie Contribue à surestimer les odds ratios de cancer du pancréas Si les cas surestiment leur exposition à certains facteurs de risques (biais de classement différentiel), le risque est donc de surestimer les odds ratios A pu être amplifié par les enquêteurs Oui, dans le cas où les enquêteurs ont connaissance du statut cas ou témoins du sujet Il n’aurait pas fallu cocher... Commentaires Est contrôlé par l’appariement des cas et des témoins Les cas et les témoins ne sont pas appariés sur les habitudes alimentaires et cela n’aurait aucun sens de l’être car les habitudes alimentaires sont un des facteurs d’exposition étudiés Est en partie contrôlé par l’analyse multivariée Les techniques d’analyses ne permettent pas de corriger des erreurs dans le recueil des données Ex e m ple 4 (EC N t est 2019) Liperoti R, Pedone C, Lapane KL, Mor V, Bernabei R, Gambassi G. Venous Thromboembolism Among Elderly Patients Treated With Atypical and Conventional Antipsychotic Agents. Arch Intern Med 12 déc 2005; 165(22) : 2677. The aim of this study was to estimate the effect of atypical and conventional antipsychotic agents on the risk of hospitalization for VTE among elderly patients. We conducted a rétrospective cohort study on nursing home residents in 5 States. Eligible candidates were residents 65 years or older. Residents with a diagnosis of schizophrenia were excluded from the study population because they might hâve presented noticeable différences in their cardiovascular risk profile. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Recueil des données 301 The thromboembolie effect of antipsychotic agents may be manifest within 3months of the initiation of therapy. We defined the length of follow-up to be 6 months. The outcome of this study was defined as any hospitalizations for VTE that occurred during that time. We identified ail hospitalizations in which the primary discharge diagnosis was one of the following: deep venons thrombosis (ICD-9 code 453.8), fémoral vein thrombi (ICD-9 code 451.11), popliteal vein thrombi (ICD-9 code 451.19), iliac vein thrombi (ICD-9 code 451.81), deep vessels of lower extremity thrombophlebitis (ICD-9 code 451.1), and pulmonary embolism and infarction (ICD-9 code 415.1). We used the first hospitalization for VTE among persons with multiple events (n = 29). Les événements thromboemboliques veineux saisis dans la base médico-administrative : Commentaires Il aurait fallu cocher... Reposaient sur le diagnostic principal de sortie We identified ail hospitalizations in which the primary discharge diagnosis was one of the following Etaient codés de façon variable selon les centres La manière de coder les actes et diagnostics en pratique clinique courante n’étant pas harmonisée selon les centres, qu’il y ait des différences est donc certain (comme pour notre PMSI) Le diagnostic de l’événement d’intérêt était indépendant de l’exposition aux antipsychotiques Il s’agit d’une cohorte historique, mais les données ont été recueillies prospectivement, les cliniciens qui ont codé le diagnostic n’étaient pas au courant de l’existence de l’étude. Ils n’ont donc pas été influencés par l’exposition aux antipsychotiques Il n’aurait pas fallu cocher... Commentaires Etaient exclus si l’événement était déjà présent à l’initiation du traitement antipsychotique Dans cette étude historique (rétrospective), il est inconcevable qu’une recherche systématique de thrombose ait été faite à l’inclusion Le diagnostic de l’événement d’intérêt reposait sur des examens invasifs Le critère de jugement était défini par l’hospitalisation pour un événement thromboembolique codé en tant que diagnostic principal Ex e m ple 5 (ED N 2021) von Ehrenstein OS, Ling C, Cui X, Cockburn M, Park AS, Yu F, et al. Prénatal and infant exposure to ambient pesticides and autism spectrum disorder in children: population based case-control study. BMJ 20 mars 2019 ; 364 :1962. Objective: To examine associations between early developmental exposure to ambient pesticides and autism spectrum disorder. Design: Population based case-control study. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 302 Études observationnelles (analytiques) Methods: Use of these pesticides in an agriculturally intensive région of California, United States, were recorded in the California State mandated Pesticide Use Reporting (CA-PUR) program. These records were integrated in our géographie information System tool, which links exposure records to addresses from birth records of the study population. L’information sur l’exposition aux pesticides ambiants est dérivée d’un système d’information géographique basé sur les données de la base CA-PUR. Quelles sont les limites méthodologiques de cette source ? Il aurait fallu cocher... Elle n’intègre pas l’exposition aux pesticides d’usage domestique Elle ne prend pas en compte les autres sources d’exposition aux pesticides, notamment alimentaires Elle peut être mise en défaut en cas de déménagement en cours de grossesse Elle repose sur l’hypothèse que les individus étaient présents à domicile aux dates d’application des pesticides par les agriculteurs Commentaires On ne trouve que ce que l’on cherche ! Ce qui n’est pas mesuré ne peut donc pas être pris en compte Les outils de mesure de pollution basés sur la localisation géographique et sur l’adresse de domiciliation du patient nécessitent de faire l’hypothèse forte que les participants à l’étude sont présents à leur adresse pendant la majeure partie de leur temps. Il n’est donc pas pris en compte le temps passé ailleurs, en lien avec l’activité professionnelle par exemple, le temps passé dans une éventuelle résidence secondaire, les déménagements, etc. Il n’aurait pas fallu cocher... Commentaires Elle est propice aux biais de mémorisation, compte tenu de son caractère rétrospectif et subjectif Il s’agit de données officielles probablement enregistrées de manière prospective. Il n’y a donc pas de subjectivité dans la mesure, donc pas de risque de biais de classement différentiel Elle est déclarative Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Fic h e 29 Analyse des résultats et évaluation de la causalité A nalyse d es résulta ts d es é t u d es o bserva tio n n elles analytiq u es 1re étape : tableau de contingence Suite au recueil des données, la première étape consiste à créer un tableau de contingence comme ceux présentés ci-dessous. Les lettres a, b, c et d représentent les effectifs correspondants. Tableau de contingence d’une étude de cohorte. Survenue de la maladie (M+) Absence de survenue de la maladie (M—) Exposés (E+) a b Non exposés (E-) c d Tableau de contingence d’une étude cas-témoins. Cas (M+) Témoins (M—) Exposition présente (E+) a b Exposition absente (E—) c d 2 e étape : calcul des mesures d'association et de leurs intervalles de confiance Ét u d e d e co h orte = calcul d'un risq u e rela tif (RR) Le RR est le rapport d’incidence entre les sujets exposés et les sujets non exposés. | a | Incidence chez les exposés _ l a + b J R R —---- ----------------------------------- — — y—-—4 Incidence chez les non exposés c [ c+d J La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 304 Études observationnelles (analytiques) Exemple : vous comparez 60 patients exposés à 60 patients non exposés au facteur de risque et vous recueillez de manière prospective la survenue de la maladie sur une période d’un an. Quel est le risque relatif correspondant au tableau de contingence suivant ? Absence de survenue de la maladie (M-) Survenue de la maladie (M+) Exposés (E+) 40 20 Non exposés (E-) 20 40 • taux d’incidence chez les exposés : 40/60 = 2/3 = 66,7 % ; • taux d’incidence chez les non-exposés : 20/60 = 1/3 = 33,3 % ; . RR = 111 = 2 ; V3 • un RR à 2 signifie que le risque de développer la maladie est multiplié par 2 chez les exposés par rapport aux non-exposés. Ét u d e cas-t é m oins = calcul d'un o d ds ra tio (OR) Dans les études cas-témoins, le calcul de l’incidence n’est pas possible étant donné l’absence de suivi, donc le calcul du RR ne l’est pas non plus. On calcule un OR qui correspond à un rapport des cotes (OR = cote des cas/cote des témoins). La cote des cas est le rapport des exposés sur les non-exposés chez les cas ; et la cote des témoins est le rapport des exposés sur les non-exposés chez les témoins. a/a + c OR = Cote des cas Cote des témoins ^c/a + c b/b + d d/b + d Exemple : vous comparez 60 cas à 60 témoins et vous recueillez rétrospectivement la mesure de l’exposition au facteur de risque. Le calcul des taux d’incidence est impossible car vous ne mesurez pas la survenue de la maladie au cours du temps. Vous devez donc calculer un odds ratio : Cas (M+) Témoins (M-) Exposition présente (E+) 40 20 Exposition absente (E-) 20 40 • cote des cas - 40/20 = 2 (2 fois plus d’exposés que de non-exposés chez les cas) ; • cote des témoins = 20/40 = 0,5 (2 fois moins d’exposés que de non-exposés chez les témoins) ; • OR (rapport des cotes) = 2/0,5 = 4 ou avec la formule : OR = — = -9 X = 4 ; cxb 20x20 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse des résultats et évaluation de la causalité 305 • un OR à 4 ne signifie pas (contrairement au RR) que le risque de développer la maladie est multiplié par 4 chez les exposés par rapport aux non-exposés (comparez les résultats avec ceux du calcul du RR au cours d’une étude de cohorte dans l’exemple précédent ; les effectifs ont volontairement été choisis à l’identique afin de permettre la comparaison). Calcul de l'intervalle de confiance de l'OR ou RR Une valeur d’OR ou RR sans son intervalle de confiance n’est pas suffisante. Un OR ou RR à 1 correspond à un risque identique entre les deux groupes, donc afin de définir une association statistique significative, il est nécessaire que l’intervalle de confiance (IC) à 95 % ne comprenne pas la valeur 1 : • IC comprenant 1 = association non significative (on ne rejette pas l’hypothèse nulle). Exemple : RR (ou OR) = 2,43 [IC95 % : 0,86-4,00] ; • IC ne comprenant pas 1 = association significative (on rejette l’hypothèse nulle). Exemple : RR (ou OR) = 1,78 [IC95 % : 1,31-2,25]. On distingue deux situations en fonction de la valeur de l’OR/RR : • OR ou RR < 1 (par exemple, OR = 0,78 [IC95 % : 0,71-0,85]) : l’association entre la maladie et le facteur d’exposition est négative avec un caractère significatif. L’exposition étudiée est donc un facteur protecteur potentiel concernant la survenue de la maladie ; • OR ou RR > 1 (par exemple, OR = 4,78 [IC95 % : 3,80-5,76]) : l’association entre la maladie et le facteur d’exposition est positive avec un caractère significatif. L’exposition étudiée est donc un facteur de risque potentiel de la survenue de la maladie. ► Remarque : la situation présentée ici ne concerne pas le cas des variables quantitatives continues où le calcul d’un RR n’est pas possible. Par exemple, on réalise une étude exposés/non exposés évaluant le volume d’expiration maximale seconde (VEMS) entre des sujets exposés au tabagisme et d’autres sujets non exposés. On pourra utiliser comme outils de comparaison dans cette situation les moyennes de VEMS ou encore la diminution du pourcentage de VEMS (voir fiche 5). Lecture des odds ratios et risques relatifs dans les tableaux de résultats Le tableau ci-dessous représente des données fictives relatives au lien entre consommation de café et ulcère de l’estomac dans une étude cas-témoins. Odds ratio p-value 95%CI 1.11 (1.04-1.18) 0.04 None 1.00 REF - 0-3 cups/day 1.37 (0.83-1.66) 0.080 > 3 cups/day 1.59 (1.11-1.73) 0.001 Coffee (quantitative) p for trend Coffee (categorical) 0.01 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 306 Études observationnelles (analytiques) On peut tirer de ce tableau les informations suivantes : • lorsque le café est traité comme une variable quantitative, l’OR s’interprète comme l’augmentation de risque pour l’augmentation d’une unité de la consommation de café : le risque est multiplié par 1,11, soit augmenté de 11 % quand on passe de 1 tasse à 2 tasses par jour, ou quand on passe de 3 à 4 tasses. Cette augmentation est significative (l’intervalle de confiance exclut 1). Le risque d’erreur en affirmant que le lien n’est pas lié au hasard est 0,04 ; • lorsque le café est traité comme une variable qualitative : - lorsqu’une variable a plus de deux catégories, il faut identifier la catégorie de référence (c’est le groupe auquel on compare tous les autres pour définir l’augmentation du risque). Elle est soit indiquée dans le tableau, soit dans les notes de bas de page, soit implicite (c’est la catégorie qui n’est pas représentée), ainsi quand on affiche le risque pour les hommes, il est évident que c’est par rapport aux femmes. Ici, si la catégorie « pas de café » avait été absente, on aurait dû en déduire que c’était la catégorie de référence, - la consommation de 0-3 tasses augmente non significativement le risque de 37 % par rapport à la non-consommation, - la consommation de plus de 3 tasses augmente significativement le risque de 59 % par rapport à la non-consommation, - ce tableau ne permet pas de comparer les consommateurs de 0-3 tasses aux consommateurs de plus de 3 tasses ; • le p de tendance (p for trend) teste l’hypothèse : « le risque d’ulcère gastrique augmente avec la consommation de café ». On peut ici affirmer que l’augmentation de la consommation de café est significativement liée à l’augmentation du risque d’ulcère. C’est un argument en faveur d’une relation dose-effet. Raiso ns p ossibles d'u ne associa tio n sig nîfica tive / n o n sig nifica tive Raisons possibles d'une association non significative • L’association n’existe pas dans la population cible. • L’association existe dans la population cible mais l’étude manque de puissance pour démontrer l’association sur le plan statistique (le nombre de sujets nécessaires ou le nombre d’événements n’est pas assez important) : risque p. • L’association existe mais est inférieure aux hypothèses initiales des auteurs. • L’association existe mais des biais trop importants la masquent : - biais de sélection (dans cet échantillon précis, qui n’est pas représentatif) on ne peut pas voir une association qui existe vraiment ; - biais de classement non différentiel (peut rapprocher le RR de 1) ou différentiel (peut éloigner ou rapprocher le RR de 1) ; - biais de confusion (voir fiche 24). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse des résultats et évaluation de la causalité 307 Raisons possibles d'une association significative • L’association existe réellement dans la population cible (situation idéale). • L’association n’existe pas mais la présence d’un ou plusieurs biais fausse les résultats : - biais de sélection (l’échantillon a sélectionné des individus chez qui l’association existe alors qu’à l’échelle de la population, elle n’existe pas) ; - biais de classement (biais de classement différentiel comme par exemple la surestimation de l’exposition chez des patients se sachant atteints de la maladie) ; - biais de confusion (voir fiche 24). • L’association n’existe pas mais les résultats retrouvés sont liés à une erreur aléatoire (fluctuations d’échantillonnage) : risque a, cette probabilité est donnée par la p-value. Evalua tio n d e la ca usalit é Principe La présence d’une association statistiquement significative entre deux éléments n’est pas synonyme pour autant de la présence d’un lien de cause à effet entre ces deux éléments. Une association statistique doit être interprétée avec prudence, notamment en raison des nombreux biais présents dans les études observationnelles. Association n’est pas synonyme de causalité ! Critères de causalité de Bradford-Hill (1965) Critères in tern es à l'é t u d e (re nv oie n t à la m é th o d olo gie e t a u x résult a ts pro pres d e l'é tu d e) • Force de l’association (ou taille de l’effet) : la présence d’un RR ou OR élevé (un RR à 14 n’a pas la même valeur qu’un RR à 1,2 même s’ils sont tous les deux statistiquement significatifs). • Relation dose-effet : augmentation de la maladie en cas d’exposition plus importante au facteur de risque (se remarque quand des sous-groupes à différents niveaux d’exposition sont constitués). Ce type d’effet est évalué par un p de tendance (p for trend). • Séquence temporelle : l’apparition de la maladie survient avec un délai logique depuis l’exposition au facteur de risque (difficile à évaluer précisément dans les études cas-témoins rétrospectives). • Spécificité de l’association : présence du facteur de risque chez presque tous les malades, uniquement chez eux et dans cette seule maladie. Ce critère signifie qu’une cause doit conduire à un seul effet, c’est-à-dire qu’à une exposition de nature causale ne doit être associée qu’une seule maladie causée par l’exposition (exemple : amiante et mésothéliome). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 308 Études observationnelles (analytiques) Critères e x t ern es à l'é t u d e (re nv oie n t à l'a n alyse d e la lit t éra t ure sur le suje t) • Résultats cohérents et reproductibles dans la littérature : résultats équivalents à ceux des autres études publiées sur le sujet, y compris dans le cadre d’autres situations avec différentes populations, dans des zones géographiques différentes, etc. • Cohérence avec la recherche expérimentale : résultats en accord avec la recherche fondamentale in vitro et chez l’animal. • Plausibilité biologique : mécanisme physiopathologique connu et apportant un lien logique avec les résultats de l’étude. • Réversibilité : association non retrouvée en cas de suppression du facteur de risque. • Analogie : il s’agit de l’analogie par rapport à d’autres relations causales et à leurs mécanismes. ► Remarque : la persistance de l’association après prise en compte des principaux facteurs de confusion est un argument indirect en faveur de la causalité, car elle est en faveur de la force de l’association. Cette proposition a déjà été considérée comme juste aux EDN. En revanche, « la prise en compte de tous les facteurs de confusion existants » est toujours fausse, car il est impossible de s’assurer que tous ces facteurs, connus ou inconnus, aient été pris en compte. En pra tique Ex e m ple 1 (ED N 2016) Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai consumption of coffee and caffeine-containing beverages and oral clefts: a population-based case-control study in Norway. Am J Epidemiol 2009; 169 : 1216-22. We aimed to evaluate the association of maternai consumption of coffee and caffeinated beverages in early pregnancy with the risk of delivering an infant with an orofacial cleft. Data from animal studies suggest that large single doses of caffeine may cause palatal clefts in a systematic review of 3 studies of orofacial clefts and caffeine, high coffee intake was associated with a slight increase in risk. Ail infants born with facial clefts in Norway are treated at government expense in surgical centers at university hospitals located in Oslo and Bergen. In collaboration with these 2 centers, we identified ail babies born from 1996 to 2001 who were referred for treatment for either cleft lip with or without cleft palate (CLP) or cleft palate only (CPO). Controls were recruited during the same period by randomly selecting approximately 4 births per 1,000 from the National Medical Birth Registry (which includes ail births in the country). These births served as Controls for both case groups, with the target of 2 Controls per case of CLP (nearly 4 Controls for each case of CPO). Both cases and Controls Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse des résultats et évaluation de la causalité 309 were recruited during their first weeks of life. Mothers completed a 32-page questionnaire covering démographie characteristics, reproductive history, and exposures during pregnancy (including smoking, alcohol consumption, coffee intake, médication use, and occupational and Household exposures). Cleft Lip With or Without Cleft Palate Ail Cases Cleft Palate Only AH Cases Crude Analysis Adjusted Analysis Crude Analysis Adjusted Analysis (n = 377/763) (n = 318/653) (n = 196/763) (n = 178/653) Odds Ratio 95% CI Odds 1.04, 1.1 8 1.07 > 0- < 3 cups/ 1.37 day 1.03, 1.81 >3 cups/day 1.80 1.29, 2.53 P for trend < 0.001 Odds Ratio 95% 1.11 Coffee, percup increase CI 95% Odds Ratio 95% CI 0.92, 1.09 0.98 0.88, 1.09 1.17 0.83, 1.66 1.26 0.85, 1.86 1.07 0.68, 1.70 0.96 0.55, 1.67 Ratio CI 1.00, 1.16 1.00 1.39 1.01, 1.92 1.59 1.05, 2.39 Coffee, categoricald 0.566 0.013 0.760 Tea, categoricald >0- < 3 cups/ 0.68 day 0.52, 0.88 0.74 0.55, 1.01 0.65 0.46, 0.91 0.66 0.45, 0.95 >3 cups/day 0.50 0.31, 0.80 0.55 0.32, 0.95 0.68 0.39, 1.18 0.58 0.31, 1.07 P for trend 0.001 0.014 0.033 0.025__________ d Reference category : 0 cups/day. En analyse multivariée (tableau ci-dessus), les auteurs indiquent qu’il existe une relation croissante entre l’odds ratio (OR) de fente labiale (avec ou sans fente palatine) et la consommation de café codée en tasses par jour. Sur quel(s) arguments) repose(nt) cette affirmation ? Il aurait fallu cocher... Commentaires L’estimation ponctuelle de l’OR ajusté est égale, respectivement, à 1,00 pour 0 tasse, 1,39 pour 0 à 3 tasses, et 1,59 pour 3 tasses et plus Le test de tendance p for trend indique s’il existe une augmentation significative du risque avec l’augmentation des doses de café. L’augmentation croissante des valeurs des OR en fonction de la dose de café est un argument en faveur de la relation « dose-effet » : 1 pour 0 tasse (catégorie de référence), 1,39 pour 1-3 tasses et 1,59 pour plus de 3 tasses. Cette impression est confirmée par la significativité du test de tendance Le degré de signification (valeur de p) du test de tendance (soit 0,013) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 310 Études observationnelles (analytiques) Il n’aurait pas fallu cocher... Commentaires Le recouvrement partiel des intervalles de confiance à 95 % des OR ajustés pour les catégories 0 à 3 tasses et 3 tasses et plus, respectivement L’OR d’une catégorie s’interprète comme l’indicateur du risque pour cette catégorie par rapport à la catégorie de référence. Si l’OR est supérieur à 1 et que son intervalle de confiance exclut 1, cela veut dire que le risque de FLP est significativement plus fort dans la catégorie considérée que chez les femmes ne consommant pas de café (catégorie de référence). Ces intervalles de confiance ne permettent pas de comparer le risque associé à la catégorie 0-3 avec celui de la catégorie > 3 L’exclusion de l’échantillon d’analyse des mères ne consommant pas de café pendant le premier trimestre de grossesse Cette proposition est sans rapport avec la relation dose-effet L’OR de fente labiale chez les femmes consommant 3 tasses par jour ou plus de café par rapport aux femmes consommant moins de 3 tasses par jour est de 1,59 (IC95 % : 1,05-2,39) La catégorie de référence est erronée Le risque de conclure à tort à la responsabilité de la consommation de café au cours du premier trimestre de la grossesse dans cette étude peut s’expliquer par : Il aurait fallu cocher... Commentaires Le risque d’erreur statistique de première espèce (a) = par hasard Le risque a correspond dans toute étude au risque de conclure à une différence qui n’existe pas en réalité. Cela correspond au risque de montrer une différence par hasard en raison des fluctuations d’échantillonnage (si les témoins qui sont tirés au sort sont par hasard peu consommateurs de café par rapport à la population générale dont ils sont issus, on peut alors montrer à tort une responsabilité du café dans la survenue de fentes labiopalatines) Le caractère rétrospectif du recueil des données = par biais de classement différentiel Le fait de recueillir rétrospectivement les données entraîne toujours un biais de mesure (= biais de classement). Le caractère différentiel s’explique par le fait que les mères d’enfants ayant développé une fente labiopalatine auront plus ou moins tendance à surestimer leur consommation de café pendant le premier trimestre, ce qui peut donc contribuer à augmenter l’association Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse des résultats et évaluation de la causalité Il aurait fallu cocher... L’existence de facteurs de confusion résiduels méconnus 311 Commentaires Il existe potentiellement des tiers facteurs non connus ou non pris en compte qui jouent un rôle dans l’augmentation du risque de la maladie. L’absence de randomisation dans les études observationnelles ne permet pas une bonne répartition de ces tiers facteurs dans les différents groupes comparés. Cette proposition est donc toujours vraie dans les études observationnelles Il n’aurait pas fallu cocher... Commentaires L’existence d’une relation entre la dose de caféine ingérée quotidiennement et l’OR de fente labiale L’existence d’un effet dose fait partie des critères de causalité. C’est donc plutôt un argument pour des résultats non erronés Un défaut de puissance statistique Un défaut de puissance expliquerait plutôt l’absence de démonstration d’une association qui existe réellement Un biais de classement différentiel en faveur du groupe témoin Un tel type de biais maximiserait l’exposition dans le groupe témoin au détriment des cas. Ce serait alors possible que cette surestimation ait comme conséquence de masquer une association qui existe réellement Citez le ou les arguments en faveur de la nature causale de l’association, retrouvée dans cette étude, entre la consommation de café pendant le premier trimestre de grossesse et le risque accru de fente labiale (avec ou sans fente palatine) à la naissance : Il aurait fallu cocher... Commentaires L’existence d’une relation dose-effet statistiquement significative La relation dose-effet est démontrée par : d’une part, l’augmentation de l’OR avec l’augmentation de la consommation de café d’autre part, la valeur du test de tendance (p for trend) qui montre que cette augmentation de risque est significative Le risque de fente labiopalatine induit par l’exposition à une dose unique élevée de caféine chez l’animal Cet argument cité dans l’introduction correspond à la preuve expérimentale des critères de causalité Le risque de fente labiopalatine ayant déjà été mis en évidence dans des études antérieures La cohérence avec la littérature déjà publiée et la reproductibilité des résultats est en faveur de la causalité Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 312 Études observationnelles (analytiques) Il n’aurait pas fallu cocher... Commentaires L’ajustement sur tous les facteurs de confusion possibles Il n’est pas impossible que des facteurs de confusion n’aient pas été pris en compte. On ne peut jamais prendre en compte tous les facteurs de confusion possibles La séquence temporelle entre l’exposition et l’événement de santé étudié La séquence temporelle est toujours difficile à évaluer dans les études castémoins en raison du caractère rétrospectif des données. De plus, dans cette étude, il est difficile de superposer exactement la consommation de café à la période au cours de laquelle s’est formée la fente labiopalatine chez chaque fœtus L’absence d’association similaire entre la consommation de café et la fente palatine seule On n’a aucune raison de penser que la consommation de café soit un facteur de risque de fente labiopalatine et non de fente palatine seule. Cela ne rend pas les résultats très cohérents Parmi les implications potentielles de cette étude pour la prévention des fentes labiopalatines, il paraît pertinent de : Il aurait fallu cocher... Commentaires Informer les femmes enceintes concernées sur l’absence de preuve de l’innocuité d’une consommation de café supérieure à 3 tasses par jour Un niveau de preuve faible comme celui d’une étude cas-témoins (niveau III = présomption scientifique) ne permet pas la mise en place de recommandations « dures » Conseiller d’éviter les boissons contenant de la caféine au cours du premier trimestre de grossesse Cependant, l’absence de preuve de l’innocuité de la consommation de café doit inciter au principe de précaution et à conseiller aux femmes enceintes de limiter leur consommation de café pendant le premier trimestre Il n’aurait pas fallu cocher... Commentaires Réaliser une étude randomisée portant sur la consommation de thé versus café chez les femmes enceintes Il n’est pas éthique de réaliser un essai clinique randomisé qui obligerait d’exposer des femmes enceintes volontairement à une consommation de café, alors qu’il existe un doute sur la responsabilité des boissons caféinées dans le développement des fentes labiopalatines Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse des résultats et évaluation de la causalité Il n’aurait pas fallu cocher... Commentaires Inciter les femmes enceintes à consommer plus de 3 tasses de thé par jour pendant le premier trimestre de grossesse Une étude cas-témoins a un niveau de preuve faible (niveau III = présomption scientifique). Cela ne permet pas de recommander la consommation de plus de 3 tasses de café par jour malgré un effet protecteur significatif sur le plan statistique (OR à 0,55 avec intervalle de confiance excluant 1 ) Renforcer la surveillance échographique morphologique de l’extrémité céphalique chez les femmes enceintes consommant plus de 3 tasses de café par jour Une étude cas-témoins a un niveau de preuve faible (niveau III = présomption scientifique) ne permettant pas de recommander un tel type de surveillance qui entraînerait une surmédicalisation et un stress pour les futurs parents 313 Ex e m ple 2 (é preuve t est 2018) Johansson K, Cnattingius S, Nâslund I, Roos N, Trolle Lagerros Y, Granath F, Stephansson O, Neovius M. Outcomes of pregnancy after bariatric surgery. N Engl J Med 2015 ; 372 : 814-24. Maternai obesity is associated with increased risks of gestational diabètes, large-for-gestational-age infants, preterm birth, congénital malformations, and stillbirth. The risks of these outcomes among women who hâve undergone bariatric surgery are unclear. We investigated the risks of gestational diabètes and adverse périnatal outcomes among women with a history of bariatric surgery as compared with women without such a history but with similar characteristics. We therefore conducted a population-based study using data from nation wide Swedish registries, including information on presurgery BMI among women who had undergone bariatric surgery. We investigated the risks of gestational diabètes and adverse périnatal outcomes among women with a history of bariatric surgery as compared with women without such a history but with similar characteristics. The Swedish Medical Birth Register includes information on more than 98% of ail births in Sweden since 1973. Information is prospectively collected from standardized prénatal, obstétrical, and néonatal records. We identified 627,693 singleton pregnancies in the Swedish Medical Birth Register from 2006 through 2011, of which 670 occurred in women who had previously undergone bariatric surgery and for whom presurgery weight was documented. For each pregnancy after bariatric surgery, up to five control pregnancies were matched for the mother’s presurgery body-mass index (BMI; we used early-pregnancy BMI in the Controls), âge, parity, smoking history, educational level, and delivery year. We assessed the risks of gestational diabètes, large-for-gestational-age and small-for-gestational-age infants, preterm birth, stillbirth, néonatal death, and major congénital malformations. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 314 Études observationnelles (analytiques) Dans cette étude prospective, les arguments en faveur de la nature causale de l’association observée entre la chirurgie bariatrique et la réduction du risque de diabète gestationnel incluent : Il aurait fallu cocher... Commentaires L’intensité de l’association quantifiée par l’estimation ponctuelle de Vodds ratio (OR = 0,25) Ceci argumente la force de l’association : OR = 0,25 = diminution de risque de 75 % = risque divisé par 4 La cohérence avec les résultats d’une étude antérieure citée dans les références de l’article Ceci prouve la reproductibilité de l’association Le respect de la séquence temporelle L’étude étant prospective, on n’a pas de doute sur ce point Il n’aurait pas fallu cocher... Commentaires L’existence d’une relation « dose-effet » Est non applicable pour une exposition qualitative binaire (oui/non). La chirurgie bariatrique (exposition d’intérêt) ne peut pas être catégorisée autrement La taille de l’échantillon d’analyse Ce n’est pas un critère de causalité. Si l’association est forte, elle pourra être mise en évidence, même sur un petit échantillon La chirurgie bariatrique était associée à un odds ratio de diabète gestationnel égal à 0,25 (intervalle de confiance à 95 % : 0,13 à 0,47, p < 0,001). Ce résultat peut s’expliquer par : Il aurait fallu cocher... Commentaires L’existence de facteurs de confusion résiduels C’est en théorie toujours possible d’imaginer l’existence de facteurs de confusion résiduels modifiant une association dans une étude observationnelle, il faudrait que ce facteur soit plus fréquent chez les patientes opérées et lié au diabète gestationnel (par exemple, la prise en charge plus fréquente par une diététicienne en post-chirurgie : les patientes feraient moins d’erreurs diététiques et seraient moins sujettes au diabète, non pas parce qu’elles ont été opérées, mais grâce à cette prise en charge) L’efficacité de la chirurgie bariatrique pour la réduction du risque de diabète gestationnel C’est bien sûr possible, même si cette étude n’a pas le niveau de preuve pour s’assurer que cette relation soit causale Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse des résultats et évaluation de la causalité 315 Il aurait fallu cocher... Commentaires Une prévalence plus élevée de diabète préconceptionnel méconnu dans le groupe « contrôle » La connaissance de l’antécédent de chirurgie bariatrique et donc d’une obésité morbide pourrait en effet inciter les cliniciens à une recherche plus active de diabète dans le groupe opéré que chez les contrôles. Il en résulterait une sous-estimation de la prévalence réelle du diabète préconceptionnel chez les contrôles. Les patientes avec un diabète préconceptionnel sont exclues de l’analyse. On aurait donc exclu plus de patientes diabétiques du groupe « chirurgie » et donc possiblement augmenté la force de l’association La différence de l’indice de masse corporelle (IMC) moyen en début de grossesse entre les 2 groupes d’étude Les patientes opérées ont un IMC plus bas et c’est probablement le mécanisme principal qui explique la diminution du risque de diabète gestationnel Une relation causale entre la chirurgie bariatrique et la diminution du risque de diabète gestationnel Même si ce type d’étude n’a pas le niveau de preuve pour affirmer une relation causale, c’est une des explications possibles à ce résultat Il n’aurait pas fallu cocher... La différence d’effectif entre les 2 groupes d’étude Commentaires La différence d’effectif est liée au ratio exposés/non exposés de 5 La chirurgie bariatrique était associée à un odds ratio d’occurrence du critère composite de mort fœtale ou néonatale égal à 2,39 (intervalle de confiance à 95 % : 0,98 à 5,85 ; p = 0,06). Ce résultat peut s’expliquer par : Il aurait fallu cocher... Commentaires L’absence d’association entre la mortalité fœtale ou néonatale et la chirurgie bariatrique Un résultat non significatif peut s’expliquer par l’absence de lien (probabilité 1 — a) Le risque d’erreur statistique de deuxième espèce (P) Un résultat non significatif peut s’expliquer par un manque de puissance (risque p = risque de ne pas mettre en évidence une association qui existe pourtant) Un défaut de puissance statistique En l’absence de calcul de puissance a priori^ on peut toujours penser que le test manque de puissance Il n’aurait pas fallu cocher... Commentaires Le caractère composite du critère Au contraire, un critère composite génère plus d’événements et augmente la puissance du test La nature causale de l’association Au contraire, une association causale serait plutôt fortement significative > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 316 Études observationnelles (analytiques) Ex e m ple 3 (ED N 2020) Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for Pancreatic Cancer in China : A Multicenter Case-Control Study. J Epidemiol 2016 ; 26(2) : 64-70. We assessed risk factors of pancreatic cancer in China. Methods : A case-control study design was conducted using data from four hospital-based cancer registries. Controls were equally matched and selected from family members of nonpancreatic cancer patients in the same hospitals. Face-to-face interviews were conducted by trained staff using questionnaires. Conditional logistic régression models were used to assess odd ratios (ORs) and 95 % confident intervals (CIs). Lifestyles associated with risk of pancreatic cancer Risk Adjusted OR 1 Adjusted OR 2 Cases Controls Crude OR (95% CI)b (95% CI)a factors (95% CI) n n % % Smoking No 190 -58.8 210 -65.0 1.00 (reference) 1.00 (reference) 1.00 (reference) Yes 133 -41.2 113 -35.0 1.50(1.01-2.24) 1.64(1.08-2.48) 1.78(1.02-3.10) Cigarettes per day 50 -37.6 72 -63.7 1.00 (reference) 1.00 (reference) 1.00 (reference) <20 20-29 61 -45.9 34 -30.1 2.04(1.04-4.02) 1.97(1.03-4.01) 1.55(0.73-3.31) 22 -16.5 7 -6.2 3.67(1.07-12.66) 3.85(1.09-13.59) 1.94(0.52-7.36) >30 Pack-years 44 <20 -33.1 58 -51.3 1.00 (reference) 1.00 (reference) 1.00 (reference) 89 -66.9 55 -48.7 1.48(1.03-2.13) 1.45(1.01-2.09) 1.39(0.86-2.23) >20 Alcohol consumption 272 -84.2 274 -84.8 1.00 (reference) 1.00 (reference) 1.00 (reference) No Yes 51 -15.2 1.07(0.65-1.76) 1.18(0.70-1.99) 1.22(0.60-2.48) -15.8 49 Tea consumption No 240 -75.9 208 -64.8 1.00 (reference) 1.00 (reference) 1.00 (reference) -24.1 113 -35.2 0.53(0.36-0.79) 0.55(0.36-0.83) 0.49(0.25-0.84) Yes 76 Coffee consumption No 308 -96.9 297 -96.4 1.00 (reference) 1.00 (reference) 1.00 (reference) Yes 10 -3.1 11 -3.6 0.90(0.37-2.22) 0.89(0.33-2.37) 0.91(0.30-2.78) Cooking No 140 -44.7 130 -40.4 1.00 (reference) 1.00 (reference) 1.00 (reference) Yes 170 -55.3 192 -59.6 0.73(0.49-1.10) 0.69(0.45-1.05) 0.63(0.37-1.06) Mental jressure No 265 -83.1 286 -89.1 1.00 (reference) 1.00 (reference) 1.00 (reference) 1 Yes 54 -16.9 35 -10.9 1.73(1.07-2.81) 1.67(1.02-2.74) 1.32(0.73-2.39) Cl, confidence interval ; OR, odds ratio. Ail bold ORswere statistically significant as indicated by their 95% CIs. a Adjusted for âge, sex, race, and residential areas. b Adjusted for âge, sex, race, residential areas, smoking, tea drinking, mental pressure, family history of pancreatic cancer, BMI, diabètes, gallstone, pickle consumption, and vegetable consumption. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse des résultats et évaluation de la causalité 317 D’après le tableau ci-dessus, quel(s) argument(s) va (vont) à l’encontre d’une association statistiquement significative entre la pression psychologique au travail {mental pressure) et le risque de cancer du pancréas en analyse multivariée ? Il aurait fallu cocher... Commentaires Les bornes de l’intervalle de confiance à 95 % (0,73 à 2,39) de Vodds ratio ajusté incluent la valeur neutre 1,00 Le résultat à prendre est celui de l’analyse multivariée ajustée sur tous les facteurs de confusion mis en évidence et correspond au résultat de la dernière colonne (OR2). On ne retrouve pas d’association statistiquement significative entre la pression psychologique au travail et le risque de cancer du pancréas car l’intervalle de confiance de Vodds ratio correspondant comprend la valeur 1 Il n’aurait pas fallu cocher... Commentaires L’estimation ponctuelle de Vodds ratio ajusté (1,32) est comprise entre les bornes de son intervalle de confiance à 95 % (0,73 à 2,39) L’estimation ponctuelle d’un odds ratio ou d’un risque relatif est toujours comprise entre les bornes de son intervalle de confiance. Cela va de même avec la moyenne ou la médiane ou toute autre estimation pour laquelle on associe un intervalle de confiance Le pourcentage de cas rapportant une pression psychologique au travail est négatif Il ne s’agit pas de valeur négative. Les pourcentages sont simplement représentés avec un tiret L’estimation ponctuelle de Vodds ratio ajusté de cancer du pancréas est égale à 1,00 pour les sujets sans pression psychologique au travail Le groupe des personnes sans pression psychologique au travail correspond au groupe de référence. L’odds ratio du groupe de référence est toujours égal à 1 Seulement 16,9 % des patients subissant une pression psychologique au travail ont développé un cancer du pancréas La lecture juste du tableau est que 16,9 % des patients avec un cancer du pancréas sont exposés à une pression psychologique au travail Characteristics of patients associated with risk of pancreatic cancer Cases Controls n n Characteristics % Crude OR (95% CI) Adjusted OR1 (95% CI)a Adjusted OR2 (95% CI)b o//o Family history of pancreatic cancer No 312 -96.6 320 -99.1 1.00 (reference) 1.00 (reference) 1.00 (reference) Yes 11 -3.4 3 -0.9 3.67 (1.02-13.14) 4.04 (1.08-15.07) 1.23 (1.11-3.70) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 318 Études observationnelles (analytiques) Cases Controls n n Characteristics % Crude OR (95% CI) Adjusted OR1 (95% CI)a Adjusted OR2 (95% CI)b % BMI < 24.0 197 -61.0 230 -71.2 1.00 (reference) 1.00 (reference) 1.00 (reference) > 24.0 126 -39.0 93 -28.8 1.67(1.18-2.38) 1.78 (1.23-2.58) 1.77 (1.22-2.57) Diabètes No 174 -78.0 255 -90.7 1.00 (reference) 1.00 (reference) 1.00 (reference) Yes 49 -9.3 -22.0 26 2.69 (1.51-4.77) 2.60 (1.41-4.79) 2.96 (1.48-5.92) Cholecystitis No 272 -94.1 195 -96.7 1.00 (reference) 1.00 (reference) 1.00 (reference) Yes 17 -5.9 10 -3.3 1.89 (0.84-4.24) 1.91 (0.83-4.38) 1.35 (0.50-3.68) Gallstone No 274 -95.1 300 -98.4 1.00 (reference) 1.00 (reference) 1.00 (reference) Yes 14 -4.9 -1.6 5 2.80 (1.01-7.77) 2.58 (0.89-7.44) 2.68 (0.65-11.07) Cl, confidence interval ; OR, odds ratio. Ail bold ORs were statistically significant as indicated by their 95% Cls. a Adjusted for âge, sex, race and residential areas. b Adjusted for âge, sex, race, residential areas, smoking, tea drinking, mental pressures, family history of pancreatic cancer, BMI, diabètes, gallstone, pickles and vegetables. Characteristics of patients associated with risk of pancreatic cancer Cases Controls n n Dietary factors (%) Crude OR (95% Cl) Adjusted OR1 (95% Cl)a Adjusted OR2 (95% Cl)b (%) Pickles No 312 -96.6 320 -99.1 1.00 (reference) l.OO(reference) l.OO(reference) Yes 11 -3.4 3 -0.9 3.67(1.02-13.4) 1.59(0.99-2.57) 0.99(0.39-1.68) Sometimesc 29 -9.1 13 -4.0 l.OO(reference) 1.00 (reference) 1.00 (reference) Vegetables Alwaysd 290 -90.9 309 -96.0 0.42(0.22-0.84) 0.45(0.22-0.90) 0.41(0.14-1.20) Fruits Sometimesc 144 -45.1 132 -41.0 1.00 (reference) 1.00 (reference) 1.00 (reference) Alwaysd 175 -54.9 190 -59.0 0.80(0.57-1.14) 0.80(0.56-1.14) 0.62(0.37-1.04) Fish Sometimesc 135 -42.3 134 -41.6 1.00 (reference) 1.00 (reference) 1.00 (reference) 184 -57.7 188 -58.4 0.97(0.70-1.35) 0.94(0.67-1.33) 0.59(0.35-1.00)1 Alwaysd Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse des résultats et évaluation de la causalité Dietary factors Cases Controls n n (%) Crude OR (95% Cl) Adjusted OR1 (95% Cl)a 319 Adjusted OR2 (95% Cl)b (%) Bean Sometimesc 187 -58.6 204 -63.4 1.00 (reference) 1.00 (reference) 1.00 (reference) Alwaysd 132 -41.4 118 -36.6 1.22(0.88-1.69) 1.18(0.84-1.65) 1.35(0.86-2.10)] Cl, confidence interval ; OR, odds ratio. Ail bold ORs were statistically significant as indicated by their 95% Cls. a Adjusted for âge, sex, race and residential areas. b Adjusted for âge, sex, race, residential areas, smoking, tea drinking, mental pressure, family history of pancreatic cancer, BMI, diabètes, gallstone, pickles and vegetables. c <2 times per week d >3 times per week Dans cette étude, les expositions indépendamment associées à un risque augmenté de cancer du pancréas incluent : Il aurait fallu cocher... Commentaires Les antécédents familiaux de cancer du pancréas Les expositions indépendamment associées à un risque augmenté de cancer du pancréas sont celles pour lesquelles V odds ratio ajusté sur les tous les facteurs de confusion (OR2 dans les tableaux) est supérieur à 1 avec un intervalle de confiance ne comprenant pas la valeur 1 (dans le premier et le deuxième tableau de cet exemple on retrouve donc le tabac, les antécédents familiaux de cancer du pancréas, l’IMC > 24 et le diabète) Un IMC supérieur ou égal à 24 kg/m2 Il n’aurait pas fallu cocher... Commentaires La consommation d’alcool Odds ratio à 1,22 avec intervalle de confiance comprenant la valeur 1 La lithiase biliaire {gallstone) Odds ratio à 2,68 avec intervalle de confiance comprenant la valeur 1 La consommation de cornichons au vinaigre {pickles) Odds ratio à 0,99 avec intervalle de confiance comprenant la valeur 1 Les arguments en faveur d’une relation causale entre le tabagisme et le cancer du pancréas incluent : Il aurait fallu cocher... Commentaires La persistance d’une association statistiquement significative en analyse multivariée Cette proposition ne fait pas directement partie des critères de causalité de Bradford-Hill mais on peut considérer que c’est un argument en faveur de la force de l’association Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 320 Études observationnelles (analytiques) H aurait fallu cocher... Commentaires L’existence d’une relation croissante entre le nombre de cigarettes fumées quotidiennement et le risque de cancer du pancréas L’OR passe de 1,55 pour 20-29 cigarettes fumées à 1,94 pour plus de 10 cigarettes fumées. Cela correspond à l’effet-dose (critère interne à l’étude) La cohérence avec les résultats d’études antérieures Cela correspond à un des critères externes de causalité Il n’aurait pas fallu cocher... Commentaires L’ajustement sur tous les facteurs de confusion potentiels Cette formulation incite à la prudence. Il est impossible d’envisager connaître tous les facteurs de confusion de la relation entre une exposition et un phénomène La spécificité de la relation entre le tabagisme et le risque de cancer du pancréas La relation est bien entendu non spécifique quand on connaît la diversité de pathologies induites par le tabac Quel(s) mécanisme(s) pourrai(en)t expliquer l’association observée entre le diabète et le risque augmenté de cancer du pancréas ? Il aurait fallu cocher... Commentaires Un dysfonctionnement des cellules endocrines des îlots de Langerhans serait impliqué dans le développement d’adénocarcinome pancréatique Argument présenté en discussion, cela correspond à une hypothèse physiopathologique qui expliquerait une réelle association entre le diabète et le risque de cancer du pancréas Le diabète serait une complication du cancer du pancréas Oui, d’autant plus que l’étude présentée ici est une étude-cas témoin et donc par définition rétrospective. Il est donc délicat d’affirmer que le diabète précédait systématiquement la survenue du cancer du pancréas L’existence de facteurs de confusion résiduels qui ne sont pas pris en compte dans l’analyse multivariée Le biais de confusion résiduel pourrait expliquer une association statistiquement significative alors qu’il n’existe pas de réelle association Un biais dans le recueil de l’information sur le diabète Il est difficile dans le cadre d’une étude rétrospective de s’assurer de la séquence temporelle entre survenue du diabète puis survenue d’un cancer du pancréas > Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse des résultats et évaluation de la causalité 321 Characteristics of 323 pancreatic cancer cases and 323 Controls Variables Cases3 Controls3 n % n % 110 (34.1) ■ X2 P 0.000 1.000 Center Henan Cancer Hospital 110 (34.1) Beijing Cancer Hospital 105 (32.5) 105 (32.5) Hebei Cancer Hospital 73 (22.6) 73 (22.6) CICAMSb 35 (10.8) 35 (10.8) Male 181 (56.0) 181 (56.0) Female 142 (44.0) 142 (44.0) 0.000 1.000 Age, yearsc 58.7 (11-2) 58.0 (11.2) 0.790 0.430 Han 312 (96.6) 314 (97.2) Other 9 (2.8) 9 (2.8) 0.000 1.000 Unmarried 5 (1-5) 4 Married 294 298 (1.3) (93.1) Divorced 7 (91-3) (2.2) 2 (0.6) Widowed 16 (5.0) 16 (5.0) 3.248 0.517 76 (25.0) 75 (23.7) 6-12 111 (36.5) 118 (37.2) >12 117 (38.5) 124 (39.1) 0.152 0.927 Urban 163 (50.6) 156 (48.9) Rural 159 (49.4) 163 (51.1) 0.189 0.664 29 (9.2) 32 (10.1) 1.622 0.951 Sex Ethnie group Marital status Education, years <6 Residential areas Occupation Worker Peasant 117 (37.3) 117 (36.9) Manager 76 (24.2) 82 (25.9) Other 92 (29.3) 86 (27.1) a Sums may not add up to total because of missing values. b Cancer Institute & Hospital, Chinese Academy of Medical Sciences. c Values given are mean (standard déviation). Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 322 Études observationnelles (analytiques) Quel(s) élément(s) limite(nt) les possibilités d’extrapolation des résultats de cette étude à la population française ? Il aurait fallu cocher... La proportion d’agriculteurs dans l’échantillon L’ethnie majoritaire des participants Il n’aurait pas fallu cocher... Le schéma d’étude cas-témoin Le recrutement des cas dans des hôpitaux Les modalités de recueil de l’information sur les expositions étudiées Commentaires Cette question fait référence à la validité externe, c’est-à-dire la capacité d’extrapolation des résultats à une population plus large. Cette étude a eu lieu en Chine auprès de membres de l’ethnie Han majoritaire à plus de 95 % et avec une proportion d’agriculteurs supérieure à 35 %. Ces 2 éléments sont donc une limite importante à l’extrapolation des résultats à la population française Commentaires Ces différentes propositions correspondent à des choix méthodologiques internes à l’étude. Ils permettent donc d’apprécier la validité interne mais n’interviennent pas dans l’extrapolation ou la généralisation des résultats (validité externe) Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse des résultats et évaluation de la causalité 323 Ex e m ple 4 (ED N 2021) von Ehrenstein OS, Ling C, Cui X, Cockburn M, Park AS, Yu F, et al. Prénatal and infant exposure to ambient pesticides and autism spectrum disorder in children: population based case-control study. B MJ 20 mars 2019 ; 364 : 1962. Odds ratios and 95 % confidence intervals for association between ail cases of autism spectrum disorder combined and pesticide exposure during pregnancy and first year of life in logistic régression models, by pesticide substance Pesticide Pregnancy substance Model 1* No of exposed cases/ Controls First year of life Model 2+ No of exposed cases/ Controls Model 1* Model 2+ Glyphosate* 2293/26 660 1.12 1.16 2256/26 (1.06 to 1.27) (0.99 to 1.27) 390 1.15 1.17 (1.05 to 1.26) (1.04 to 1.32) Chlorpyrifos 1799/20 914 1.07 1876/22 1.13 (1.05 to 1.23) (0.96 to 1.19) 125 1.04 1.10 (1.02 to 1.20) (0.93 to 1.16) Diazinon 764/9176 1.11 1.09 787/9890 1.04 1.00 (0.95 to 1.14) (0.90 to 1.11) (1.01 to 1.21) (0.98 to 1.20) Acephate 341/4047 1.09 1.06 381/4783 1.00 0.96 (0.97 to 1.23) (0.93 to 1.19) (0.90 to 1.13) (0.85 to 1.08) Malathion 642/7277 1.11 1.05 784/8911 1.11 1.07 (1.01 to 1.22) (0.95 to 1.16) (1.02 to 1.21) (0.97 to 1.18) Permethrin 930/10 773 1.04 1047/12 1.10 1.10 1.05 (1.01 to 1.20) (0.94 to 1.14) 129 (1.01 to 1.19) (0.96 to 1.16) Bifenthrin 638/7 300 0.96 886/9671 1.09 1.05 1.03 (0.94 to 1.13) (0.87 to 1.07) (1.00 to 1.19) (0.95 to 1.15) Methyl bromide 1.04 0.95 761/8986 1.08 657/8085 1.03 (0.99 to 1.18) (0.94 to 1.15) (0.94 to 1.13) (0.86 to 1.05) Imidacloprid 1123/14 490 1323/16 0.81 0.93 (0.86 to 1.00) (0.74 to 0.89) 771 0.95 0.86 (0.88 to 1.02) (0.78 to 0.95) Avermectin 1513/17 212 1.12 1.10 1719/20 (1.04 to 1.22) (1.00 to 1.22) 100 1.07 1.01 (0.99 to 1.15) (0.90 to 1.12) Myclobutanil 1254/15 222 1.04 0.99 1375/16 (0.96 to 1.12) (0.90 to 1.09) 871 1.01 0.95 (0.93 to 1.09) (0.86 to 1.05) *Logistic régression; adjusted for year of birth, sex, maternai race or ethnicity, maternai âge, maternai éducation, and NOx (CALINE4) as a marker of traffic related air pollution; pesticide exposure defined as ever versus never to spécifie substance in considered developmental period. +Logistic régression; adjusted as model 1; pesticide exposure defined as ever versus never to spécifie substance in considered developmental period with ail considered pesticides in the model. ^Glyphosate compounds include glyphosate isopropylamine sait, glyphosate potassium sait, glyphosate monoammonium sait, glyphosate diammonium sait, glyphosate trimesium, and glyphosate dimethylamine sait. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 324 Études observationnelles (analytiques) Quelle(s) exposition(s) pendant la première année de vie est (sont) indépendamment associée(s) à une augmentation significative du risque de trouble du spectre autistique dans le modèle multivarié ajusté sur l’ensemble des pesticides (tableau ci-dessus) ? Il aurait fallu cocher... Glyphosate Commentaires L’information concernant l’exposition au cours de la première année de vie est située dans la partie droite du tableau. L’expression « indépendamment associée » renvoie à la mesure d’association ajustée sur les facteurs de confusion ; et l’ajustement sur l’ensemble des pesticides correspond au modèle 2. Le seul pesticide pour lequel une exposition au cours de la première année de vie est associée à une augmentation du risque de troubles du spectre autistique est le glyphosate car Vodds ratio correspondant est supérieur à 1 et que son intervalle de confiance ne comprend pas la valeur 1 Il n’aurait pas fallu cocher... Perméthrine Imidaclopride Diazinon Avermectine Commentaires Tous les odds ratios correspondant à ces pesticides comprennent la valeur 1 dans le modèle 2 L’association entre l’exposition au glyphosate ambiant pendant la première année de vie et le développement de troubles du spectre autistique (tableau 3) peut résulter : Il aurait fallu cocher... Commentaires De fluctuations aléatoires d’échantillonnage Cette question renvoie aux raisons possibles d’un résultat significatif Soit l’effet est réel, soit il est lié au hasard, soit il est la conséquence de biais (comme la confusion) De facteurs de confusion méconnus De l’effet du glyphosate sur le système nerveux central en développement Il n’aurait pas fallu cocher... Commentaires D’une erreur de classement sur l’exposition au glyphosate, non différentielle entre les cas et les témoins Le biais de classement non différentiel a tendance à diminuer les différences entre les groupes comparés : il pourrait plutôt expliquer un résultat non significatif D’un défaut de puissance statistique Un défaut de puissance peut expliquer un résultat non significatif Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Analyse des résultats et évaluation de la causalité 325 Ex e m ple 5 (é preuve t est 2020) Billioti de Gage S, Moride Y, Ducruet T, Kurth T, Verdoux H, Tournier M, et al. Benzodiazépine use and risk of Alzheimer’s disease: case-control study. BMJ 9 sept 2014 ; 349 : g5205. Objectives : To investigate the relation between the risk of Alzheimer’s disease and exposure to benzodiazépines started at least five years before, considering both the dose-response relation and prodromes (anxiety, dépréssion, insomnia) possibly linked with treatment. Le fait de ne considérer que les expositions antérieures d’au moins 5 ans (ou 6 ans dans l’analyse de sensibilité) à la date de diagnostic permet de : Il aurait fallu cocher... Commentaires S’assurer que la prescription de benzodiazépines n’était pas motivée par les premiers symptômes de la maladie d’Alzheimer Cette question renvoie à la nature causale de l’association observée et plus particulièrement à la notion de séquence temporelle. S’assurer que l’exposition précède bien la survenue de la maladie et non pas l’inverse, c’est apporter un argument (parmi d’autres) en faveur de la nature causale de l’association. Si les benzodiazépines sont prescrites pour les premiers symptômes de la maladie d’Alzheimer, on pourra bien constater une association entre les deux mais la relation causale sera en réalité inverse par rapport à l’hypothèse émise initialement Mieux appréhender la séquence temporelle entre l’exposition et l’événement Renforcer les arguments en faveur de la nature causale de l’association Il n’aurait fallu cocher... Commentaires Recruter des cas incidents La mesure de l’exposition est indépendante de la notion de recrutement de cas incidents Limiter les biais de confusion Même si la séquence temporelle est respectée, cela ne permet en aucun cas de maîtriser l’importance de tiers facteurs à la fois associés à la maladie et à l’exposition Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 In d e x A c Agence nationale de sécurité du médicament, 83 Aire sous la courbe, 236 Ajustement (adjustment), 253 Allocation aléatoire, 113 Analyse - de sécurité, 155 - de survie, 63 - en intention de traiter, 151 - en ITT modifiée, 153 - en sous-groupes, 175 — homogénéité, 176 - en traitement reçu, 154 - multivariée, 54, 254 - per-protocole, 153 - univariée, 54 Appariement (matching), 253, 280 Association - non significative — raisons possibles, 306 - significative — raisons possibles, 307 Attrition, 14 Autorisation de mise sur le marché, 95 Caractéristique extrinsèque, 206 Cas, 279 - incidents, 279 - prévalents, 279 Causalité, 303, 307 Choix d’un seuil, 237 Clause d’ambivalence, 110 Coefficient - de corrélation intra-classe, 223 - kappa k de concordance, 222 Comité - de protection des personnes, 83 - national de l’informatique et des libertés, 83 Comparabilité - des groupes, 114 Concordance, 48 Conflit d’intérêt, 86 Confusion, 251 Corrélation, 48 Courbe ROC, 235 - aire sous la courbe ROC, 236 Critère - d’exclusion, 109 - d’inclusion, 109 - de causalité de Bradford-Hill, 307 - de jugement — clinique, 100 — cliniquement pertinent, 100 — de substitution, 100 — final, 100 — intermédiaire, 100 — multiple, 98 — objectif, 99 — principal, 97 — secondaire, 97 — subjectif, 100 — unique, 98 - externe à l’étude, 308 - interne à l’étude, 307 B Biais, 13 - d’attrition, 144, 190 - d’information, 15 - de classement, 15 — différentiel, 294 — non différentiel, 294 - de confusion, 17, 251 - de mémoire - de mesure, 15 — différentiel, 127 - de performance, 128 - de publication, 74 - de sélection, 14, 109,190, 287 - de suivi, 144 - maximum — hypothèse, 152 Boîte à moustaches (boxplot), 29 Bornes d’équivalence, 163 () D Date - d’origine, 64 - de point, 64 - des dernières nouvelles, 64 La LCA en anglais facile aux EDN © 2022 Elsevier Masson SAS. Tous droits réservés. Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 328 Index Degré de signification, 50 Diagramme - de flux (flou chart), 143 - en forêt (ou forest plot), 176 Dispersion - écart type (standard déviation), Y7 - intervalle interquartile (interquartile range), 27 - variance, 27 Données censurées à droite, 64 E Échantillon, 14, 109 Échantillonnage (fluctuation), 13, 36 Effectifs marginaux, 31 Effet - nocebo, 128 - placebo, 128 — double placebo, 129 — indistinguable, 129 Erreur - aléatoire, 13 - différentielle, 15 - non différentielle, 16 Essai - clinique de phase III, 93 - d’équivalence, 163 - de non-infériorité, 163 - en cross-over, 140 - en groupes parallèles, 139 Étude - analytique - cas-témoins nichée dans une cohorte, 281 - cas-témoins, 249 - de cohorte — exposés/non exposés, 250, 270, 287 — historique (ou rétrospective), 287 — prospective, 287 - descriptive, 5 - en population, 288 - étiologique, 5 - expérimentale, 3 - historicoprospective, 5 - historique, 5 - longitudinale d’incidence, 249 - observationnelle, 3 - primaire, 73 - pronostique, 5 - prospective, 5 - rétrospective, 5 - suivi — longitudinal, 4 — transversal, 4 - transversale de prévalence, 249 F Facteur - de confusion, 251 - de risque, 63, 269 - pronostique, 63, 269 Faux - négatif, 206 - positif, 206 Fraction étiologique, 45 Fréquences - conditionnelles, 32 - partielles, 32 - relatives, 31 Funnel plot, 78 G Gestion des perdus de vue, 152 H Hazard ratio, 45, 67 Histogramme, 28 Hypothèse - alternative Hl, 49 - nulle H0, 49 - tests, 49 I Imputation, 154 - multiple, 152 - par la dernière valeur connue, 153 Incidence, 34 Indicateurs de mortalité fœto-infantile, 35 Indice de Youden, 206 Intervalle de confiance, 36, 47 L Létalité, 35 Lien d’intérêt, 86 Loi - Informatique et liberté, 83 - Jardé, 83 M Médiane de survie, 66 Médicament - phases de développement, 94 — phase clinique, 94 ------ phase I, 94 ------ phase II, 94 ------ phase III, 94 ------ phase Illb, 95 ------ phase IV, 95 — phase préclinique, 94 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Index Mesure - d’association, 43 - de l’exposition, 287 - répétée (donnée appariée), 55 Méta-analyse, 24 Méthode de Kaplan-Meier, 66 Modèle de Cox, 55, 67 Mortalité prématurée, 35 N Nombre - de patients à traiter (number needed to treat), 45 - de sujets nécessaires, 52 Nomogramme de Fagan, 211 0 Odds ratio, 46, 304 P Perdus de vue, 295 Personnes-temps à risque, 33 Pharmacoépidémiologie, 95 Pharmacovigilance, 95 Plan - expérimental, 139 - factoriel, 141 Plausibilité clinicobiologique, 293 Population - cible, 14, 109 - ITT, 143 - per-protocole, 143 - restriction, 253 - source, 14, 109 Position - déciles, 26 - étendue (range), T7 - médiane, 26 - mode, 27 - moyenne, 26 - percentiles, 26 - quartiles, 26 Pratiques (évaluation), 4 Preuve (niveau), 23 Prévalence, 34 Procédure d’aveugle, 127 - comité de suivi indépendant, 129 - essais en double insu (ou double aveugle), 127 - essais en ouvert, 127 - essais en simple insu (ou simple aveugle), 127 Puissance, 51 p-value, 49, 50 329 R Randomisation - centralisée, 115 - déséquilibrée, 114 - équilibrée, 114 - imprévisibilité, 116 - indépendante, 115 - individuelle, 113 - minimisée, 115 - par blocs, 114 - par grappes, 114 - ratio de, 114 - stratifiée, 115 Rapport de vraisemblance, 209 Ratio de randomisation, 114 Recherche - impliquant la personne humaine, 84 — investigateur, 85 — promoteur, 85 - interventionnelle Régression - linéaire multiple, 55 - logistique, 55 Relation - étiologique, 250 - pronostique, 250 Représentativité, 287 Reproductibilité - fiabilité ou reliability, 223 - inter-observateur (inter-rater), 222 - intra-observateur (intra-rater), 222 Résultat - généralisation, 190 - pertinence clinique, 190 Risque - a (inflation), 180 - [3 (inflation), 180 - de deuxième espèce (risque P), 51 - de première espèce (risque a), 50 - différence absolue du risque, 43 - relatif, 43, 45, 303 S Score de propension, 254 Sécurité des patients, 110 Sélection, 109 Sensibilité, 205 Séquence temporelle, 293 Séries indépendantes, 55 Seuil de non-infériorité, 163 Spécificité, 205 Standardisation - directe, 36 - indirecte, 36 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 330 Index Stratification (stratification), 253 Survie - globale (overall survival), 64 - sans rechute (progression free survival), 64 - spécifique, 64 T Taille globale de l’effet, 73 Taux, 34 - d’incidence, 33 - de mortalité, 34 Témoins, 280 Test - caractéristique — extrinsèque (valeurs prédictives), 206 — intrinsèque, 205 - d’hétérogénéité, 176 - d’interaction, 176 - de dépistage, 220 - de Mann-Whitney, 55 - de McNemar, 55 - de référence, 221 - de Student, 55 — apparié, 55 - de Wilcoxon, 55 - diagnostique, 220 - du Chi2, 55 - du log rank, 55 - non paramétrique, 55 - paramétrique, 55 - qualitatif, 219 - quantitatif, 219 Transparence, 86 V Valeur prédictive - négative, 206 - positive, 206 Validité - externe, 190 - interne, 109, 189 Variable, 25, 30 - à expliquer (ou dépendante), 54 - dépendante (ou à expliquer), 254 - explicative (ou indépendante), 54 - indépendante (ou explicative), 254 - qualitative — nominale, 30 — ordinale, 30 - quantitative — continue, 25 — discrète (discontinue), 25 477638 - (I) - (4,5) - Quatro Silk 90 Elsevier Masson SAS. 65, rue Camille-Desmoulins, 92442 Issy-les-Moulineaux cedex Dépôt légal : octobre 2022 Composition : Thomson Imprimé en Pologne par Dimograf Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009 Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE , pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009