Telechargé par nycforever

LCA en anglais facile aux EDN: Fiches théoriques

La LCA en anglais facile aux EDN
Fiches théoriques et pratiques
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Chez le même éditeur
Maîtriser la LCA en anglais - Méthodologie et Entraînement - Réussir les ECNi par le Collège
universitaire des enseignants de santé publique (CUESP), coordonné par Damien Jolly, 2019,
288 pages.
ECNi Le Tout-en-un par Alexandre Somogyi, 2017,1416 pages.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
La LCA en anglais facile
aux EDN
Fiches théoriques et pratiques
Hervé Devilliers
Médecin interniste, professeur de thérapeutique et coordonnateur de FUE12
à la faculté de médecine de Dijon
Thomas Thibault
Chef de clinique - Assistant en médecine interne au CHU de Dijon
2e édition
Elsevier Masson
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
ELSEVIER
Elsevier Masson SAS, 65, rue Camille-Desmoulins, 92442 Issy-les-Moulineaux cedex, France
La LCA en anglais facile aux EDN - Fiches théoriques et pratiques^ de Hervé Devilliers et
Thomas Thibault.
© 2022 Elsevier Masson SAS
ISBN : 978-2-294-77638-0
e-ISBN : 978-2-294-76674-9
Tous droits réservés.
Les praticiens et chercheurs doivent toujours se baser sur leur propre expérience et connaissances pour évaluer et utiliser toute information, méthodes, composés ou expériences décrits
ici. Du fait de l’avancement rapide des sciences médicales, en particulier, une vérification
indépendante des diagnostics et dosages des médicaments doit être effectuée. Dans toute
la mesure permise par la loi, Elsevier, les auteurs, collaborateurs ou autres contributeurs
déclinent toute responsabilité pour ce qui concerne la traduction ou pour tout préjudice
et/ou dommages aux personnes ou aux biens, que cela résulte de la responsabilité du fait
des produits, d’une négligence ou autre, ou de l’utilisation ou de l’application de toutes les
méthodes, les produits, les instructions ou les idées contenus dans la présente publication.
Tous droits de traduction, d’adaptation et de reproduction par tous procédés, réservés pour
tous pays. Toute reproduction ou représentation intégrale ou partielle, par quelque procédé
que ce soit, des pages publiées dans le présent ouvrage, faite sans l’autorisation de l’éditeur
est illicite et constitue une contrefaçon. Seules sont autorisées, d’une part, les reproductions
strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective
et, d’autre part, les courtes citations justifiées par le caractère scientifique ou d’information
de l’œuvre dans laquelle elles sont incorporées (art. L. 122-4, L. 122-5 et L. 335-2 du Code
de la propriété intellectuelle).
DANGER
PHOTOCOPILLAGE
TUE LE LIVRE
Ce logo a pour objet d’alerter le lecteur sur la menace que représente
pour l’avenir de l’écrit, tout particulièrement dans le domaine universitaire, le développement massif du « photo-copillage ». Cette pratique
qui s’est généralisée, notamment dans les établissements d’enseignement,
provoque une baisse brutale des achats de livres, au point que la possibilité même pour les auteurs de créer des œuvres nouvelles et de les faire
éditer correctement est aujourd’hui menacée. Nous rappelons donc que
la reproduction et la vente sans autorisation, ainsi que le recel, sont passibles de poursuites. Les demandes d’autorisation de photocopier doivent
être adressées à l’éditeur ou au Centre français d’exploitation du droit de
copie : 20, rue des Grands-Augustins, 75006 Paris. Tél. 01 44 07 47 70.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Ta b l e d e s m a t iè r e s
( s o mm a i r e c l i q u a b l e)
Avant-propos.................................................................................
IX
Remerciements...............................................................................
XIII
Historiques des types d’articles aux épreuves des EDN ...
XV
Abréviations...................................................................................
XVII
PARTIE I
Généralités
1
Fic h e 1
Types d’études...............................................................................
Introduction.......................................................................................
Types d’études le plus souvent rencontrés aux EDN......................
Exemples...........................................................................................
3
3
5
6
Fic h e 2
Les trois biais : sélection, classement, confusion.................
Biais et fluctuation d’échantillonnage..............................................
Les différents biais.............................................................................
13
13
14
Fic h e 3
Niveau de preuve des études.....................................................
23
Fic h e 4
Statistiques descriptives...............................................................
Les différents types de variables......................................................
Mesures de l’état de santé d’une population..................................
Phénomène de fluctuation d’échantillonnage et intervalles
de confiance.......................................................................................
25
25
33
Fic h e 5
Statistiques comparatives et mesures d’association..........
Mesures d’association entre une exposition et un événement........
Principe des tests d’hypothèse..........................................................
Risque d’erreur et test statistique....................................................
Calcul du nombre de sujets nécessaires à inclure dans une étude. . .
Quel test statistique utiliser ?..........................................................
43
43
49
50
52
54
Fic h e 6
Analyses dépendantes du temps ou « analyses
de survie »..........................................................
Principe.............................................................................................
Quelques définitions utilisées dans les analyses de survie
au cours des essais cliniques............................................................
Données nécessaires à une analyse de survie..................................
Critères de qualité.............................................................................
Représentation des résultats............................................................
64
64
66
66
Méta-analyse.................................................................................
Définition de la méta-analyse..........................................................
Avantages de la méta-analyse..........................................................
Limites de la méta-analyse..............................................................
Présentation des résultats................................................................
Hétérogénéité dans les méta-analyses..............................................
Evaluation du biais de publication..................................................
73
73
73
74
75
76
78
Fic h e 7
36
63
63
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
VI
Fic h e 8
Conditions réglementaires et éthiques dans la recherche
impliquant la personne humaine................
83
Aspects réglementaires.......................................................................
Participants à la recherche et définitions........................................
83
85
PARTIE II
Essais cliniques
91
Fic h e 9
Caractéristiques d’un essai clinique..........................................
Phases de développement d’un médicament....................................
Phase préclinique...............................................................................
Phase clinique...................................................................................
93
94
94
94
Fic h e 10
Critères de jugement et objectifs.............................................
Définition des critères de jugement..................................................
Nature de la variable = critère de jugement qualitatif
ou quantitatif....................................................................................
Critère de jugement principal..........................................................
Critères de jugement secondaires....................................................
97
97
97
98
101
Fic h e 11
Critères de sélection......................................................................
Echantillon, population source et population cible (voir fiche 2). . .
Critères d’inclusion et d’exclusion..................................................
109
109
109
Fic h e 12
Randomisation.............................................................................
Définition...........................................................................................
Caractéristiques à connaître............................................................
113
113
113
Fic h e 13
Procédure d’aveugle et effet placebo.......................................
Définitions.........................................................................................
Quels sont les problèmes posés par un essai en ouvert ?................
Quelles mesures peut-on prendre pour maintenir la procédure
d’aveugle tout au long d’un essai ?..................................................
Quelles mesures peut-on prendre pour limiter les biais liés
à la nature ouverte d’un essai ?........................................................
Aspects éthiques.................................................................................
127
127
127
129
130
Fic h e 14
Plan expérimental..........................................................................
Introduction.......................................................................................
Essai en groupes parallèles..............................................................
Essai en cross-over.............................................................................
Plans factoriels...................................................................................
139
139
139
140
141
Fic h e 15
Suivi de l’étude et diagramme de flux......................................
Eléments importants à repérer........................................................
Biais d’attrition.................................................................................
143
144
144
Fic h e 16
Population d’analyse (ITT et per-protocole).......................
Population pour l’analyse en intention de traiter
(intention to treat ou ITT)................................................................
Population pour l’analyse per-protocole (PP)..................................
Population pour l’analyse en traitement reçu (as treated)..............
Population pour l’analyse « de sécurité » (safety analysis)............
Synthèse.............................................................................................
151
151
153
154
155
155
Essais de non-infériorité et d’équivalence.............................
Principe.............................................................................................
Notions statistiques...........................................................................
163
163
163
Fic h e 17
129
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
VII
Exemples...........................................................................................
Choix de l’analyse statistique : intention de traiter
ou per-protocole/en traitement reçu ?..............................................
166
Fic h e 18
Analyse en sous-groupes............................................................
Définition et principe.........................................................................
Comment interpréter une analyse en sous-groupes ?......................
Limites de l’analyse en sous-groupes..............................................
175
175
176
179
Fic h e 19
Conclusion de l’étude et critique des résultats....................
Résultats sur le critère de jugement principal..................................
Résultats sur les critères de jugement secondaires..........................
Validité interne/validité externe......................................................
Généralisation des résultats..............................................................
Pertinence clinique du résultat........................................................
Raisons possibles d’un essai positif ou d’un essai négatif..............
189
189
189
189
190
190
191
Pa r t i e III
Etudes de performances diagnostiques
203
Fic h e 20
Performances diagnostiques......................................................
Caractéristiques intrinsèques du test = sensibilité et spécificité....
Caractéristiques extrinsèques (valeurs prédictives = probabilités
post-test).............................................................................................
Influence de la prévalence sur les caractéristiques extrinsèques . . .
Estimateur ponctuel des caractéristiques du test et intervalle
de confiance.......................................................................................
Exemple.............................................................................................
Rapports de vraisemblance (likelihood ratio)................................
Nomogramme de Fagan..................................................................
205
205
Fic h e 21
164
206
207
207
208
209
211
Objectifs et méthodologie des études de performance
diagnostique...................................................................................
Principe.............................................................................................
Types de tests.....................................................................................
Objectifs du test.................................................................................
Définition de la population source..................................................
Test de référence (gold standard)....................................................
Application du test étudié, notion de reproductibilité
(ou fiabilité)......................................................................................
222
Fic h e 22
Courbe ROC et choix d’un seuil.............................................
Introduction.......................................................................................
La courbe ROC (receiver operating characteristic)........................
Aire sous la courbe ROC..................................................................
Choix d’un seuil.................................................................................
235
235
235
236
237
PARTIE rv
Études observationnelles (analytiques)247
Fic h e 23
Objectifs de l’étude.......................................................................
Etudes observationnelles descriptives..............................................
Etudes observationnelles analytiques..............................................
Considérations éthiques..................................................................
249
249
249
250
Fic h e 24
Confusion dans les études observationnelles.......................
Position du problème........................................................................
Définition de la confusion (voir fiche 2)..........................................
251
251
251
219
219
219
220
221
221
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
VIII
Analyse du tableau descriptif de la population (comparant les cas
et les témoins ou les exposés et les non exposés)............................
Comment prendre en compte les facteurs de confusion
dans les études analytiques ?............................................................
C’est quoi, mathématiquement, une analyse multivariée ?............
Cas particulier d’ajustement/appariement : le score
de propension...................................................................................
Exemple.............................................................................................
252
253
254
254
255
Fic h e 25
Principes généraux des études cas-témoins et des études
de cohorte..........................................................
269
Fic h e 26
Études cas-témoins : sélection des participants
et définition de la maladie............................
Définition de la maladie...................................................................
Sélection des cas.................................................................................
Sélection des témoins.........................................................................
Appariement.....................................................................................
Cas particulier de l’étude cas-témoins nichée dans une cohorte
(nested case-control study)..............................................................
281
Études de cohorte : sélection des participants et mesure
de l’exposition..................................................
Objet de l’étude de cohorte..............................................................
Modalités de sélection des participants..........................................
Biais de sélection et notion de représentativité (voir fiche 2)..........
En résumé...........................................................................................
287
287
287
287
288
Fic h e 28
Recueil des données......................................................................
Exposition.........................................................................................
Maladie (ou événement étudié)........................................................
Dans les études cas-témoins............................................................
Études de cohorte de type exposés/non exposés..............................
293
293
293
294
295
Fic h e 29
Analyse des résultats et évaluation de la causalité.............
Analyse des résultats des études observationnelles analytiques. . . .
Raisons possibles d’une association significative/non significative . . .
Évaluation de la causalité.................................................................
303
303
306
307
Index.................................................................................................
327
Fic h e 27
279
279
279
280
280
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Av a n t -pr o po s
Pourquoi cet ouvrage ?
La lecture critique d’articles (LCA) est un des exercices des épreuves dématérialisées nationales (EDN) les plus craints par les étudiants. Pourtant, comme pour
l’ensemble des autres épreuves, les connaissances et les compétences nécessaires
pour la réussir ne sont qu’une question d’entraînement !
Cet ouvrage ne prétend pas contenir exhaustivement l’ensemble des connaissances nécessaires et suffisantes à la réussite aux EDN ni même à la pratique de la
LCA en 3e cycle et après. D’autres ouvrages publiés par les collèges d’enseignants
et les polycopiés fournis par vos professeurs remplissent déjà cette fonction.
Les auteurs ont souhaité aborder les différentes notions utiles pour l’apprentissage de la LCA à partir des questions des annales des EDN et des EDN tests
depuis 2016. La revue des questions a donné lieu à la rédaction de fiches de
synthèse exposant brièvement les notions théoriques indispensables, accompagnées d’exemples concrets. Chaque fiche est illustrée par deux ou trois questions issues d’annales des EDN dont les propositions justes et les distracteurs
sont commentés en détail.
Comment utiliser cet ouvrage ?
Cet ouvrage ne se substitue pas aux connaissances en statistiques et en épidémiologie acquises pendant le premier cycle des études médicales, ni aux ouvrages
de référence permettant d’appliquer ces notions à la lecture d’un article. Les
étudiants en début de second cycle des études médicales y verront un glossaire
synthétique des premières notions à acquérir pour aborder l’exercice difficile
de la LCA. Les étudiants en DFASM3 pourront plutôt l’utiliser comme un
aide-mémoire à consulter lors des séances d’entraînement, pour comprendre
et approfondir les notions qui leur poseraient des difficultés. L’organisation de
l’ouvrage en fiches et en grandes thématiques permettra aisément de retrouver la notion d’intérêt et les questions déjà posées par le jury des EDN en
rapport avec cette notion. Enfin, de courtes vidéos pédagogiques disponibles
sur la chaine Youtube « Pr Geek », vous permettront de vérifier que vous avez
compris l’essence des notions abordées.
Comment aborder l’épreuve de LCA aux EDN ?
En LCA, l’entraînement est sans doute encore plus important que dans les
autres matières. Les connaissances théoriques nécessaires à l’abord de la
matière peuvent s’acquérir relativement rapidement. En revanche, l’aptitude
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
X
à la lecture « rapide » d’un article en anglais est le savoir-faire qui fera la
différence le jour J. Seul l’entraînement vous permettra d’acquérir les réflexes
de lecture afin de gagner de précieuses minutes pour répondre aux QCM de vos
examens facultaires et de l’épreuve finale. La clé de votre réussite réside dans les
principes pragmatiques suivants :
• en fin de cursus, vous devez être capable de lire et de comprendre un article
de recherche en 30 minutes ;
• les aspects techniques et statistiques n’ont d’intérêt que s’ils sont nécessaires à
l’interprétation des résultats ou au jugement de la validité de l’étude présentée ;
• derrière chaque QCM, l’enseignant cache plus ou moins subtilement un objectif pédagogique que vous avez certainement déjà entendu ou lu quelque part...
Le jour J, l’épreuve comportera deux articles de recherche en anglais, dont au
moins un essai clinique. Chaque article sera accompagné de 13 à 15 questions
à réponse unique ou réponses multiples, présentées à l’étudiant sur un mode
« progressif » (les QCM sont obligatoirement complétés dans l’ordre défini
par l’enseignant, sans retour en arrière possible). La durée de l’épreuve est de
3 heures. Pour être utile à votre préparation, chaque séance d’entraînement doit
vous rapprocher le plus possible des conditions d’examen.
Étape 1 : la lecture de l’article (30 à 45 minutes maximum)
Lors des examens facultaires, trop d’étudiants sont encore en train de détailler
l’article plus d’une heure après le début de l’épreuve. À l’inverse, lors des entraînements et conférences, cette étape est souvent « bâclée » en 15 minutes. Notre
expérience montre que le meilleur compromis est de passer environ 30 minutes
de concentration sur l’article avant d’envisager de répondre aux questions. Peu
importe le détail de l’analyse statistique ou de la description des paramètres
biologiques recueillis, ce temps est nécessaire et suffisant pour « habituer l’œil »
à l’article et en comprendre l’essentiel :
• schéma et type d’étude ;
• critère de jugement principal, population d’étude ;
• nature de la maladie et de l’exposition (étude épidémiologique) ou de l’intervention (essai clinique) ;
• caractéristiques de la randomisation et de la procédure d’aveugle (essais cliniques) ;
• principaux résultats, compréhension des tableaux et figures.
En fonction de votre niveau d’anglais et de vos connaissances théoriques en
épidémiologie/statistiques, il est normal de ne pas être capable de réussir cet
exercice dans le temps imparti dès la première fois ! L’entraînement à la lecture
est donc la clé du succès.
Étape 2 : la réponse aux QCM (30 à 45 minutes, soit 2 à 4
minutes par QCM)
Après avoir lu l’ensemble des propositions du QCM, deux questions doivent se
poser immédiatement :
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Re m e r c ie m e n t s
Les auteurs remercient Nicolas Rousselot, étudiant en DFASM2, et l’ensemble
des étudiants en médecine de Dijon pour leur relecture attentive.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
XI
• quel est l’objectif pédagogique du QCM ? (Ex. : savoir qu’un critère de
jugement subjectif pose problème dans un essai ouvert, savoir que la connaissance de la maladie peut influencer la mesure rétrospective d’une exposition,
comprendre pourquoi l’analyse per-protocole est plus conservatrice dans un
essai de non-infériorité, etc.) Si vous arrivez à formuler cet objectif à la lecture
de l’intitulé de la question, l’ensemble des propositions doit être ensuite critiqué
à la lumière du point de cours que vous avez identifié ;
• y a-t-il une ou des propositions que je peux éliminer d’emblée ? Certaines
propositions sont fausses dans l’absolu (ex. : dans cette étude, l’analyse en perprotocole comprenait plus de patients que l’analyse en intention de traiter, tous
les facteurs de confusion possibles ont été pris en compte, Vodds ratio est significatif car son intervalle de confiance exclut la valeur 1, etc.).
La stratégie consiste donc à éliminer, sur votre brouillon, les propositions
fausses dans l’absolu, s’il y en a, puis à retourner chercher dans le texte les
informations nécessaires à la réponse aux autres propositions en gardant à
l’esprit l’objectif pédagogique du QCM en cas de doute.
Étape 3 : l’autoévaluation
Il est conseillé de ne découvrir la correction qu’après avoir répondu à l’ensemble du sujet proposé. La notation des QCM est faite de la manière suivante :
• toutes les bonnes réponses : 1 point ;
• une discordance (une réponse manquante ou une mauvaise réponse cochée) :
0,5 point ;
• deux discordances (réponses manquantes ou cochées à tort) : 0,25 point ;
• plus de deux discordances : 0 point.
Bon courage et belle réussite à toutes et tous !
Thomas Thibault
Hervé Devilliers
Twitter/Instagram/Facebook : @Professeur_geek
Youtube : Pr Geek
D es q u e st io n s s u r c e t t e o u v r a g e ?
C o n t a c t e z l e s a u t e u rs s u r l e g r o u p e F a c e b o o k : h t t p : / / g ro u p e.p rg e e k .fr
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
His t o r iq u e d e s t y pe s
d ’a r t ic l e s a u x é pr e u v e s
d e s EDN
Année
Épreuve test
Examen final
2016
Essai thérapeutique de supériorité
Étude cas-témoins
Essai thérapeutique de supériorité
Étude cas-témoins
2017
Essai d’intervention de supériorité
Essai thérapeutique de supériorité
Étude de cohorte prospective
Essai thérapeutique de supériorité
2018
Essai thérapeutique de supériorité
Étude de cohorte prospective exposés/
non exposés
Étude de performance diagnostique
Essai thérapeutique de non-infériorité
2019
Étude de cohorte rétrospective
Essai thérapeutique de non-infériorité
Essai thérapeutique de non-infériorité
Étude de performance diagnostique
2020
Essai thérapeutique de supériorité
Étude cas-témoins
Essai thérapeutique de supériorité
Étude cas-témoins
2021
Essai thérapeutique de non-infériorité
Étude de performance diagnostique
Essai thérapeutique de supériorité
Étude cas témoins
En résumé, sur 24 épreuves élaborées par le CNCI :
• 13 essais thérapeutiques (dont 9 essais de supériorité et 4 essais de noninfériorité) ;
• 8 études analytiques observationnelles (dont 5 études cas-témoins et 3 études
de cohorte) ;
• 3 études de performance diagnostique.
Les épreuves les moins bien réussies par les étudiants sont habituellement les
études de performance diagnostique.
La lecture critique d’articles (LCA) est un des exercices des épreuves dématérialisées nationales (EDN) les plus craints par les étudiants. Pourtant, comme pour
l’ensemble des autres épreuves, les connaissances et les compétences nécessaires
pour la réussir ne sont qu’une question d’entraînement !
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Ab r é v ia t io n s
AD
AMM
ANSM
AOD
AUC
AVC
AVK
AZT
BMI
BPCO
CA-PUR
CHU
CKDepi
CNIL
CPP
CRP
DDN
DFG
DFS
DR
ECBU
ECN
EGFR
EP
FLP
FN
FP
FPS
GHS
HAS
HbAlc
HCG
HCQ
HR
HTA
IC
IEC
IMC
INCa
INSERM
IQR
IRM
axillary dissection
autorisation de mise sur le marché
Agence nationale de sécurité du médicament et des produits de santé
anticoagulants oraux directs
area under curve
accident vasculaire cérébral
antivitamine K
azithromycine
body mass index (indice de masse corporelle)
bronchopneumopathie chronique obstructive
California State mandated Pesticide Use Reporting
centre hospitalier universitaire
Chronic Kidney Disease EPIdemiology collaboration
Commission nationale de l’informatique et des libertés
comité de protection des personnes
C-reactive protein
date des dernières nouvelles
débit de filtration glomérulaire
disease-free survival
différence de risque
examen cytobactériologique des urines
épreuves classantes nationales
estimated glomerular filtration rate
embolie pulmonaire
fente labiopalatine
faux négatif
faux positif
fente palatine seule
glenohumeral subluxation
Haute Autorité de santé
hémoglobine glyquée
hormone chorionique gonadotrophique
hydroxychloroquine
hazard ratio
hypertension artérielle
intervalle de confiance
inhibiteur de l’enzyme de conversion
indice de masse corporelle
Institut national du cancer
Institut national de la santé et de la recherche médicale
interquartile range
imagerie par résonance magnétique
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
XVIII
ITT
IV
IVT
IVTMT
LADA
LOCF
MDRD
mITT
NI
NNS
NNT
OR
PCT
PEC
PFS
PMSI
PO
PP
PSA
PT
RIPH
RNIPH
ROC
RR
RV
SaO2
SD
Se
SIR
SLA
SMR
SOFA
Sp
TI
TVP
VEMS
VN
VP
VPN
VPP
intention to treat
intraveineux
intravenous thrombolysis
intravenous thrombolysis plus mechanical tbrombectomy
latent autoimmune diabètes in adults
last observation carried forward
modification of diet in rénal disease
modifed intention to treat
non-infériorité
number needed to be screened
number needed to treat
odds ratio
procalcitonine
prise en charge
progression-free survival
programme de médicalisation des systèmes d’information
per os
per-protocole
prostate-spécifie antigen
personne-temps
recherche impliquant la personne humaine
recherche n’impliquant la personne humaine
receiver operating characteristic
risque relatif
rapport de vraisemblance
saturation artérielle en oxygène
standard déviation
sensibilité
standardized incidence ratio
sclérose latérale amyotrophique
standardized mortality ratio
sequential organ failure assessment
spécificité
taux d’incidence
thrombose veineuse profonde
volume d’expiration maximale seconde
vrai négatif
vrai positif
valeur prédictive négative
valeur prédictive positive
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Pa r t ie I
Généralités
Pl a n
Fiche 1
Fiche 2
Fiche 3
Fiche 4
Fiche 5
Fiche 6
Fiche 7
Fiche 8
Types d’études
Les trois biais : sélection, classement, confusion
Niveau de preuve des études
Statistiques descriptives
Statistiques comparatives et mesures d’association
Analyses dépendantes du temps ou « analyses de survie »
Méta-analyse
Conditions réglementaires et éthiques dans la recherche
impliquant la personne humaine
3
13
23
25
43
63
73
83
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Types d’études
In tro d uctio n
Cette fiche décrit brièvement les études les plus importantes à connaître afin de
pouvoir en appréhender facilement leurs principes.
Les trois types d’études ayant fait l’objet de questions à l’ECNi à ce jour sont :
• les études observationnelles analytiques (à visée étiologique ou pronostique) ;
• les essais cliniques ;
• les études d’évaluation de la performance diagnostique.
Elles sont toutes les trois détaillées dans les parties correspondantes de ce
livre.
En pratique, il faut dissocier cinq notions :
1. la nature observationnelle ou expérimentale de l’étude :
- étude expérimentale : l’attribution de l’exposition (ou facteur à évaluer)
est fixée par le design de l’étude (le plus souvent par tirage au sort). Cela
permet d’établir une relation causale car la seule différence entre les groupes
est l’exposition d’intérêt,
- étude observationnelle : l’exposition (ou le facteur pronostique étudié) est
recueillie mais non imposée par le design de l’étude ;
► Remarque : la confusion est régulièrement faite entre le terme « expérimental » qui est une définition « méthodologique », et « interventionnel »
qui est un terme règlementaire. Sur le plan méthodologique, on oppose les
études observationnelles et expérimentales (comme défini ci-dessus en 1).
Sur le plan réglementaire, on oppose les études interventionnelles (modifiant la prise en charge habituelle du patient) et les études non interventionnelles (qui ne modifient pas la prise en charge habituelle du patient,
voir fiche 8, « Conditions réglementaires et éthiques dans la recherche
impliquant la personne humaine »). Par exemple, une étude imposant
la réalisation systématique d’un coroscanner chez les patients suivis en
consultation pour une polyarthrite rhumatoïde en vue de prédire le risque
ultérieur d’événement cardiovasculaire est une étude observationnelle
(non expérimentale) au plan méthodologique mais interventionnelle
au sens de la réglementation (on impose la réalisation d’un examen en
dehors de la pratique courante).
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
4
Généralités
2. la temporalité entre le début de l’étude et l’événement étudié :
- prospectif : la planification de l’étude commence avant la survenue de
l’événement étudié,
- rétrospectif (ou historique) : la planification de l’étude commence après la
survenue de l’événement étudié,
► Remarque : cette terminologie pose actuellement problème, car certaines
études sont planifiées après l’événement d’intérêt, alors que le recueil
de l’information concernant la maladie est prospectif. C’est le cas des
études cas-témoins réalisées à partir des données de registres de population. Dans ce cas, on voit parfois apparaître le terme « d’étude castémoins prospective » qui est une appellation hautement controversée, la
terminologie exacte serait « étude rétrospective avec recueil prospectif de
l’information ».
- historicoprospectif : l’étude est planifiée avant la survenue de la maladie,
mais tout ou partie de l’exposition est recueilli rétrospectivement ;
3. le type de suivi :
- transversal (cross-sectional) : recueil simultané d’un facteur d’exposition et
d’un événement,
- longitudinal (ou étude de cohorte) : il existe plusieurs mesures au cours du
temps pour un patient. Le recueil de l’exposition et/ou de la maladie nécessite un suivi. En pratique, au moins deux visites sont prévues dans le cadre de
l’étude ;
4. la finalité/l’objectif :
- étude analytique à visée étiologique : faire le lien entre un facteur de risque
et une maladie,
- étude analytique à visée pronostique : faire le lien entre un facteur pronostique et l’évolution naturelle ou une complication de la maladie,
- à visée descriptive : décrire un phénomène de santé (prévalence, incidence,
etc.),
- étude de performance diagnostique : étudier les performances diagnostiques d’un marqueur par rapport à un gold standard (sensibilité, spécificité),
- essai clinique/essai thérapeutique : comparer l’efficacité et la tolérance d’un
traitement à un placebo ou à celles du traitement de référence,
- évaluation des pratiques : décrire les pratiques professionnelles et éventuellement les facteurs pouvant les influencer ;
5. le design/plan expérimentale :
- pour les essais cliniques : essais en groupes parallèles, en cross-over, en plan
factoriel ; ces termes sont détaillés dans la fiche 14,
- étude de type exposés/non exposés : étude observationnelle, prospective
ou rétrospective, longitudinale, à visée étiologique ou pronostique dans lesquelles des sujets exposés ou non à un facteur de risque sont suivis sur une
période plus ou moins longue (éventuellement après appariement). La fréquence de la maladie (ou du facteur pronostic) chez les exposés est ensuite
comparée à celle des non-exposés,
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Types d’études
5
- étude de type cas-témoins : étude observationnelle, rétrospective, à visée
étiologique ou pronostique, dans laquelle des patients sont comparés à des
témoins indemnes de la pathologie (ou de la complication de la pathologie)
étudiée (éventuellement après appariement), en termes de fréquence des facteurs de risque ou des facteurs pronostiques.
Ty p es d'é tu d es le plus so uvent re nco n trés au x ED N
Études observationnelles descriptives
Études observationnelles analytiques
Objectifs : décrire ou mesurer un problème
de santé
Étude transversale = étude de prévalence :
étude réalisée à un instant t, afin d’estimer
la fréquence d’une maladie au sein d’une
population donnée à un moment donné
Étude longitudinale = étude d’incidence :
estime le nombre de nouveaux cas d’une
maladie au sein d’une population au cours
d’une période de temps
Objectifs :
- rechercher des facteurs de risque (étude
étiologique)
- rechercher des facteurs pronostiques
(étude pronostique)
Étude cas-témoins (rétrospective) : des
cas sont comparés à des témoins sur la
base d’un recueil de données construit de
manière rétrospective concernant le ou les
facteurs d’exposition. Le ratio cas/témoins
est fixé par l’investigateur
Étude exposés/non exposés ou de
cohorte (prospective ou rétrospective,
longitudinale) : des patients exposés on
non à un ou des facteurs de risque (ou
pronostiques) sont suivis dans le temps,
ce qui permet d’étudier le lien entre ce(s)
facteur(s) et la survenue de la maladie (ou
son évolution)
Études interventionnelles (expérimentales)
Évaluation d’une méthode diagnostique
Objectifs : évaluer l’efficacité d’une
intervention. Contrairement aux études
observationnelles, l’étude contrôle le
facteur d’exposition
Essais cliniques : le facteur d’exposition
est le traitement évalué. Le traitement sera
appliqué par l’investigateur à un groupe
de patients. Il y a donc intervention
de l’investigateur concernant le facteur
d’exposition (à savoir le traitement
évalué)
Évaluation d’une nouvelle stratégie de
prévention : on applique la nouvelle
stratégie à un groupe d’individus. On
compare alors les résultats obtenus aux
résultats d’un autre groupe chez qui
la stratégie de prévention n’a pas été
appliquée
ROC : receiver operating characteristic.
Objectif : évaluer les performances d’un
nouveau test diagnostique par rapport au
test de référence
Principe : le nouveau test à l’étude et
le test de référence sont tous les deux
appliqués aux patients. Cela permet de
calculer la sensibilité et la spécificité d’un
nouveau test et également, en fonction des
caractéristiques du test, le choix d’un seuil
grâce à une courbe ROC
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
6
Généralités
Ex e m ples
• Étude évaluant le nombre de nouveaux cas annuels de cancer au sein de la
population française = étude d’incidence.
• Étude évaluant le nombre de cancers en 2018 dans la région Bourgogne =
étude de prévalence.
• Étude visant à établir comme facteur de risque de cancer l’exposition passée
à certains toxiques en comparant un groupe d’individus atteints d’un cancer et
un groupe d’individus sains = étude cas-témoins.
• Étude visant à établir comme facteur de risque de cancer l’exposition supposée au rayonnement ionisant en suivant dans le temps l’apparition d’un cancer
chez un groupe d’individus habitant à côté d’une centrale nucléaire et chez un
groupe d’individus éloignés de toute centrale = étude exposés/non exposés.
• Étude évaluant l’impact sur la mortalité du cancer colorectal de la recherche de
sang occulte dans les selles en comparant une population chez qui l’on applique
cette stratégie de prévention à une population chez qui on ne l’applique pas =
étude interventionnelle (ou expérimentale).
• Étude évaluant les performances d’un marqueur biologique d’évolution
métastatique en comparant les résultats du marqueur aux résultats du scanner
thoraco-abdomino-pelvien. On établit une sensibilité et une spécificité et on
détermine le choix du meilleur seuil grâce à une courbe ROC (receiver operating characteristic] - étude d’évaluation des performances diagnostiques.
En pra tique
Ex e m ple 1 (é pre uve t est ED N 2018)
Johansson K, Cnattingius S, Nâslund I, Roos N, Trolle Lagerros Y, Granath
F, Stephansson O, Neovius M. Outcomes of pregnancy after bariatric
surgery. N Engl J Med 2015 ; 372 : 814-24.
Maternai obesity is associated with increased risks of gestational diabètes,
large-for-gestational-age infants, preterm birth, congénital malformations,
and stillbirth. The risks of these outcomes among women who hâve undergone bariatric surgery are unclear. We investigated the risks of gestational
diabètes and adverse périnatal outcomes among women with a history of
bariatric surgery as compared with women without such a history but with
similar characteristics.
We identified 627,693 singleton pregnancies in the Swedish Medical Birth
Register from 2006 through 2011, of which 670 occurred in women who had
previously undergone bariatric surgery and for whom presurgery weight was
documented. For each pregnancy after bariatric surgery, up to five control pregnancies were matched for the mother’s presurgery body-mass index (BMI ;
we used early-pregnancy BMI in the Controls), âge, parity, smoking history,
educational level, and delivery year. We assessed the risks of gestational diabètes, large-for-gestational-age and small-for-gestational-age infants, preterm
birth, stillbirth, néonatal death, and major congénital malformations.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Types d’études
7
Il s’agissait d’une étude :
Il aurait fallu cocher...
Commentaires
Observationnelle
De toute évidence, l’exposition d’intérêt (l’obésité
maternelle traitée par chirurgie bariatrique) n’a pas
été contrôlée par les investigateurs
De cohorte
Le suivi des patientes (par l’intermédiaire
des données des registres) du début de la grossesse
à l’accouchement définit une étude de cohorte
Avec un groupe contrôle
Ici, le groupe contrôle est le groupe des femmes ayant
réalisé une grossesse sans avoir été opérée d’une
chirurgie bariatrique
De type exposés/non
exposés
On part du facteur d’exposition (la chirurgie
bariatrique) pour définir les groupes, contrairement
à une étude cas-témoins où l’on part de la maladie
Longitudinale
L’enregistrement des complications pendant la durée
de la grossesse impose un suivi longitudinal
À visée étiologique
On cherche la relation entre une exposition
(la chirurgie bariatrique) et plusieurs maladies,
notamment les complications obstétricales
Analytique
L’objectif principal de cette étude est d’obtenir une
mesure d’association (risque relatif d’avoir un diabète
gestationnel quand on a une obésité traitée par
chirurgie bariatrique par rapport à une obésité non
traitée par chirurgie bariatrique)
Avec appariement des
exposés et des non-exposés
L’appariement des mères opérées à des mères
non opérées sur l’indice de masse corporelle (BMI)
et les autres facteurs de confusion a pour but
d’améliorer la comparabilité des groupes exposés
et non exposés
Il n’aurait pas fallu cocher...
Commentaires
Cas-témoins
Dans cette étude, le point de départ est l’exposition,
pas la maladie. Si on avait voulu réaliser une étude
cas-témoins, il aurait fallu partir des diabètes
gestationnels et leur apparier des grossesses sans cette
complication
Expérimentale
L’exposition d’intérêt n’est ni contrôlée, ni
randomisée
Randomisée
Que cinq grossesses de femmes non opérées aient
été tirées au sort dans le registre des naissances pour
chaque femme opérée ne fait pas de cette étude une
étude randomisée. Une étude randomisée est une
étude dans laquelle l’exposition est tirée au sort
pour un patient donné
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
8
Généralités
Il n’aurait pas fallu cocher...
Commentaires
Avec appariement des cas et
des témoins
Les mères souffrant de diabète gestationnel n’ont pas
été appariées à des mères indemnes
À visée pronostique
Une partie des femmes de l’étude sont indemnes
de toute pathologie à l’inclusion, et on ne peut pas
considérer la grossesse comme une maladie
Transversale
Comme explicité plus haut, l’enregistrement des
complications de la grossesse nécessite un suivi de
plusieurs mois
Remarque : ici, la nature prospective ou rétrospective de l’étude est sujette à
discussion. Nous sommes en toute rigueur dans le cadre d’une étude rétrospective (planifiée après l’apparition de l’événement) avec recueil prospectif de
l’information.
Ex e m ple 2 (ED N 2016)
Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai
consumption of coffee and caffeine-containing beverages and oral clefts :
a population-based case-control study in Norway. Am J Epidemiol 2009 ;
69 : 1216-22.
We used data from a population-based study to evaluate the association of
maternai consumption of coffee and caffeinated beverages in early pregnancy
with the risk of delivering an infant with an orofacial cleft.
Ail infants born with facial clefts in Norway are treated at government expense in surgical centers at university hospitals located in Oslo and Bergen.
In collaboration with these 2 centers, we identified ail babies born from 1996
to 2001 who were referred for treatment for either cleft lip with or without
cleft palate (CLP) or cleft palate only (CPO). Controls were recruited during
the same period by randomly selecting approximately 4 births per 1,000 from
the National Medical Birth Registry (which includes ail births in the country). These births served as Controls for both case groups, with the target of
2 Controls per case of CLP (nearly 4 Controls for each case of CPO). Both cases
and Controls were recruited during their first weeks of life.
Il s’agissait d’une étude :
Il aurait fallu cocher...
Commentaires
Cas-témoins
Dans cette étude, on part des cas pour leur apparier
des témoins. C’est bien la définition d’une étude
cas-témoins. Le ratio cas/témoin est fixé par
l’investigateur
Rétrospective
L’étude débute après l’apparition de la maladie
étudiée
À visée étiologique
Le but de l’étude est de chercher un facteur de risque
de fente labiopalatine
Le ratio cas/témoins était de
1:2
Comme indiqué ci-dessus, on a inclus deux enfants
indemnes pour chaque cas
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Types d’études
Il n’aurait pas fallu cocher...
9
Commentaires
Prospective
L’étude débute après l’apparition de la maladie
Historicoprospective
Toute l’information est recueillie dans le passé, y
compris la maladie. Cette étude ne mérite donc pas la
dénomination d’étude historicoprospective
Transversale
Le schéma de l’étude impose plusieurs « points de
suivi », même s’ils sont reconstitués rétrospectivement
À visée pronostique,
étudiant les facteurs
pronostiques des fentes
labiopalatines
Dans cette étude, il y a des témoins, donc le but n’est
clairement pas d’étudier les facteurs pronostiques des
fentes labiopalatines. Dans une étude pronostique,
tous les patients sont porteurs de la maladie dont
on cherche le(s) facteur(s) pronostique(s) ; le facteur
d’exposition est le facteur pronostique et l’état
pathologique étudié est la complication de la maladie
De cohorte historique
Le terme de cohorte, même historique ou rétrospective,
impose un suivi de patients avec un recueil prospectif
de l’information (par l’intermédiaire de registres ou de
bases de données médico-administratives, par exemple)
Ex e m ple 3
Hjort R, Alfredsson L, Carlsson PO, Groop L, Martinell M, Storm P,
Tuomi T, Carlsson S. Low birthweight is associated with an increased risk
of LADA and type 2 diabètes : results from a Swedish case-control study.
Diabetologia 2015 ; 58 : 2525-32.
Le texte ci-dessous est issu d’un résumé PubMed :
The aim of a study was to investigate the association between birthweight and
latent autoimmune diabètes in adults (LADA), a common diabètes form with
features of both type 1 and type 2 diabètes. Authors used data from a Swedish
population-based study, recruiting incident cases of diabètes through diabètes
registries in the Swedish counties of Skâne and Uppsala. Ail participants gave
self-reported information on birthweight. Participants free from diabètes (six
per LADA case) were randomly selected via the National Population Registry,
which covers the whole population of Skâne and Uppsala. They were matched
on geographical area (county) and date of participation.
Il s’agit d’une étude :
Il aurait fallu cocher...
Commentaires
Cas-témoins
Dans cette étude, on part des cas pour leur apparier
des témoins. C’est bien la définition d’une étude castémoins. Le ratio cas/témoins est fixé par l’investigateur
Rétrospective
L’étude débute après l’apparition de la maladie étudiée
À visée étiologique
Le but de l’étude est de chercher un facteur de risque
de LADA
Le ratio cas/témoin était
de 1:6
Comme indiqué ci-dessus, on a inclus 6 enfants
indemnes pour chaque cas
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
10
Généralités
Il n’aurait pas fallu cocher...
Commentaires
Prospective
L’étude débute après l’apparition de la maladie
Historicoprospective
Toute l’information est recueillie dans le passé, y
compris la maladie. Cette étude ne mérite donc pas
la dénomination d’étude historicoprospective
Transversale
Le schéma de l’étude impose plusieurs « points
de suivi », même s’ils sont reconstitués
rétrospectivement
À visée pronostique
Dans cette étude, il y a des témoins, donc le but n’est
clairement pas d’étudier les facteurs pronostiques des
LADA. Dans une étude pronostique, tous les patients
sont porteurs de la maladie dont on cherche le(s)
facteur(s) pronostique(s) ; le facteur d’exposition est
le facteur pronostique et l’état pathologique étudié
est la complication de la maladie
De cohorte historique
Le terme de cohorte, même historique
ou rétrospective, impose un suivi de patients
avec un recueil prospectif de l’information
(par l’intermédiaire de registres ou de bases
de données médico-administratives, par exemple).
Ici, le poids de naissance est recueilli en interrogeant
les patients
Ex e m ple 4 (ED N 2020)
Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for
Pancreatic Cancer in China : A Multicenter Case-Control Study. J Epidemiol
2016 ; 26(2) : 64-70.
Quel(s) serai(en)t l’(les) obstacle(s) à la mise en place d’un essai contrôlé randomisé évaluant l’efficacité d’une supplémentation quotidienne en thé pour la
prévention primaire du cancer du pancréas ?
Il aurait fallu cocher...
L’incidence du cancer du pancréas est
faible
Le temps d’apparition du cancer du
pancréas dure plusieurs années
Commentaires
Les résultats issus d’un essai randomisé
sont d’un niveau de preuve plus élevé
que les résultats issus d’une étude
observationnelle. Dans un certain
nombre de cas cependant, la réalisation
d’un essai randomisé est impossible, soit
parce que l’événement attendu est rare
ou survient après un temps d’apparition
trop long (comme dans cet exemple), soit
parce qu’on dispose déjà de suffisamment
d’information pour penser qu’il serait
nocif d’exposer les participants à un des
deux bras expérimentaux (problème
éthique)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Types d’études
Il n’aurait pas fallu cocher...
Commentaires
L’effet protecteur du thé est controversé
dans la survenue du cancer du pancréas
Comme il n’existe pas de preuve d’un tel
effet pour l’instant, un essai randomisé
pourrait être théoriquement intéressant,
mais des questions de faisabilité rendent
ce type d’essai impossible (il faudrait
sélectionner des patients indemnes de
cancer du pancréas et les randomiser
dans 2 groupes. Un groupe serait exposé
à une consommation de thé et l’autre
non. On suivrait alors les participants
dans le temps jusqu’à l’apparition d’un
cancer du pancréas. On se doute bien
qu’il faudrait certainement suivre les
patients pendant plusieurs dizaines
d’années pour recueillir suffisamment
d’événements nous permettant de
conclure, ce qui est impossible en
pratique)
Cet essai clinique ne serait pas
éthique car le rôle protecteur de la
consommation de thé est prouvé
11
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 2
Les trois biais : sélection,
classement, confusion
Biais e t fluct u atio n d'écha n tillo n n a g e
Biais
Définition : erreur systématique qui entraîne une déviation de ce qui est observé
par rapport à la réalité. Si on étudie l’association entre un facteur de risque et
une maladie donnée, l’erreur est dans la même direction à chaque fois. Cela
peut donc entraîner une surestimation ou une sous-estimation d’un effet. On
distingue trois grands types de biais : confusion, classement et sélection.
Fluctuation d'échantillonnage et erreur aléatoire
• Erreur aléatoire : une erreur aléatoire est liée au hasard. Elle affecte de la
même manière tous les groupes d’une étude (exemple : utilisation d’un automate défectueux mesurant la C-reactive protein avec une précision de 30 mg/L).
• Fluctuation d’échantillonnage : lors de la constitution d’un échantillon à
partir d’une population source, la probabilité d’obtenir un échantillon présentant les mêmes caractéristiques que cette population à 1 % près est très
faible. L’âge moyen des patients et le pourcentage de femmes dans l’échantillon
sont des estimateurs ponctuels des valeurs « vraies » de la population source.
La fluctuation d’échantillonnage est une erreur aléatoire, résultant de l’écart
entre cet estimateur ponctuel et la valeur « vraie » que l’on observerait dans
l’ensemble de la population source. Augmenter la taille de l’échantillon réduit
les fluctuations d’échantillonnage. Le risque alpha correspond au risque qu’une
différence observée soit liée aux fluctuations d’échantillonnage plutôt qu’à la
réalité.
Dans le tableau ci-dessous :
• les fluctuations d’échantillonnage entraînent des erreurs aléatoires et donc
une imprécision des résultats ;
• les biais entraînent des erreurs systématiques et donc une surestimation ou
une sous-estimation des résultats.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
14
Généralités
Les dif f ére nts biais
Biais de sélection
• Echantillon : patients inclus dans une étude.
• Population source : population dont est tiré l’échantillon : par exemple, tous
les patients vus dans un service pendant la période d’étude, tous les patients
hospitalisés dans un service de neurologie pour un accident vasculaire cérébral
(AVC) pendant la période d’étude, etc.
• Population cible : population à laquelle on veut généraliser les résultats : par
exemple, tous les patients souffrant d’AVC en France.
On parle de biais de sélection lorsque l’échantillon n’est pas représentatif de
la population cible (3 raisons principales à cela) :
• échantillon non représentatif de la population source : le seul médecin qui
inclut des patients dans une étude monocentrique est le spécialiste régional
d’une forme rare de la maladie ;
• population source non représentative de la population cible : inclure des patients
uniquement dans des centres experts qui présentent des pathologies avec des caractéristiques particulières et rares ;
• sorties d’étude : si l’échantillon est réduit par des sorties d’études (on parle
d’attrition), l’échantillon restant est sélectionné et par conséquent moins représentatif de la population source et donc de la population cible.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Les trois biais : sélection, classement, confusion
15
Biais de classement, de mesure ou d'information
Dans une étude épidémiologique, le biais de classement concerne toute erreur
conduisant à une mesure erronée de l’exposition (considérer un patient comme
exposé alors qu’il ne l’est pas) ou de la maladie (considérer un patient comme
malade alors qu’il est indemne).
Dans un essai clinique randomisé, le biais de classement concerne essentiellement la mesure des critères de jugement (considérer que le critère est atteint
alors qu’il ne l’est pas ou inversement). C’est le cas dans les essais réalisés en
ouvert (le patient et le médecin investigateur connaissent le bras de traitement).
L’erreur est dite différentielle lorsque :
• l’erreur de mesure ou de classement sur l’exposition est influencée par la
connaissance de la maladie :
- ce type d’erreur est impossible si l’étude est prospective (on recueille l’exposition alors que la maladie n’est pas encore survenue),
- dans une étude cas-témoins, on interroge des patients sur leur consommation de tabac après le diagnostic de cancer bronchique. Les cas ont tendance
à surestimer leur consommation, tandis que les témoins la sous-estiment. Le
lien entre le cancer et le tabac est donc artificiellement augmenté ;
• l’erreur de mesure ou de classement sur la maladie est influencée par la
connaissance de l’exposition :
- ce type d’erreur est rare dans les études rétrospectives, puisqu’au moment
où l’on recueille l’exposition, la maladie est déjà connue,
- par exemple, lors d’une étude exposés/non exposés sur le lien entre la
consommation de café et le cancer du côlon, la connaissance du lien potentiel va
conduire à un sur-dépistage du cancer du côlon par coloscopie chez les grands
consommateurs de café, et donc à une augmentation artificielle de l’association ;
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
16
Généralités
• l’évaluation de l’efficacité d’un traitement et des effets secondaires est faite
en ouvert : par exemple, dans le cas d’un essai comparant l’efficacité d’un antibiotique 7 jours versus 14 jours dans l’infection urinaire haute, si le critère de
jugement est la récidive des symptômes, et que l’essai est réalisé en ouvert, les
patientes du groupe « 7 jours » signaleront plus facilement des symptômes
après la fin du traitement que les patientes encore sous antibiotique. Ceci augmentera artificiellement l’efficacité du traitement de 14 jours.
L’erreur est dite non différentielle lorsque l’erreur affecte de manière aléatoire
les deux groupes : par exemple, on interroge des sujets sains de 40 ans sur leurs
habitudes alimentaires à l’adolescence, puis on les suit pendant 10 ans pour
étudier le lien entre alimentation riche en graisse et cancer (étude historicoprospective). Le cancer n’étant pas survenu au moment de la mesure de
l’exposition, une erreur différentielle est impossible. En revanche, certains
patients ont oublié leurs habitudes alimentaires passées et répondront mal au
questionnaire. Cette erreur affecte identiquement les deux groupes, et aura
tendance à réduire l’estimation de l’association entre l’alimentation et le cancer
(voir figure ci-dessous).
Alimentation riche
en graisse = exposés
Alimentation pauvre en
en graisse = non exposés
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Les trois biais : sélection, classement, confusion
17
À retenti
Une erreur de classement différentielle peut augmenter ou diminuer une associa
tion ou l'effet d'un traitement par rapport à la réalité. Elle remet en question
le résultat de l'étude, qu'il soit significatif ou non.
Une erreur de classement non différentielle peut rapprocher la mesure d'associa
tion de la valeur neutre (1 ou un risque relatif, 0 pour un risque absolu)
et diminuer le niveau de significativité. Une telle erreur ne remet pas en question
un résultat significatif.
En pratique, un résultat significatif dans une étude comportant une erreur de classe
ment non différentielle est probablement encore plus significatif dans la réalité.
Un résultat non significatif est peut-être lié à cette erreur.
Biais de confusion (voir fiche 24)
On parle de biais de confusion lorsque l’association observée entre une exposition et une maladie est en réalité liée à un troisième facteur, associé à l’exposition (c’est-à-dire plus fréquent chez les exposés que chez les non-exposés) et lié
à la maladie. Par exemple :
• on souhaite étudier le lien entre tabagisme et cirrhose. En analyse bivariée, la
cirrhose est significativement plus fréquente chez les fumeurs. Or, la consommation d’alcool plus fréquente chez les fumeurs est fortement liée au risque de
cirrhose. L’alcool est un facteur de confusion dans l’étude de la relation entre
tabac et cirrhose ;
►
Attention ! Il faut distinguer facteur de confusion et élément de la chaîne
causale entre le facteur de risque et la maladie.
• on souhaite étudier l’association entre consommation de nourriture grasse et
AVC ischémique. On s’interroge sur la place éventuelle de l’hypercholestérolémie
comme facteur de confusion. L’hypercholestérolémie est bien associée à la fois à
la consommation de nourriture grasse et à la survenue d’AVC ; or elle fait partie
de la chaîne causale entre les deux éléments, la survenue d’accident vasculaire
étant la conséquence de l’élévation du cholestérol qui est elle-même conséquence
des habitudes alimentaires. Ce n’est donc pas un facteur de confusion.
À retenir
V oca b ulaire u tile fra nçais-a n glais
Biais = bias
Échantillon = sample
Échantillonnage = sampling
Fluctuation d'échantillonnage = sampling distribution
Tirage au sort = random sampling
Facteur de confusion = confounding factor
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
18
Généralités
En pra tique
Ex e m ple 1
On réalise une étude sur le lien entre allaitement maternel et développement
cognitif dans la petite enfance. Les mères présentant leur enfant à l’examen obligatoire des 2 ans ont été systématiquement invitées à remplir un questionnaire
sur la durée et les modalités de l’allaitement pendant la première année de vie
de leur enfant. Un test neuropsychologique a été proposé à l’entrée au cours
préparatoire aux enfants des mères ayant rempli le questionnaire à l’examen
obligatoire des 2 ans.
Concernant l’erreur de mesure sur les modalités d’allaitement, il est vrai que :
Il aurait fallu cocher...
Commentaires
L’erreur est non différentielle
Il n’y a aucune raison que l’erreur soit
différentielle, car la mesure de l’exposition,
bien que rétrospective, n’a aucune raison
d’être influencée par la maladie étudiée
(développement cognitif), car elle n’est pas
connue au moment du recueil
L’erreur ne peut pas être influencée par
le développement cognitif de l’enfant
Cette proposition est synonyme de la
précédente
L’erreur aura tendance à rapprocher le
risque relatif de la valeur 1
L’erreur est ici liée à la mémorisation
et introduit donc une diminution de la
précision dans la mesure de l’exposition
qui risque de réduire le lien éventuel entre
allaitement et développement cognitif
L’erreur aura tendance à faire
sous-estimer le niveau de significativité
Si le résultat obtenu est significatif, la
conclusion n’est pas remise en cause
par cette erreur
Il n’aurait pas fallu cocher...
Dans la mesure où l’erreur conduit à
une sous-estimation de l’association, si
on observe une association significative
malgré l’erreur, elle le serait sans doute
encore plus dans la réalité
Commentaires
La mesure risque d’être influencée par
la connaissance du résultat des tests
neurocognitifs
La temporalité de l’étude rend ce biais
impossible
L’erreur est limitée car le recueil des
modalités d’allaitement est prospectif
Le recueil est bien rétrospectif, ce qui
risque d’induire un biais de mémorisation
Le calcul de risque relatif n’est
pas possible en raison du recueil
rétrospectif de l’exposition
En épidémiologie, le seul schéma ne
permettant pas le calcul d’un risque
relatif est l’étude cas-témoins. La nature
prospective ou rétrospective du recueil de
la maladie ou de l’exposition importe peu
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Les trois biais : sélection, classement, confusion
Il n’aurait pas fallu cocher...
Commentaires
L’erreur n’aura aucune influence sur la
mesure d’association
Il est impossible de faire cette affirmation,
il est tout à fait possible que l’erreur
diminue la mesure d’association
Si le résultat est significatif, cette erreur
remet en cause la conclusion
Une erreur non différentielle risque de
diminuer la significativité. Un résultat
non significatif pourra donc être remis en
question, mais pas un résultat significatif
19
Ex e m ple 2
Hjort R, Alfredsson L, Carlsson PO, Groop L, Martinell M, Storm P, Tuomi
T, Carlsson S. Low birthweight is associated with an increased risk of LADA
and type 2 diabètes : results from a Swedish case-control study. Diabetologia
2015; 58(11): 2525-32.
Le texte ci-dessous est issu d’un résumé PubMed :
In a study on birthweight and latent autoimmune diabètes in adults (LADA), ail
individuals with incident LADA registered in Skâne (2010-) and Uppsala (2012-)
in a régional pathology registry were invited to take part in a study and
participants free from diabètes (six per LADA case) were randomly selected
via the National Population Registry, which covers the whole population of
Skâne and Uppsala. They were matched on geographical area (county) and
date of participation. Ail participants who gave self-reported information on
birthweight were eligible for the analyses presented here. Those who filled
in the questionnaire but did not remember their birthweight (answered ‘I do
not know’ to the birthweight question) were excluded from the analysis. The
overall response rates were 80 % for incident LADA cases and 66 % for
participants free from diabètes. Were presented here Odds Ratios and 95 %
CIs for LADA in relation to birthweight, adjusted for sex, âge, BMI and family
history of diabètes.
Results : Eligible for the analysis were 134 incident LADA cases and 603
randomly selected participants free from diabètes. The OR (95 % Cis) for
participants weighing < 3 kg compared with > 4 kg at birth was estimated as
2.38 (1.23,4.60) for LADA.
Il est vrai que :
Il aurait fallu cocher...
Il existe potentiellement un biais de
mesure différentiel
Commentaires
Il est tout à fait possible que la mesure
de l’exposition (le poids de naissance)
soit influencée par la connaissance de la
maladie (le LADA) dans la mesure où la
maladie est connue au moment du recueil
de l’exposition
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
20
Généralités
Il aurait fallu cocher...
Commentaires
Il existe potentiellement un biais de
sélection
Les cas sont sélectionnés car seuls
les patients connaissant leur poids de
naissance ont été inclus. Les témoins sont
sélectionnés car seuls ceux acceptant
de participer ont été inclus. On n’a
donc pas d’indication sur le fait que
l’échantillon représente en effet la
population source (biais de sélection). En
revanche, la population source semble
être représentative de la population cible
(utilisation de registres de population donc
source = cible)
La valeur de Vodds ratio (OR) donnée
tient compte des éventuels facteurs de
confusion
L’OR est en effet ajusté sur le sexe,
l’âge, les antécédents grâce à une analyse
multivariée. Ces variables sont des facteurs
de confusion dans l’étude du lien entre
poids de naissance et LADA
Les investigateurs ont réalisé un
appariement
Chaque cas se voit apparier (matched)
6 témoins originaires de la même région
géographique et avec la même date de
participation
Les investigateurs ont réalisé un
ajustement
Le calcul d’un OR ajusté atteste la réalisation
d’une analyse multivariée et donc d’un
ajustement
Il est possible que le résultat obtenu soit
uniquement lié à l’erreur de mesure
Un biais de mesure différentiel peut
expliquer la modification d’une association
dans les deux sens, il peut expliquer à lui
seuil un résultat positif ou négatif
L’utilisation d’un registre limite le biais
de mesure sur la maladie
Les cas étant tous issus d’un registre, on
est en droit de penser que la véracité de la
pathologie a été vérifiée, et que tous les cas
sont vraiment malades
Les témoins sont issus de la population
générale
Le tirage au sort des témoins à partir de
registres de population indique bien qu’ils
sont issus de la population générale (la
population source et la population cible
sont confondues)
Cette étude ne permettra pas l’étude de
l’effet de la zone géographique sur le
risque de LADA
L’appariement signifie que pour chaque
patient d’une région donnée, on recrute
6 témoins de la même région. La
proportion de patients de cette région est
donc la même chez les cas et les témoins.
L’effet de la région sur le risque de LADA
est donc nul par définition
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Les trois biais : sélection, classement, confusion
Il n’aurait pas fallu cocher...
Commentaires
L’utilisation de registres limite le biais de
mesure sur l’exposition
L’exposition n’est pas recueillie à partir
de données de registre, mais par
interrogatoire des patients. Le registre
assure la qualité des données pour les
variables qui sont recueillies dans son
cadre
L’étude est randomisée
Le tirage au sort des témoins ne fait
pas d’une étude une étude randomisée.
Les seules études méritant le
qualificatif de randomisée sont les
études expérimentales dans lesquelles
l’exposition (ou le traitement) est
randomisée
On ne sait pas si la mesure de l’association
entre faible poids de naissance et risque
de diabète LADA est significative
L’intervalle de confiance de l’OR permet
de tirer cette conclusion. En l’occurrence,
l’exclusion de la valeur neutre « 1 »
permet d’affirmer que l’association est
significative
Les témoins ont été sélectionnés à partir
d’un registre de patients atteints de
LADA
Les témoins sont issus d’un registre de
population générale
21
Ex e m ple 3
Une étude cas-témoins monocentrique a été réalisée pour étudier l’existence
d’une relation entre certaines expositions environnementales, liées à l’activité
professionnelle ou aux habitudes de vie, et la survenue de lymphomes malins
non hodgkiniens. Les cas étaient définis comme l’ensemble des patients atteints
de lymphome, actuellement suivis dans le service participant, avec confirmation
par un examen histopathologique. Les témoins étaient recrutés par le département de médecine du travail lors de la visite systématique, et devaient être
indemnes d’hémopathie maligne.
Quelle(s) est(sont) la(les) proposition(s) exacte(s) ?
Il aurait fallu cocher...
Commentaires
Les modalités de recrutement des
témoins exposent à un biais de sélection
Les témoins sont recrutés par
le département de médecine du
travail, alors que la population cible
concerne clairement l’ensemble des
personnes résidant dans les lieux
exposés (« expositions liées aux
habitudes de vie »). La population
source de l’échantillon n’est donc pas
représentative de la population cible
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
22
Généralités
Il aurait fallu cocher...
Commentaires
Les critères de définition des cas visent à
limiter un biais de classement
La nécessité d’une confirmation
histologique permet de limiter le biais de
classement sur les cas
Le recrutement de cas prévalents expose
au risque de biais de sélection
L’ensemble des patients actuellement
suivis dans le service participant
correspond en effet à la définition des cas
prévalents, ce qui limite le recrutement
aux survivants et donc potentiellement
aux cas les moins graves
Le calcul des risques relatifs est
impossible dans cette étude
Dans une étude cas-témoins, le ratio cas/
témoins est fixé, ce qui interdit le calcul
de taux d’incidence, de prévalence ou
de risque relatif. On estime les risques
relatifs par des OR
Il n’aurait pas fallu cocher...
Commentaires
Le schéma d’étude envisagé permet de
mesurer de façon non biaisée les facteurs
d’exposition
Les facteurs d’exposition sont recueillis
dans cette étude de manière rétrospective,
ce qui n’est pas le meilleur moyen de
s’assurer qu’il n’y ait pas de biais
Les cas recrutés sont les cas incidents, ce
qui assure leur représentativité
Comme indiqué plus haut, le recueil de
cas incidents est préférable, mais ce n’est
pas le cas dans cette étude
Il existe potentiellement un biais de
mesure différentiel sur la maladie
Dans une étude rétrospective, il est
souvent possible que le recueil de
l’exposition soit sujet à un biais
différentiel (c’est-à-dire lié à la maladie).
En revanche, le recueil de la maladie est
réalisé sans tenir compte de l’exposition,
on n’a donc pas de raison de penser que
le diagnostic de lymphome peut être
retenu plus facilement chez les exposés
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 3
Niveau de preuve des études
Toutes les études n’apportent pas le même degré de confiance vis-à-vis des résultats.
L’essai randomisé en double insu apporte toujours un meilleur niveau de
preuve qu’une étude observationnelle, car la seule différence entre les deux
groupes comparés est la prise du traitement.
Cependant, certaines questions de recherche ne peuvent pas donner lieu à un
essai randomisé (pour étudier le lien entre tabac et cancer, on ne peut pas randomiser l’utilisation du tabac et forcer un groupe de patients à fumer). L’étude
avec le niveau de preuve le plus élevé n’est donc pas toujours faisable pour
répondre à une question donnée.
Une étude de cohorte apporte toujours un meilleur niveau de preuve qu’une étude
cas-témoins, principalement du fait du caractère prospectif du recueil des données.
La recherche et la publication d’études scientifiques entraînent à terme l’élaboration et la publication de recommandations scientifiques. Ces dernières se
verront attribuer différents grades définis par le niveau de preuve des études
publiées sur le sujet.
Le tableau ci-dessous, publié par la Haute Autorité de santé (HAS), définit les
niveaux de preuve et les grades des recommandations en fonction du type de
l’étude et de certains critères de qualité méthodologiques.
Grade des recommandations
Niveau de preuve scientifique fourni par la littérature
A
Preuve scientifique établie
Niveau 1 :
- essais comparatifs randomisés de forte puissance
- méta-analyse d’essais comparatifs randomisés
- analyse de décision fondée sur des études bien menées
B
Présomption scientifique
Niveau 2 :
- essais comparatifs randomisés de faible puissance
- études comparatives non randomisées bien menées
- études de cohortes
Niveau 3 :
- études cas-témoins
Niveau 4 :
- études comparatives comportant des biais importants
- études rétrospectives
- séries de cas
- études épidémiologiques descriptives (transversale,
longitudinale)
Source : HAS. Niveau de preuve et gradation des recommandations de bonne pratique. 2013.
C
Faible niveau de preuve
scientifique
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
24
Généralités
Il est donc nécessaire, pour juger du niveau de preuve d’une étude, d’évaluer
deux éléments :
• le type d’étude en lui-même : une étude rétrospective sera d’emblée classée en
faible niveau de preuve ;
• la qualité méthodologique : la présence de biais importants dans une étude
comparative rétrograde immédiatement l’étude en niveau 4.
/À retenir^
La m é t a-a n alyse (v oir fich e 7)
Une méta-analyse regroupe les résultats de plusieurs études comparatives déjà
réalisées sur un sujet donné :
l'objectif est d'effectuer une synthèse des essais cliniques réalisés sur le même
sujet ;
il ne s'agit pas simplement de dresser une liste des résultats des différents essais,
mais réellement de permettre une analyse statistique grâce aux données des
études déjà réalisées ;
point fort : augmentation de l'effectif donc meilleure représentation de la
population et augmentation de la puissance ;
point faible : résultats pouvant être biaisés notamment en raison de la
non-publication des essais négatifs (biais de publication).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques descriptives
Les dif f ére n ts t y p es d e varia bles
Une variable, en statistiques, est définie par toute caractéristique pouvant être
mesurée chez plusieurs individus et susceptible de prendre des valeurs différentes selon ces individus. Dans les études, on recueille ces variables chez les
individus de l’échantillon d’étude. En recherche clinique, on utilise des variables
comme critères de jugement.
En statistiques, la nature d’une variable a moins d’importance que la manière
dont elle est traitée. Prenons l’exemple de l’indice de masse corporelle (IMC) :
• si on compare l’IMC moyen en kg/m2 entre deux groupes, la variable étudiée
est quantitative ;
• si on compare le pourcentage de patients obèses (l’obésité étant définie par un
IMC > 30) entre deux groupes, la variable étudiée est qualitative.
Variables quantitatives
À l’échelle du patient, c’est une valeur numérique. À l’échelle de l’échantillon,
on peut calculer une moyenne.
Variable quantitative
Caractéristiques
Exemples
Continue
Peut prendre n’importe
quelle valeur numérique dans
l’intervalle des observations
possibles. Le nombre de chiffres
après la virgule est limité par
la précision des appareils de
mesure. Une unité de mesure
y est généralement associée
Variables biologiques +++
(taux de C-reactive
protein en mg/L, taux
d’hémoglobine en g/dL, etc.)
Taille en cm, tension
artérielle en mmHg, poids
en kg, etc.
Discrète
(discontinue)
Ne prend comme valeur que les
nombres entiers dans l’intervalle
d’observations possible
Nombre d’hospitalisations,
de rappels de vaccinations,
d’épisodes d’infection, etc.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
26
Généralités
Para m è tres d e p ositio n
Définition
Paramètre
Moyenne
(mean)
Valeur correspondant à la somme des valeurs de la série divisée par le
nombre d’individus :
Xx
LL =-----N
p = moyenne
Sx = somme des valeurs de la série
N = nombre d’individus
Médiane
(médian)
Valeur qui partage les individus d’une série en 2 groupes d’effectifs identiques
50 % des individus présentent une valeur inférieure à la médiane et 50 %
des individus présentent une valeur supérieure. L’avantage par rapport
à la moyenne est que la médiane n’est pas influencée par des valeurs
extrêmes pouvant être considérées comme aberrantes
Quartiles
(Ql:
1er quartile,
Q3 :
3e quartile)
Les quartiles sont au nombre de 3 et partagent la série en 4 groupes
d’effectif identique :
- 1er quartile : 25 % des individus présentent une valeur inférieure et 75 %
une valeur supérieure
- 2e quartile : 50 % des individus présentent une valeur inférieure et 50 %
des individus présentent une valeur supérieure = médiane
- 3e quartile : 75 % des individus présentent une valeur inférieure et 25 %
une valeur supérieure
Déciles
Les déciles sont au nombre de neuf et partagent la série en 10 groupes
d’effectifs identiques :
- 1er décile = 10 % des individus présentent une valeur inférieure et 90 %
une valeur supérieure
- 5e décile = la médiane
- 7e décile = 70 % des individus présentent une valeur inférieure et 30 %
une valeur supérieure
Percentiles
Les percentiles sont au nombre de 99 et partagent la série en 100 groupes
d’effectifs identiques :
- 1er percentile = 1 % des individus présentent une valeur inférieure et 99 %
une valeur supérieure
- 10e percentile = 1er décile
- 25e percentile = 1er quartile
- 50e percentile = la médiane = 2e quartile
- 75e percentile = 3e quartile
- 99e percentile = 99 % des individus présentent une valeur inférieure et 1 %
une valeur supérieure
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques descriptives
Paramètre
27
Définition
Mode
Valeur la plus fréquente au sein d’une série de données. On parle de
distribution unimodale lorsqu’il existe une seule valeur surreprésentée et
de distribution bimodale lorsqu’il existe deux valeurs surreprésentées
Étendue
(range)
L’étendue est l’intervalle entre la valeur la plus basse (le minimum) et la
valeur la plus haute possible (ou maximum). Par exemple, l’étendue des
valeurs possibles du score de Glasgow est de 3 à 15
Para m è tres d e disp ersio n
Définition
Paramètre
Variance
Il s’agit du paramètre de dispersion le plus important car c’est celui qui
est le plus utilisé dans les analyses statistiques. Il résume la distribution
des valeurs de la série étudiée autour de la moyenne
Il correspond à la somme des carrés des écarts à la moyenne de toutes
les valeurs de la série divisée par le nombre d’individus :
N
Dans le cadre de l’estimation de la variance d’une population après
échantillonnage de celle-ci la formule est légèrement différente car
on utilise le terme n — 1 en tant que dénominateur. La notation est
également différente dans cette situation :
s2 _S(x-m)2
n-1
Écart type
(standard
déviation)
L’écart type correspond à la racine carrée de la variance :
ct = Vct ^
Dans le cadre de l’estimation de l’écart type après réalisation d’un
échantillonnage, la notation est :
S=
Intervalle
interquartile
(interquartile
range ou IQR)
Correspond à la différence entre le 1er quartile et le 3e quartile.
L’intervalle interquartile comprend alors les 50 % de la population les
plus proches de la médiane. Il est souvent noté IQR :
IQR = Q3-Q1
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
28
Généralités
Re prése nt a tio n gra p hiq u e
Histogramme
Prenons l’exemple de la distribution de la consommation de café en tasses par
jour des patientes d’une étude cas-témoins pendant le premier trimestre de
grossesse : médiane = 3 tasses, étendue (range) = 0-8, intervalle interquartile
(IQR ou Q1-Q3) = 1-5. Dans cet échantillon de 400 patientes, on peut donc en
déduire qu’un quart des patientes (soit 100) boivent moins d’une tasse de café
par jour, la moitié (soit 200) entre 1 et 5 tasses, et un quart plus de 5 tasses.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques descriptives
29
Boîte à moustaches (boxplot)
8
Max
5
03
Moyenne
2
Médiane
01
0
Min
tasses / jour
Cette figure est réalisée à partir du même exemple ci-dessus portant sur la
consommation de café de patientes lors de leur premier trimestre de grossesse.
La boîte à moustaches {boxplot en anglais) est un autre mode classique de
représentation des différents paramètres de position.
À retenir
Dans un tableau de résultats, on représente habituellement pour une variable
quantitative :
la moyenne et l'écart type (m ± ET) ou la moyenne et l'intervalle de confiance si
la distribution de la variable est gaussienne ;
la médiane et l'étendue ou la médiane et l'intervalle interquartile si la distribu
tion n'est pas symétrique.
Les parenthèses qui suivent une valeur donnée par un paramètre de position
(moyenne ou médiane) dans un article peuvent donc contenir un seul chiffre
(écart type) ou deux chiffres (intervalle interquartile ou IQR, étendue ou range,
intervalle de confiance). Dans un tableau, des annotations définissent quels
paramètres de position et de dispersion ont été utilisés.
P o u r q u oi u t ilis e r p l u t ô t la m é d i a n e q u e la m o y e n n e e t l es I Q R p l u t ô t q u e l es
i n t e r v a ll es d e c o n fi a n c e ? Quand la distribution n'est pas symétrique, ou qu'il y
a des valeurs aberrantes ou extrêmes, la moyenne est « attirée par les extrêmes ».
Pensez à l'exemple du salaire des Français : la moyenne est de 3 000 , or très peu
des salariés français ont un tel salaire ; la médiane est de 1 800 ; les quelques très
gros salaires attirent donc la moyenne mais donnent une piètre représentation de
la rémunération de la majorité des salariés. On préfère donc parler en médiane et
utiliser l'IQR ou le range.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
30
Généralités
Variables qualitatives
• À l’échelle du patient, c’est un oui/non ou un choix entre plusieurs possibilités
(imaginer des cases à cocher).
• À l’échelle de l’échantillon, c’est un pourcentage.
Caractéristique
Exemple
Nominale
Variable qui est représentée par
différentes classes ou catégories
sans hiérarchie possible entre elles
Groupe sanguin (A, B, O, AB)
Sexe (féminin ou masculin)
Ville de résidence
Ordinale
Variable qui est représentée par
différentes classes ou catégories
avec une hiérarchie entre elles.
On peut définir un ordre entre ces
différentes catégories
Résultat d’un score de risque
de l’embolie pulmonaire
(faible risque, risque intermédiaire, risque élevé)
Variable qualitative
Il est possible de transformer une variable quantitative en variable qualitative
ordinale.
1.
Par exemple :
prenons la variable quantitative « Age » de dix individus :
Individus
A
B
C
D
E
F
G
H
I
Âge en
années
45
60
33
98
85
54
59
62
23
J
77
2. transformons la variable quantitative « Âge » en variable qualitative ordinale
à trois classes :
Classes d’âge
Âge < 60 ans
Âge entre 60 et 79 ans
Âge >80 ans
Effectifs par classe
5
3
2
Proportion
50 %
30 %
20 %
Le choix des bornes des classes est important car en fonction de celui-ci les
résultats peuvent varier considérablement :
Classes d’âge
Âge < 40 ans
Âge en 40 et 59 ans
Âge >60 ans
Effectifs par classe
2
3
5
Proportion
20 %
30 %
50 %
Description des variables qualitatives
D escrip tio n d'u ne se ule v aria ble q u alit ativ e
On définit des variables qualitatives à deux (ou plus) modalités :
• ex. : statut vivant/décès = variable à 2 modalités ;
• ex. : groupe sanguin A, B, AB, O = variable à quatre modalités.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques descriptives
31
Afin de décrire ce type de variable au sein d’une population, on réalise un
calcul des fréquences relatives (ce qui correspond à une proportion ou un pourcentage). Par exemple, au sein d’une population de 200 personnes on retrouve :
• 150 femmes et 50 hommes (correspondant à une variable qualitative nominale) ;
• 20 personnes avec une hypertension artérielle (HTA) sévère, 60 avec une HTA
modérée et 120 sans HTA (correspondant à une variable qualitative ordinale).
On calcule alors les fréquences relatives pour la variable « sexe » et la variable
« HTA » :
Sexe
Total
Masculin
Féminin
Effectif
150
50
200
Fréquence relative
75 %
25 %
100 %
HTA
Non
Total
Modérée
Sévère
Effectif
120
60
20
200
Fréquence
relative
60 %
30 %
10 %
100 %
Les femmes représentent 75 % de l’échantillon.
Les individus avec HTA sévère représentent 10 % de l’échantillon.
D escrip tio n co njoin t e d e d e u x v aria bles q u alita tiv es
Construction d'un tableau de contingence
Dans l’exemple précédent, on a décidé de décrire les variables qualitatives
« sexe » et « HTA » de manière séparée. Il est également possible de les décrire
de manière simultanée ce qui permettra éventuellement par la suite de réaliser
des statistiques comparatives. On pourra dans l’exemple se demander si l’HTA
sévère est plus fréquente chez les femmes ou chez les hommes. On commence
par construire un tableau de contingence qui correspond au calcul des effectifs
partiels :
Total
Absence d’HTA
HTA modérée
Hommes
25
15
10
50
Femmes
95
45
10
150
Total
120
60
20
200
HTA sévère
Dans cet échantillon de 200 individus, 25 individus sont des hommes sans
HTA, 10 sont des femmes avec HTA sévère, 45 sont des femmes avec HTA
modérée.
►
Remarque : la ligne et la colonne « total » correspondent aux effectifs
marginaux qui sont équivalents à la description indépendante de chacune
des deux variables.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
32
Généralités
Calcul des fréquences partielles
Les fréquences partielles correspondent au calcul de la proportion des effectifs
partiels au sein de l’échantillon total. Il faut pour cela diviser chaque effectif
partiel par le nombre total de l’échantillon (ici 200) :
Absence d’HTA
HTA modérée
Total
HTA sévère
Hommes
25 (12,5 %)
15 (7,5 %)
10 (5 %)
50 (25 %)
Femmes
95 (47,5 %)
45 (22,5 %)
10 (5 %)
150 (75 %)
Total
120 (60 %)
60 (30 %)
20 (10 %)
200 (100 %)
Dans cet échantillon : 47,5 % sont des femmes sans HTA, 5 % sont des
hommes avec HTA sévère, 7,5 % sont des hommes avec HTA modérée.
► Remarque : on retrouve les fréquences marginales propres à chaque
variable dans la ligne et dans la colonne « total ».
Calcul des fréquences conditionnelles
Il s’agit ici de calculer les fréquences de distribution d’une variable au sein
d’une des modalités de l’autre variable.
Distribution conditionnelle de la variable « sexe » en fonction de la variable
« HTA » (pourcentage en colonne) :
Absence d’HTA
HTA modérée
HTA sévère
Total
Hommes
25 (20,8 %)
15 (25 %)
10 (50 %)
50
Femmes
95 (79,2 %)
45 (75 %)
10 (50 %)
150
Total
120 (100 %)
60 (100 %)
20 (100 %)
200
Parmi les individus avec une HTA sévère, on retrouve 50 % d’hommes, alors
que parmi les individus sans HTA on retrouve seulement 20,8 % d’hommes.
Distribution conditionnelle de la variable « HTA » en fonction de la variable
« sexe » (pourcentage en ligne) :
Absence d’HTA
HTA modérée
HTA sévère
Total
Hommes
25 (50 %)
15 (30 %)
10 (20 %)
50 (100 %)
Femmes
95 (63,33 %)
45 (30 %)
10 (6,67 %)
150 (100 %)
Total
120
60
20
200
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques descriptives
33
Parmi les femmes, on retrouve 6,67 % d’HTA sévère, alors que parmi les
hommes on en retrouve 20 %.
À retenir
Pour comprendre un tableau, et les questions qui s'y rapportent, il est indispensable
de comprendre si les pourcentages donnés sont les fréquences partielles ou les
fréquences conditionnelles en ligne ou en colonne. Vous pouvez vous y retrouver
en faisant le total des pourcentages en ligne et en colonne. S’il n ’ y a pas de donnée
manquante, le pourcentage en ligne (ou en colonne) vaut 100 °/o dans le cas de
fréquences conditionnelles en ligne (ou en colonne).
M esures d e l'é t a t d e san t é d'u ne p o p ula tio n
Taux et notion de personnes-temps à risque
Ta ux
Un taux est un indicateur qui représente la fréquence de survenue d’un événement au cours du temps (taux d’incidence, taux de mortalité, etc.). Un taux se
calcule dans le cadre d’une étude longitudinale : par exemple, taux de mortalité
au sein d’une population x = 5 décès pour 100 000 habitants par an.
On peut calculer :
• le taux brut prenant en compte la survenue de l’événement au cours du temps
au sein de l’ensemble de la population étudiée ;
• des taux spécifiques prenant en compte ce taux au sein d’une tranche de la
population étudiée (par exemple, taux d’incidence spécifique chez les femmes).
N o tion d e p erso n n es-t e m ps à risq u e
Le calcul d’un taux nécessite au préalable de calculer le nombre de personnestemps (PT) au sein de la population considérée. Les PT regroupent au sein
d’une même unité de mesure le nombre de personnes et le temps pendant lequel
ces personnes sont exposées au phénomène (ou au risque) étudié.
Ex e m ple a v ec calcul d'u n t a u x d'incid e nce
• Incidence = nombre de nouveaux cas au cours d’une période de temps.
• Personnes-temps à risque exprimées en personnes-années = 17.
• Nombre de nouveaux cas = 2.
• Taux d’incidence = 2/17 = 0,12 = 12 nouveaux cas par an pour 100 personnesannées exposées au risque.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
34
Généralités
Indicateurs de morbidité
Incide nce
L’incidence correspond au nombre de nouveaux cas d’une maladie survenant
au sein d’une population.
Il s’agit d’une mesure longitudinale.
Le taux d’incidence est un calcul qui reflète la vitesse d’apparition d’une
maladie dans une population.
Calcul du taux d’incidence : TI - N/PT
Avec :
• TI : taux d’incidence ;
• N : nombre de nouveaux cas de la maladie constatés dans la population étudiée
pendant la période de temps étudiée ;
• PT : nombre de personnes-temps à risque calculé dans la population étudiée
pendant la période de temps étudiée.
Pré vale nce
La prévalence est le pourcentage d’individus malades dans une population à un
moment donné.
Il s’agit d’une mesure transversale.
Calcul de la prévalence : P = n/N
Avec :
• P : prévalence ;
• n : nombre de personnes malades dans la population étudiée à un instant t ;
• N : effectif total de la population étudiée.
La prévalence dépend de deux éléments :
• l’incidence : plus le nombre de cas incidents (nouveaux cas) augmente, plus le
nombre de cas prévalents augmente ;
• la durée d’évolution de la maladie : plus la maladie évolue longtemps, plus le
nombre de cas prévalents augmente.
Par exemple, une maladie qui, auparavant, entraînait le décès rapidement et
qui dispose depuis peu de temps d’un traitement qui la transforme en maladie
chronique verra sa prévalence augmenter, et cela sans que l’on observe d’augmentation de nouveaux cas.
Indicateurs de mortalité
Ta ux d e m ort alité
• Taux de mortalité brut : le taux de mortalité brut est égal au nombre de décès
divisé par le nombre de personnes-temps à risque au sein d’une population entière.
• Taux de mortalité spécifique : le taux de mortalité spécifique est égal au nombre de décès divisé par le nombre de personnes-temps à risque au sein d’un
sous-groupe d’une population. Par exemple, le taux de mortalité spécifique
dans la classe d’âge des 40-49 ans.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques descriptives
35
M ort alit é pré m a t uré e
• Décès prématuré : par définition, décès avant l’âge de 65 ans.
• Taux de mortalité prématurée = taux de mortalité spécifique chez la souspopulation des moins de 65 ans.
• Années potentielles de vie perdues = nombre d’années entre un décès prématuré et 65 ans :
- par exemple, pour un sujet décédé à 30 ans, années de vie perdues = 35 ans ;
- cela permet de nuancer le taux de mortalité prématurée. Deux populations avec un taux de mortalité prématurée identique mais avec un nombre
d’années potentielles de vie perdues différentes n’auront pas forcément les
mêmes problématiques.
Lé t alité
La létalité correspond à la proportion de personnes décédées secondairement à
une maladie au sein d’une population atteinte de cette maladie.
In dica t e urs d e m ort alit é f œ t o -in f a n tile
• Indicateurs prenant en compte la mortalité avant l’âge de 1 an.
• Différents indicateurs en fonction de la période de vie considérée :
Mortalité foeto-infantile
Z
X_____________
Mortalité infantile
X
2
z
__________
x
X
2
Mortalité post-néonatale
Mortalité néonatale
X
2
Z____________________
X
z
X
X___________ 2
Mortalité néonatale précoce
z
x
X__________ 2
Mortalité néonatale tardive
z
Mortalité périnatale X
____________________ X
2
X
Mortinatalité Z
\__________ 2
22 semaines
d'aménorrhée ou
foetus > 500g
Naissance
7 jours
28 jours
1 an
Standardisation des taux
Les taux dépendent de la structure d’âge de la population étudiée. Le taux de
mortalité d’un pays dépend évidemment de la proportion de personnes plus
âgées qui compose ce pays. Pour comparer les taux entre des pays de structures
d’âge différentes, on utilise la standardisation.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
36
Généralités
Sta n d ardisa tio n direct e o u m é t h o d e d e la p o p ula tio n t y pe
On applique les taux spécifiques de chaque tranche d’âge du pays étudié à une
population type (population du monde, par exemple). On calcule ensuite le
taux standardisé à partir du nombre de décès attendus si la structure d’âge était
celle de la population type. Les taux de plusieurs pays standardisés sur la même
population type deviennent ainsi comparables.
St an d ardisatio n in directe o u m é t h o d e d u t a u x t y pe
On applique les taux spécifiques par âge de la population type (ou de référence)
à chaque tranche d’âge du pays étudié. On obtient ainsi un nombre de décès
attendus. En divisant le nombre de décès observés dans la population étudiée
par le nombre de décès attendus, on obtient un ratio standardisé (standardized
incidence ratio ou SIR, standardized mortality ratio ou SMR). Si le ratio est
supérieur à 1, la mortalité est plus importante dans la population étudiée que
dans la population de référence. S’il est inférieur à 1, elle est moins importante.
On utilise habituellement les taux standardisés (méthode directe) pour
comparer des pays et les ratios standardisés (méthode indirecte) pour comparer
une population plus petite à une unité plus grande (ex. : une région versus un
pays ou un pays versus le monde).
Phén o m ène d e fluct u atio n d'échan tillo n n a g e e t
in t ervalles d e co n fia nce
Principe
En épidémiologie, on souhaite décrire un phénomène au sein d’une population.
Il est donc nécessaire de mesurer ce phénomène chez les individus constituant
cette population. Malheureusement, il est le plus souvent impossible de réaliser
la mesure chez tous les individus, ce qui prendrait énormément de temps et
coûterait beaucoup d’argent.
On décide alors de mesurer le phénomène chez un groupe plus restreint
d’individus représentatif de la population. Ce groupe d’individus correspond
à l’échantillon qui a été choisi aléatoirement au sein d’une population source.
Cet échantillon est destiné à représenter la population cible (pour la définition
de ces termes, voir fiche 2).
La valeur d’un phénomène obtenu dans un échantillon est appelée « estimateur ponctuel » de la valeur de ce phénomène dans la population cible. L’intervalle de confiance représente la zone dans laquelle la « valeur vraie » dans la
population cible a 95 % de chances de se trouver.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques descriptives
37
Fluctuations d'échantillonnage et intervalle de confiance
Prenons l’exemple suivant :
• vous souhaitez calculer la moyenne du taux d’hémoglobine glyquée (HbAlc)
au sein d’une population de 1 000 patients diabétiques ;
• vous tirez au sort pour cela un échantillon de 10 patients et vous mesurez
chez eux leur taux d’HbAlc ;
• vous obtenez une moyenne de 8,8 %, il s’agit d’une estimation ponctuelle de
la moyenne du taux d’HbAlc de la population de 1 000 patients ;
• vous décidez d’effectuer un autre tirage au sort de 10 patients et vous réitérez
les mesures, vous obtenez cette fois-ci une moyenne de 8,1 % ; vous recommencez et vous obtenez cette fois-ci 9,2 % ;
• vous pouvez ainsi effectuer des mesures à l’infini au sein de plusieurs échantillons de 10 patients et vous obtiendrez des mesures à chaque fois différentes ;
• ces différents résultats issus des différents échantillons se distribuent autour
de la véritable moyenne de la population de 1 000 patients que vous souhaitez
estimer ;
• ce phénomène est le reflet des fluctuations d’échantillonnage.
Comment prendre en compte ce phénomène ? Ce phénomène est pris en
compte par le calcul d’un intervalle de confiance (IC) souvent défini à 95 %.
Dans le cadre de notre exemple, on retrouve une moyenne estimée à 8,8 %
[IC95 % : 7,8 %-9,8 %].
Cela signifie que la vraie moyenne a 95 % de chances de se trouver entre 7,8
et 9,8 %.
Comment limiter les fluctuations d’échantillonnage ?
• En augmentant la taille de l’échantillon l’estimation sera de plus en plus précise.
• Si l’on réalise la mesure d’HbAlc chez 999 des 1 000 malades, on se rapprochera de très près de la véritable moyenne de la population et si l’on réalise la
mesure chez les 1 000 patients on connaîtra la vraie moyenne.
• Donc lorsque l’on augmente la taille de l’échantillon, on limite le phénomène
de fluctuations d’échantillonnage et on diminue la distance entre les bornes de
l’intervalle de confiance à 95 %.
• Pour un échantillon de 100 patients, on retrouve une moyenne à 8,6 %
[IC95 % : 8,1 %- 9,1 %].
• Pour un échantillon de 500 patients, on retrouve une moyenne à 8,7 %
[IC95 % : 8,5 %- 8,9 %].
En pratique, chaque mesure estimée grâce à la constitution d’un échantillon
vue précédemment (moyenne, proportion, prévalence, incidence, taux de mortalité, etc.) doit être accompagnée des résultats du calcul de son intervalle de
confiance à 95 %.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
38
Généralités
En pra tique
Ex e m ple 1 (ED N 2017)
Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML,
Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D,
Nutt CL, McNamee JJ, Reschreiter H, Breen A, Lin KD, Ashby D.
Levosimendan for the prévention of acute organ dysfunction in sepsis.
N Engl J Med 2016 ; 375 : 1638-48.
Le tableau suivant est donné dans un essai clinique comparant un vasodilatateur
(le lévosimendan) à un placebo sur la mortalité du choc septique. Ce tableau
compare les caractéristiques à l’inclusion des deux groupes randomisés.
Baseline Characteristics*.
Levosimendan
(N = 258)
Characteristic
Placebo
(N = 257)
69 (58-77)
Médian âge (IQR) - yr
67 (58-75)
Male sex - no. ( %)
145 (56.2)
144 (56.0)
Médian weight (IQR) - kg
76 (65-90)
80 (68-91)
Médian body-mass index (IQR)
27 (23-30)
28 (24-32)
Médian time from shock to
randomization (IQR) - hr
16 (10-21)
15 (10- 20)
Médian SOFA score (IQR)
10 (8-12)
10 (7- 12)
Stroke volume - ml
55.7 (40.0-73.5)
67.0 (49.4-79.7)
* There were no significant between-group différences in the characteristics at baseline, except for
stroke volume (P = 0.02).
Que peut-on dire du tableau ci-dessus ?
Il aurait fallu cocher...
Commentaires
25 % des patients du groupe lévosimendan
avaient un index de masse corporelle (IMC)
supérieur à 30
Le 3e quartile de l’IMC correspond bien
à 30 kg/m2
Le délai médian entre le choc et la
randomisation était comparable entre les
2 groupes
En effet, une différence d’une heure de
délai moyen entre les groupes ne correspond pas à une différence cliniquement
pertinente
Le groupe lévosimendan comprenait
145 hommes
Le signe « no. » signifie « nombre
d’observations »
Le groupe de référence pour l’étude du
sexe était le sexe féminin
Le pourcentage d’hommes est donné par
rapport aux femmes. La catégorie de référence implicite est donc bien les femmes
1/4 des patients du groupe lévosimendan
avaient un score SOFA entre 10 et 12
On trouve bien 25 % de la distribution
entre la médiane et le 3e quartile (voir
plus bas)
SOFA : sequential organ failure assessment.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques descriptives
Il n’aurait pas fallu cocher...
Commentaires
Le score SOFA à la randomisation était
compris entre 8 et 12 dans le groupe
lévosimendan
Cette affirmation correspondrait à
l’étendue {range) du score SOFA et pas à
l’intervalle interquartile (1QR)
La moyenne d’âge dans le groupe
placebo était de 69 ans
C’est la médiane qui est représentée
La randomisation était déséquilibrée
À l’évidence, le ratio de randomisation
était de 1:1
Plus de la moitié des patients inclus dans
l’étude était des femmes
SOFA : sequential organ failure assessment.
Le pourcentage d’hommes inclus dans
chaque groupe dépasse les 50 %
39
Pour mémoire, répartition des patients entre les quartiles :
Fréquence simple
Classes
[Xmin ; Q1 [
25 %
[Q1 ; Q2 [
25 %
[Q2 ; Q3 [
25 %
[Q3 ; Xmax [
25 %
Ex e m ple 2 (ED N 2016)
Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai
Consumption of coffee and caffeine-containing beverages and oral clefts :
a population-based case-control study in Norway. Am J Epidemiol 2009 ;
169 : 1216-22.
Le tableau ci-dessous est issu d’une étude cas-témoin comparant les caractéristiques
de mères ayant donné naissance à des fentes palatines seules d’une part, et des
fentes labiopalatines d’autre part à celles de mères ayant donnés naissance à des
enfants indemnes {control group). 1 336 patientes ont été incluses dans cette étude.
Démographie and Other Characteristics of Participants in the Case-Control
Study of Maternai Consumption of Caffein-containing. Beverages and Oral
Clefts, Norway, 1996-2001.
Cleft Lip With or Without Cleft Palate Only (n = 196)
Cleft Palate (n = 377)
Médian
(25th, 75th
percentile)3
%
Mean
(SD)
Médian
(25th, 75th
percentile)3
%
Mean
(SD)
Control Group (n = 763)
Médian
(25th, 75th
percentile)3
%
Mean
(SD)
Mother’s
characteristics
Coffee
consumption
before
pregnancy,
cups/day
3.0(1.0,4.1)
3.0 (1.0,5.0)
3.0 (1.0,4.3)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
40
Généralités
Cleft Lip With or Without Cleft Palate Only (n = 196)
Cleft Palate (n = 377)
Médian
(25*, 75*
percentile)3
%
Mean
(SD)
Médian
(25*, 75*
percentile)3
%
Mean
(SD)
Médian
(25*, 75*
percentile)3
%
Smoking
during the
first trimesterb
44.1
36.8
31.9
Working
during the
first trimester
76.3
79.5
83.1
1.0 (1.0,2.0)
1.0 (1.0,2.0)
Alcohol
2.0 (1.0,2.0)
consumption,
drinks/sitting
Mean
(SD)
2.0 (07,3.0)
2.0 (0.4,3.0)
2.0(07,4.0)
Coffee
consumption
during the
first trimester,
cups/day
Control Group (n = 763)
Age at
delivery, years
28.9
(4.9)
28.9
(5.1)
29.2
(4.8)
Height, cm
168.6
(5.7)
166.9
(6.6)
167.7
(6.0)
Abbreviation : SD, standard déviation.
a Intake among consumers only.
b Ail levels of active smoking versus nonsmoking and passive smoking.
D’après le tableau ci-dessus :
Il aurait fallu cocher...
Commentaires
La fréquence du tabagisme maternel
actif au cours du premier trimestre de
grossesse était de 31,9 % dans le groupe
contrôle
En effet, cette valeur est un pourcentage,
comme indiqué dans l’en-tête du tableau
573 cas de fente labiopalatine (FLP) ou
fente palatine seule (FPS) ont été inclus
au total dans cette étude
Cette valeur est obtenue en sommant les
effectifs des 2 groupes de cas (377 + 196)
Parmi les femmes consommant du
café avant la grossesse, 25 % en
consommaient moins de 1 tasse par jour
Le 1er quartile de la consommation
de café est en effet à 1 tasse dans les
3 groupes. Attention, la note de bas
de page a indique clairement que ces
statistiques descriptives ne portent que
sur les consommatrices
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques descriptives
Il n’aurait pas fallu cocher...
Commentaires
Avant la grossesse, 75 % des femmes
consommaient au moins 1 tasse de café
par jour
Même si le 1er quartile est effectivement
à 1 dans les 3 groupes, cette formulation
est fausse en raison de la note de bas de
page a qui précise que les statistiques
descriptives ne sont calculées que chez les
consommatrices
79,5 % des mères travaillant durant le
premier trimestre de grossesse ont donné
naissance à un nouveau-né avec une
fente palatine seule (FPS)
La formulation exacte serait « 79,5 %
des patientes ayant donné naissance à
un enfant avec une fente labiopalatine
travaillaient pendant le premier
trimestre ». Dans le tableau de
l’exemple 2, les pourcentages sont donnés
en colonne
50 % des mères du groupe témoin
consommaient au moins 2 tasses de café
quotidiennement pendant le premier
trimestre de grossesse
Cette proposition est fausse en raison de
la note de bas de page a
41
Ex e m ple 3
Dans une étude descriptive à propos du taux de C-reactive protein (CRP) en
mg/L portant sur 100 patients atteints de pneumopathie à pneumocoque à la
phase précoce, on peut lire que le taux moyen de CRP est de 70 mg/L avec une
étendue (range) de 7 à 300 mg/L, une médiane de 110 mg/L, un intervalle interquartile de 80 à 150 mg/L. Il est vrai que :
Il aurait fallu cocher...
Commentaires
Compte tenu de la distribution des
valeurs de la CRP, la médiane est plus
informative que la moyenne de la CRP
Il existe des valeurs extrêmes semblant
« tirer » la moyenne vers le bas (valeur
minimale : 7 mg/L), il existe un écart
significatif entre la moyenne et la médiane
semblant indiquer que la distribution
n’est pas symétrique. La médiane semble
donc plus informative que la moyenne
pour décrire cette distribution
1/4 des patients ont une valeur de CRP
de moins de 80 mg/L
C’est la signification de la première
valeur de l’intervalle interquartile
(1er quartile ou Ql)
1/4 des patients ont une valeur de CRP
entre 110 et 150 mg/L
1/4 de la distribution se trouve entre la
médiane et le 3e quartile
Aucun patient n’a une CRP supérieure à
300 mg/L dans cette étude
L’étendue (range) étant de 7 à 300, cela
signifie que la valeur maximale est de
300 et la valeur minimale de 7 mg/L
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
42
Généralités
Il n’aurait pas fallu cocher...
Commentaires
Les valeurs de CRP ont
probablement une distribution
gaussienne
Dans une distribution symétrique, notamment la
distribution normale, la moyenne et la médiane
sont très proches. Ici, la médiane (110) est bien
plus importante que la moyenne (70), ce qui
semble indiquer que certaines valeurs basses
« extrêmes » tirent la moyenne vers le bas
La valeur réelle de la CRP dans la
population cible a 95 % de chances
de se trouver entre 80 et 150 mg/L
Cette formulation serait exacte si l’intervalle
donné était un intervalle de confiance à 95 %
La valeur réelle de la CRP dans la
population cible a 50 % de chances
de se trouver entre 80 et 150 mg/L
50 % des valeurs de l’échantillon se trouvent
dans cet intervalle, mais cela ne permet pas de
conclure sur la précision de l’estimateur ponctuel.
Seul un intervalle de confiance le permet
Ex e m ple 4 (ED N t est 2021)
Hoffmann MHK, Shi H, Schmitz BL, Schmid FT, Lieberknecht M, Schulze
R, et al. Noninvasive coronary angiography with multislice computed
tomography. JAMA 25 mai 2005 ; 293(20) : 2471-8.
The mean (SD) interval between the multislice computed tomography scan
and conventional coronary angiography was 16.3 (15.1) days, while the médian (IQR) was 10 (7-15) days.
Pour le délai entre le scanner multicoupe 16 barrettes et la coronarographie
conventionnelle sélective, quelle(s) est (sont) la (les) statistique(s) descriptive(s)
la (les) plus appropriée(s) ?
Il aurait fallu cocher...
La médiane
L’intervalle interquartile
(interquartile range, IQR)
L’étendue (range)
Il n’aurait pas fallu cocher...
La moyenne
Commentaires
La distribution de ce délai est clairement asymétrique,
la médiane et la moyenne étant assez éloignées. Il serait
donc préférable de décrire la variable par sa médiane et
son intervalle interquartile qui sont moins influencées
par les valeurs extrêmes, ou l’étendue, qui permet
d’identifier les valeur aberrantes
Commentaires
L’écart type
La moyenne et l’écart type sont préférés en cas de distribution symétrique des valeurs (c’est-à-dire autant
d’individu en dessous et au-dessus de la moyenne),
auquel cas la moyenne est très proche de la médiane
La variance
La variance correspond à l’écart type au carré
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 5
Statistiques comparatives
et mesures d’association
M esures d'associatio n e n tre une e x p ositio n
e t un évé ne m e n t
Calcul d'un risque
Dif fére nce a bsolu e d u risq u e o u dif f ére nce d e risq u e (DR)
• Correspond à la différence absolue des risques entre deux groupes, en points
de pourcentage.
• Exemple : si le risque de déclarer la grippe chez le groupe vacciné est de 30 %
et que le risque chez le groupe non vacciné est de 70 %, la réduction absolue du
risque est de 70 % — 30 % = 40 %. Cela signifie qu’en vaccinant 100 individus,
on évite 40 cas de grippe. On parle parfois d’une diminution de 40 points de
pourcentage.
Risq u e rela tif (RR)
• Le risque relatif est le rapport entre le risque chez les exposés et le risque chez
les non-exposés. La diminution relative du risque en pourcentage (comparable
à la réduction du prix pendant les soldes) est égale à « (1 — RR) X 100 ».
• Dans notre exemple précédent, le RR correspond à 0,3/0,7 = 0,44. Cela signifie que la vaccination « multiplie le risque de grippe » par 0,44 ; ce qui correspond à une réduction relative de (1 — 0,44) X 100 = 56 % du nombre de cas
de maladie chez les vaccinés, ou encore que le RR est de 0,44 pour les sujets
vaccinés par rapport aux sujets non vaccinés.
• On peut aussi dire que le RR des sujets non vaccinés par rapport aux sujets
vaccinés est de 0,7/0,3 = 2,3 ; soit une augmentation de (1 — 2,3) X 100 =
130 % du RR chez les non-vaccinés par rapports aux vaccinés.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Généralités
44
Prenons l’exemple du vaccin avec les patients non vaccinés comme référence :
Si le risque relatif est de...
Le risque relatif des patients vaccinés par rapport
aux patients non vaccinés diminue de...
1
0%
0,8
20 %
0,65
35 %
0,55
45 %
Prenons l’exemple du vaccin avec les patients vaccinés comme référence :
Si le risque relatif est de...
Le risque relatif des patients non vaccinés par rapport
aux patients vaccinés augmente de...
1
0%
1,5
50 %
1,7
70 %
2
100 %
8,5
750 %
À retenir^
Attention à la différence entre risque absolu et risque relatif pour les pourcentages !
Variables qualitatives = comparaison de pourcentages
Exemple - une étude sur une chimiothérapie dans le traitement d’un lymphome
montre à 1 an une réduction de la mortalité (50 % de mortalité dans le groupe
placebo, et 25 % dans le groupe traité) :
• la différence absolue de la mortalité due au traitement est de 50 % — 25 % =
25 points de pourcentage (on passe de 50 % à 25 % de mortalité) ;
• la réduction relative de mortalité due au traitement est de 100 % — 25 %/50 %,
soit 1 — 0,5 = 50 % de réduction relative du risque (le taux de mortalité a été
divisé par 2) ;
• pour la différence absolue, on parle parfois d’une différence en « points de
pourcentage ».
Variables quantitatives = comparaison de moyennes
Exemple - une étude sur un traitement antalgique permet contre placebo une
diminution de la douleur mesurée en millimètres sur une échelle visuelle numérique (40 mm dans le groupe traité, 60 mm dans le groupe placebo) :
• le traitement permet une réduction absolue de la douleur de 20 mm ;
• la réduction relative de la douleur est de 40/60 = 0,66, soit une diminution
relative de 100 — 66 = 34 % de la douleur (la douleur diminue d’un tiers).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques comparatives et mesures d’association
45
In t ervalle d e co n fia nce d'un e dif f ére nce d e risq ue e t d'u n risq u e rela tif
• Si le risque est identique entre les deux groupes, la réduction absolue est
égale à 0 %. Si l’intervalle de confiance d’une différence absolue en points de
pourcentage exclut la valeur 0, on peut raisonnablement exclure le fait que la
valeur vraie de cette différence absolue soit égale à 0 (ce qui revient à exclure
l’hypothèse HO : réduction du risque absolu = 0).
• Si le risque est identique entre les deux groupes, le risque relatif (RR) est égal
à 1. Si l’intervalle de confiance du RR exclut la valeur 1, on peut raisonnablement exclure le fait que les risques soient identiques (ce qui revient à exclure
l’hypothèse HO : RR = 1).
N o m bre d e p a tie n ts à trait er (n u m ber needed to tre a t ou N N T)
• Le NNT correspond au nombre de patients à traiter pour éviter un événement.
• Son calcul est l’inverse de la réduction absolue du risque : NNT = 1/DR.
• Dans notre exemple précédent, NNT = 1/0,4 = 2,5 ; il est donc nécessaire de
vacciner entre deux et trois individus pour éviter la survenue d’un cas de maladie.
Fractio n é tiolo giq ue
Le « risque attribuable pour les exposés » (ou « fraction étiologique ») mesure
la proportion de cas de la maladie que l’on peut attribuer au facteur de risque
parmi les sujets exposés à ce facteur (par exemple, pourcentage des cas de cancer du poumon dus au tabagisme parmi les fumeurs).
La fraction étiologique vaut : (RR - 1)/RR.
Ainsi, si le RR vaut 4, la fraction étiologique vaut : (4 — 1 )/4 = 0,75.
C’est-à-dire que 75 % des cas survenus chez des sujets exposés peuvent être
attribués à l’exposition au facteur de risque, et auraient donc pu être évités si
ces sujets n’avaient pas été exposés.
Prenons l’exemple du cancer du poumon :
• si le RR vaut 4 parmi la population fumeuse par rapport à la population non
fumeuse, cela signifie que pour 4 cas de cancer chez les fumeurs on a 1 cas de
cancer chez les non-fumeurs pour des populations identiques en effectif ;
• imaginons maintenant que les 4 patients fumeurs n’aient pas fumé au cours
de leur vie, ils rejoindraient alors le risque de la population générale. On aurait
alors parmi ces 4 patients non pas 0 cas de cancer mais bien 1 cas de cancer, ce
qui correspond au risque dans la population générale ;
• donc en pratique, on peut dire que le tabac explique 3 cas de cancer sur 4
chez les patients fumeurs, soit 75 % des cas survenus chez les patients exposés
au tabac. Ce pourcentage correspond bien à la fraction étiologique évoquée
ci-dessus en cas de RR à 4.
Calcul de rapports
Ét u d e d e co h ort e : calcul d'un risq u e rela tif o u d'un h a z a rd r a tio
Le RR est le rapport du risque entre les sujets exposés et les sujets non exposés.
Le RR peut être calculé dans les études (prospectives ou rétrospectives) dans
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
46
Généralités
lesquelles le ratio malades/non malades n’est pas fixé par l’étude (c’est-à-dire
toutes les études à l’exception des études cas-témoins).
Tableau de contingence.
Indemne
Malade
Exposé
a
b
Non exposé
c
d
RR = —
In t erpré ta tio n d u risq u e rela tif (RR)
• RR < 1 (par exemple : RR = 0,78 [IC95 % : 0,71-0,85]) : l’association entre
l’événement et le facteur d’exposition est négative. L’exposition étudiée entraîne
une diminution de la survenue de l’événement, c’est un facteur protecteur.
• RR > 1 (par exemple : RR = 4,78 [IC95 % : 3,80-5,76]) : l’association entre
l’événement et le facteur d’exposition est positive. L’exposition étudiée entraîne
une augmentation de la survenue de l’événement, c’est un facteur de risque.
• Il reflète directement l’effet de l’exposition sur la survenue de la maladie avec
exactitude. Par exemple, en cas de RR = 5, cela signifie que l’exposition multiplie par 5 la survenue de l’événement (on retrouve 5 fois plus l’événement chez
les sujets exposés).
H azard ra tio (HR)
Il est équivalent au RR et s’interprète de la même façon. Il est utilisé dans la
comparaison des risques instantanés de survenue d’un événement entre exposés
et non-exposés dans les modèles statistiques étudiant un événement dépendant
du temps (comme le modèle de Cox ; on parle aussi d’analyse de survie).
Ét u d e cas-t é m oins : calcul d'un o d ds ra tio (OR)
• L’OR peut être calculé dans tous les types d’études, mais c’est la seule mesure
d’association que l’on peut calculer dans les études cas-témoins.
• Dans les études cas-témoins, le calcul de l’incidence ou de la prévalence ou
des risques relatifs n’est pas possible car le ratio cas/témoins est fixé par l’étude.
[il
1-R.
OR=HrH
__o
1-R o 7
a/a + c
c / a+c
b/b + d
d/b + d
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques comparatives et mesures d’association
47
• Signification de l’OR : il s’interprète de la même façon que le RR à la différence près qu’il n’est pas le reflet exact de l’augmentation ou de la diminution
du risque en cas d’exposition. Lorsque la maladie ou l’événement étudié touche
moins de 10 % de la population étudiée, l’OR est alors une bonne estimation
du RR et peut s’interpréter comme tel.
À retenir
On peut calculer un OR dans toutes les études.
L'OR est la seule mesure d'association que l'on peut calculer dans une étude
cas-témoins.
L’ OR est un estimateur du RR d'autant plus fiable que l'événement étudié
est rare.
Si la fréquence de l'événement est < 10 °/o, on estime que l'OR évalue
correctement le RR.
In t erv alle d e co n fia nce (IC)
En complément
V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l e s i n t e r v all e s d e c o n fi a n c e :
h t t ps: / / y o u t u .b e / K 2 h M 6 Q Q q p O s
Une valeur d’OR ou RR sans son intervalle de confiance n’est pas suffisante.
Afin de définir une association significative, il est nécessaire que l’intervalle de
confiance à 95 % ne comprenne pas la valeur 1 :
• intervalle de confiance comprenant 1 —» association non significative (on ne
rejette pas l’hypothèse nulle). Par exemple, RR (ou OR) = 2,43 [IC95 % : 0,864,00] ;
• intervalle de confiance ne comprenant pas 1 —> association significative (on
rejette l’hypothèse nulle). Par exemple, RR (ou OR) = 1,78 [IC95 % : 1,312,25].
On distingue deux situations en fonction de la valeur du rapport :
• OR ou RR < 1 (par exemple, OR = 0,78 [IC95 % : 0,71-0,85])
l’association entre l’événement et le facteur d’exposition est négative. L’exposition
étudiée entraîne une diminution de la survenue de l’événement ;
• OR ou RR > 1 (par exemple, OR = 4,78 [IC95 % : 3,80-5,76]) -> l’association entre l’événement et le facteur d’exposition est positive. L’exposition
étudiée entraîne une augmentation de la survenue de l’événement.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Généralités
48
Corrélation et concordance
Le coefficient de corrélation permet d’étudier la relation entre deux variables
quantitatives. Il quantifie le degré de liaison entre deux variables mais ne préjuge pas d’une éventuelle relation de causalité. Le coefficient de corrélation noté
r prend une valeur qui varie entre - 1 et 1. La valeur 0 correspond à l’absence
de corrélation. Les valeurs - 1 et 1 correspondent à une corrélation parfaite
(c’est-à-dire que les points sont tous alignés sur une même droite dont la pente
est 1, la relation entre les variables est de type Y = -X ou Y = X). Les valeurs
négatives correspondent à une corrélation négative (lorsque les valeurs prises
par X augmentent, les valeurs de Y diminuent, et inversement) et les valeurs
positives correspondent à une corrélation positive (lorsque les valeurs prises
par X augmentent, les valeurs de Y augmentent). Le coefficient de corrélation
s’accompagne généralement d’un test de signification dont l’hypothèse nulle est
HO : coefficient de corrélation = 0. On distingue le coefficient de corrélation de
Pearson (qui nécessite une distribution gaussienne des variables), et le coefficient de corrélation de Spearman qui n’a pas cette contrainte.
Le coefficient de détermination (r2) correspond au carré du coefficient de
Pearson. C’est le pourcentage de la variabilité d’une variable que l’on peut
expliquer par l’autre variable. Par exemple, admettons que le poids soit corrélé
à la taille avec un r (de Pearson) à 0,7 dans un échantillon. Ceci correspond
à un r2 = 0,72 = 0.49. La variabilité du poids est donc expliquée à 49 % par
la variation de la taille. Ce qui veut dire que 51 % de la variabilité du poids
s’explique par d’autres facteurs (la composition corporelle notamment !).
80 -
70 60 50 -
40 -
.
•
20 -
30 -
*
1
---------- r
5 10
1
15
•
1
20
---- 1------------- 1------------- 1------------- 1------------- 1
5
10
15
20
X
1
25
X
Graphique 1 : r = - 0,90 ; p < 0.05 (Corrélation
négative entre X et Y)
Graphique 2: r = 1 ; p < 0.05 (Corrélation positive
parfaite entre X et Y, les points sont parfaitement
alignés)
25 -
25 “ I
20 -
20 -
15 -
15 -
10 -
10 -
5 -
5 -
30
40
50
Y
60
70
80
Graphique 3: r = - 0,90; p < 0.05 (même
interprétations que le graphique 1 malgré X et Y
interchangés au niveau des axes).
25
--------------- i--------------------1------------------- 1r~
40
60
80
Y
Graphique 4: r = -0,22; p = 0,30 (Absence de
corrélation significative)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques comparatives et mesures d’association
49
La concordance est plus exigeante que la corrélation. Elle établit dans quelle
mesure deux techniques différentes sont en accord pour mesurer la même
chose. Par exemple, pour étudier la relation entre le poids et la taille, on utilise
la corrélation (de Pearson ou de Spearman). Pour étudier la relation entre la
formule MDRD et la formule CKDepi pour la mesure du DFG, on utilisera
une technique de concordance (le coefficient de corrélation intraclasse car la
variable est quantitative). Pour étudier l’accord de deux radiologues concernant
l’existence d’une récidive tumorale, on utilisera une technique de concordance
(le coefficient kappa [k ] car la variable est qualitative, voir partie « Application
du test étudié, notion de reproductibilité [ou fiabilité] » de la fiche 21).
Princip e d es t ests d'hy p o t hèse
Un test statistique a pour objectif de déterminer si la différence observée entre
les groupes comparés existe vraiment dans la population cible ou si elle est liée
au hasard de la constitution de l’échantillon (fluctuations d’échantillonnage) :
• exemple 1 : on étudie le lien entre activité physique (actif/sédentaire) et mortalité ;
• exemple 2 : on étudie le lien entre taux de CRP (en mg/L) à l’entrée en réanimation et la mortalité.
Pour répondre à chaque question, on formule deux hypothèses dites H1 et HO :
• hypothèse nulle HO, « il n’y a pas de différence entre les groupes étudiés » :
- exemple 1 : « le taux de décès est le même quel que soit le niveau d’activité »,
- exemple 2 : « la moyenne de CRP à l’entrée est la même chez les patients
qui survivent que chez les patients qui décèdent » ;
• hypothèse alternative H1, « il y a une différence entre les groupes » :
- exemple 1 : « le taux de décès diffère entre les deux groupes » (hypothèse
bilatérale) ou « le taux de mortalité cardiovasculaire est plus faible chez
patients actifs » (hypothèse unilatérale),
- exemple 2 : « la moyenne de CRP diffère entre les deux groupes » (hypothèse bilatérale) ou « la moyenne de CRP à l’entrée est plus élevée chez les
patients survivants » (hypothèse unilatérale).
La conclusion du test repose sur le calcul d’un critère de test permettant de
déterminer la probabilité que la différence observée soit liée au hasard {p-value}.
Habituellement, on tolère un risque d’erreur (risque de conclure à une différence qui n’existe pas, alpha) de 5 %. Après le test, on peut calculer cette
probabilité dans notre étude (la p-value) :
• p-value < 0,05, « on rejette HO », « la différence observée est significative » :
- exemple 1 : le taux de décès est significativement différent entre les deux
groupes,
- exemple 2 : la moyenne de CRP diffère significativement entre les deux
groupes ;
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Généralités
50
• p-value > 0,05, « on ne peut pas rejeter HO », « la différence observée n’est
pas significative », « on ne peut pas conclure à une différence » :
- exemple 1 : le taux de décès ne diffère pas significativement entre les deux
groupes ;
- exemple 2 : la CRP moyenne ne diffère pas significativement entre les deux
groupes.
► Attention ! Ne pas rejeter l’hypothèse nulle signifie que le risque est trop
important pour que l’on puisse conclure à une différence. Ceci ne veut
pas dire que les deux moyennes comparées sont égales/équivalentes. Il
reste possible que la différence existe, mais que les conditions du test ne
permettent pas de le démontrer.
Risque d ’ erre ur e t t est st a tistiq u e
Introduction
Peu importe la conclusion d’un test, il existe un risque de se tromper à chaque
fois :
• risque alpha (a) : conclure à une différence qui n’existe pas ;
• risque bêta (P) : conclure à l’absence de différence alors qu’il en existe une.
Conclusion
Différence
Réalité
Différence
1-0
Pas de différence
a
Pas de différence
p
1-oc
Risque de première espèce = risque a
Le risque a est le risque de conclure à une différence qui en réalité n’existe pas,
autrement dit : risque de rejeter l’hypothèse HO à tort.
Il est fixé a priori le plus souvent à 5 % (ou 0,05) pour un test bilatéral et
2,5 % pour un test unilatéral.
Il augmente si on fait plusieurs tests : critères multiples, analyse intermédiaire.
C’est la raison pour laquelle le critère de jugement principal d’une étude doit
être unique. Si tel n’est pas le cas, il faut vérifier que les auteurs aient diminué le
seuil du risque a (à 2,5 % par exemple dans le cas de deux critères de jugement
principaux).
Le degré de signification, « petit p », « p-value »
C’est la probabilité de se tromper si on dit qu’il existe une différence significative après avoir réalisé un test. Il a la même signification que le risque a, à
savoir le risque de rejeter H0 à tort, mais il est déterminé a posteriori par la
réalisation du test lui-même. Si p < a, on conclut à une différence significative
et on rejette donc H0.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques comparatives et mesures d’association
51
Risque de deuxième espèce = risque P
Le risque [3 est le risque de conclure à l’absence de différence, alors qu’en réalité
cette différence existe, autrement dit : risque de ne pas rejeter HO à tort. Il est
fixé a priori le plus souvent à 10 ou 20 %.
Il augmente avec la diminution du nombre d’événements attendus pour
le critère de jugement principal et si la différence attendue entre les groupes
comparés est faible.
Puissance = 1 - p
Elle correspond à la probabilité de conclure à une différence qui existe vraiment, c’est-à-dire à l’aptitude d’une étude à montrer une différence.
Une étude dite de forte puissance a donc beaucoup de chances de mettre en
évidence ce pour quoi elle a été construite.
Un des principaux déterminant de la puissance est le nombre de sujets inclus
dans une étude et le nombre d’événements pour le critère de jugement principal
(déterminé par la fréquence de l’événement dans la population sélectionnée).
Une étude concluant à l’absence de différence (étude dite négative) a potentiellement plusieurs raisons de l’être. Cette absence de différence peut être liée à :
• l’absence réelle de différence ;
• la présence de biais masquant la différence entre les groupes (sélection,
mesure, confusion) ;
• un manque de puissance. Si on augmentait le nombre de sujets inclus dans
l’étude et donc le nombre d’événements, on augmenterait la puissance (on diminuerait le risque P), l’hypothèse HO pourrait être rejetée et on pourrait conclure
à une différence significative.
Risque a
Risque p
Puissance
p de signification
Défini a priori
généralement à 5 %
en bilatéral, 2,5 %
en unilatéral
Défini a priori
généralement à 10
ou 20 %
Correspond à 1 — p
donc défini a priori
généralement à 80
ou 90 %
Défini a posteriori,
correspond au
résultat du test
Risque de rejeter
HO à tort
Risque de ne pas
rejeter HO à tort
Probabilité de
rejeter H0 à raison
Risque de
rejeter H0 à tort
a posteriori
Risque de conclure
à une différence qui
n’existe pas
Risque de conclure
à l’absence de
différence alors
qu’elle existe
Probabilité de
conclure à une
différence qui existe
vraiment
Risque de conclure
à une différence qui
n’existe pas
Inflation du
risque a en cas
d’utilisation de tests
multiples
Augmentation du
risque p en cas
d’une diminution
du nombre
d’événements
Augmentation de
la puissance en cas
d’une augmentation
du nombre
d’événements
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
52
Généralités
Calcul du n o m bre de suje ts n écessaires à inclure
d ans u ne é t u d e
Pourquoi calculer un nombre de sujets nécessaires
dans une étude ?
En complément
V o us p o u v e z co ns u l t e r c e t t e v i d é o s u r l a pl a ylist « G é n é r a lit é s s t a t ist i q u es
w w w .y o u t u b e.co m / p l a y lis t ? H s t = PLL3 6 x s y T 4 F F fc u L9 Z 9 -SSV N - _ U r w j c A y a
Afin de maximiser les chances de prouver la différence que l’on souhaite
mettre en évidence entre les groupes comparés, il est nécessaire de disposer
d’une puissance suffisante.
► Rappel : risque p —» risque de conclure à une absence de différence qui
existe en réalité. Puissance (1 - P) —> risque de conclure à une différence
qui existe en réalité. En augmentant la puissance, on recherche donc à
augmenter la possibilité de montrer une véritable différence.
Nous avons vu que le principal déterminant de l’augmentation de la puissance est l’augmentation du nombre de sujets à inclure dans l’étude. Néanmoins, une augmentation trop importante du nombre de sujets s’accompagne
de plusieurs difficultés :
• l’étude peut alors devenir trop compliquée à réaliser voire infaisable en cas de
faiblesse de recrutement ; le budget s’alourdit et la durée de l’étude s’allonge ;
• augmenter le nombre de sujets et donc augmenter la puissance revient à réaliser un zoom qui permettra la mise en évidence de détails et de différences de
plus en plus petites (voir figure ci-après). Cela peut donc entraîner un risque
de mettre en évidence des différences qui ne sont pas toujours cliniquement
pertinentes ;
• exemple : dans le cadre de l’évaluation d’un nouveau traitement antidiabétique,
une étude de très forte puissance avec 100 000 patients est réalisée et montre
une diminution significative de l’HbAlc de 0,01 %. Cette étude a été très coûteuse, a duré de nombreuses années et l’information recueillie n’est finalement
pas intéressante.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques comparatives et mesures d’association
Augmentation du
nombre d'individus
Augmentation
de la puissance
53
Mise en évidence
d'une différence de
plus en plus petite
En résumé, il est indispensable de calculer un nombre de sujets nécessaires
avant de réaliser une étude. Ce nombre de sujet doit être suffisant pour mettre
en évidence la différence minimale cliniquement intéressante, sans atteindre
un nombre excessif de participants, ce qui rendrait la réalisation de l’étude
compliquée.
►
Remarque : en pratique, le facteur limitant le plus fréquent lors de la
mise en place d’une étude est d’avoir un nombre de participants inclus
inférieur au nombre calculé de sujets nécessaires et non pas l’inverse.
Éléments nécessaires au calcul du nombre de sujets
nécessaires
On retrouve :
• d’une part, les risques d’erreurs statistiques vus précédemment : risque oc,
risque p et puissance ;
• d’autre part, la différence minimale attendue cliniquement pertinente entre
les groupes.
Ce qui augmente le nombre de sujets
nécessaires
Ce qui diminue le nombre de sujets
nécessaires
Augmenter la puissance
Diminuer le risque p
Diminuer le risque oc
Diminuer la différence minimale attendue
entre les groupes
Faire l’étude dans une population où le
risque d’événements est faible
Diminuer la puissance
Augmenter le risque P
Augmenter le risque a
Augmenter la différence minimale attendue
Faire l’étude dans une population où le
risque d’événements est élevé
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
54
Généralités
À retenir^
En pra tiq u e lors d e l'EC N
Vérifier que la différence minimale attendue utilisée dans le calcul est
cliniquement pertinente.
Vérifier que les risques a et P sont fixés a priori à des seuils classiquement
admis.
Vérifier que le nombre de sujets inclus dans l'étude atteint le nombre de sujets
nécessaires calculé, et/ou que le nombre d'événements prévus par le calcul
d'effectif a été atteint (si tel n'est pas le cas, cela pourrait expliquer un résultat
négatif par manque de puissance).
Q uel t est st a tistiq u e u tiliser ?
Quelques notions à prendre en compte pour le choix du
test à utiliser
N o tio n d e v aria ble e x plicativ e / à e x pliq u er o u in d é pe n da n te /
d é p e n d a n te
• Variable à expliquer (ou dépendante) : correspond à la variable que l’on
mesure, que l’on décrit et que l’on compare ensuite entre les groupes. Il s’agit
généralement du critère de jugement. Elle est dite dépendante de la variable
explicative indépendante.
• Variable explicative (ou indépendante) : correspond à la variable qui permet
la constitution des groupes de comparaison et dont on se sert pour expliquer la
variable dépendante.
• Exemples :
- exemple 1 : on souhaite comparer la mortalité entre deux groupes de traitement (traitement A et traitement B). La variable à expliquer est la mortalité
et la variable explicative est le traitement ;
- exemple 2 : on souhaite évaluer le niveau de tension artérielle en fonction
de l’âge. La tension artérielle est la variable à expliquer (ou dépendante) et
l’âge est la variable explicative (ou indépendante).
• La variable à expliquer est dite dépendante de la variable explicative (= variable
indépendante).
N o tio n d'a n alyses u niv arié es o u m ultiv arié es (v oir fich e 24)
• Analyse univariée : il y a une seule variable à expliquer (dépendante) et une
seule variable explicative (indépendante) dans l’analyse. L’influence d’éventuels
facteurs de confusion n’est donc pas prise en compte.
• Analyse multivariée : prise en compte de plusieurs variables explicatives
(indépendantes) dans l’analyse (avec prise en compte des éventuels facteurs de
confusion). On obtient alors des résultats dits « ajustés ».
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques comparatives et mesures d’association
55
• Exemple : lors de la comparaison de la mortalité entre deux groupes de
traitements, l’analyse univariée ne prendra en compte qu’une seule variable
explicative (variable explicative = le traitement). L’analyse multivariée prendra
en compte plusieurs variables explicatives, c’est-à-dire les éventuels facteurs
de confusion qui pourront interférer sur la variable à expliquer (variable à
expliquer = la mortalité) comme l’âge ou le stade de la maladie.
N o tio n d e m esures ré p é t é es (« d o nn é es a p parié es »)
• Mesures répétées (données appariées) : comparaison de deux groupes de données mesurées chez un même patient (par exemple, avant et après traitement).
Chaque patient est alors son propre témoin.
• Séries indépendantes : comparaison de deux groupes de données mesurées
chez des patients différents (par exemple, entre un groupe de patients recevant
le traitement et un groupe de patients recevant le placebo).
• Dans le cas de mesures répétées, on utilise des tests statistiques spécifiques :
test de McNemar (= test du Chi2 apparié), test t apparié (= test de Student
apparié), test de Wilcoxon (test non paramétrique pour série appariée).
N o tion d e t est p ara m é triq u e / no n p ara m é triq ue
La plupart des test utilisés sont des tests paramétriques. Ceux-ci ne sont utilisables que si leurs conditions d’utilisation sont remplies (comme l’égalité et
la distribution normale des variances pour le test de Student, ou des effectifs
théoriques > 5 pour le test du Chi2).
Si les conditions d’application ne sont pas remplies, il convient alors d’utiliser
des tests non paramétriques : le test de Mann-Whitney, le test de Wilcoxon,
le coefficient de corrélation de Spearman sont les tests non paramétriques à
connaître.
À retenir
Cas des variables
à expliquer
qualitatives
Objectif :
comparaison de
deux (ou plus)
pourcentages
Analyse univariée = test du Chi2
Analyse multivariée = régression
logistique
Cas des variables
à expliquer
quantitatives
Objectif :
comparaison de deux
moyennes
Analyse univariée = test
de Student (paramétrique)/tests
de Mann-Whitney ou Wilcoxon
(non paramétrique)
Analyse multivariée = régression
linéaire multiple
Cas des analyses
de survie (analyse de
données censurées)
Objectif :
comparaison de deux
(ou plus) courbes de
survie
Analyse univariée = test du log
rank
Analyse multivariée = modèle
de Cox
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
56
Généralités
En pra tique
Ex e m ple 1
On souhaite planifier un essai clinique visant à évaluer l’effet d’un antiagrégant
plaquettaire sur la mortalité cardiovasculaire d’un groupe de patients à risque.
Le nombre de patients à inclure pour obtenir la puissance souhaitée sera d’autant plus important que :
Il aurait fallu cocher...
Commentaires
Le risque a diminue
Plus le risque d’erreur de type 1 que l’on accepte est
faible, plus il faut inclure de patients dans l’essai
Le risque p diminue
De la même manière, si le risque d’erreur de type 2
est faible (donc la puissance plus forte), il faut
inclure plus de patients
La réduction relative du risque
liée au traitement est faible
Plus on souhaite mettre en évidence une différence
qui est petite, plus le nombre de sujets nécessaires
augmente. Si l’effet d’un traitement attendu est une
différence de 1 % de mortalité, le nombre de sujets
nécessaires sera plus important que si l’effet du
traitement attendu est une différence de 20 % de
mortalité
Le traitement est peu efficace
Cette proposition a la même signification que la
précédente
La mortalité cardiovasculaire
dans ce groupe, en l’absence
de traitement, est faible
Si le risque d’événements est faible, pour un même
nombre de patients, on aura moins de puissance,
car moins d’événements. Pour faire un essai de
prévention cardiovasculaire, il faudra inclure
beaucoup plus de sujets sains que de patients avec
de nombreux facteurs de risque
On souhaite réaliser un test
bilatéral à 5 % plutôt qu’un
test unilatéral à 5 %
Pour un même risque a, il faut inclure plus de
patients pour un test bilatéral que pour un test
unilatéral
Il n’aurait pas fallu cocher...
Commentaires
Le risque cardiovasculaire
dans le groupe sans traitement
est élevé
Si le risque dans le groupe contrôle est élevé,
cela indique qu’on attend un nombre important
d’événements et donc que la puissance sera plus
élevée. Il n’est pas nécessaire d’inclure beaucoup de
patients pour avoir la puissance attendue
La puissance diminue
La diminution de la puissance correspond à une
augmentation du risque p
Le nombre de centres
participant à l’étude est
important
C’est un élément de faisabilité qui ne rentre pas
en compte dans le calcul de l’effectif (capacité de
recrutement)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques comparatives et mesures d’association
Il n’aurait pas fallu cocher...
Commentaires
On souhaite réaliser un test
bilatéral à 5 % plutôt qu’un
test unilatéral à 2,5 %
Il faut le même nombre de patients pour un test
unilatéral à 2,5 % que pour un test bilatéral à 5 %
L’essai est réalisé en ouvert
Cet élément du design n’a pas de conséquence sur le
calcul du nombre de patients à inclure
57
Ex e m ple 2 (ED N 2016)
Deslée G, Mal H, Dutau H, Bourdin A, Vergnon JM, Pison C, Kessler R,
Jounieaux V, Thiberville L, Leroy S, Marceau A, Laroumagne S, Mallet JP,
Dukic S, Barbe C, Bulsei J, Jolly D, Durand-Zaleski I, Marquette CH, for the
REVOLENS Study Group. Lung volume réduction coil treatment vs usual
care in patients with severe emphysema: The REVOLENS Randomized
Clinical Trial. JAMA 2016 ; 315(2) : 175-84.
On a conduit un essai clinique comparant un traitement par spirales endobronchiques dans la bronchopneumopathie chronique obstructive (BPCO) à un traitement conventionnel.
Cette étude rapporte une amélioration cliniquement pertinente, à 6 mois, de la
distance parcourue au test de marche de 6 minutes, chez 36 % des patients du
groupe « spirales » et chez 18 % des patients du groupe « soins habituels ». Il
est possible de conclure à la supériorité du traitement par spirales, comparativement aux soins habituels. La différence absolue (IC95 %) entre les groupes est
de + 18 % (4 % ; 60 %), p-value = 0,03. Il est vrai que :
Il aurait fallu cocher...
Commentaires
L’intervalle de confiance indique la
significativité de la différence car il exclut
la valeur « 0 »
Dans la situation de l’évaluation d’une
différence de risque absolu en points
de pourcentage (36 — 18 = 18%), on
cherche bien à montrer que la différence
diffère significativement de 0
La probabilité de conclure, à tort, à
l’efficacité du traitement est de 3 %
C’est la définition de la p-value
Il y a 2,5 % de chances que la différence
absolue d’efficacité réelle entre les
2 groupes soit inférieure à 4 %
C’est la signification de l’intervalle de
confiance
Il y a 95 % de chances que la différence
absolue réelle d’efficacité entre les
2 groupes soit comprise entre 4 % et
60 %
C’est la signification de l’intervalle de
confiance
Il n’aurait pas fallu cocher...
Commentaires
L’intervalle de confiance indique la
significativité de la différence car il exclut
la valeur « 1 »
La valeur 1 est la valeur neutre pour un
risque relatif, pas pour une différence
absolue de risque
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
58
Généralités
Il n’aurait pas fallu cocher...
Commentaires
95 % des patients de l’échantillon sont
compris dans l’intervalle (+ 4 % ; + 60 %)
L’intervalle de confiance à 95 %
représente la fourchette des valeurs au
sein de laquelle la vraie différence du
pourcentage entre les 2 groupes a 95 %
de chances de se trouver
La probabilité de conclure, à tort, à
l’absence d’efficacité est de 3 %
Cette probabilité définit le risque p et
non la p-value
La différence absolue réelle d’efficacité
a 97 % de chances de se trouver dans
l’intervalle (+ 4 % ; + 60 %)
L’intervalle de confiance reste un
intervalle de confiance à 95 % quelle
que soit la valeur de la p-value. Ces
deux informations s’interprètent
indépendamment l’une de l’autre
Ex e m ple 3 (é preuve t est 2017)
Hugosson J, Carlsson S, Aus G, Bergdahl S, Khatami A, Lodding P, Pihl CG,
Stranne J, Holmberg E, Lilja H. Mortality results from the Gôteborg Randomised
Prostate Cancer Screening Trial. Lancet Oncol 2010 ; 11(8) : 725-32.
In December 1994, 20,000 men born from 1930 to 1944, randomly sampled
from the Population Register, were computer randomised in a 1:1 ratio to
a screening group invited for biennial PSA [prostate-specific antigen] testing
or to a control group not invited. The primary endpoint was prostate cancer
spécifie mortality analyzed according to the intention to-screen principle.
The number needed to screen (NNS) was calculated as (1/absolute réduction
in prostate cancer mortality). As this study is an intention-to-screen analysis,
we refer to NNS as number needed to invite for screening. The number needed
to treat (NNT) was calculated as ((1/absolute réduction in prostate cancer
mortality) * excess prostate cancer incidence). This measure was also rephrased to number needed to diagnose, because many patients actually were not
treated.
The number of men needed to invite for screening (NNS) to prevent one prostate cancer death was calculated as 293 while the number needed to diagnose
(NNT) was calculated as 12. »
Les auteurs font référence au calcul de l’indicateur NNS {number needed to be
screened). Que peut-on dire de cet indicateur ?
Il aurait fallu cocher...
Commentaires
Il est calculé comme le NNT {number
needed to treat) pour la mesure
d’efficacité d’un essai thérapeutique
La définition donnée par les auteurs
(1/réduction absolue du risque) indique
bien que le NNS est calculé comme le
NNT
Il donne le nombre de patients à dépister
pour éviter un décès par cancer de la
prostate durant la période de suivi
considérée
Cette définition correspond à ce que
nous avons décrit plus haut
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques comparatives et mesures d’association
Il aurait fallu cocher...
Dans cette étude, il faut dépister
293 patients pour éviter un décès et
diagnostiquer 12 patients en plus grâce
au dépistage pour éviter un décès
Il n’aurait pas fallu cocher...
59
Commentaires
C’est bien ce que signifient ces deux
marqueurs
Commentaires
Il donne le nombre d’événements évités
pour 100 patients dépistés
Non, cette définition correspond à la
diminution absolue du risque
Il fait référence à la réduction relative de
risque de décès par cancer de la prostate
durant la période de suivi considérée
Non, la réduction relative du risque
correspond à 1-RR de cancer de prostate
Il fait référence à la fraction étiologique
du risque de décès
Le risque attribuable pour les exposés
(ou « fraction étiologique ») mesure la
proportion de cas de la maladie qu’on
peut attribuer au facteur de risque parmi
les sujets exposés à ce facteur (pourcentage
des cas de cancer du poumon dus au
tabagisme parmi les fumeurs)
Que peut-on dire du résultat concernant le risque relatif de décès par cancer de
la prostate (RR estimé à 0,56, IC à 95 % [0,39 à 0,82], p = 0,002) ?
Il aurait fallu cocher...
Commentaires
Le risque d’erreur de lre espèce de la
comparaison est égal à 0,002
Le risque de lre espèce d’une
comparaison donnée est la p-value
La réduction relative de risque de décès
par cancer de la prostate est égale à
44 %
Le RR est de 0,56, ce qui correspond à
une réduction relative du risque de 44 %
(= 1 - 0,56)_________________________
Le risque de décès est significativement
réduit dans le groupe PSA
(prostate-specific antigeri)
Cette conclusion est attestée par la
p-value < 0,05
Le risque de décès par cancer de prostate
dans le groupe PSA est multiplié par 0,56
par rapport au groupe contrôle
C’est la signification du risque relatif
Il n’aurait pas fallu cocher...
Commentaires
Le RR est statistiquement différent de 0
parce que p < 0,05
Un RR par définition ne peut pas prendre
la valeur 0
La comparaison des taux cumulés de
mortalité par cancer de la prostate entre
les 2 groupes a une puissance de 99,8 %
99,8 % (1 - p) correspond à la
probabilité d’avoir raison si on affirme
que la différence n’est pas significative, et
non à la puissance
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
60
Généralités
Il n’aurait pas fallu cocher...
Le RR est statistiquement significatif car
compris entre les bornes de son intervalle
de confiance à 95 %
Commentaires
Par définition, une valeur est contenue
dans les bornes de son intervalle de
confiance. Un RR est statistiquement
significatif si la valeur 1 n’est pas
comprise entre les bornes de son
intervalle de confiance
Ex e m ple 4 (ED N 2017)
Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML,
Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D,
Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D.
Levosimendan for the prévention of acute organ dysfunction in sepsis.
N Engl J Med 2016 ; 375 : 1638-48.
This trial was designed to test whether the addition of levosimendan to standard care would reduce the severity of organ dysfunction among patients with
septic shock.
We calculated that a sample of 500 patients would provide the trial with 90%
power to detect a différence of 0.5 points in the mean SOFA score, assuming
a standard déviation of 1.5 and a significance level of 0.05. To allow for a 3%
rate of withdrawal of consent, the recruitment target was 516 patients.
A p-value of less than 0.05 was considered to indicate statistical significance,
with the use of two-sided tests ; no corrections were made for multiple testing.
Concernant le calcul d’effectif :
Il aurait fallu cocher...
Commentaires
Il a été déterminé sans préjuger du sens
de la différence entre lévosimendan et
placebo
Le test bilatéral two-sided indique que
l’hypothèse alternative est bilatérale
(placebo > lévosimendan ou lévosimendan > placebo)
Il a été déterminé en tenant compte de
l’écart type du score SOFA
Standard déviation et écart type sont des
synonymes
Il a été déterminé pour un risque p de
10 %
Une puissance de 90 % implique un
risque p de 10 %
La différence attendue du critère de
jugement principal, entre les 2 groupes,
était d’au moins 0,5 point
SOFA : sequential organ failure assessment.
C’est l’hypothèse qui est faite par les
auteurs. Une différence plus faible ne
sera pas détectée
Il n’aurait pas fallu cocher...
Commentaires
Le calcul d’effectif a considéré un taux
de perdus de vue de 3 %
Le calcul d’effectif tient compte de
3 % de retrait de consentement, pas de
perdus de vue (difficiles à imaginer en
réanimation)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Statistiques comparatives et mesures d’association
Il n’aurait pas fallu cocher...
Commentaires
La différence attendue du critère de
jugement principal, entre les 2 groupes,
est au maximum de 0,5 point
Attention, 0,5 est la différence minimale
que l’on pouvait mettre en évidence
L’essai nécessite une différence minimale
de 50 % de la valeur du score SOFA
entre les 2 groupes
La différence attendue est formulée en
termes de différence absolue et pas relative
comme indiqué dans cette proposition
Il était basé sur les capacités de
recrutement des centres
Le calcul du nombre de sujets nécessaire
est basé sur les risques de lre et de
2e espèce fixés a priori et sur la différence
minimale attendue cliniquement
pertinente entre les 2 groupes. La durée
de période de recrutement et les capacités
de recrutement des centres sont des
éléments dont il faudra tenir compte pour
la faisabilité de l’étude suite au calcul
du nombre de sujets nécessaires, mais ils
n’interviennent pas dans ce calcul
Il était basé sur la durée de la période
de recrutement
61
SOFA : sequential organ failure assessment.
Ex e m ple 5 (ED N 2019)
Galimberti V, Cole BF, Zurrida S, Viale G, Luini A, Veronesi P, et al. Axillary
dissection versus no axillary dissection in patients with sentinel-node
micrometastases (IBCSG 23-01) : a phase 3 randomised controlled trial.
Lancet Oncol avr 2013 ; 14(4) : 297-305.
As originally designed, target accrual was 1960 patients with analysis planned
after 558 events. These targets were based on having 90% power to detect
non-inferiority of no axillary dissection with a one-sided statistical significance level of 10% (ie, a= 0.10) under the assumption that 5-year disease-free
survival with axillary dissection was 70 % and defining non-inferiority as a
hazard ratio (HR) of less than 1.25 (no axillary dissection relative to axillary
dissection).
Les auteurs ont fixé le seuil de signification statistique alpha à 10 % (c’est-à-dire
0,10), en situation unilatérale. Cela correspondrait à (une ou plusieurs réponses
possibles) :
Il aurait fallu cocher...
Commentaires
Un risque alpha bilatéral de 20 %
Un risque alpha à 10 % en unilatéral, en
mettant bien 10 % de « chaque côté »
correspond à un risque alpha bilatéral de
20 %. C’est très inhabituel de choisir un
risque alpha à 10 % mais c’est ce qui a
été fait
Un risque de conclure à tort à la
non-infériorité égal à 10 %
C’est la définition du risque alpha de lre
espèce : le risque de conclure à tort à une
différence qui n’existe pas
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
62
Généralités
Il n’aurait pas fallu cocher...
Commentaires
Une puissance statistique de 90 %
La puissance se calcule grâce au risque
de 2e espèce bêta et est égale à 1-bêta,
qui est par ailleurs bien de 90 % dans
cette étude mais ce n’était pas la question
posée
Un risque alpha bilatéral de 5 %
Un risque alpha à 10 % en unilatéral, en
mettant bien 10 % de « chaque côté »
correspond à un risque alpha bilatéral
de 20 %
Une marge de non-infériorité de 10 %
La marge de non-infériorité n’a rien à
voir avec le risque alpha ni le risque
bêta. C’est la perte maximale d’efficacité
tolérée pour conclure à la non-infériorité
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyses dépendantes du temps
ou « analyses de survie »
Princip e
• L’analyse de survie permet d’étudier la survenue d’un événement, mais également le délai de survenue de cet événement.
• Utilisée historiquement pour étudier la survie des patients (délai de survenue
du décès), elle peut s’appliquer à tout type d’événement de nature binaire pouvant survenir au cours du temps (par exemple, délai de survenue d’une rétinopathie au sein d’une cohorte de diabétiques, d’un rejet de greffe, de la survenue
de métastases, etc.).
• Ce type d’analyse est largement utilisée dans :
- les études observationnelles analytiques à visée pronostique au cours desquelles l’objectif est de mettre en évidence un ou des facteurs pronostiques
d’évolution d’une pathologie. On compare alors la survie entre le groupe
exposé au facteur pronostique supposé et le groupe non exposé à ce facteur
pronostique ;
- les essais cliniques, notamment en cancérologie (par exemple, comparaison
de la survie des patients randomisés dans le groupe recevant une nouvelle
chimiothérapie à la survie des patients randomisés dans le groupe recevant le
traitement de référence).
À retenir
A t te n tio n à la dif fére nce e n tre f act e ur d e risq u e e t f act e ur
pro n ostiq u e
Facteur de risque : élément associée à la survenue d'une maladie au cours du
temps. C'est un facteur qui augmente le risque de développer une maladie.
Facteur pronostique : élément associé l'aggravation d'une maladie au cours du
temps. Dans cette situation la maladie s'est déjà déclarée et le facteur pronos
tique est un élément qui aggrave (ou améliore) le pronostic de la maladie.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
64
Généralités
Q uelq ues d é finitio ns u tilisées d ans les analyses
d e survie au co urs d es essais cliniqu es
• Survie globale (overall survival) : décès, toutes causes confondues (le patient a
présenté l’événement d’intérêt s’il est décédé, quelle que soit la cause du décès).
• Survie spécifique : décès lié spécifiquement à la pathologie étudiée. Les décès
d’autres causes ne seront pas pris en compte et les patients décédés d’autres
causes seront censurés à droite (voir plus bas la définition de la censure à droite).
• Survie sans rechute (progression free survival) : survenue d’un décès ou survenue d’une rechute (il s’agit d’un critère composite : il est considéré qu’un
patient a présenté l’événement d’intérêt s’il est décédé ou s’il a présenté une
rechute de la maladie).
D o n nées n écessaires à u ne analyse d e survie
• Date d’origine : date d’entrée dans l’étude pour chaque patient.
• Date de point : considérée comme la date de fin de l’étude au-delà de laquelle
plus aucun événement ne sera pris en compte (date d’arrêt du suivi) ; correspond à une date du calendrier ou à une durée de suivi identique pour tous les
patients.
• Date des dernières nouvelles (DDN) = date du dernier contact avec chaque
patient (correspond généralement à la date de la dernière consultation pour les
patients vivants et à la date de décès pour les patients décédés) :
- en cas de décès avant la date de point : DDN = date du décès ;
- en cas de décès après la date de point : DDN = date de point ;
- patient vivant et dernière date connue avant la date de point : DDN = dernière date connue ;
- patient vivant et dernière date connue après la date de point : DDN = date
de point.
• Données censurées à droite : on parle de données censurées à droite lorsque
l’information sur la survenue de l’événement étudié n’est pas disponible à la
date de point et que l’on ne peut donc pas mesurer la survie exacte du patient ;
cela s’observe soit lorsque les patients sont perdus de vue au cours de la période
de suivi de l’étude, soit lorsque les patients n’ont pas encore présenté l’événement d’intérêt au moment de la date de point (on parle alors d’exclu vivant).
La censure d’un patient à droite permet de prendre malgré tout en compte ce
patient au moment de l’analyse statistique bien que l’on ne connaisse pas sa
durée de survie exacte.
• Exemple :
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyses dépendantes du temps ou « analyses de survie
65
Date de
point
Date de
début de l'étude
I
Décès
II
III
IV
V
Décès
Statut
à la
date des
dernières
nouvelles
Statut Particularités
à la date
de point
5 jours 3 jours
Décédé
Décédé
Donnée non
censurée
(mesure de
la survie
exacte à
la date de
point)
Samedi
4 jours 4 jours
Vivant
Vivant
Données
censurées à
droite (exclu
vivant)
Vendredi
4 jours 3 jours
Vivant
?
Données
censurées à
droite (perdu
de vue)
Mercredi Samedi
3 jours 3 jours
Vivant
Vivant
Données
censurées à
droite (exclu
vivant)
Samedi
2 jours 2 jours
Vivant
Vivant
Données
censurées
à droite
(exclu vivant)
Patient
Date des
Date
d’origine dernières
nouvelles
Recul
I
Lundi
Jeudi
II
Mardi
III
Mardi
IV
V
Jeudi
Temps de
participation
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
66
Généralités
Crit ères d e q ualité
• La date d’origine doit être clairement définie (date d’une chirurgie, date du
diagnostic, date du début du traitement, date d’admission aux urgences, etc.).
Au mieux, elle est choisie le plus tôt possible dans l’évolution d’une maladie.
Une inclusion tardive induit un biais par sélection des patients en meilleure
santé, les patients décédés précocement ne pouvant pas être inclus.
• La date de point doit être clairement définie à l’avance et doit permettre une
durée de suivi suffisamment longue afin de recueillir le maximum d’informations. Il peut arriver d’observer précocement une différence de survie entre deux
groupes qui s’estompe avec le temps, donc si le suivi n’est pas assez long, on
risque de conclure à une différence qui n’existe pas au final. D’un autre côté un
suivi trop long peut induire une augmentation du nombre de perdu de vue.
• Le critère de jugement doit être mesuré de la manière la plus objective possible et de manière identique dans les groupes comparés, si possible en aveugle
(éviter le biais de classement). Le décès est le critère le plus objectif qui existe, il
est impossible de mal classer un patient.
• La raison de l’arrêt de suivi chez les perdus de vue doit être si possible
notifiée dans le but de vérifier qu’elle ne soit pas en lien avec l’état de santé du
patient. Par exemple, si les patients sont perdus de vue car leur état de santé
s’aggrave, il apparaîtra un biais car les malades les plus graves ne pourront pas
être analysés.
Re prése n t atio n d es résulta ts
• Grâce aux données brutes obtenues précédemment, on construit une courbe
de survie en marche d’escalier avec la méthode de Kaplan-Meier. Chaque point
de la courbe représente la probabilité de survie en fonction du temps.
• La médiane de survie d’un groupe correspond au délai pour lequel un sujet
appartenant à ce groupe a 50 % de chances de ne pas avoir présenté l’événement étudié.
• Dans l’exemple suivant, il semble que le groupe de sujets représenté par la
courbe orange ait un pronostic plus sombre que le groupe représenté par la
courbe grise. La médiane de survie de la courbe orange est moins bonne que
celle de la courbe grise. Afin d’en être certain, il est nécessaire d’utiliser un test
statistique de comparaison de courbes de survie.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyses dépendantes du temps ou « analyses de survie
67
Courbe de survie de Kaplan-Meier
Survie
100 o/o —
Courbe noire = groupe exposé au facteur pronostic étudié
Courbe rouge = groupe non exposé au facteur pronostic étudié
50 o/o
Échelle
Médiane de survie
dans le groupe
exposé
Médiane de survie
dans le groupe non
exposé
de temps
• Afin de comparer deux courbes de survie, on utilise un test du log-rank après
avoir posé deux hypothèses :
- hypothèse HO : les deux courbes sont identiques ;
- hypothèse H1 : les deux courbes sont différentes ;
- attention : ne pas rejeter HO ne permet pas de conclure à l’équivalence des
courbes.
• Le modèle de régression de Cox est utilisé pour réaliser une analyse multivariée
prenant en compte d’éventuels facteurs de confusion. Les modèles multivariés
d’analyse de survie dont le modèle de Cox sont essentiels au cours des études
observationnelles à visée pronostique. A contrario des essais cliniques, au cours
des études observationnelle, l’exposition d’intérêt (le facteur pronostique) n’a pas
été affecté aux participants de manière aléatoire par randomisation. On ne peut
donc pas être certain à 100 % que la différence de survie observée entre les deux
groupes (à savoir le groupe des patients non exposés au facteur pronostique et le
groupe des patients exposés au facteur pronostique) ne soit pas liée à la présence
d’un ou plusieurs facteurs de confusion. Le modèle de Cox permet donc de mesurer la différence entre les deux groupes indépendamment de la prise en compte de
ces facteurs de confusion. Le modèle de Cox rend des résultats sous la forme de
hazard ratio (HR) qui s’interprètent exactement de la même façon que le risque
relatif (RR) ou Vodds ratio (OR). Ce hazard ratio correspond au rapport des
risques instantanés à chaque moment du suivi de l’étude.
Survie
100 o/o
Survie
Hypothèse H0
100 o/o
Temps
Hypothèse H1
Temps
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
68
Généralités
Partie pra tique
Ex e m ple 1 (ED N 2021)
Cappuzzo F, Ciuleanu T, Stelmakh L, Cicenas S, Szczésna A, Juhâsz E, et al.
Erlotinib as maintenance treatment in advanced non-small-cell lung cancer:
a multicentre, randomised, placebo-controlled phase 3 study. Lancet Oncol
juin 2010; 11(6) : 521-9.
Kaplan-Meier estimâtes of progression-free survival in the intention-to-treat
population (A), progression-free survival in patients with EGFR
immunohistochemistry-positive tumours (B), progression-free survival in
patients with EGFR mutation-positive tumours (C), and progression-free
survival in patients with EGFR wild-type tumours (D).
Numbers at risk
Erlotinib
438
400
329
261
204
168
118
76
Placebo
451
404
326
256
196
157
102
63
42
24
11
1
0
Kaplan-Meier estimâtes of overall survival in the intention-to-treat population (A)
and in patients with EGFR wild-type tumours (B).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyses dépendantes du temps ou « analyses de survie
69
À propos de ces deux figures (une ou plusieurs propositions attendues) :
Il aurait fallu cocher...
Commentaires
La décroissance en marches
d’escalier régulièrement espacées de
la survie sans progression résulte
de la périodicité des visites de suivi
programmées
Chaque marche d’escalier survient à un rythme
de toutes les 6 semaines, ce qui correspond au
rythme de surveillance par imagerie (scanner
ou IRM), la date de progression de la maladie
pour chaque patient est donc influencée par le
rythme de surveillance
Les marches d’escalier de la survie
globale correspondent aux moments
des décès
La survie globale considère comme
événement d’intérêt le décès de toute cause.
On remarque par ailleurs que la courbe
en marche d’escalier de la survie globale
est beaucoup plus lisse que la courbe de la
survie sans progression. Cela s’explique par
le fait que les dates de décès correspondent
à la date individuelle de décès pour chaque
patient (qui est une date facile à identifier)
alors que la date de progression de la maladie
est fortement influencée par le rythme de
surveillance par imagerie
La médiane de la survie sans
progression est plus courte que la
médiane de survie globale
Elle est d’environ 12 semaines (3 mois) pour
la survie sans progression et d’une douzaine
de mois pour la survie globale (attention,
car l’échelle de temps renseignée sur l’axe
des abscisses n’est pas la même entre les
deux figures). Il est logique que la médiane
de survie sans progression soit plus courte
que la médiane de survie globale, la survie
sans progression étant un critère composite
qui considère l’événement « décès » ou
l’événement « progression » alors que
la survie médiane considère seulement
l’événement « décès »
Il n’aurait pas fallu cocher...
Commentaires
Les événements apparaissent aux
mêmes durées de suivi pour la survie
sans progression et la survie globale
La progression survient la plupart du temps
avant le décès, ce qui explique la différence de
médiane de survie entre la survie globale et la
survie sans progression
L’efficacité de l’erlotinib sur la survie
sans progression est identique à celle
observée pour la survie globale
L’efficacité de l’erlotinib semble un peu moins
importante sur la survie globale (HR à 0,81
[IC95 % : 0,70-0,95]) que sur la survie sans
progression (HR à 0.71 [IC95 % : 0,62-0,82])
même si l’effet est significatif dans les
deux cas
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
70
Généralités
Ex e m ple 2 (ED N 2019)
Galimberti V, Cole BF, Zurrida S, Viale G, Luini A, Veronesi P, et al. Axillary
dissection versus no axillary dissection in patients with sentinel-node
micrometastases (IBCSG 23-01): a phase 3 randomised controlled trial.
Lancet Oncol avr 2013; 14(4): 297-305.
We designed IBCSG trial 23-01 to détermine whether no axillary dissection
was non-inferior to axillary dissection in patients with one or more micrometastatic (< 2 mm) sentinel nodes and tumour of maximum 5 cm.
Patients were randomly assigned (in a 1:1 ratio) to either undergo axillary
dissection or not to undergo axillary dissection. The primary endpoint was
disease-free survival. Non-inferiority was defined as a hazard ratio (HR) of
less than 1.25 for no axillary dissection versus axillary dissection. The primary
endpoint was disease-free survival, determined as the number of years from
randomisation until first evidence of invasive relapse at any site, second primary tumour (controlatéral or non-breast), or death.
We assessed disease-free survival and overall survival using the Kaplan-Meier
product-limit method. We used the log-rank test, stratified by menopausal
status, to compare the treatment groups.
Le critère de jugement principal de survie sans récidive {disease-free survival) est
un critère {une ou plusieurs réponses possibles) :
Il aurait fallu cocher...
Commentaires
Composite
Le critère de jugement Disease-free survival est
clairement défini dans l’article comme étant soit
la survenue d’une rechute invasive du cancer, soit
la survenue d’un second cancer, soit du décès. Il
correspond à la survie sans rechute que l’on retrouve
au sous sus le terme progression free survival
Identique pour les 2 groupes
Oui, c’est la base de l’évaluation du critère de
jugement dans les essais cliniques
Avec données censurées
C’est un critère de jugement d’une analyse de survie,
il y aura donc des données censurées car tous les
patients n’auront pas présenté l’événement d’intérêt
au moment de la date de point et que certains auront
été perdus de vue
Il n’aurait pas fallu cocher...
Commentaires
Qualitatif à 3 modalités
Bien qu’il y ait 3 types d’événement pris en compte
(rechute invasive, second cancer ou décès), le critère
de jugement est un critère binaire (OUI/NON) car
il s’agit d’un critère composite. C’est-à-dire qu’un
patient aura présenté l’événement s’il présente soit une
rechute invasive, soit un second cancer soit le décès
Quantitatif
C’est un critère qualitatif binaire, c’est-à-dire survenue
de l’événement : OUI/NON
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyses dépendantes du temps ou « analyses de survie
71
Analysis of disease-free survival
AD = axillary dissection, DFS = disease-free survival.
À propos de la figure ci-dessus sur la survie sans récidive {une ou plusieurs réponses possibles) :
Il aurait fallu cocher...
Commentaires
La non-infériorité de l’absence de curage
ganglionnaire axillaire est significative
car la borne supérieure de l’intervalle de
confiance à 95 % du rapport des risques
instantanés {hazard ratio) est inférieure
à 1,25
Le hazard ratio est la mesure
d’association la plus couramment
utilisé dans les analyses de survie.
Il correspond au rapport des risques
instantanés à chaque moment du suivi
de l’étude entre 2 groupes comparés et
s’interprète de la même manière d’un
risque relatif. Ici, la borne supérieure de
son intervalle de confiance est inférieure
au seuil de non-infériorité choisi par les
auteurs (voir fiche 17 sur les études de
non-infériorité)
La supériorité de l’absence de curage
ganglionnaire axillaire est non
significative car l’intervalle de confiance
à 95 % contient la valeur 1
Oui, même si la conclusion principale de
l’étude ne peut pas reposer sur ce résultat
car l’objectif principal est de démontrer
la non-infériorité, il est tout à fait
possible de conclure sur la supériorité
dans cette situation
Il n’aurait pas fallu cocher...
Commentaires
La réduction du nombre de patients
exposés, divisé par 3 en 6 ans, résulte du
taux élevé de récidives et de décès
Le taux d’événement est faible dans cette
situation (moins de 20 % en 6 ans).
Cela s’explique par une durée de suivi
des patients très hétérogène {médian
follow-up of 5-0 [IQR 3.6-7.3] years)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 7
Méta-analyse
La méta-analyse est définie comme une « approche statistique qui a pour but
de rassembler, de résumer les résultats empiriques d’études singulières pour en
faire une synthèse reproductible et quantifiée » (Laroche P. La méta-analyse.
Méthodes et applications en sciences sociales. Louvain-la-Neuve : De Boeck
Supérieur, 2015).
D éfinitio n d e la m é t a-a n alyse
• Agrégation des résultats de plusieurs études (essais cliniques, études observationnelles à visée étiologique, études de performances diagnostique, études descriptives). Dans la méta-analyse on n’inclut pas des patients directement, mais
on inclut des études (on parle alors d’études primaires).
• L’objectif est d’apporter des réponses supposées plus précises et moins biaisés.
• Il ne s’agit pas simplement d’une revue de la littérature exposant le résultat de
chaque étude primaire prise isolément, la méta-analyse regroupe les résultats et
présente une taille globale de l’effet du traitement pour l’ensemble des études
primaires incluses dans la méta-analyse (comme un risque relatif global, par
exemple), en y associant son intervalle de confiance et une p-value globale.
A va n t a ges d e la m é t a-a n alyse
Dans quel contexte de recherche va-t-on bénéficier le plus de la réalisation
d’une méta-analyse ?
• Lorsque les résultats des essais sur un sujet sont en apparence contradictoires.
• Lorsque vous pensez qu’un traitement est efficace mais que la plupart des
essais sont négatifs par manque de puissance.
Quels sont les avantages de la méta-analyse ?
• Mesure d’un effet global permettant d’avoir un estimateur plus fiable de
l’effet d’un médicament par rapport à toutes les études prises séparément.
• Augmentation de l’effectif donc Meilleure représentativité de la population et
augmentation de la puissance.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
74
Généralités
Limit es d e la m é t a-a n alyse
Principal problème = biais de publication
• Plus une étude montre un effet important et un résultat statistiquement
significatif, plus celle-ci a de chance d’être publiée. A contrario les études dites
négatives ou retrouvant de faibles effets ont moins de chance d’être publiées.
• Le risque majeur de la méta-analyse est donc d’inclure majoritairement des
études « positives » car ce sont elles qui ont été majoritairement publiées. Les
études « négatives » non publiées sont alors ignorées et ne sont pas incluses
dans la méta-analyse.
• Le biais de publication entraîne donc un risque majeur de déséquilibre entre
les études « positives » et les études « négatives » avec une balance qui penche
en faveur des études « positives ». Finalement, plus le biais de publication est
important, plus le risque de conclure à une efficacité du traitement alors que
celui-ci n’existe pas l’est également.
Autres problèmes méthodologiques
Les études publiées sur un sujet donné sont très hétérogènes. Les critères de sélection des études à inclure dans une méta-analyse doivent donc être rigoureuse ment établis afin de permettre une évaluation des résultats la plus fiable possible
(la moins biaisée) sans pour autant perdre trop d’information (il ne faut pas
exclure des études intéressantes).
Voilà quelques questions méthodologiques qui se posent lors du choix des
critères de sélection des études :
Définition de la
population
Les populations peuvent être
très différentes d’une étude
à une autre, notamment si
les critères de définition de
la maladie ne sont pas les
mêmes à chaque fois
Exemple : durée d’évolution
de la maladie différente, stade
métastatique vs localisé, âge
des patients différents
Définition du critère de
jugement
Le critère de jugement peut
être différent d’une étude à
l’autre
Exemple : tout événement
cardiovasculaire versus AVC
seulement versus infarctus
seulement
Qualité des études
La qualité des études
publiées n’est bien sûr pas
homogène. La présence de
biais sera plus ou moins
importante selon les études
Exemple : essais randomisés
contre placebo en aveugle vs
essais ouverts voire non
randomisés
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Méta-analyse
75
Langue de publication
des études
Certaines études peuvent
être publiées dans d’autres
langues que l’anglais ou le
français. Cela peut donc
poser des problèmes de
recherche et de traduction
La recherche uniquement en
langue anglaise peut entraîner
une perte d’information si
des études présentant un
intérêt ont été publiées dans
une autre langue
Manque d’information
dans certaines études
Certaines études vont
manquer de données pour
permettre la réalisation de
l’analyse statistique de la
méta-analyse et risquent
donc d’être exclues
Une possibilité est alors de
réaliser une méta-analyse sur
données individuelles (il faut
alors contacter l’auteur de
l’article et qu’il accepte de
partager sa base de données)
Prése n t atio n d es résult ats
• Flow chart de la procédure d’inclusion des études.
- Visualisation des sources des études (PubMed, Cochrane, ClinicalTrials.gov,
etc.).
- Visualisation du nombre d’études identifiées comme candidates et du nombre d’études exclues et incluses dans la méta-analyse.
- Visualisation schématique de la méthodologie mise en œuvre pour la sélection des études.
► Remarque : la bonne méthodologie consiste à demander à deux auteurs
différents de sélectionner les études. En cas de discordance sur une étude,
on peut demander à un 3e auteur d’intervenir afin d’obtenir un consensus
sur l’inclusion ou l’exclusion de l’étude.
• Evaluation de la qualité des études sélectionnées.
- C’est une étape importante de la méta-analyse qui permet d’apprécier la qualité méthodologique des études sélectionnées.
- Les auteurs notent la méthodologie utilisée par chaque étude pour répondre
à la question posée par la méta-analyse.
- Il ne s’agit pas de noter la méthodologie de chaque étude hors contexte de la
méta-analyse mais bien dans le contexte de la question posée. Par exemple, un
essai clinique peut être de très bonne qualité méthodologique mais avoir une
« mauvaise note » dans le contexte de la méta-analyse car celle-ci s’intéresse
à un résultat sur un critère secondaire recueilli aléatoirement dans l’étude primaire.
- Cette étape aide à l’interprétation des résultats et permet de faire des analyses
en sous-groupe en fonction de la qualité des études primaires sélectionnées.
• Diagramme en forêt (forest plot) avec une ligne de résultat pour chaque étude
et une ligne de résultat (généralement la dernière ligne) qui représente l’effet
global et que l’on appelle la taille de l’effet.
- Exemple de forest plot :
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
76
Généralités
En faveur du
placebo
RR=1
En faveur du
traitement
*----------------
;
------------------------*
0.6
Study A
Study B
1
0.8
1.2
1.4
1.6
1.8
2
2.2
---------------------------------- •---------------------------------- 1
----------------------- •----------------------- 1
Study C
Study D
Global effect
---------------------------------- ♦--------------------------------- 1
i-------------------- •-------------------- 1
------------- •------------- 1
Fig u r e 7.1
• Les études A et B retrouvent un RR à 1,4 et 1,2 en faveur du traitement mais
avec un effet non significatif car leur IC à 95 % comprend la valeur 1.
• Les études C et D retrouvent un RR à 1,6 et 1,5 en faveur du traitement
mais avec un effet cette fois significatif car leur IC à 95 % ne comprend pas la
valeur 1.
• La taille de l’effet global retrouve un RR à 1,3 en faveur du traitement avec
un effet significatif car son IC à 95 % ne comprend pas la valeur 1.
►
Remarque : l’IC à 95 % de l’effet global est plus étroit que l’IC à 95 %
des RR des études prises isolément car la taille de la population prise en
compte est plus importante du fait de l’agrégation des données.
H é t éro g é n éité d ans les m é t a-a n alyses
L’hétérogénéité peut être de deux types dans les méta-analyses : clinique et/ou
statistique. Les conséquences de ces deux types d’hétérogénéité ne sont pas les
mêmes.
Hétérogénéité clinique
Par exemple, on peut retrouver une hétérogénéité sur les populations des études
(stade localisé vs stade métastatique, population hospitalière vs population
ambulatoire, etc.), sur les critères de jugement (décès vs variable biologique),
sur les durées de suivi (transversales vs longitudinales), sur la manière d’administrer les médicaments (posologies différentes), etc.
C’est la lecture de la partie matériel et méthodes de chaque étude qui permet
de se rendre compte de l’importance de l’hétérogénéité clinique de la métaanalyse.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Méta-analyse
L’hétérogénéité clinique peut poser des problèmes d’interprétabilité des résultats : quelle interprétation faire d’un estimateur commun issu de la sélection
d’études très hétérogènes entre elles (concernant des populations très différentes, par exemple) ?
Parfois, le calcul d’un estimateur commun est impossible car les études sont
tellement différentes que cela n’aurait aucun sens.
La définition a priori des critères permettant d’inclure les études lors de la
rédaction du protocole de la méta-analyse doit permettre de trouver un équilibre entre homogénéité clinique et exclusion trop importante d’études intéressantes pour répondre à la question posée.
Hétérogénéité statistique
La méta-analyse est statistiquement hétérogène quand les différentes études qui
la composent sont discordantes sur le plan de leurs résultats. Le forest plot
permet d’identifier visuellement une hétérogénéité statistique si les estimateurs
de chaque étude se distribuent de manière différente de chaque côté de la ligne
verticale représentant un risque relatif = 1 ou une différence absolue = 0.
L’hétérogénéité statistique fait généralement l’objet d’un test statistique que
l’on retrouve généralement positionné tout en bas du forest plot. Il s’agit du test
du I2 ou du T2.
Si toutes les études retrouvent toutes le même risque relatif, on dit que les
résultats sont homogènes et alors le I2 est à 0 %. Au contraire, si les études
retrouvent des résultats différents, les résultats sont hétérogènes et alors le I2 est
différent de 0 %. Un petit p est parfois associé et représente le résultat du test
sous l’hypothèse nulle HO : I2 = 0 %.
On peut définir le niveau d’hétérogénéité selon les valeurs de I2 suivantes :
• I2 < 0,25
hétérogénéité faible ;
• 0,25 < I2 < 0,5 —> hétérogénéité modérée ;
• I2 > 0,5
hétérogénéité importante.
Parfois, un intervalle de prédiction {prédiction interval) est représenté juste
en dessous du résultat représentant la taille globale de l’effet associée à son
intervalle de confiance. L’intervalle de prédiction est une notion différente de
l’intervalle de confiance de la taille globale de l’effet.
L’intervalle de prédiction indique dans quelle tranche a 95 % de chance de se
trouver la mesure d’association estimée par la prochaine étude qui sera réalisée
sur le sujet. Il reflète l’homogénéité ou l’hétérogénéité des différents résultats
des études incluses dans la méta-analyse car l’intervalle de prédiction est très
fortement lié au I2 d’homogénéité. En effet, si les études sont homogènes (le RR
est pratiquement identique dans toutes les études), alors le I2 est à 0 %. Dans
ce cas, le risque qu’une prochaine étude publiée sur le même sujet retrouve un
résultat identique est très important et en conséquence l’intervalle de prédiction
de la méta-analyse sera très étroit. À l’inverse, plus les résultats des études sont
hétérogènes, plus le I2 est éloigné de 0 %, plus il est difficile de prédire le résultat
d’une future étude avec certitude et donc l’intervalle de prédiction s’agrandit.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
78
Généralités
Évaluatio n du biais d e p u blica tio n
Le funnel plot (graphique en entonnoir) représente les estimations ponctuelles de
chaque étude primaire en fonction de la taille de l’échantillon de chaque étude.
On retrouve la mesure d’association utilisée dans l’étude (le risque relatif, par
exemple) en abscisse et l’erreur standard (qui dépend de la taille de l’échantillon)
en ordonnée.
Le triangle représente artificiellement les intervalles de confiance. Les études
avec les effectifs les plus importants et donc avec les intervalles de confiance les
plus étroits se situent en haut du graphique, à l’endroit où le triangle se resserre.
Exemple de funnel plot :
Dans l’exemple de funnel plot ci-dessus, le résultat de chaque étude primaire
est représenté par un petit carré orange. On remarque qu’une zone est vierge
de ces petits carrés (la zone entourée d’un cercle gris). Cette zone correspond
aux études de faible puissance qui montrent un effet délétère du traitement. Cet
aspect est typique d’un biais de publication car cela laisse penser que les études
qui se situent dans cette zone n’ont pas été publiées.
E x e m pl e d e m é t a - a n a l ys e
Fiolet T, Guihur A, Rebeaud ME, Mulot M, Peiffer-Smadja N,
Mahamat-Saleh Y. Effect of hydroxychloroquine with or without
azithromycin on the mortality of coronavirus disease 2019 (COVID-19)
patients: a systematic review and meta-analysis. Clin Microbiol Infect Off
Publ Eur Soc Clin Microbiol Infect Dis janv 2021 ; 27(1) : 19-27.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Méta-analyse
79
Flow diagram of study sélection process.
Study
Type of study = non-randomised
Ayerbe et al., 2020 [17]- Spain
Gelerisétal., 2020 [15]- USA
Rivera et al., 2020 [47]-USA/Canada/Spain
Ip et al., 2020 [42]- USA
Magagnoli et al., 2020 [41]- USA
Mahevas et al., 2020 [13]- France
Membrillo et al., 2020 [16]- Spain
Mikami et al., 2020 [56]- USA
Paccoud et al., 2020 [46] France
Rosenberg et al., 2020 [18]- USA
Sanchez-Alvarez et al., 2020 [44]- Spain
Sbidian et al., 2020 [48]- France
Singh et al., 2020 [19]- USA
Yu et al., 2020 [14]- China
TE seTE
Risk Ratio
RR
-0.86 0.1323
0.04 0.1214
0.10 0.2287
-0.01 0.1077
0.60 0.2329
0.18 0.5400
-2.66 0.8958
-0.63 0.1253
-0.12 0.6923
-0.08 0.2742
-0.75 0.2652
0.05 0.1394
-0.05 0.1300
-1.02 0.3641
ss ;
ia
7»
si
0.42
1.04
1.11
0.99
0.83
0.20
0.07
0.53
0.89
1.08
0.47
1.05
0.95
0.36
0.79
(0.33-0.55)
(0.82-1.32)
(0.71-1.74)
(0.80-1.22)
(1.16-2.89)
(0.42-3.45)
(0.01-0.41)
(0.23-0.68)
(0.63-3.46)
(0.28-1.85)
(0.80-0.79)
(0.80-0.38)
(0.74-1.23)
(0.18-0.73)
(0.60-1.04)
8.1%
8.1%
6.9o/o
8.3%
6.80/0
3.4%
I.60/0
8.20/0
2.4%
6.20/0
6.40/0
8.0%
8.10/0
5.10/0
87.50/0
1.47
1.09
1.01
1.09
(0.48-0.55)
(0.96-1.32)
(0.06-1.74)
(0.97-1.22)
3.10/0
8.70/0
O.7O/o
12.5%
0.83
(0.65-1.06)
(0.33-2.12)
1OO.OO/o
-h -
A,
V
1
s'
*
s
95% Cl Weight
Random effects model
hetergeneity:/2 =84%, t2 =0.2021, p<0.01
Type of study=RCT
Cavalcanti et al.,2020 [51 Brazil
Horby et al., 2020, RECOVERY Trial [40]-UK
Skipper et al.,2020, [39]-USA/Canada
Ramdom effects model
Helerogeneity. /2 =0%, t2 =0,87
Random effect model
Prédiction interval
Helerogeneity: /2 =83o/o.t2 =0.1768, p<0,01
Residual heterogeneity: /2 =82%, p<0.01
____ i s
!>
0.39 0.5726
0.09 0.0632
0.01 1.4264
4
1
1
1
1
0.1
0.5 1
2
10
Forest plot of the association between hydroxychloroquine alone and
COVID-19 mortality (excluding studies with critical risk of bias) RR, risk ratio.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
80
Study
Généralités
TE
seTE
Type of study = observational
-0.02 0.1364
lp
0.27 0.2500
Magagnoli
0.77 0.2497
Rivera
Rosernberg
0.30 0.2900
0.34 0.1565
Sbidian
0.17 0.1500
Singh
Random effects model
Heterogeneity: I2 = 42°/o, x 2 = 0.0263, p = 0.12
Risk Ratio
RR
| ;
LL
----- B
-L-----
0.98
r
0.5
1
Weight
23.3o/o
II.60/0
11.6o/o
9.3o/o
2O.5O/o
21.40/0
97.7o/o
!----- +---------Hi----4H-
2.15
1.35
1-40
1-19
O
11
1.29
(0.75-1.28)
(0.80—2.14)
(1.32-3.51)
(0.76-2.38)
(1.03—1.90)
(0.88-1.59)
(1.06-1.58)
0.64
0.64
(0.18-2.24)
(0.18—2.24)
2.3o/o
2.3o/o
ï 27
(1.04-1.54)
(0.79-2.05)
WO.OO/o
1.31
Type of study - RCT
-0.45 0.6397 ----------------- *----- -[------Cavalcanti
Random effects model
■f
11
Heterogeneity: not applicable
1
Random effects model
Prédiction interval
i
Heterogeneity:
0.2
I2 = 38O/o, t 2 = 0.0247, p = 0.14
Residual heterogeneity: I2 ■ = 42o/o, p = 0.12
95o/o Cl
1
2
1
5
Forest plot of the association between hydroxychloroquine with azithromycin and
COVID-19 mortality (excluding studies with critical risk of bias) RR, risk ratio.
Concernant les études incluses dans cette méta-analyse :
Il aurait fallu cocher...
Commentaires
Les études avec un risque de biais important n’ont pas été prises en compte dans
l’analyse
C’est pour cette raison que le nombre
d’études utilisées pour les analyses ne
correspond pas au nombre d’études
incluses. Il est par ailleurs précisé dans le
titre des figures : excluding studies with
critical risk of bias
L’identification des études candidates à
l’inclusion dans cette méta-analyse semble
avoir été réalisée de manière à rendre
compte d’un screening le plus exhaustif
possible
Du fait de l’utilisation de différentes
sources de données (Pumed, Embase,
Web of science, Cochrane)
283 articles ont été exclues car ils ne
correspondaient pas à des études
épidémiologiques ou thérapeutiques
Il s’agit des articles publiant des résultats
qui ne correspondent pas directement aux
résultats d’études conduites directement
avec des patients (lettres commentées,
des revues de la littérature, des métaanalyses, etc.)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Méta-analyse
Il n’aurait pas fallu cocher...
Commentaires
Toutes les études incluses ont été utilisé
dans la réalisation de l’analyse statistique
Concernant les études évaluant l’HCQ
seule 17/27 études incluses ont été
analysées et concernant les études évaluant
l’HCQ et l’AZT seule 7/12 ont été
analysées
La majorité des études utilisées dans
l’analyse sont des essais thérapeutiques
randomisés
Seulement 3 essais randomisés pour l’HCQ
seule et seulement 1 essai randomisé pour
l’association HCQ + AZT
Le risque d’inclure 2 fois certains
patients n’a pas été pris en compte par
les auteurs
2 études ont été exclues car elles étaient
des doublons d’une même cohorte
81
Concernant les résultats de la méta-analyse sur l’effet de l’hydroxychloroquine
seule :
Il aurait fallu cocher...
Commentaires
Il n’y a pas d’effet statistiquement
significatif sur la mortalité comparé au
placebo selon cette méta-analyse
Oui, avec un RR à 0,83 et un IC comprenant
la valeur 1
Les résultats des essais cliniques randomisés sont très homogènes entre eux
Oui, globalement le RR est proche de 1 et
toujours > à 1 avec intervalle de confiance
comprenant la valeur 1 et I2 d’homogénéité
est à 0 %
On retrouve un effet statistiquement significatif en faveur du traitement dans
certaines études non randomisées
Oui, est ce pour 5 études sur 14 pour lesquelles le RR est < 1 avec un intervalle de
confiance ne comprenant pas la valeur 1
Dans cette méta-analyse, la largeur de
l’intervalle de prédiction est liée à la
prise en compte importante d’études
non randomisées
Oui, car les résultats des études non
randomisées sont très hétérogènes alors que
les résultats des études randomisées sont
homogènes. Si on calculait un intervalle de
prédiction seulement en prenant en compte
les essais randomisés, celui-ci serait très étroit
Il n’aurait pas fallu cocher...
Commentaires
Les résultats des études non randomisées
sont très homogènes entre eux
Certaines études ne retrouvent pas d’effet
de l’HCQ, certaines retrouvent un effet
protecteur et d’autres un effet délétère. Par
ailleurs, le I2 est très éloignés de 0 (83 %)
est très large et comprend la valeur 1
(0,33-2,12)
On retrouve un effet statistiquement significatif en faveur du traitement dans
certaines études randomisées
Les 3 essais randomisés retrouvent un RR
proche de 1 avec un intervalle de confiance
comprenant la valeur 1
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
82
Généralités
Il n’aurait pas fallu cocher...
Commentaires
L’estimation du risque relatif donnée
par la taille de l’effet global et mesurée
à 0,83 est probablement moins biaisée
que celle donnée par l’agrégation
des essais randomisés et mesurée à
1,09 étant donné que beaucoup plus
d’études sont utilisées pour son calcul
L’estimation donnée par le résultat des
3 essais randomisés est certainement moins
biaisée que l’estimation donnée par les
14 études observationnelles. Augmenter le
nombre d’études les plus biaisés ne permet
pas de diminuer les biais
Il y a 95 % de chance que la vraie
valeur du risque relatif de mortalité liée
à la prise d’HCQ soit comprise entre
0,33 et 2,12
Il s’agit de l’intervalle de prédiction et non
pas de l’intervalle de confiance. Les résultats de cette méta-analyse indiquent qu’il
y a 95 % de chance que la vraie valeur du
risque relatif de mortalité liée à la prise
d’HCQ soit comprise entre 0,65 et 1,06
Concernant les résultats de la méta-analyse sur l’effet de l’hydroxychloroquine
en association avec l’azithromycine :
Il aurait fallu cocher...
Commentaires
L’effet significatif du traitement sur
la mortalité dans cette méta-analyse
pourrait s’expliquer par un biais de prescription de l’association HCQ + AZT
vers les patients les plus graves
La plupart des études non randomisées
retrouvent une tendance à un effet délétère du traitement. Ceci peut s’expliquer
par le fait que le traitement pourrait
avoir été prescrit pour les patients les
plus graves ou les plus fragiles. Par
ailleurs, le seul essai randomisé pris en
compte retrouve plutôt une tendance à
un effet positif du traitement (même si
celui-ci n’est pas significatif)
Il n’aurait pas fallu cocher...
Commentaires
Les résultats concernant l’association
HCQ + AZT retrouvent un effet significatif en faveur du traitement
Le RR est à 1,27 avec un intervalle de
confiance ne comprenant pas la valeur 1 ;
l’effet est donc significatif, mais en faveur
du placebo (il s’agit du RR estimant
l’effet du traitement sur la mortalité,
donc un risque > 1 suggère une augmentation de la mortalité des patients traités
vs placebo)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 8
Conditions réglementaires
et éthiques dans la recherche
impliquant la personne
humaine
Asp ects ré gle m en t aires
En France, deux lois principales régissent les autorisations pour réaliser des
études dans le champ de la santé :
• la loi Jardé de 2012 : loi sur la recherche impliquant des personnes humaines.
Elle permet notamment de classer les différents types de recherche en différentes
catégories (voir tableau ci-dessous) et définit les différentes démarches à suivre
en fonction de la catégorie dans laquelle se situe l’étude ;
• la loi Informatique et liberté : loi sur la protection des données. Elle vise
à établir des règles concernant les données collectées, notamment l’obligation
d’assurer la sécurité de ces données, l’obligation d’informer les individus
concernés et le droit à l’accès, la modification et la suppression de ces données
pour les individus concernés.
Les structures impliquées dans ces processus règlementaires sont :
• le comité de protection des personnes (CPP) : qui veille au respect de la loi
Jardé et qui donne son avis préalable à toute recherche biomédicale. Il en existe
un par région. S’il donne un avis défavorable, il est interdit de mettre en place
la recherche ;
• le Comité national de l’informatique et des libertés (CNIL) qui veille au respect de la loi informatique et liberté ;
• enfin, l’Agence nationale de sécurité du médicament (ANSM), est un troisième
acteur qui doit donner son autorisation pour tout ce qui concerne l’évaluation
du médicament et des dispositifs médicaux. Donc, en pratique, pas d’essai clinique sans autorisation de l’ANSM.
La LCA en anglais facile aux ED N
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
84
Généralités
Démarches réglementaires en fonction du projet selon la loi Jardé (recherche
impliquant la personne humaine [RIPH]).
Catégorie 1
Recherches
interventionnelles
Catégorie 2
Recherches
interventionnelles à risques
et contraintes minimes
Catégorie 3
Recherches non
interventionnelles
Etude avec intervention
non justifiée par la prise
en charge habituelle
qui est susceptible de
comporter un risque pour
le patient (essai évaluant
un médicament, un acte
diagnostique invasif, etc.)
Etudes non
médicamenteuses avec
contraintes et risques
minimes (par exemple,
une étude de cohorte avec
un ou des bilans sanguins
supplémentaires par
rapport à ce qui est réalisé
en pratique courante)
Etudes observationnelles
type cas-témoins ou
cohorte n’impliquant
aucune procédure
supplémentaire par rapport
à la prise en charge
habituelle du patient
(même pas une prise de
sang supplémentaire)
Autorisation du CPP nécessaire
Autorisation spécifique de la CNIL nécessaire
Information auprès de l’ANSM
Autorisation de l’ANSM
nécessaire
Assurance nécessaire
Consentement libre, éclairé
et écrit
Autorisation de la CNIL ou
engagement de respect de la
méthodologie de référence
de la CNIL
Consentement libre, éclairé
et exprès
Assurance non nécessaire
Non-opposition
Démarches réglementaires des études non couvertes par la loi Jardé (recherche
n’impliquant la personne humaine [RNIPH]).
Catégorie 4
Recherche dite « hors champ de la loi Jardé » ou RNIPH
Réutilisation secondaire de données et/ou de collections déjà acquises ou d’un registre
agréé, ou de dossiers médicaux sans que de nouvelles informations soient collectées
auprès de patients
pas de nécessité de revenir au patient
Pas d’autorisation du CPP requise. Avis d’un comité d’éthique souhaitable pour
publication mais non imposé par la loi
Autorisation de la CNIL non obligatoire si méthodologie de référence de la CNIL
utilisée
ANSM non impliquée
Pas d’assurance nécessaire (pas de promoteur obligatoire)
Non-opposition
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Conditions réglementaires et éthiques dans la recherche impliquant...
85
En pratique
La publication du protocole ne garantit pas qu'il respecte les règles éthiques,
c ’ est l’ autorisation du comité d ’ éthique qui en est garante.
Toutes les études avec traitement informatisé des données doivent obtenir
l'autorisation de la CNIL
Toutes les études dans lesquelles on doit recueillir des informations auprès des
patients dans le cadre de l'étude (cas-témoins) doivent obtenir l’ accord du CPP.
Les études interventionnelles sur le médicament doivent obtenir l'autorisation
de l'ANSM.
Les seules études dispensées de l'autorisation du CPP sont les études sur des
données ou des collections existantes.
PS : l'expression « recherche interventionnelle » définit ici toute procédure réalisée sur le
patient qui n'est pas prévue par la prise en charge habituelle de la pathologie considérée.
C'est à bien différencier de l'expression « étude expérimentale », utilisé en méthodologie
pour définir les études au cours desquelles l'attribution de l'exposition est fixée par le design
de l'étude (au contraire des études observationnelles).
Particip a n ts à la recherche e t d é finitio ns
Promoteur
Personne physique ou morale qui est responsable d’une recherche impliquant
la personne humaine ; il en assure la gestion et vérifie que son financement est
prévu. C’est généralement le promoteur qui prend l’initiative de l’essai clinique.
Le promoteur est responsable de la sécurité des personnes et doit contracter une
assurance. Il peut être industriel (laboratoire pharmaceutique) ou institutionnel
(par exemple, un CHU, l’INSERM, l’INCa, etc.).
Dans les articles on repère le promoteur grâce aux termes de promoter ou
sponsor.
Le terme investigator-initiated study signifie que l’étude a été conçue et réalisée par un médecin académique, promue par un hôpital public ou privé, mais
payée par une firme pharmaceutique. Normalement, la firme pharmaceutique
n’a pas de droit de regard sur le protocole, l’étude ou le résultat, mais en pratique cela ne garantit pas l’indépendance de l’étude.
Investigateur
Personne physique médicalement qualifiée qui inclut les patients et veille à leur
sécurité. Il est responsable de la conduite de la recherche. Il informe et recueille
le consentement des patients. Il veille au bon respect du protocole et à la qualité
du recueil des données. Un investigateur principal est l’investigateur responsable de la recherche dans un centre investigateur (un service, un hôpital, etc.).
L’investigateur coordonnateur représente l’ensemble des investigateurs et fait le
lien direct avec le promoteur.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
86
Généralités
Lie n d'int érê t / co n flit d'in t érê t
Un lien d’intérêt est un lien direct ou indirect (via un membre de sa famille, par
exemple) qui permet d’obtenir un avantage en rapport ou non avec la profession.
Un conflit d’intérêt apparaît dans la situation au cours de laquelle un professionnel voit son lien d’intérêt influer ou paraître influer sur l’exercice impartial
et objectif de ses fonctions.
Établir l’existence d’un lien d’intérêt ne veut pas forcément dire qu’il existe
un conflit d’intérêt. En revanche un conflit d’intérêt survient dans le contexte
d’un lien d’intérêt préexistant.
La loi impose la transparence des liens existant entre l’industrie pharmaceutique (ou de santé de manière générale) et les acteurs du monde de la santé. La
déclaration des liens d’intérêts est donc obligatoire.
En pra tique
Ex e m ple 1 (ED N 2017)
Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML,
Santhakumaran S, et al. Levosimendan for the Prévention of Acute Organ
Dysfunction in Sepsis. N Engl J Med T7 oct 2016 ; 375(17) : 1638-48.
We conducted this multicenter, randomized, double-blind, placebo-controlled
clinical trial in 34 general adult intensive care units (ICUs) in the United
Kingdom. London-Harrow Research and Ethics Committee approved the
protocol. The trial was funded by the National Institute for Health Research
and Tenax Therapeutics and sponsored by Impérial College London. Data
management and analysis were performed by the Impérial Clinical Trials
Unit. Orion Pharma provided levosimendan and placebo free of charge. The
funders, the sponsor, and Orion Pharma had no rôle in designing the trial,
gathering or analyzing the data, writing the manuscript, or making the decision to submit the manuscript for publication. The first author vouches for the
data and analyses, as well as for the fidelity of this report to the trial protocol.
Dr. Gordon reports receiving Consulting fees from Ferring Pharmaceuticals
and grant support from HCA International, both paid to his institution.
Concernant les aspects éthiques ou règlementaires, quelle(s) est(sont) la (les)
proposition(s) exacte(s) ?
Il aurait fallu cocher...
Commentaires
Le premier auteur ne
déclarait pas de lien
d’intérêt avec Orion
Les liens d’intérêts (Disclosure of interest) sont
généralement fournis en fin d’article
Le principe d’ambivalence
a été respecté
L’étude a été réalisée avec une randomisation en double
aveugle. Donc, tous les patients avaient de fait la même
probabilité de recevoir l’un ou l’autre des traitements.
On suppose en conséquence que l’ensemble des
contre-indications aux deux traitements ont été prises en
compte, même si ce n’est pas directement précisé
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Conditions réglementaires et éthiques dans la recherche impliquant...
Il n’aurait pas fallu cocher...
Commentaires
La signature d’un consentement
aux patients garantit l’éthique du
protocole
La signature d’un consentement est indispensable
mais ne garantit pas en soi l’éthique
du protocole. Seule la validation par
un comité d’éthique le peut
En France, une telle étude
multicentrique aurait seulement
requis l’autorisation d’un CPP
En France, un essai clinique sur le médicament
requiert l’autorisation d’un CPP, de la CNIL,
et de l’ANSM (loi Jardé) :
Toute étude prospective = CPP + CNIL
Toute étude sur le médicament =
CPP + CNIL + ANSM
Le promoteur de l’étude était la
firme Orion
En anglais le promoteur est décrit sous les
termes promoter ou sponsor. Ici il s’agit donc
de l’Imperial College of London. Pour rappel,
le promoteur est la personne physique
ou morale qui prend l’initiative de l’essai
clinique. Elle est responsable de la sécurité des
personnes et doit contracter une assurance
87
Ex e m ple 2 (é preuve t est 2017)
Hugosson J, Carlsson S, Aus G, Bergdahl S, Khatami A, Lodding P, et al.
Mortality results from the Gôteborg randomised population-based
prostate-cancer screening trial. Lancet Oncol août 2010 ; 11(8) : 725-32.
Funding : The Swedish Cancer Society, the Swedish Research Council and the
National Cancer Institute.
Disclosure : Dr. Hans Lilja holds patents for free PSA and hK2 assays. Dr.
Lilja reports having received honoraria from GlaxoSmithKline. Dr. Hugosson
reports receiving lecture fees from GlaxoSmithKline and Abbott Pharmaceuticals. Ail other authors déclaré that they hâve no conflicts of interest.
This study is registered [as an International Standard Randomised Controlled
Trial], controlled-trials.com identifier number [ISRCTN49127736].
Rôle of the funding source : The funding sources had no rôles in the design
and conduct of the study ; collection, management, analysis, and interprétation of the data ; and préparation, review, or approval of the manuscript. The
funding sources had no access to the database which is kept at the Sahlgrenska
University Hospital.
Parmi les éléments suivants, quels sont ceux qui traduisent le respect par les
auteurs des règles de transparence ou d’indépendance ?
Il aurait fallu cocher...
L’étude a été référencée dans un
registre des essais cliniques sous le
numéro ISRCTN54449243
Commentaires
Enregistrement et autorisation, financement,
liens d’intérêts sont des éléments à repérer à
la première lecture du texte
Le financeur n’a joué aucun rôle dans
la conception et la réalisation de
l’étude
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
88
Généralités
Il aurait fallu cocher...
Commentaires
Les auteurs ont publié les sources de
financement de l’étude
Les auteurs ont publié les liens
d’intérêts
Il n’aurait pas fallu cocher...
L’étude est multicentrique
L’étude est réalisée en population
Commentaires
Distracteurs n’ayant aucun rapport
avec les règles de transparence et
d’indépendance
Ex e m ple 3 (é preuve t est 2020)
Bracard S, Ducrocq X, Mas JL, Soudant M, Oppenheim C, Moulin T, et al.
Mechanical thrombectomy after intravenous alteplase versus alteplase
alone after stroke (THRACE): a randomised controlled trial. Lancet Neurol
oct 2016; 15(11): 1138-47.
The study protocol was approved by the CPP (comité de protection des personnes) III Nord Est Ethics Committee and the research boards of the participating centres. Ail patients or their legal représentatives provided written
informed consent.
Patients were randomised (1:1) as soon as possible during intravenous thrombolysis to receive intravenous thrombolysis and mechanical thrombectomy
(IVTMT group) or intravenous thrombolysis alone (IVT group).
Quelle(s) est(sont) la(les) propositions) exacte(s) concernant les démarches éthiques
de cette étude ?
Il aurait fallu cocher...
Commentaires
La loi permet d’inclure des patients
n’étant pas en mesure de fournir un
consentement éclairé
Lorsque la personne n’est pas en état de
pouvoir donner son consentement libre
et éclairé (ce qui arrive souvent au cours
des études se déroulant en réanimation
et en soins intensifs), il est possible de
recueillir le consentement de la personne
de confiance, de la famille ou d’une
personne entretenant avec le patient des
liens stables et étroits
L’étude est en accord avec les exigences
règlementaires françaises
The study protocol was approved
by the CPP (comité de protection
des personnes) III Nord-Est Ethics
Committee and the research boards of
the participating centres. AU patients
or their legal représentatives provided
written informed consent
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Conditions réglementaires et éthiques dans la recherche impliquant...
Il n’aurait pas fallu cocher...
Commentaires
Le protocole aurait dû être approuvé par
le CPP de chaque centre français
En France, l’autorisation d’un seul CPP
est nécessaire. Le CPP est tiré au sort
Un consentement oral était suffisant et
aurait permis d’élargir le recrutement
Le consentement écrit est indispensable
au cours des essais cliniques. Il doit
être donné après avoir reçu toutes les
informations nécessaires et après lecture
de la lettre d’information
Les patients randomisés dans le groupe
thrombectomie mécanique auraient dû
donner un 2e consentement, compte tenu
du caractère invasif de cette stratégie
Le patient exprime son consentement
avant randomisation et doit donc recevoir
toutes les informations nécessaires
concernant l’étude et notamment le fait
qu’il puisse être randomisé dans le groupe
avec ou sans thrombectomie. Il n’y a
donc qu’une seule signature. Néanmoins,
il a le droit de retirer son consentement
par la suite et à tout moment, qu’il ait été
randomisé dans l’un ou l’autre bras
89
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Pa r t ie II
Essais cliniques
Pl a n
Fiche 9
Fiche 10
Fiche 11
Fiche 12
Fiche 13
Fiche 14
Fiche 15
Fiche 16
Fiche 17
Fiche 18
Fiche 19
Caractéristiques d’un essai clinique
Critères de jugement et objectifs
Critères de sélection
Randomisation
Procédure d’aveugle et effet placebo
Plan expérimental
Suivi de l’étude et diagramme de flux
Population d’analyse (ITT et per-protocole)
Essais de non-infériorité et d’équivalence
Analyse en sous-groupes
Conclusion de l’étude et critique des résultats
93
97
109
113
127
139
143
151
163
175
189
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 9
Caractéristiques d’un essai
clinique
Un essai clinique de phase III est une étude dont l’objectif est de comparer deux
interventions thérapeutiques entre elles ou une intervention thérapeutique à un
placebo.
Un essai clinique de phase III est donc par définition toujours une étude :
• prospective ;
• comparative ;
• interventionnelle ;
• randomisée.
Un essai clinique n’est donc jamais une étude :
• rétrospective ;
• descriptive ;
• observationnelle.
À l’issue de la lecture de cette partie du livre, vous devrez être capable de
repérer à la lecture d’un essai clinique :
• si l’essai est de phase II ou III (l’ensemble des essais présentés jusqu’ici aux
ECN et EDN concernait des essais de phase III) ;
• si l’essai est randomisé ou non et les caractéristiques de la randomisation ;
• si l’essai est mono- ou multicentrique. Si la randomisation est stratifiée sur le
centre (voir fiche 12) ;
• si une procédure d’aveugle est mise en place (essai en double aveugle ou en
ouvert) ;
• le schéma d’étude (en groupes parallèles, en cross-over ou en plan factoriel) :
l’ensemble des essais présentés jusqu’ici aux ECN et EDN concernait des essais
en groupes parallèles ;
• si l’essai est de supériorité, d’infériorité ou d’équivalence ;
• si l’analyse principale est présentée en intention de traiter ou en per-protocole ;
• le nombre de perdus de vue et la technique pour les prendre en compte, ceci
permettant de se rendre compte du biais d’attrition ;
• le critère de jugement principal et les critères de jugement secondaires ;
• les critères d’inclusion et d’exclusion des participants (ce qui définira la population de l’étude).
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
94
Essais cliniques
Phases d e d évelo p p e m en t d'un m é dica m e n t
Au cours du développement d’un médicament, différentes phases se succèdent.
La phase préclinique permet dans un premier temps de sélectionner le meilleur
« candidat médicament ». Dans un second temps, l’évaluation est autorisée
chez l’homme au cours de la phase clinique.
Phase précliniq u e
• Objectif : sélectionner parmi de nombreuses molécules celle possédant les
meilleures qualités lui permettant d’être testée chez l’homme.
• Se déroule au laboratoire in vitro et in vivo sur l’animal.
• Pas d’administration chez l’homme.
• Sélection selon des données de toxicité et les potentiels effets thérapeutiques.
Phase cliniq u e
Phase I
• Objectifs : déterminer la tolérance du médicament, la dose maximale tolérée,
le mode d’administration.
• Administration du médicament sélectionné en phase préclinique à dose croissante à des volontaires sains (sauf cas particuliers) sur un effectif réduit.
• Étude de pharmacocinétique associée.
• En cas de profil de toxicité favorable, permet de choisir les posologies qui
seront testées en phase IL
• Essai non comparatif.
Phase II
• Objectifs : évaluer l’efficacité du médicament et déterminer la dose optimale
chez l’homme ; évaluer la toxicité à court terme ; étudier la pharmacocinétique
et la relation dose-effet.
• Administration du médicament à des malades (phase Ilb) ou à des sujets sains
(phase Ha).
• Dépiste des effets indésirables moins fréquents et non constatés en phase I en
raison d’un effectif un peu plus grand.
• Permet de choisir la posologie offrant la meilleure balance bénéfice/risque
pour la réalisation des essais de phase III.
• Ces essais sont parfois comparatifs.
Phase III
• Objectif : évaluer l’efficacité du médicament de manière comparative soit face
à un placebo, soit face à un traitement de référence.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Caractéristiques d’un essai clinique
95
• Effectifs de plus grande importance avec constitution d’un groupe témoin :
essai comparatif.
• Poursuite de l’analyse de tolérance avec recueil des effets indésirables.
• Permet au traitement l’obtention de l’autorisation de mise sur le marché
(AMM) et donc sa commercialisation.
Phase IV
• Concerne toutes les études réalisées sur un médicament après son obtention
de l’AMM et de sa commercialisation.
• Concrètement, on désigne l’étude des conditions d’application du médicament notamment en termes de sécurité (étude de pharmacovigilance). Concerne
de larges échantillons de sujets et permet ainsi de dépister des effets indésirables
très rares mais potentiellement très graves et de mesurer son efficacité en situation de vie réelle (pharmacoépidémiologie). Peut entraîner un retrait du marché
du médicament, ou une modification de son AMM.
►
Remarque : les essais qui évaluent de nouvelles indications, de nouveaux
dosages, de nouveaux modes d’administration, de nouvelles associations
en vue de l’obtention d’une nouvelle AMM doivent être considérés
comme des essais de phase III (on parle de phase Illb) et pas comme des
essais de phase IV.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 10
Critères de jugement
et objectifs
En complément
V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l e s cri t è r es d e j u g e m e n t :
h t t ps: / / y o u t u .b e / l 6 L W sC 4 k 3 gs
D éfinitio n d es crit ères de ju g e m e n t
• Les critères de jugement correspondent aux mesures qui permettent de répondre aux questions posées dans les objectifs.
• Le critère de jugement principal permet de répondre à la question posée par la
formulation de l’objectif principal et les critères de jugement secondaires permettent de répondre aux questions posées par la formulation des objectifs secondaires.
N a t ure d e la variable = crit ère d e ju g e m e n t
q u alit a tif ou q u a n tit atif
Critère quantitatif
Critère qualitatif
Paramètre
calculable
On peut calculer une moyenne
On peut calculer un pourcentage
Tests
statistiques
utilisés
Comparaison de deux moyennes :
test de Student et régression
linéaire pour l’analyse multivariée
- Analyse de pourcentage : test du
Chi2 et régression logistique pour
l’analyse multivariée
- Analyse de survie (données censurées) :
courbes de Kaplan-Meier, test du log
rank et modèle de Cox pour l’analyse
multivariée
Exemples
Age, taux de C-reactive protein
(CRP), indice de masse corporelle
(IMC en kg/m2), score de qualité,
échelle visuelle analogique de la
douleur, etc.
Décès (oui/non), rechute de la
maladie (oui/non), IMC (< ou > 30),
âge (< ou > 40 ans), etc.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
98
Essais cliniques
► Attention ! Ce qu’il faut prendre en compte c’est la façon dont la variable
est traitée (calcul de moyennes ou de pourcentages). L’âge est un critère
quantitatif lorsque l’on compare des moyennes entre plusieurs groupes et
un critère qualitatif lorsque l’on compare des pourcentages (ex. : pourcentage des patients âgés de plus de 80 ans).
Crit ère de ju g e m e n t princip al
• Le critère de jugement principal est le plus souvent unique sauf cas particuliers.
• Dans un essai clinique, on repère facilement le critère de jugement principal :
- c’est la variable qui a servi à calculer le nombre de sujets nécessaires (voir fiche 5) ;
- c’est très souvent la mesure qui permet de répondre à la question de l’objectif principal formulée dans la dernière phrase de l’introduction d’un article.
• Dans l’idéal, un critère de jugement est :
- unique (unique simple ou unique composite) ;
- objectif ;
- cliniquement pertinent ;
- clinique (ou final).
Critère de jugement unique (ou composite) ou multiple
• Critère unique, il s’agit d’une variable unique qui donne lieu à un seul test
statistique :
- critère unique simple :
- il existe une seule mesure qui donne lieu à la réalisation d’un seul test
statistique,
- par exemple, le taux de décès est un critère unique ;
- critère unique composite (ou composé) :
- plusieurs conditions créent une mesure et un résultat unique. Un critère
composite (ou composé) est également unique car il donne lieu à un seul
résultat et à l’utilisation d’un seul test statistique,
- par exemple, le critère de jugement « événement cardiovasculaire majeur
ou décès » est un critère de jugement composite mais unique. On considère le patient comme ayant déclaré un événement s’il a fait un AVC, un
infarctus ou s’il est décédé. Les résultats sont rendus sous la forme d’un
seul pourcentage qui est le pourcentage d’événements. Un seul pourcentage
représente la survenue d’au moins l’une de ces trois situations et amène à la
réalisation d’un seul test, donc le critère est bien unique.
• Critère multiple : on retrouve plusieurs critères de jugement principaux indépendants correspondants à plusieurs mesures avec autant de tests statistiques
réalisés que de mesures. Cela peut arriver quand on n’a pas déterminé quelle
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Critères de jugement et objectifs
99
était la meilleure mesure qui évaluera l’efficacité d’un médicament. Un critère
multiple pose classiquement deux problèmes :
- à chaque fois que l’on réalise un test statistique, on a 5 % de risque de
conclure à une différence significative par hasard (cela correspond au risque a).
Donc si on réalise deux tests, on prend deux fois ce risque. On parle d’inflation du risque a par la multiplicité des tests :
- pour pallier ce problème, le risque a doit être ajusté. Par exemple, au lieu
de tester un seul critère avec un risque a à 5 %, on testera deux critères avec
un risque a à 2,5 %. Cette méthode d’ajustement (diviser le risque a par le
nombre de tests) est la méthode de Bonferroni. Il en existe beaucoup d’autres
qui ont toutes en commun de diminuer le seuil a pour l’interprétation des tests,
- une autre approche est celle de la méthode séquentielle hiérarchique. Les
critères de jugement sont hiérarchisés a priori dans le protocole, un ordre
leur est attribué. Les critères sont ensuite testés les uns après les autres, et on
arrête l’analyse au premier test non significatif. L’intérêt de cette approche
est de pouvoir éventuellement (en fonction des résultats obtenus) conclure
à la démonstration de l’effet sur plusieurs critères à partir d’un seul essai,
sans inflation du risque a ;
- en l’absence de hiérarchie préétablie, la conclusion de l’essai est difficile si
les résultats sont discordants sur plusieurs critères (un positif et un négatif,
par exemple). Cela peut être clarifié par la détermination a priori d’une règle
de conclusion (par exemple, un essai sur la vaccination antigrippale pourra
n’être considéré comme positif que si les résultats sont positifs pour le critère de
séroconversion et le critère de séroprotection pour chacun des sérotypes testés).
Critère de jugement subjectif ou objectif
• Critère objectif :
- un critère est objectif lorsque sa mesure est non influençable par les opinions
ou par des aspects psychologiques, ou n’est pas soumise à interprétation. Le
critère est objectif s’il veut dire la même chose pour tout le monde et s’il n’a
aucune raison d’être influencé par le traitement étudié dans l’essai. Il repose
sur la mesure d’une grandeur physique objective ;
- exemples : la mortalité, le taux de C-reactive protein (CRP), la vitesse de
marche (si mesure standardisée), la spirométrie, etc.
À retenir
Dans un essai ouvert, un critère est parfaitement objectif lorsque tout a été fait
pour que sa mesure ne soit pas influencée par le bras. Par exemple, dans un essai
ouvert sur le traitement du cancer de la prostate (comparant une stratégie fondée
sur la surveillance régulière du PSA [prostate-specific antigen] à une stratégie sans
PSA), le critère « progression radiologique du cancer de la prostate », bien qu'en
apparence objectif, peut être influencé par la connaissance du bras de traitement
(l'augmentation du PSA peut justifier la réalisation de plus d'examens d'imagerie).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
100
Essais cliniques
En faveur de l’objectivité d’un critère dans un essai ouvert, on retient :
• la standardisation de la mesure : la mesure est faite de manière fiable et reproductible pour tous les patients ;
• la standardisation du suivi : la recherche de cancer est faite à intervalle régulier et imposée par le protocole dans les deux bras ;
• l’existence d’un comité d’adjudication externe : groupe d’experts validant la
valeur du critère en aveugle du bras de traitement.
• Critère subjectif :
- un critère est subjectif lorsque sa mesure peut être influencée par des effets
psychologiques ou soumise à interprétation ;
- exemples : échelle visuelle de la douleur, échelle de qualité de vie, impression
du médecin sur l’observance, etc.
Critère de jugement cliniquement pertinent
• Un critère cliniquement pertinent doit avoir un sens pour la prise en charge
du patient.
• Un résultat positif sur un critère non cliniquement pertinent retire tout intérêt
à la conclusion de l’étude.
• Exemple 1 - comparaison de deux antibiotiques dans la pneumopathie à pneumocoque en réanimation :
- critère cliniquement pertinent : mortalité ;
- critère non cliniquement pertinent : taux de CRP ;
- un résultat positif sur le taux de CRP ne permet en aucun cas de savoir si le
traitement est efficace sur la mortalité.
• Exemple 2 - la survie sans récidive versus la survie globale dans le cancer de
prostate :
- la pertinence clinique de la survie globale est supérieure à celle de la survie
sans rechute. Connaissant la fréquence des cancers asymptomatiques, que
pourrait-on dire d’un traitement qui allonge la survie sans rechute mais pas
la survie globale ?
- dans ce cas, utiliser le critère composite « survie sans rechute » plutôt que « survie globale » permet d’augmenter le nombre d’événements, et la puissance, et donc
la probabilité d’un résultat positif pour une pertinence clinique discutable !
Critère de jugement clinique ou intermédiaire/de
substitution
• Critère clinique = cliniquement pertinent/démontre l’efficacité d’un traitement. On le retrouve parfois sous l’appellation de critère final.
• Critère « intermédiaire » = critère utilisé pour démontrer indirectement l’efficacité du médicament.
• Critère « de substitution » = critère intermédiaire ayant démontré son lien
avec le critère clinique. Survient plus tôt que le marqueur d’efficacité clinique et
lui est fortement corrélé.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Critères de jugement et objectifs
Pathologie
Critère intermédiaire
101
Critère clinique
Hypertension
Pression artérielle
Evénements coronariens, accident
vasculaire cérébral (AVC)
Rhumatisme
inflammatoire
C-reactive protein (CRP)/
disparition du signal
inflammatoire en échographie
Handicap fonctionnel
Déformation
Ostéoporose
Densité osseuse
Fracture du col du fémur
Infarctus du
myocarde
Taux de reperméabilisation
coronaire
Décès, événements coronariens
Diabète non
insulinodépendant
(DNID)
Glycémie, hémoglobine
glycosylée, épaisseur
intima-média
Evénements cardiovasculaires,
rétinopathie, insuffisance rénale,
etc.
Crit ères de ju g e m e n t seco n d aires
• Les critères secondaires sont utiles pour étudier la tolérance du traitement
ou pour étudier un certain nombre de variables que l’on pense pouvoir être
améliorées par le traitement mais qui semblent d’importance moindre ou plus
difficiles à mesurer. On retrouve habituellement :
- des critères de tolérance (effets secondaires ++). Exemple : saignements intracrâniens sous anticoagulants oraux directs (AOD) versus antivitamine K (AVK) ;
- des critères de ressenti du patient grâce à des échelles de qualité de vie ;
- des échelles fonctionnelles évaluant l’autonomie, le handicap, etc.
• Peut-on conclure sur un critère de jugement secondaire ?
- on a le droit de conclure sur la significativité d’un critère de jugement
secondaire avec les mêmes exigences sur le plan statistique (ex. : il est vrai de
dire que l’on retrouve de manière significative moins de saignements intracrâniens sous AOD que sous AVK si p < 0,05) ;
- mais ce ne sont pas sur ces résultats que va reposer la conclusion principale
de l’essai ;
- chaque essai a été construit avec une puissance suffisante pour tenter de
montrer une différence significative sur le critère de jugement principal. Donc
il faut que l’essai soit significatif sur le critère de jugement principal pour qu’il
soit considéré comme positif.
• En d’autres termes, un traitement n’obtiendra pas d’autorisation de mise sur
le marché (AMM) sur les résultats portant sur un critère secondaire.
En pra tique
Ex e m ple 1 (é preuve t est 2017)
Griffin D, Parsons N, Shaw E, Kulikov Y, Hutchinson C, Thorogood M,
Lamb SE; UK Heel Fracture Trial Investigators. Operative versus
non-operative treatment for closed, displaced, intra-articular fractures of the
calcaneus: randomised controlled trial. BMJ 2014; 349: g4483.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
102
Essais cliniques
Objective: To investigate whether surgery by open réduction and internai fixation provides benefit compared with non-operative treatment for displaced,
intra-articular calcaneal fractures.
Methods: The primary outcome instrument was the Kerr-Atkins calcaneal
fracture score. This is a validated patient reported instrument quantifying pain
and function after calcaneal fracture. One hundred points represent normal
pain and function. Scores in the range 80-100 indicate either slight pain or
minor restrictions to walking ability, such as occasional use of a walking stick,
and scores in the range 60-80 indicate moderate pain, restricted walking, and
more than occasional use of a walking stick. We measured the primary outcome at two years after injury when at least two thirds of the patients would
be expected to hâve reached maximal recovery. Patient reported outcomes
were gathered before randomisation, and by postal questionnaires after 6,
12, and 18 months. Complications, additional surgery, and return to work
were recorded at a six week follow-up consultation, and at 6, 12, 18, and
24 months. We designed the study to detect a treatment effect of 10 points
with 80% power at the 5% significance level, which required data from
126 participants. Allowing for approximately 20% loss to follow-up, we
sought to recruit 150 participants.
Dans cette étude, le critère de jugement principal est :
Commentaires
Il aurait fallu cocher...
Subjectif
Il s’agit d’un score patient patient reported outcome, donc
influencé par la perception subjective de l’efficacité du
traitement
Traité comme une
variable quantitative
La différence attendue dans le calcul d’effectif est une
différence en termes de points sur l’échelle, ce qui indique
que cette variable est bien traitée comme une variable
quantitative
Unique
Le calcul d’effectif porte bien sur une valeur unique, qui
est la valeur du score de fracture « Kerr-Atkins »
Cliniquement pertinent
L’utilisation d’une échelle de symptômes ressentis par
les patients pour évaluer l’efficacité d’un traitement
chirurgical est probablement le critère le plus cliniquement
pertinent que l’on puisse imaginer
Il n’aurait pas fallu cocher
Commentaires
Evalué en aveugle
La nature de l’intervention rend le double
aveugle impossible. L’évaluateur est le
patient qui a évidemment connaissance du
traitement chirurgical ou non
Un score dont les valeurs les plus
élevées indiquent une douleur plus
importante et une fonction plus altérée
C’est clairement indiqué dans les méthodes
Mesuré à 6, 12, 18 et 24 mois
Composite
C’est un critère unique
Intermédiaire
C’est un critère clinique
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Critères de jugement et objectifs
103
Ex e m ple 2 (é preuve t est 2018)
Fleshner NE, Lucia MS, Egerdie B, Aaron L, Eure G, Nandy I, Black L,
Rittmaster RS. Dutasteride in localised prostate cancer management: the
REDEEM randomised, double-blind, placebo-controlled trial. Lancet 2012;
379: 1103-11.
We aimed to assess whether treatment with dutasteride decreased the rate
of prostate cancer progression (pathological or therapeutic) compared with
placebo in men with low-risk, localised disease who would otherwise undergo
active surveillance.
The primary endpoint was time to pathological progression (at least one of
the predefined criteria : four or more cores involved, > 50% of any one core
involved, or a Gleason pattern score of > 4) or the institution of definitive
medical therapy (referred to as therapeutic progression; eg, prostatectomy,
radiation, or hormonal therapy).
Secondary endpoints were time to pathological progression, time to therapeutic progression, absence of cancer in repeat biopsy, change in Gleason score
from baseline, change in biopsy characteristics from baseline, and change in
MAX-PC score (memorial anxiety scale for prostate cancer) from baseline.
We recorded adverse events, serious adverse events, laboratory data (including
total prostate-specific antigen), and physical examinations.
We analysed the primary endpoint on the basis of a restricted crude rate
approach, which included participants from the intention-to-treat population
who had at least one post-baseline biopsy procedure or documented therapeutic progression.
We compared time to prostate cancer progression (pathological or therapeutic) between treatment groups with the log-rank test. As a supportive analysis,
we used a Cox proportional hazards model.
Cette étude vise à :
Il aurait fallu cocher...
Commentaires
Démontrer la supériorité du dutastéride
sur le taux de progression du cancer
localisé de la prostate comparativement à
un placebo
C’est l’objectif principal de l’étude
Évaluer la sécurité d’utilisation du dutastéride pour le traitement du cancer localisé
de la prostate comparativement à un
placebo
C’est un objectif secondaire
Comparer l’anxiété liée à un cancer
localisé de la prostate des patients traités
par dutastéride et de ceux traités par un
placebo
C’est un objectif secondaire
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
104
Essais cliniques
Il n’aurait pas fallu cocher...
Commentaires
Démontrer la supériorité du dutastéride
sur le taux de progression du cancer
localisé de la prostate comparativement à
une surveillance active simple
La surveillance active est une modalité de
prise en charge du cancer de la prostate.
Dans cet essai, les bras comparés sont
dutastéride + surveillance active et
placebo + surveillance active. Un tel
design ne permet pas de comparer le
dutastéride à la surveillance active
Le critère de jugement principal est :
Il aurait fallu cocher...
Composite
Commentaires
Le critère de jugement principal était
le temps jusqu’à progression
anatomopathologique ou l’instauration
d’un traitement. Il s’agit donc bien d’un
critère composite
Identique pour les deux bras de l’essai
Une variable de survie censurée
La formulation (temps jusqu’à survenue)
et les analyses utilisées (modèles de Cox,
méthodes de Kaplan-Meier) indiquent
que ce critère est bien une variable dite
« censurée »
Analysé en intention de traiter
L’analyse a été réalisée en intention de
traiter comme indiqué dans les méthodes
Un critère intermédiaire
Si le critère le plus cliniquement pertinent
imaginable est la mortalité globale, on peut
considérer que le temps jusqu’au début d’un
traitement est un critère intermédiaire
Il n’aurait pas fallu cocher...
Commentaires
Objectif
La décision de traiter étant laissée à
la discrétion du clinicien, ce critère est
donc subjectif. Les auteurs du sujet nous
mettaient la puce à l’oreille dans la question
précédente indiquant que la connaissance
du PSA (et donc potentiellement du bras,
puisque le dutastéride réduit le PSA)
pourrait influencer la décision de traiter et
donc l’objectivité du critère de jugement
principal
Plus pertinent cliniquement que la
mortalité globale
En cancérologie, et en particulier dans le
cancer de la prostate, la mortalité globale
est toujours plus pertinente cliniquement
que les autres critères
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Critères de jugement et objectifs
105
Ex e m ple 3 (ED N 2018)
Bonjer HJ, Deijen CL, Abis GB, Cuesta MA, van der Pas MHGM,
de Lange-de Klerk ESM, Lacy AM, Bemelman WA, Andersson J,
Angenete E, Rosenberg J, Fuerst A, Haglind E, for the COLOR II
Study Group. A randomized trial of laparoscopie versus open surgery
for rectal cancer. N Engl J Med 2015; 372: 1324-32.
In this international trial conducted in 30 hospitals, we randomly assigned
patients with a solitary adenocarcinoma of the rectum within 15 cm of the
anal verge, not invading adjacent tissues, and without distant métastasés to
undergo either laparoscopie or open surgery in a 2:1 ratio. The primary end
point was locorégional récurrence 3 years after the index surgery. Three years
after the index surgery, CT or MRI of the pelvis combined with imaging of
the liver and the chest were performed. Récurrent disease was defined as the
presence of locorégional récurrence, the presence of distant métastasés, or
death from rectal cancer.
Le critère de jugement principal de l’étude est un critère :
Il aurait fallu cocher...
Commentaires
Identique pour les deux bras de l’essai
Il est évalué dans les deux bras de la
même façon
Intermédiaire
Dans la mesure où la finalité principale
du traitement est la survie, on peut
considérer que la récidive locorégionale
est un critère intermédiaire, puisqu’il est
lié à la survie mais qu’il sera accessible
plus précocement
Il n’aurait pas fallu cocher...
Commentaires
Evalué par des investigateurs en aveugle
du bras de l’essai
Les investigateurs qui évaluent ce critère
sont les praticiens qui ont pris en charge
les patients, ils ne sont pas en aveugle du
traitement (la chirurgie)
Composite
Un seul critère est considéré pour mettre
en évidence une récidive locorégionale, il
ne s’agit donc pas d’un critère combiné
La recherche de cancer n’a pas pu être
influencée par le bras de traitement.
Ce critère est fondé sur des données
d’imagerie, mais on aimerait qu’il soit
quand même plus précisément défini, la
recherche du cancer peut être influencée
par la connaissance du bras de traitement
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
106
Essais cliniques
Ex e m ple 4 (ED N 2017)
Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML,
Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D,
Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D.
Lévosimendan for the prévention of acute organ dysfunction in sepsis.
N Engl J Med 2016; 375: 1638-48.
We conducted a double-blind, randomized clinical trial to investigate whether
lévosimendan reduces the severity of organ dysfunction in adults with sepsis.
Patients were randomly assigned to receive a blinded infusion of levosimendan for 24 hours or placebo in addition to standard care.
The primary trial outcome was the mean daily Sequential Organ Failure Assessment (SOFA) score while the patient was in the ICU, as measured from
randomization to a maximum of 28 days. The daily SOFA score after baseline
was calculated for each patient on the basis of five organ Systems : cardiovascular, respira tory, rénal, hepatic, and coagulation Systems. (Scores for each System range from 0 to 4, with higher scores indicating more severe organ-system
dysfunction ; maximum score, 20.) The neurologie System was not included,
as in some previous trials, owing to the difficulties of accurately scoring the
Glasgow Coma Score daily in the presence of sédation. Daily scores were
totaled for each patient’s ICU stay and divided by the number of days that
they remained in the ICU in order to calculate the mean SOFA score for that
patient.
Le critère de jugement principal :
Il aurait fallu cocher...
Commentaires
Est fondé sur un score SOFA modifié
Il est effectivement modifié (score SOFA
moins l’évaluation neurologique)
A été évalué à l’aveugle de la
connaissance du groupe de traitement
Oui car l’essai a été réalisé en double
aveugle
Il n’aurait pas fallu cocher...
Commentaires
Est traité comme une variable
qualitative
Un score « moyen » indique forcément
la prise en compte de la variable comme
une variable quantitative, une variable
qualitative est exprimée en pourcentage
Est le score SOFA mesuré à J28
Il ne s’agit pas du score à J28 mais du
score SOFA quotidien moyen obtenu pour
l’ensemble du séjour en réanimation, et au
maximum 28 jours (addition du score SOFA
quotidien divisé par le nombre de jours de
séjour en réanimation pour chaque patient)
Est un critère combiné
Le score SOFA quotidien moyen est un seul
élément. Les différents éléments constituant
le score n’en font pas un critère composite
ou combiné. Le score a une existence en tant
que tel (score de Glasgow, par exemple)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Critères de jugement et objectifs
107
Ex e m ple 5 (ED N 2021)
Cappuzzo F, Ciuleanu T, Stelmakh L, Cicenas S, Szczésna A, Juhâsz E, et al.
Erlotinib as maintenance treatment in advanced non-small-cell lung cancer:
a multicentre, randomised, placebo-controlled phase 3 study. Lancet Oncol
juin 2010; 11(6): 521-9.
The co-primary endpoints were PFS in ail analysable patients irrespective of
EGFR status, and PFS in patients with EGFR immunohistochemistry-positive
tumours. The alpha level of 5% was split between the two coprimary endpoints: 3% for ail patients and 2% for patients with EGFR immunohistochemistry-positive tumours.
Il y a deux cocritères de jugement principaux dans cette étude : la survie sans
progression (PFS) dans la population totale et la survie sans progression chez
les patients qui sur-expriment l’EGFR en immunohistochimie (EGFR positif).
Qu’implique ce choix méthodologique ?
Il aurait fallu cocher...
Commentaires
Le risque global de conclure à
tort à l’efficacité du traitement
est conservé à 5 % (3 %
+ 2 %)
le risque alpha correspond bien au risque de
conclure à tort à l’efficacité du traitement. Dans
le cas de critères multiples, pour éviter l’inflation
d’alpha, une des techniques consiste à répartir le
risque total de l’étude entre les différents critères.
On parle d’ajustement du risque alpha
Il n’aurait pas fallu cocher...
Commentaires
On ne prend pas en compte la
multiplicité des tests
La multiplicité des tests est prise en compte car
le risque alpha global de 5 % est réparti entre
les deux tests correspondant aux cocritères de
jugements principaux
Chacun des deux tests doit
être significatif au seuil de 5 %
pour conclure à l’efficacité
Le premier test comprenant l’ensemble des patients
doit être significatif au seuil de 3 % et le second
test comprenant seulement les patients avec une
expression tumorale de l’EGFR doit être significatif
au seuil de 2 %
Il faudra d’abord montrer la
supériorité sur la PFS dans
la population totale pour
pouvoir faire le test chez les
patients EGFR positifs
Dans cette situation-là, on aurait d’abord réalisé
un seul test au seuil de signification alpha de 5 %
puis si, et seulement si, ce test avait été significatif
on aurait alors réalisé le second test au seuil alpha
de 5 %
Il ne sera pas possible de
conclure chez les patients
EGFR positifs car c’est un
sous-groupe
Il s’agit effectivement d’un sous-groupe mais qui a
été défini en amont de l’analyse comme cocritère
de jugement principal avec une anticipation sur
la prise en compte de la multiplicité des tests. Il
sera donc tout à fait possible de conclure chez ces
patients si le résultat du test est significatif à un
seuil de 2 %
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 11
Critères de sélection
En complément
V o u s p o u v e z co nsu l t e r c e t t e v id é o su r l es crit è r e s d e s é l ec t io n d a n s l es e ssa is cli n iq u e s :
h t t ps: / / y o u t u.b e / 6L_ U n 9 B t G D I
Ech a n tillo n, p o p ula tio n so urce e t p o p ula tio n cible
(v oir fich e 2)
• Dans un essai clinique, le biais de sélection peut survenir si :
- l’échantillon n’est pas représentatif de la population cible : critères de sélection trop restrictifs, inclusion de patients non consécutifs, etc. ;
- la population source n’est pas représentative de la population cible. Par
exemple, si la population source est choisie dans un centre d’expertise de la
maladie étudiée, les malades auront alors un profil particulier (plus graves,
présentations atypiques, etc.). Il est alors possible que l’échantillon constitué
finalement ne soit plus représentatif de la population cible (c’est-à-dire de
tous les patients atteints de la maladie).
• Le biais de sélection ne remet pas en cause la validité interne des résultats,
mais ils ne seront généralisables qu’à une population ayant les mêmes caractéristiques que celles de l’échantillon (moindre validité externe).
Crit ères d'inclusio n e t d'e xclusio n
Les critères d’inclusion et d’exclusion peuvent être classés en trois grands groupes
en fonction de leurs objectifs.
Homogénéiser la population
• L’objectif est d’optimiser l’efficacité du traitement afin de ne pas gaspiller du
temps et de l’argent. On sélectionne une population homogène pour laquelle on
s’attend à une efficacité du traitement. On exclut également les patients pour
lesquels on sait que le traitement ne fonctionnera pas.
• Exemple : on souhaite tester l’efficacité d’une statine en prévention primaire
des accidents vasculaires au sein d’une population d’étudiants de 20 à 25 ans.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
110
Essais cliniques
Le taux d’événements attendu est si bas que l’étude nécessitera de sélectionner
des milliers de patients à suivre sur plusieurs dizaines d’années pour avoir une
chance d’être positive. Il est plus judicieux de sélectionner une population de
sujets de plus de 60 ans, consommateurs de tabac et atteints de diabète.
Assurer la sécurité des patients
• Il est bien entendu logique d’exclure d’emblée les patients pour lesquels on
sait par avance que le traitement peut être dangereux ou comporte un risque.
• Exemple : les patients allergiques aux médicaments étudiés, les femmes enceintes
(médicaments à risque tératogène), les enfants, les patients ayant une contreindication au traitement étudié (les asthmatiques pour les bêta-bloquants, les
insuffisantes rénaux pour la metformine, etc.).
Respecter la clause d'ambivalence
• Respecter la clause d’ambivalence, c’est s’assurer que tous les patients ont la
même probabilité d’être randomisés dans l’un ou l’autre bras de l’essai clinique.
Il s’agit principalement d’exclure à l’avance les patients ayant une contre-indication
à l’un et à l’autre des traitements testés. Le problème se pose essentiellement dans
les essais ouverts où l’on pourrait être tenté d’inclure des patients dans un bras,
alors qu’ils ont une contre-indication à l’autre traitement.
• Exemple 1 : on souhaite comparer chirurgie d’emblée et antibiothérapie dans
la prise en charge de l’appendicite aiguë non compliquée. Les patients ayant des
contre-indications anesthésiques doivent être exclus (et non pas inclus dans le
bras antibiothérapie) pour respecter la clause d’ambivalence.
• Exemple 2 : on souhaite comparer l’effet thérapeutique des inhibiteurs de
l’enzyme de conversion (IEC) et des bêta-bloquants. Il faut exclure des deux
bras les sténoses bilatérales des artères rénales (contre-indication aux IEC) et
l’asthme sévère (contre-indication aux bêta-bloquants).
À retenir
A t t e n tio n au piè ge O C M sur la clause d ’ a m biv ale nce
Le fait d'exclure les patients ayant une contre-indication commune aux deux
traitements testés dans les deux bras n'intervient pas dans le respect de la clause
d'ambivalence. La clause d'ambivalence intervient lorsqu'on exclut des patients
ayant une contre-indication à seulement un des deux bras.
Exemple : on souhaite évaluer dans le traitement de la pneumopathie à pneumo
coque la non-infériorité d ’ une durée d'un traitement par amoxicilline de 5 jours
versus 10 jours. Le fait d'exclure les patients avec une allergie à l'amoxicilline ne
rentre pas dans le cadre du respect de la clause d'ambivalence puisque les deux
bras exposent les patients à cette contre-indication. La probabilité d'être rando
misé dans le bras « amoxicilline 5 jours » ou dans le bras « amoxicilline 10 jours » est
la même pour tous les patients allergiques, c'est-à-dire égale à 0. En revanche, on
exclut bien ces patients pour assurer leur sécurité.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Critères de sélection
111
E n p r a t iq u e
Ex e m ple (é preuve t est 2017)
Hugosson J, Carlsson S, Aus G, Bergdahl S, Khatami A, Lodding P, Pihl CG,
Stranne J, Holmberg E, Lilja H. Mortality results from the Gôteborg Randomised
Prostate Cancer Screening Trial. Lancet Oncol 2010; 11(8): 725-32.
In December 1994, 20,000 men born 1930 to 1944, randomly sampled from
the Population Register, were computer randomised in a 1:1 ratio to a screening group invited for biennial PSA [prostate-specific antigen] testing or to a
control group not invited. In each arm, 48 men were excluded from analysis
due to either death or émigration before randomization date or prévalent
prostate cancer. The primary endpoint was prostate cancer spécifie mortality
analyzed according to the intention to-screen principle.
Le registre de population qui recense au 31 décembre 1994 les 32 298 hommes
nés entre 1930 et 1944 à Gôteborg peut être considéré comme :
Il aurait fallu cocher...
La population source de
l’étude
Commentaires
La population source est la population au sein de
laquelle est tiré l’échantillon. Il s’agit de la population
de recrutement. Dans le meilleur des cas, elle doit être
représentative de la population cible pour laquelle on
souhaite généraliser les résultats
Il n’aurait pas fallu cocher...
Commentaires
Un registre épidémiologique
des cancers
C’est un registre de population, toutes les naissances
sont enregistrées entre 1930 et 1944, et non pas
seulement les cas de cancer
L’échantillon de l’étude
L’échantillon est constitué des 20 000 hommes tirés
au sort au sein du registre (registre = population
source)
La cohorte des participants
Cela correspond à l’échantillon de l’étude. La cohorte
des patients est tirée au sort au sein du registre
Le groupe témoin
Le groupe témoin correspond au groupe des
participants randomisés au sein de l’échantillon dans
le groupe contrôle
Les auteurs ont choisi de réaliser l’étude en population parce qu’ils souhaitaient
privilégier :
Il aurait fallu cocher...
La meilleure généralisation
possible des résultats
Commentaires
L’intérêt principal d’une étude en population est
qu’elle permet une meilleure généralisation des
résultats à la population cible grâce à une bonne
représentativité de l’échantillon
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
112
Essais cliniques
Il n’aurait pas fallu cocher...
Commentaires
La qualité de la randomisation en
2 groupes parallèles
Le choix de la population source n’affecte en
rien la qualité de la randomisation
Les aspects éthiques liés à ce type
d’étude
Le recrutement en population n’améliore pas les
aspects éthiques par rapport à un recrutement
par des investigateurs
La procédure d’assignation
masquée des patients dans chacun
des groupes
Le choix de la population source est
indépendant du choix de mettre en place une
procédure en aveugle ou non
Le contrôle d’un biais de
classement
La mesure de la maladie n’est pas influencée
par le choix de la population de recrutement
(population source)
Ex e m ple 2 (ED N 2020)
Hofmann R, James SK, Jernberg T, Lindahl B, Erlinge D, Witt N, et al.
Oxygen Therapy in Suspected Acute Myocardial Infarction. N Engl J Med
28 sept 2017; 377(13): 1240-9.
We therefore conducted a registry-based randomized clinical trial to evaluate
the effect of oxygen therapy on all-cause mortality at 1 year among patients
with suspected myocardial infarction who did not hâve hypoxemia at baseline.
À la phase aiguë d’un infarctus du myocarde, l’ambivalence entre l’oxygénothérapie et l’air ambiant n’est pas respectée en cas :
Il n’aurait pas fallu cocher...
Commentaires
D’arrêt cardiaque se produisant à
l’arrivée des secours
Le principe d’ambivalence précise que les
patients inclus dans les deux bras doivent
avoir la même probabilité de recevoir les deux
traitements évalués dans l’étude. Ici, le principe
d’ambivalence n’est pas respecté si les patients
ont soit une indication formelle à recevoir de
l’oxygène, soit au contraire une contre-indication
absolue. Dans ce cas, ils ne peuvent pas être
inclus dans l’essai, car ils ne pourraient être
inclus que dans un seul des deux bras. En cas
d’arrêt cardiaque, d’hypoxémie (SaO2 < 90 %)
ou d’insuffisance respiratoire, l’oxygénothérapie
est impérative. Les patients ne pourraient pas être
inclus dans le bras sans oxygène
D’oxygénothérapie au long
cours indiquée pour insuffisance
respiratoire chronique
De saturation artérielle en
oxygène inférieure à 90 %
Il n’aurait pas fallu cocher...
Commentaires
De démence ne permettant pas le
recueil du consentement oral
En cas de refus ou d’incapacité de donner son
consentement, les patients ne peuvent pas être
inclus dans l’étude, quel que soit le bras
De refus de participer à un essai
randomisé
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 12
Randomisation
En complément
V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l a r a n d o m is a t io n :
h t t ps: / / y o u t u .b e / D h f-i n CiT 7 M
D éfinitio n
• La randomisation (ou allocation aléatoire) est le tirage au sort des traitements
ou de l’intervention à l’étude.
• La randomisation et toutes ses caractéristiques ont pour but de :
- garantir la comparabilité initiale des groupes ;
- s’assurer que la seule différence entre les bras est liée au traitement ;
- conférer aux essais cliniques un niveau de preuve élevé ;
- limiter l’effet des facteurs de confusion.
• La randomisation ne garantit pas :
- l’éthique de l’étude ;
- la comparabilité du suivi entre les deux groupes ;
- que le critère de jugement soit mesuré de la même manière dans les deux
groupes ;
- l’absence d’effet placebo.
• Si la randomisation a marché, la seule différence entre les deux groupes est le
traitement. Si un groupe va mieux à la fin de l’étude, il est très probable que ce
soit lié au traitement.
Caract éristiq u es à co n n aître
Unité de randomisation
Ra n d o m isa tio n in divid u elle (u nit é = le p atie nt)
On tire au sort des patients pour recevoir l’un ou l’autre des traitements à
l’étude.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
114
Essais cliniques
Par gra p p es (o u clusters, u nité = un grou pe d e p a tie n ts)
On tire au sort des groupes d’individus (à l’échelle d’un service, d’un hôpital,
d’un établissement scolaire), par exemple :
• parce que l’action étudiée ne peut se mesurer qu’à l’échelle d’un groupe :
concernant la prévention des conduites sexuelles à risque, une intervention orale
auprès de lycéens (A) est comparée à la remise d’une brochure sur le sujet (B).
Certains lycées auront l’intervention A, d’autres l’intervention B ;
• parce qu’il existe des risques d’interférence, ou « contamination », entre les
groupes patients (si certains lycéens ont bénéficié de l’information orale sur
les conduites à risque, ils vont sans doute l’expliquer à leurs camarades du
même établissement).
Randomisation équilibrée/déséquilibrée : le ratio
de randomisation
La mise en place d’un ratio de randomisation différent de 1:1 a comme objectif
d’engendrer un déséquilibre intentionnel entre les groupes de traitement. Un
ratio de 2:1 signifie que 2/3 des patients seront randomisés dans un groupe et
1/3 dans l’autre groupe. Cela peut se justifier, afin de diminuer le coût d’un essai
thérapeutique en cas de comparateur trop cher par exemple.
Techniques pour améliorer la comparabilité des groupes
La comparabilité des groupes au début de l’étude (en nombre de patients et
en caractéristiques) peut être imparfaite du fait du hasard (on peut gagner en
jouant au casino !), surtout si le nombre de patients inclus est faible. Pour
s’assurer que cela n’arrive pas, on peut utiliser les techniques suivantes.
Ra n d o m isa tio n p ar blocs
• But : obtenir le même nombre de patients dans chaque bras de randomisation.
• Principe : exemple d’une randomisation par blocs de 4 patients entre deux traitements A et B. On tire au sort tous les 4 patients une des séquences suivantes :
AABB I ABAB I BBAA I BABA I BAAB
• Résultat : il y a donc autant de A que de B tous les 4 patients (6 pour des blocs
de 6). Le déséquilibre maximum entre deux bras est de 2 patients (3 pour des
blocs de 6).
• Limites : si la taille des blocs est trop grande, le risque de déséquilibre est plus
important. Si la taille des blocs est trop petite, les investigateurs peuvent deviner
la séquence et le traitement du patient suivant.
• Variantes : des blocs de taille variable permettent de maintenir l’aveugle (les
investigateurs ne peuvent pas deviner la séquence puisque la taille des blocs
change à chaque fois).
► Attention piège ! Une randomisation par blocs peut être individuelle
(quand l’unité de randomisation est le patient) ou par clusters/grappes
(on tire au sort des permutations de 4 écoles/hôpitaux).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Randomisation
115
Ra n d o m isa tio n stratifié e
• But : forcer la comparabilité des groupes pour des caractéristiques données
(âge > 50 ans, par exemple).
• Principe : on tire au sort l’allocation du traitement dans chaque sous-groupe
(< 50 ans et > 50 ans). En pratique, il y a une liste de tirage au sort pour
chaque sous-groupe. On peut également appliquer la technique des blocs à
chaque tirage au sort : chez les moins de 50 ans, le nombre de traitements A et
de traitements B est équilibré tous les 4 patients (blocs de 4), de même chez les
plus de 50 ans.
• Résultat :
- il y a 50 % de traitements A et B dans chaque strate ;
- il y a le même pourcentage de < 50 ans et > 50 ans dans chaque groupe de
traitement ;
- randomisation stratifiée sur les facteurs pronostiques importants (en cancérologie, si on a plus de patients métastatiques dans un bras, et que le traitement
semble plus efficace dans l’autre, on ne peut pas interpréter l’essai) ;
- randomisation stratifiée sur le centre : il faut que la proportion de patients
en provenance de chaque centre soit la même dans les deux bras pour éviter
un « effet centre ». Elle est recommandée dans les essais multicentriques.
Parfois, il est spécifié qu’il existe une liste de tirage au sort par centre = cela
correspond à une randomisation stratifiée sur le centre.
► Attention piège ! Ne pas confondre la stratification de la randomisation
avec la stratification de l’analyse (= analyse en sous-groupe). La stratification de la randomisation a pour but de forcer la comparabilité des groupes
sur des caractéristiques choisies. Les analyses en sous-groupe ont comme
objectif de mettre en évidence une ou des populations particulières pour
lesquelles le traitement pourrait être plus efficace ou plus délétère.
Ra n d o m isa tio n m ini m isée
• But et résultat : identique à celui de la randomisation stratifiée.
• Principe : un algorithme attribue le traitement à chaque patient en fonction
des caractéristiques de tous ceux qui ont été inclus auparavant de manière à
« forcer » la comparabilité des groupes. Utile lorsque l’on souhaite équilibrer la
randomisation sur beaucoup de caractéristiques.
Autres critères de qualité de la randomisation
Ra n d o m isa tio n ce n tralisé e
L’allocation aléatoire des traitements est effectuée par un centre unique qui est
contacté au fur et à mesure des inclusions par les différents investigateurs.
Ra n d o m isa tio n in d é p e n d a n t e
La randomisation doit être indépendante de l’équipe d’investigation.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
116
Essais cliniques
Im pré visibilité d e la ra n d o m isa tio n
C’est un critère de qualité important de la randomisation, a fortiori dans un
essai ouvert. L’imprévisibilité de la randomisation signifie qu’il est impossible
pour l’investigateur de deviner le bras dans lequel le prochain patient inclus
sera tiré au sort. Sinon, l’investigateur pourrait décider d’inclure ou de ne pas
inclure le patient du fait de sa connaissance « à l’avance » du résultat de la
randomisation. Les conséquences pourraient être un biais de sélection, par noninclusion de certains patients qui auraient pu participer à l’étude (par exemple,
on pourrait ne pas proposer à un patient de participer à une étude sachant
qu’il a plus de chance d’être dans le bras placebo). Une randomisation centralisée avec vérification des critères d’inclusion/exclusion avant tirage au sort
est le meilleur moyen de s’assurer de cette imprévisibilité. Dans le cas d’une
randomisation par blocs dans un essai en double aveugle, l’utilisation de blocs
de taille aléatoire permet également de favoriser l’imprévisibilité en cas d’effets
indésirables reconnaissables.
Tableau de description des patients après randomisation
Le tableau 1 correspond généralement au premier tableau de la partie des résultats des essais randomisés dans lequel sont décrites les caractéristiques de la
population d’étude (âge, sexe, caractéristiques sociodémographiques, comorbidités, traitements médicamenteux, stades de la maladie, etc.). Etant donné
que les résultats sont présentés de manière à disposer d’une colonne par groupe
comparé, il a comme intérêt notable de permettre la vérification de la bonne
qualité de la randomisation. Une randomisation de bonne qualité distribue les
différentes caractéristiques de façon très proche entre les deux groupes du fait
du hasard (distribution d’âge similaire, un sexe-ratio similaire, un pourcentage
de comorbidités similaire, etc.). Cela est un témoin indirect de la distribution
aléatoire des facteurs de confusion.
Est-il nécessaire de disposer d’analyses statistiques comparatives dans ce type
de tableau avec une p-value en regard de chaque caractéristique pour s’assurer
de l’absence de différence entre les deux groupes ?
La réponse est habituellement non dans un essai clinique randomisé. En
effet, si l’on tire au sort l’allocation des traitements, toute différence observée
entre les groupes sera liée au hasard. La p-value (probabilité que la différence
soit liée au hasard) n’a donc pas d’intérêt. C’est la pertinence clinique de la
différence observée et sa potentialité à modifier l’effet du traitement qui nous
intéresse.
► Attention ! La situation est très différente au cours des études observationnelles (voir fiche 24 sur la confusion dans les études observationnelles),
que ce soit au cours des études cas-témoins ou exposés-non exposés, car
les groupes comparés n’ont pas été constitués par randomisation. La différence observée entre les groupes n’est donc probablement pas liée au
hasard !
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Randomisation
117
En pra tique
Ex e m ple 1 (ED N 2017)
Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML,
Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D,
Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D.
Levosimendan for the prévention of acute organ dysfunction in sepsis.
N Engl J Med 2016; 375: 1638-48.
Enrollment, randomization, and data collection were performed by means
of an online System (InForm, Oracle). Patients were assigned in a 1:1 ratio
to receive levosimendan or placebo, with the use of variable block sizes of
four and six and computer-generated random numbers and with stratification
according to recruitment center. The randomization sequence was prepared by
an independent statistician.
Dans cette étude, l’allocation aléatoire des traitements est réalisée :
Commentaires
Il aurait fallu cocher...
De manière indépendante
De manière centralisée
Indépendamment des investigateurs
De manière à ce que le déséquilibre
maximum entre les bras soit de 3 patients
De manière à limiter le déséquilibre
d’effectif entre les groupes
La randomisation est indépendante
car elle est réalisée par un statisticien
indépendant de l’équipe clinique. Elle est
centralisée car réalisée par un système
en ligne qui collecte les informations en
provenance de tous les centres
La randomisation est réalisée par
blocs de taille aléatoire : 4 ou 6. Le
déséquilibre maximum d’effectif entre
les 2 groupes est donc de 3 patients
De manière à limiter « l’effet centre »
De manière à ce que le pourcentage de
patients inclus dans chaque centre soit le
même dans les deux bras
Ces propositions définissent la
randomisation stratifiée sur le centre
De manière à ce que le ratio 1:1 soit
assuré dans tous les centres
De manière individuelle
Par opposition à une randomisation par
grappes ou clusters
Il n’aurait pas fallu cocher...
Commentaires
Par blocs de 4 ou de 6 selon le
centre
Ce distracteur était proposé dans l’épreuve de
l’EDN. La formulation peut prêter à confusion,
mais according to recruitment center se rapporte à
stratification uniquement. Par définition, les blocs
de taille aléatoire permettent d’éviter de deviner la
séquence. Cet avantage est perdu si les blocs sont
de même taille dans un centre donné
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
118
Essais cliniques
Il n’aurait pas fallu cocher...
Commentaires
Par clusters de 4 ou 6 centres
Ne pas confondre cluster et bloc
Pour s’assurer que l’échantillon
d’étude est représentatif de la
population source
Le fait que les groupes de traitement soient
comparables ne garantit pas que tous les patients
éligibles aient été inclus
Pour respecter les règles éthiques
Si une étude est faite pour prouver qu’un traitement
apporte un bénéfice sans toxicité majeure, c’est
bien parce que ce n’est pas démontré à ce jour. Il est
donc éthique de proposer l’un ou l’autre des deux
traitements
Ex e m ple 2
Roy PM, Rachas A, Meyer G, Le Gai G, Durieux P, El Kouri D, Honnart D,
Schmidt J, Legall C, Hausfater P, Chrétien JM, Mottier D, and PREVENU
study group. Multifaceted intervention to prevent venous thromboembolism
in patients hospitalized for acute medical illness: a multicenter
cluster-randomized trial. PLoS One 2016 ; 11(5) : e0154832.
We prospectively enrolled ail consecutive patients over 40 years old presenting
to the emergency department of the participating sites for acute medical illness
and requiring hospitalization in a medical ward. A random number table was
used to assign hospitals to either the intervention or standard practice group
(control group). Randomization was stratified in order to include the same
number of academie hospitals and centers using a computerized medical file
in each group.
À propos de la randomisation, il est vrai que :
Il aurait fallu cocher...
Commentaires
Il s’agit d’une randomisation par grappes
ou clusters
C’est forcément une randomisation par
clusters car l’intervention est assignée de
manière aléatoire aux hôpitaux et non
aux patients
Les hôpitaux étaient tirés au sort pour
recevoir l’intervention ou la pratique
standard
La randomisation a été réalisée de
manière à limiter l’effet du type de centre
(académique ou non) sur la mesure de
l’efficacité de l’intervention
C’est la définition de la stratification
sur le caractère académique ou non des
centres
La proportion de centres académiques a
été équilibrée entre les 2 groupes
Il n’aurait pas fallu cocher...
Il s’agit d’une randomisation équilibrée
par blocs
Il s’agit d’une randomisation individuelle
par blocs
Commentaires
Ne pas confondre bloc et cluster. Une
randomisation individuelle ou par
clusters peut être équilibrée par des
blocs
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Randomisation
Il n’aurait pas fallu cocher...
Commentaires
Les patients se présentant consécutivement
dans chaque centre ont été tirés au
sort pour recevoir l’intervention ou un
traitement standard
Ce sont les hôpitaux et non pas les
patients qui sont tirés au sort
Elle permet de maintenir l’aveugle pendant
la durée de l’étude
C’est faux dans l’absolu. La
randomisation ne permet pas de
maintenir l’aveugle, ni de garantir
que le suivi ou la mesure du critère
de jugement soit comparable. Seule
la procédure d’aveugle apporte cette
garantie. De plus, il est fort probable
que cette étude soit ouverte même si
non précisé (intervention en général
difficile à cacher aux patients et aux
médecins !)
Elle permet de s’assurer que le suivi a été le
même dans les deux bras
Elle garantit que le critère de jugement a
été mesuré de la même manière dans les
deux bras
119
Ex e m ple 3 (é preuve t est 2018)
Fleshner NE, Lucia MS, Egerdie B, Aaron L, Eure G, Nandy I, Black L,
Rittmaster RS. Dutasteride in localised prostate cancer management: the
REDEEM randomised, double-blind, placebo-controlled trial. Lancet 2012;
379: 1103-11.
We aimed to assess whether treatment with dutasteride decreased the rate
of prostate cancer progression compared with placebo in men with low-risk,
localised disease who would otherwise undergo active surveillance.
We randomly allocated participants in a one-to-one ratio with GlaxoSmithKline’s central registration and médication ordering System (RAMOS) to
receive dutasteride 0.5 mg or matching placebo once daily for 3 years. Randomisation was done by site with a block size of four.
Concernant l’allocation aléatoire (randomisation) du traitement à l’étude dutastéride versus placebo :
Il aurait fallu cocher...
Commentaires
Vise à constituer 2 groupes comparables
pour les facteurs de confusion potentiels
La randomisation permet de rendre les
groupes initialement comparables (la
seule différence entre les groupes est le
traitement)
Repose sur une liste de tirage au sort
établie pour chaque site d’étude
La randomisation a été faite « par site
avec des blocs de quatre ». Ceci indique
qu’une liste de randomisation a été
établie pour chaque centre. En d’autres
termes, la randomisation est stratifiée sur
le centre, ce qui permet de s’assurer de
l’équilibre de l’effectif (dutastéride + surveillance/placebo + surveillance) dans
chaque centre
Utilise des blocs de taille fixe
La taille des blocs est fixée à 4 patients
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
120
Essais cliniques
Il aurait fallu cocher...
Commentaires
Est équilibrée
One-to-one ratio (1:1) indique que la
randomisation est équilibrée
Est centralisée
L’utilisation d’un système centralisé
(RAMOS) est précisée, ce qui n’est pas
incompatible avec l’établissement d’une
liste par centre
Vise à limiter l’influence d’un biais
potentiel quant au choix du traitement
pour chaque patient
Le traitement reçu est tiré au sort et non
pas décidé par le clinicien ou le patient
dont la décision aurait pu être influencée
par des caractéristiques particulières
pouvant interférer avec le critère de
jugement
Il n’aurait pas fallu cocher...
Commentaires
Vise à limiter les fluctuations
d’échantillonnage
La randomisation ne limite pas les
fluctuations d’échantillonnage. Les
2 groupes constitués peuvent différer en
raison du hasard
Vise à augmenter la puissance statistique
de l’essai
La puissance statistique de l’essai dépend
essentiellement du nombre de sujets
inclus
Vise à contrôler le risque d’erreur
statistique de lre espèce (alpha)
Le risque a est fixé a priori et augmente
lorsque l’on multiplie les tests, il n’est pas
influencé par la randomisation
Vise à maintenir la comparabilité des
2 groupes tout au long de l’essai
La randomisation ne suffit pas à
maintenir la comparabilité des groupes
pendant le suivi. C’est la procédure
d’aveugle qui remplit ce but (dans un
essai randomisé en ouvert, le suivi des
patients peut différer en fonction du
groupe de traitement)
Est stratifiée sur les antécédents de
traitement chirurgical de la prostate
Aucune mention n’est faite d’une
stratification sur ces facteurs
Ex e m ple 4 (ED N 2019)
Galimberti V, Cole BF, Zurrida S, Viale G, Luini A, Veronesi P, et al. Axillary
dissection versus no axillary dissection in patients with sentinel-node
micrometastases (IBCSG 23-01): a phase 3 randomised controlled trial.
Lancet Oncol avr 2013 ; 14(4) : 297-305.
We designed IBCSG trial 23-01 to détermine whether no axillary dissection
was non-inferior to axillary dissection in patients with one or more micrometastatic (< 2 mm) sentinel nodes and tumour of maximum 5 cm.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Randomisation
121
Randomisation and masking: Patients were randomly allocated (in a 1:1 ratio)
to either axillary dissection or no axillary dissection. Randomisation was done
with permuted blocks generated by a congruence algorithm. Randomisation
was stratified by participating centre and menopausal status. After confirming
eligibility, participating centre staff accessed the central randomisation System via the internet and entered required information including stratification
factors. The randomisation System assigned a patient identification number,
treatment group, and date of randomisation via the computer screen with a
follow-up email. The IBCSG data management centre developed and maintains the randomisation System. Masking was not done in this surgical trial.
The patient, participating centre staff, trial management staff, and others were
aware of the assigned treatment.
À propos des modalités de randomisation dans cette étude {une ou plusieurs
réponses possibles) :
Il aurait fallu cocher...
Commentaires
La randomisation est imprévisible
La centralisation de la randomisation
garanti l’imprévisibilité de celle-ci
La randomisation est centralisée
Oui : participating centre staff accessed
the central randomisation System
via the internet and entered required
information including stratification
factors
Il y a une liste de tirage au sort par
centre
Cette proposition correspondant à la
stratification sur le centre
La randomisation est stratifiée sur le
statut ménopausal pour contrôler ce
facteur pronostique connu
La stratification sur des facteurs
pronostiques connue permet de forcer la
comparabilité des groupes sur ce facteur
en particulier
Il n’aurait pas fallu cocher...
La randomisation a lieu juste avant le
consentement du patient
Commentaires
La randomisation doit se faire après la
vérification des critères d’éligibilité et
après le consentement du patient. Dans
le cas contraire, des patients randomisés
pourrait être exclus dès le début de
l’étude, ce qui pourrait entraîner un
déséquilibre de certaines caractéristiques
entre les groupes et donc une perte de
l’intérêt de la randomisation
Quelles informations peut-on tirer du tableau 1 {une ou plusieurs réponses
possibles) ?
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
122
Essais cliniques
Patient characteristics and adjuvant thérapies.
Axillary dissection
(n=464)
No axillary
dissertation (n=467)
53 (28-81)
54 (26-81)
323 (70%)
131 (28%)
10 (2%)
0
320 (69%)
135 (29%)
11 (2%)
1 (<1%)
17 (4%)
447 (96%)
453 (97%)
14 (3%)
44 (9%)
420 (91%)
10/420 (2%)
410/420 (98%)
79/420 (19%)
293/420 (70%)
36/420 (9%)
2/420 (<1%)
42 (9%)
425 (91%)
12/425 (3%)
413/425 (97%)
80/425 (19%)
297/425 (70%)
35/425 (8%)
1/425 (<1%)
441 (95%)
292 (63%)
42 (9%)
107 (23%)
451 (97%)
315 (67%)
33 (7%)
103 (22%)
General characteristics
Age (years)
Médian (range)
Sentinel-node tumour size
< 1 mm
1.1-2 mm
> 2 mm
Unknown
Axillary dissection performed
No
Yes
Local treatment*
Masectomy
Breast-conserving surgery
Without radiotherapy
With radiotherapy
Intraoperative radiotherapy only
Postoperative radiotherapy only
Combination radiotherapy
Unspecified radiotherapy
Systemic therapy
Any systemic therapy
Hormonal therapy only
Chemotherapy only
Combination therapy
Data are number of patients (%) unless otherwise indicated. *Percentages for type of surgery are
based on entire population, those for radiotherapy (no or yes) and for the type of radiotherapy
are based on only the breast-conserving subpopulation.
Il aurait fallu cocher...
Commentaires
Plus de 50 % des participantes sont
âgées de plus de 50 ans
Oui, car la médiane d’âge est supérieure
à 50 ans dans les 2 groupes
La taille de la tumeur est inférieure
ou égale à 1 mm sur la biopsie de
ganglion sentinelle, pour la majorité des
participantes
Oui pour environ 70 % d’entre elles
Il ne semble pas exister de déséquilibre
apparent de la prévalence des traitements
associés entre les deux bras de l’essai
Globalement les pourcentages associés
à chaque thérapeutique sont similaires
entre les 2 groupes de randomisation
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Randomisation
Il aurait fallu cocher...
123
Commentaires
La différence de chimiothérapie seule
(9 % vs 7 %) entre les 2 groupes est
probablement liée au hasard
Oui, si la randomisation est bien faite,
les seules différences observées entre
les groupes (hormis l’assignation de
l’intervention) sont liées au hasard
L’absence de différence apparente entre
la distribution des caractéristiques
démographiques et cliniques des
patients à l’inclusion s’explique le plus
vraisemblablement par l’assignation de la
modalité de traitement par tirage au sort
La randomisation a comme objectif de
constituer des groupes comparables
pour les caractéristiques recueillies à
l’inclusion
Il n’aurait pas fallu cocher...
Commentaires
L’absence de p-value ne permet pas de
conclure formellement à la comparabilité
des caractéristiques à l’inclusion entre les
deux bras de l’essai
On rappelle que la réalisation de
tests statistiques pour comparer les
caractéristiques initiales des groupes
comparés dans les essais randomisés
n’est pas nécessaire et n’a pas beaucoup
de sens. Mais attention : cela est différent
pour les études observationnelles au
cours desquelles les groupes comparés ne
sont pas constitués par randomisation
La différence d’hormonothérapie seule
(63 % rs 67 %) entre les 2 groupes
doit faire suspecter le non-respect de
la procédure de randomisation par les
investigateurs
Cette légère différence peut tout à fait
être expliquée par le hasard induit par
l’assignation aléatoire des traitements
Le déséquilibre observé concernant la
réalisation du curage ganglionnaire
axillaire (axillary dissection) entre les
deux bras de l’essai est probablement lié
à un échec de la randomisation
Ce n’était pas l’objectif de la
randomisation puisque le curage
ganglionnaire était l’intervention tirée
au sort. En revanche, on remarque que
certains patients ont reçu la stratégie
pour laquelle ils n’avaient pas été tirés au
sort, sinon on aurait dû constater 100 %
de réalisation de curage dans le bras
« curage » et 0 % dans le bras « absence
de curage »
Ex e m ple 5 (ED N 2021)
Cappuzzo F, Ciuleanu T, Stelmakh L, Cicenas S, Szczésna A, Juhâsz E, et al.
Erlotinib as maintenance treatment in advanced non-small-cell lung cancer :
a multicentre, randomised, placebo-controlled phase 3 study. Lancet Oncol
juin 2010; 11(6): 521-9.
We designed the phase 3, placebo-controlled Sequential Tarceva in Unresectable NSCLC study to assess use of erlotinib as maintenance therapy in
patients with non-progressive disease following first-line platinum doublet
chemotherapy. Randomisation was done using a 1:1 adaptive randomisation
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
124
Essais cliniques
method (using minimisation) via a third-party interactive voice response System. Patients were stratified by EGFR immuno histo chemistry status (positive; négative; indeterminate), disease stage (IIIB; IV), ECOG performance
status (0; 1), chemotherapy regimen (cisplatin and gemcitabine; carboplatin
and docetaxel; other), smoking history (current; former; never smokers) and
région (North America, South America, western Europe, eastern Europe,
southeast Asia, and Africa).
Dans cette étude, la randomisation est :
Il aurait fallu cocher...
Commentaires
Basée sur une procédure de
minimisation
La randomisation par minimisation consiste à forcer
la comparabilité des groupes sur des caractéristiques
données grâce à un algorithme informatique. C’est
un équivalent de stratification qui est utile lorsque
l’on souhaite stratifier la randomisation sur de
nombreuses caractéristiques
Centralisée
Un système dit « de tierce partie » correspond à une
centralisation de la randomisation
Imprévisible
Une randomisation est imprévisible lorsqu’il est
impossible pour l’investigateur de deviner le résultat
de la randomisation pour le prochain patient inclus
dans l’étude. Une randomisation centralisée favorise
l’imprévisibilité
A été stratifiée sur le statut
tabagique car il s’agit d’un
facteur pronostique connu
pour lequel on souhaitait
une équi-répartition entre
les 2 groupes
Un facteur pronostique important qui serait réparti
de manière inégale entre les 2 groupes entraînerait un
risque important de biais de confusion
Il n’aurait pas fallu cocher...
Réalisée avant le début du
traitement de lre ligne
Commentaires
Les patients qui ont été randomisés sont
ceux qui ont reçu 4 cycles complets de
chimiothérapie sans signe de progression
de la maladie. La randomisation doit être
réalisée au plus près du début du traitement à
l’étude, sinon on risque de perdre le bénéfice
de la randomisation qui est l’équilibre des
facteurs de confusion entre les groupes. En
randomisant avant le début des 4 cycles de
chimiothérapie, les patients décédés avant
le début du traitement à l’étude ne pourront
pas participer à l’étude. Comme ces patients
sont certainement très différents de ceux non
décédés, les facteurs de confusion ne seront
plus distribués de manière aléatoire entre les
2 groupes
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Randomisation
Il n’aurait pas fallu cocher...
125
Commentaires
Stratifiée sur l’erlotinib
Les facteurs sur lesquels la randomisation est
stratifiée sont présentés dans le paragraphe
sur la randomisation. Cependant, cette
proposition est fausse à la première lecture car
on ne stratifie jamais sur le traitement à l’étude
A été stratifiée sur le statut
tabagique car il s’agit d’un facteur
pronostique connu pour lequel on
souhaitait 1/3 de fumeurs actuels,
1/3 fumeurs passés et 1/3 de
non-fumeurs
On souhaite qu’il y ait autant de fumeur
actuel, de fumeurs passés et de non-fumeurs
dans chacun des 2 groupes
A été stratifiée sur le statut
tabagique car il s’agit d’un facteur
pronostique connu pour lequel on
souhaitait tester une interaction
avec l’effet traitement sans inflation
du risque alpha
Le but de la stratification de la randomisation
est d’équilibrer la répartition du facteur de
confusion entre les groupes. Attention à ne pas
confondre la stratification de la randomisation
avec la stratification de l’analyse en
sous-groupe qui s’accompagne quoi qu’il
arrive d’une inflation du risque alpha
Ex e m ple 6 (ED N 2020)
Hofmann R, James SK, Jernberg T, Lindahl B, Erlinge D, Witt N, et al.
Oxygen Therapy in Suspected Acute Myocardial Infarction. N Engl J Med
28 sept 2017; 377(13): 1240-9.
De manière générale, les éléments en faveur de l’imprévisibilité de la randomisation sont :
Il aurait fallu cocher...
Une procédure centralisée
La génération de la liste de
tirage au sort par un programme
informatique
L’utilisation de blocs de taille
variable
Commentaires
Une randomisation est imprévisible si
l’investigateur ne peut pas deviner le
traitement que va recevoir le prochain patient
qu’il va inclure. En pratique, cet écueil est
évitable si la procédure est centralisée. Dans le
cas d’une randomisation par bloc, l’utilisation
de blocs de taille aléatoire est également
souhaitable pour éviter à l’investigateur
de pouvoir deviner la séquence si les effets
secondaires du traitement sont facilement
identifiables
Il n’aurait pas fallu cocher...
Commentaires
La stratification sur le site d’étude
La stratification sur le site permet d’équilibrer
le ratio entre les deux bras de traitements
dans tous les centres, mais n’améliore pas
l’imprévisibilité
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 13
Procédure d’aveugle et effet
placebo
D é finitio ns
La procédure d’aveugle a pour objet de maintenir l’ignorance d’un ou de plusieurs participants d’une étude sur l’appartenance des patients à l’un ou l’autre
des groupes de randomisation. La procédure d’aveugle fait partie des critères de
qualité d’une étude. On distingue :
• les essais en ouvert (op en-label study) : le patient et le médecin investigateur
connaissent le groupe dans lequel le patient a été randomisé, il n’y a pas de
procédure d’aveugle ;
• les essais en simple insu (ou simple aveugle, single-blind) : seul le médecin
investigateur connaît le groupe de randomisation du patient ;
• les essais en double insu (ou double aveugle, double-blind) : ni le patient, ni
le médecin ne connaissent le groupe dans lequel le patient a été randomisé.
Q uels so n t les pro blè m es p osés p ar un essai
en o u vert ?
Les essais ouverts sont parfois indispensables, notamment quand la réalisation
d’un double insu est impossible. L’évaluation du critère et le suivi dans le cadre
de l’étude souffrent alors d’une subjectivité en lien avec la connaissance de
l’appartenance à tel ou tel groupe de traitement.
Biais de mesure différentiel
La connaissance du bras de traitement influence la mesure du critère de jugement de manière différente en fonction du bras.
Par exemple, on réalise un essai comparant 15 jours à 7 jours de traitement
par fluoroquinolone dans la pyélonéphrite aiguë de la femme. Le critère de
jugement principal est la guérison bactériologique (examen cytobactériologique
des urines ou ECBU) et clinique (absence de symptôme). Si l’essai est maintenu
en ouvert après le 7e jour, pour des symptômes identiques (brûlures urinaires),
les patientes du groupe non traité auront plus facilement tendance à consulter que les patientes qui prennent des antibiotiques. Ceci augmente le taux de
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
128
Essais cliniques
rechute dans le bras placebo et le réduit dans le bras traité. On observe donc
une différence entre les groupes qui peut être liée uniquement à l’erreur de
mesure et pas à l’effet du traitement.
Biais de performance
Même avec un critère de jugement objectif, comme le décès, les patients peuvent être soumis à une prise en charge différente en raison du bras de traitement
(surveillance plus rapprochée par exemple, menant à un dépistage plus rapide
des complications). Ces différences peuvent agir sur le critère de jugement et
modifier les résultats de l’essai indépendamment de l’effet du traitement.
Non-comparabilité du suivi en rapport
avec la connaissance du traitement
La connaissance de la stratégie thérapeutique peut amener à une recherche plus
active du critère de jugement ou de la toxicité dans un bras (par exemple, dans
un essai clinique comparant une nouvelle thérapie ciblée + le traitement de
référence versus le traitement de référence seul dans le cancer avec la rechute
radiologique comme critère : la connaissance du traitement reçu par le patient
peut entraîner une recherche plus active et/ou fréquente de la rechute par le
radiologue chez les patients ayant eu le traitement de référence seul).
L'effet placebo/nocebo est différent entre les deux bras
L’effet placebo/nocebo est l’écart positif (placebo) ou négatif (nocebo) entre ce
qui est attendu compte tenu de la pharmacologie et l’effet réellement observé. Il
comprend des mécanismes psychologiques et biochimiques qui ne sont pas liés
directement à la pharmacologie du médicament. Dans un essai ouvert, cet effet
peut conduire à une conclusion d’efficacité d’un médicament (liée notamment aux
attentes d’efficacité plus forte avec le nouveau traitement) ou au contraire de toxicité non liée à l’effet pharmacologique propre. L’utilisation du double insu et le
recours à un placebo dans une étude permettent de prendre en compte cet effet placebo. Dans un essai en double insu, l’effet placebo est le même entre les deux bras.
À retenir
Le double insu permet de garantir :
un suivi identique entre les groupes de traitement et l'absence de biais de
performance ;
une évaluation objective et identique du critère de jugement dans les deux
groupes de traitement ;
l'absence de biais de mesure différentiel sur le critère de jugement principal ;
un effet placebo identique dans tous les groupes de traitement.
Alors que la randomisation permet de :
rendre les groupes comparables en termes de caractéristiques initiales ;
s'affranchir d ’ éventuels facteurs de confusion.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Procédure d’aveugle et effet placebo
129
Q u elles m esures p e u t-o n pren dre p o ur m ain t enir
la procé d ure d'aveu gle t o u t au lon g d'un essai ?
• Technique du double placebo : lorsque deux traitements comparés ont deux
voies d’administration différentes, le maintien du double insu peut s’avérer
difficile (ex. : voie sous-cutanée versus voie per os). La technique du double
placebo permet de maintenir le double insu en administrant à chaque groupe
de traitement le placebo de l’autre groupe (ex. : donner un placebo sous-cutané
au groupe « voie per os » et un placebo per os dans le groupe « voie souscutanée »).
• Monitorer les effets indésirables reconnaissables par un comité indépendant.
• Utiliser un placebo indistinguable (taille, forme, goût, couleur, galénique
identique).
Q u elles m esures p e u t-o n pren dre p o ur li m iter
les biais liés à la na t ure o uverte d'un essai ?
• Utiliser un critère de jugement objectif (par exemple, le décès : la définition
n’est donc pas influencée par la connaissance du bras de traitement), ce qui
limite le biais de mesure différentiel sur le critère de jugement principal.
• Faire adjudiquer (= décider) les événements par un comité de suivi indépendant en aveugle du bras de traitement.
• Standardiser la procédure de suivi, c’est-à-dire imposer des visites de suivi
à des temps donnés avec des examens complémentaires prédéfinis (imposer la
recherche de rechute de cancer par des examens définis à l’avance à intervalles
réguliers, par exemple).
• Standardiser la mesure du critère de jugement principal = le rendre le plus
objectif possible en définissant très précisément ce qui constitue un événement
(modalité de lecture de l’imagerie, seuil de positivité d’un marqueur, etc.).
À retenir
Le double aveugle est parfois impossible (par exemple, dans le cadre de
l’ évaluation d'une technique chirurgicale par rapport à un traitement médical).
Le double aveugle est parfois difficile à maintenir (par exemple, en raison
d'effet secondaire caractéristique d'un traitement, comme l'alopécie induite par
certaines chimiothérapies, la coloration des urines sous rifampicine, etc.). On
parle alors d'aveugle « illusoire ».
Dans un essai ouvert, un comité d'adjudication en aveugle du bras de
randomisation ne fait pas de cet essai un essai en simple ou en double aveugle.
Seule la connaissance du traitement par les patients et les investigateurs est
prise en compte pour définir un essai ouvert ou en aveugle.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
130
Essais cliniques
Asp ects é t hiq u es
La levée d’insu est autorisée et prévue par une procédure en cas de situations
d’urgence pendant lesquelles la connaissance du traitement réellement pris par
le patient doit être possible sans délai (ex. : surdosage accidentel ou volontaire).
► Attention ! Il n’est pas éthique d’évaluer un traitement contre placebo s’il
existe déjà un traitement de référence dans la maladie étudiée, ou alors
l’évaluation du traitement doit se faire en plus de l’application du traitement de référence (le traitement de référence est alors appliqué à tout le
monde et la randomisation consiste à former un groupe dit « traitement
de référence + nouveau traitement » et un autre groupe dit « traitement
de référence + placebo »).
En pra tique
Ex e m ple 1 (ED N 2017)
Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML,
Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D,
Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D.
Levosimendan for the prévention of acute organ dysfunction in sepsis.
N Engl J Med 2016; 375: 1638-48.
Levosimendan is a calcium-sensitizing drug with inotropic and other properties that may improve outcomes in patients with sepsis. We conducted a
double-blind, randomized clinical trial to investigate whether levosimendan
reduces the severity of organ dysfunction in adults with sepsis. Patients were
assigned to receive a blinded infusion of either levosimendan or placebo for
24 hours in addition to standard care.
The administration of levosimendan or placebo was started at a rate of 0.1 pg
per kilogram of body weight per minute and, in the absence of rate-limiting
side effects, was increased after 2 to 4 hours to 0.2|Llg per kilogram per minute
for a further 20 to 22 hours. If the patient had rate limiting side effects - either
hypotension or severe tachycardia - at the dose of 0.2pg per kilogram per
minute, then the infusion rate was reduced to O.lpg per kilogram per minute.
Concernant les procédures d’aveugle :
Il aurait fallu cocher...
Commentaires
Elles sont justifiées par l’effet
placebo potentiel du lévosimendan
Tout traitement a un effet propre
(pharmacologique pour un médicament) et un
effet placebo. Il faut un groupe comparateur
avec le même effet placebo
Le personnel soignant était en
aveugle du traitement
Dans l’idéal, il faut préciser qui est en aveugle,
la mention double aveugle permet de
considérer que les soignants sont en aveugle
au même titre que les patients
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Procédure d’aveugle et effet placebo
131
Il aurait fallu cocher...
Commentaires
Des éléments cliniques en cours
d’administration pourraient rompre
l’insu
Il est noté dans les méthodes if the patient had
rate limiting side effects - either hypotension
or severe tachycardia résultats... ce qui
indique des effets indésirables reconnaissables
pouvait faire craindre un « aveugle illusoire »
Elles ont pour but d’assurer la
comparabilité des procédures de suivi
pendant toute la durée de l’étude
C’est en effet un des objectifs de la procédure
d’aveugle
Il n’aurait pas fallu cocher...
Commentaires
Les auteurs ont utilisé un double
placebo pour assurer l’aveugle de
cette étude
11 n’y a pas de double placebo, mais un
seul placebo similaire au traitement par
lévosimendan
Elles permettent d’assurer la
comparabilité initiale des groupes
C’est le rôle de la randomisation et pas de la
procédure d’aveugle
Le caractère multicentrique de
l’étude a permis de s’affranchir du
double aveugle
Le caractère multicentrique n’a rien à voir
avec la procédure d’aveugle. Il permet de
recruter plus de patient et de s’affranchir d’un
effet centre et donc d’augmenter la validité
externe d’une étude
Ex e m ple 2 (é preuve t est 2018)
Fleshner NE, Lucia MS, Egerdie B, Aaron L, Eure G, Nandy I, Black L,
Rittmaster RS. Dutasteride in localised prostate cancer management : the
REDEEM randomised, double-blind, placebo-controlled trial. Lancet 2012;
379: 1103-11.
We aimed to assess whether treatment with dutasteride decreased the rate
of prostate cancer progression compared with placebo in men with low-risk,
localised disease who would otherwise undergo active surveillance.
We randomly allocated participants in a one-to-one ratio to receive dutasteride 0.5mg or matching placebo once daily for 3 years.
Participants attended follow-up visits every 3 months for the first year and
every 6 months thereafter. Participants also received a follow-up téléphoné
call 4 months after their last dose of study drug. We measured sérum prostatespecific antigen concentrations at screening and subséquent follow-up visits;
actual prostate-specific antigen concentrations were reported to the investigator and patients.
Overall incidence of adverse events, serious adverse events, and adverse events
leading to study withdrawal was much the same between treatment groups.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
132
Essais cliniques
Les auteurs ont utilisé un placebo :
Il aurait fallu cocher...
Commentaires
Pour maintenir les participants en
aveugle du groupe de randomisation
Donner un placebo identique au groupe
contrôle est en effet indispensable pour
maintenir l’aveugle
Pour s’affranchir de l’effet placebo du
traitement par dutastéride
Le groupe contrôle avec placebo permet
de compenser l’effet placebo du traitement
par dutastéride
Car il n’existe pas de traitement de
référence d’efficacité démontrée pour le
cancer localisé de la prostate
Si on considère que la surveillance active
n’est pas un « traitement », alors l’absence
de traitement actuellement validé dans
cette indication justifie la comparaison à
un placebo
Il n’aurait pas fallu cocher...
Commentaires
Pour augmenter les chances de l’étude
de conclure à une différence
statistiquement significative
L’utilisation d’un placebo et la procédure
d’aveugle ont plutôt tendance à défavoriser
le traitement, une étude ouverte aurait plutôt
tendance à induire un biais différentiel en
faveur du traitement
Pour comparer l’efficacité du
dutastéride à la surveillance active
Dans cette étude, l’utilisation de dutastéride
n’est pas comparée à la surveillance active
puisque cette surveillance active est
pratiquée dans les 2 groupes
La réalisation du double aveugle a probablement été rendue inefficace par le fait que :
Il aurait fallu cocher...
Commentaires
Les résultats du dosage périodique du
PSA (prostate-specific antigeri) étaient
communiqués aux patients et aux
investigateurs
Il est bien connu (et rappelé dans l’article)
que les inhibiteurs de la 5-alpha-réductase
diminuent le PSA, ce qui permet de deviner
le bras de randomisation
Il n’aurait pas fallu cocher...
Commentaires
Les patients ont bénéficié d’une biopsie
prostatique transrectale à 18 mois et
36 mois de suivi
Dans cet essai, la date de point est à
3 ans. Si on connaît la progression avant
3 ans, on peut imaginer que le patient est
dans le groupe placebo plutôt que dans le
groupe traité. Néanmoins, la formulation
« probablement rendue inefficace » est
trop formelle. Le fait qu’il y ait ou non
un cancer ne permet pas d’affirmer que le
patient est sous placebo ou dutastéride
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Procédure d’aveugle et effet placebo
Il n’aurait pas fallu cocher...
133
Commentaires
Les comprimés de placebo étaient
différents des comprimés de dutastéride
L’expression matched placebo indique
qu’il s’agit d’un placebo identique
Les modalités de suivi étaient différentes
entre les deux bras de l’essai
Les modalités de suivi différentes sont
une conséquence et pas une cause de
l’inefficacité de la procédure d’aveugle
Les effets indésirables étaient plus
fréquents sous traitement par
dutastéride
Les effets indésirables n’étaient pas plus
importants sous dutastéride
Ex e m ple 3 (é preuve t est 2017)
Hugosson J, Carlsson S, Aus G, Bergdahl S, Khatami A, Lodding P, Pihl
CG, Stranne J, Holmberg E, Lilja H. Mortality results from the Gôteborg
Randomised Prostate Cancer Screening Trial. Lancet Oncol 2010; 11(8):
725-32.
The European Randomized Study of Screening for Prostate Cancer (ERSPC)
compares a group of men invited for prostate cancer screening based on prostate-specific antigen (PSA) to a control group without any active intervention.
Causes of death for men diagnosed with prostate cancer were determined by
an independent COD (Cause of Death) committee. The committee performed
a blinded review of ail cases diagnosed with prostate cancer. Masking of group
assignment was only done for the Cause of Death committee.
Les auteurs on fait appel à un comité d’adjudication (COD committee) pour
statuer sur la cause des décès en aveugle du groupe de randomisation. On peut
en déduire que :
Il aurait fallu cocher...
Le biais de classement ou d’évaluation
sur le critère de jugement principal a été
minimisé
Il n’aurait pas fallu cocher...
Commentaires
En effet, cette mesure améliore
l’objectivité de la mesure du critère de
jugement
Commentaires
L’étude est en double aveugle
Cette étude est par définition ouverte. Le
comité d’adjudication est justement mis
en place pour éviter le biais de mesure
sur le critère de jugement principal
Le critère de jugement sur la mortalité
liée au cancer de la prostate est un
critère composite puisqu’il repose sur
deux évaluations : l’avis du comité et la
déclaration de décès
Ce n’est pas la définition d’un critère
composite. Un critère composite est
composé de deux conditions simultanées
qui donnent une seule mesure : par
exemple, survie sans progression
(événement : décès ou progression),
décès ou événement cardiovasculaire
majeur, etc.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
134
Essais cliniques
Il n’aurait pas fallu cocher...
Commentaires
Le biais de suivi est minimisé
Le biais de suivi est lié au fait que les
2 groupes ne sont pas suivis de la même
manière. Ceci est essentiellement lié à
l’absence d’aveugle
Les investigateurs ont souhaité limiter les
biais de confusion
C’est la randomisation qui remplit ce
rôle
Ex e m ple 4 (é preuve t est 2021)
Eriksson BI, Huisman MV, Muehlhofer E. Rivaroxaban versus Enoxaparin
for Thromboprophylaxis after Hip Arthroplasty. N Engl J Med. 2008; 11.
This phase 3 trial compared the efficacy and safety of rivaroxaban, an oral
direct inhibitor of factor Xa, with those of enoxaparin for extended thromboprophylaxis in patients undergoing total hip arthroplasty. In this randomized,
double-blind study, we assigned 4,541 patients to receive either 10 mg of oral
rivaroxaban once daily, beginning after surgery, or 40 mg of enoxaparin subcutaneously once daily, beginning the evening before surgery, plus a placebo
tablet or injection.
L’efficacité et la sécurité du rivaroxaban n’ont pas été évaluées contre placebo
car :
Il aurait fallu cocher...
Commentaires
Un traitement de référence existait
dans cette indication
Le traitement de référence est le traitement
par héparine. On souhaite donc comparer
le rivaroxaban au traitement de référence.
Il ne serait pas acceptable de comparer un
traitement face à un placebo s’il existe un
traitement de référence bien établi dans la
pathologie étudiée
Une telle étude aurait posé des
problèmes éthiques
Les patients chez qui il est réalisé une
arthroplastie de hanche ont une indication
claire à recevoir une thromboprophylaxie
post-opératoire du fait d’un risque élevé
de maladie thromboembolique veineuse.
Comparer le rivaroxaban a un placebo
exposerait donc les patients du groupe
placebo à un risque inutile
Il n’aurait pas fallu cocher...
Il n’existait pas de placebo disponible
pour le rivaroxaban
Il n’existait pas de placebo de
l’énoxaparine
Commentaires
Cette étude a utilisé la technique du
double placebo afin de maintenir
l’aveugle dans l’assignation des
traitements. Les patients prenant le
rivaroxaban prenaient en même temps
un placebo d’héparine et vice-versa
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Procédure d’aveugle et effet placebo
Il n’aurait pas fallu cocher...
135
Commentaires
L’efficacité du rivaroxaban avait déjà été
démontrée dans cette indication
On réalise cette étude justement car
l’efficacité du rivaroxaban n’a pas été
démontrée dans cette indication
Le rivaroxaban était forcément plus
efficace qu’un placebo
On imagine que le rivaroxaban est plus
efficace qu’un placebo pour prévenir
le risque thrombo-embolique veineux
dans cette indication, mais il existe
un traitement de référence dans cette
indication
Ex e m ple 5 (é preuve t est 2019)
The EINSTEIN-PE Investigators. Oral Rivaroxaban for the Treatment of
Symptomatic Pulmonary Embolism. N Engl J Med 5 avr 2012; 366(14):
1287-97.
The standard therapy for most patients with pulmonary embolism has been
the administration of heparin, overlapped and followed by a vitamin K antagonist. In a randomized, open-label, event-driven, noninferiority trial involving 4,832 patients who had acute symptomatic pulmonary embolism with
or without deep-vein thrombosis, we compared rivaroxaban (15 mg twice
daily for 3 weeks, followed by 20 mg once daily) with standard therapy with
enoxaparin followed by an adjusted-dose vitamin K antagonist for 3, 6, or
12 months. The primary efficacy outcome was symptomatic récurrent venous
thromboembolism. In the case of suspected venous thromboembolism, the
protocol required objective testing. A central committee whose members
were unaware of the study-group assignments adjudicated the results of ail
baseline lung-imaging tests and ail suspected outcome events. An independent
data and safety monitoring board periodically reviewed the study outcomes.
An independent dose confirmation committee reviewed the incidence of the
composite outcome of symptomatic récurrent venous thromboembolism and
asymptomatic détérioration on repeat lung imaging.
Dans cet essai, l’efficacité et la sécurité du rivaroxaban pour le traitement de
l’embolie pulmonaire n’ont pas été évaluées contre placebo car :
Il aurait fallu cocher...
Commentaires
Il existe un traitement
de référence de l’embolie
pulmonaire
La présence d’un traitement de référence impose toujours
d’évaluer le nouveau traitement contre ce traitement de
référence. Il ne serait pas éthique d’administrer un placebo
seul à des patients souffrant d’embolie pulmonaire
Il n’aurait pas fallu cocher...
Il n’existe pas de placebo
pour l’énoxaparine
Commentaires
C’est tout à fait possible de prévoir un placebo pour
ces deux traitements que soit en gélule pour le rivaroxaban ou par voie sous-cutanée pour l’énoxaparine
et de construite un essai avec un double placebo (voir
question suivante)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
136
Essais cliniques
Commentaires
Il n’aurait pas fallu cocher...
Il n’existe pas de placebo
pour le rivaroxaban
L’efficacité et la sécurité
du rivaroxaban ont été
démontrées contre placebo
auparavant
Ce n’est pas le cas et il existe déjà un traitement de
référence
Pour quelle(s) raison(s) pratique(s) était-il difficile de conduire cette étude en
double aveugle ?
Il aurait fallu cocher...
Commentaires
Un double placebo aurait été
nécessaire
Le groupe « rivaroxaban » aurait eu en plus un
placebo d’énoxaparine et le groupe « traitement
standard » aurait reçu un placebo de rivaroxaban
La dose d’antagoniste de la
vitamine K doit être ajustée en
fonction de la valeur de l’INR
C’est la principale raison pour laquelle l’aveugle
n’a pas été utilisée. Cela induit forcément une
différence de suivi entre les 2 groupes
Commentaires
Il n’aurait pas fallu cocher...
Il s’agit d’un essai de noninfériorité
Un essai de non-infériorité peut tout à fait être
réalisé en double aveugle
Maintenir les patients et les
médecins dans l’ignorance du
traitement alloué n’aurait pas
été éthique
Il n’y a pas de raison éthique à ne pas mettre en
place une procédure de double aveugle. S’il existe
un problème éthique, on ne peut pas conduire
l’essai, qu’il soit ouvert ou en aveugle
Il n’existait pas d’antidote du
rivaroxaban au moment de
l’étude
En cas d’événement indésirables il existe des
procédures qui permettent de lever l’aveugle pour
ne faire perdre aucune chance au patient
Quelle(s) précaution(s) a (ont) été prise(s) pour surmonter les inconvénients du
caractère ouvert de l’étude dans l’évaluation du critère de jugement principal
d’efficacité ?
Il aurait fallu cocher...
Mise en place d’un comité central
d’adjudication des événements
Adjudication des événements en aveugle
du groupe d’étude
Commentaires
A central committee whose members
were unaware of the study-group
assignments adjudicated the results of
ail baseline lung-imaging tests and ail
suspected outcome events. En revanche
cela ne permet bas de s’affranchir du
biais induit par la différence de suivi par
le clinicien entre les 2 groupes du fait de
la surveillance de l’INR dans un groupe
et pas dans l’autre
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Procédure d’aveugle et effet placebo
Il aurait fallu cocher...
Confirmation des suspicions
d’événements thrombo-emboliques
veineux par des tests diagnostiques
objectifs
137
Commentaires
In the case of suspected venous
thromboembolism, the protocol required
objective testing. Cela limite le biais
d’information (ou de classement)
Il n’aurait pas fallu cocher...
Commentaires
La mise en place d’un comité indépendant des données de sécurité
Ce comité est là pour intervenir en cas
de danger pour les patients (surrisque
hémorragique important dans un des
groupes par exemple) et a le pouvoir de
stopper l’inclusion des patients le cas
échéant. Il ne doit pas être confondu avec
le comité d’adjudication
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 14
Plan expérimental
In tro d uctio n
Le design correspond au schéma de l’étude. Dans certains articles, on peut
trouver ce schéma décrit sous la forme d’une figure, notamment lorsqu’il est
complexe ou lorsque l’administration du médicament est fractionnée (par
exemple, au cours des cures de chimiothérapie afin d’indiquer sur une frise les
jours de perfusion). Il existe plusieurs types de design dont les trois rencontrés
le plus fréquemment sont décrits ci-dessous.
Essai en gro u p es p arallèles
• Schéma le plus classique.
• Deux groupes de patients sont constitués par tirage au sort, l’un recevant
le traitement étudié et l’autre recevant soit un placebo, soit le traitement de
référence.
• Le critère de jugement est mesuré dans les deux bras de traitement de manière
identique.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
140
Essais cliniques
Essai en cross-o ver
• Deux groupes de patients sont constitués par tirage au sort.
• L’un des groupes reçoit le traitement étudié puis le placebo (ou le traitement
de référence), l’autre groupe reçoit le placebo (ou le traitement de référence)
puis le traitement étudié.
• Deux périodes d’études sont ainsi formées et le critère de jugement est évalué
à la fin de chacune des deux périodes.
• Selon ce schéma, chaque sujet est pris comme son propre témoin, on parle
aussi d’essai intra-individuel.
l'efficacité
l'efficacité
Avantages
• Augmente la puissance et diminue le nombre de sujets nécessaires à inclure
par rapport à un schéma en groupe parallèle : ceci constitue un intérêt pour les
maladies à faible potentiel de recrutement.
• Assure une forte comparabilité des groupes étant donné que chaque sujet est
pris comme son propre témoin.
Inconvénients
• Pas d’application possible en cas de critère de jugement définitif comme la
guérison ou le décès. L’état clinique doit être le même avant l’administration du
premier et du deuxième traitement.
• Entraîne un allongement de la période d’observation, donc un risque de perdus de vue plus important.
• Effet carry-over : poursuite de l’efficacité du premier traitement après arrêt
de celui-ci. Cela nécessite une période de wash-out entre les deux traitements.
• Effet ordre : biais entraînant une différence d’efficacité entre les deux périodes
indépendamment de l’effet du traitement (par exemple, par effet d’apprentissage
lors de l’application répétée d’un questionnaire à un même patient ou en cas
d’évolution de la maladie vers l’aggravation ou l’amélioration spontanée).
• L’interprétation des résultats est plus complexe.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Plan expérimental
141
Conclusion
Ce type de schéma est adapté aux maladies chroniques relativement stables,
dont le critère de jugement d’efficacité n’est pas définitif, et à l’étude de traitements dont l’efficacité est rapide et qui ne perdurent pas trop longtemps après
leur arrêt (médicaments à demi-vie courte, par exemple).
Plans f act oriels
• Quatre groupes de patients sont formés par tirage au sort.
• Deux traitements sont testés simultanément afin de rechercher s’il existe une
potentialisation de l’effet des deux traitements ou au contraire une incompatibilité.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 15
Suivi de l’étude et diagramme
de flux
Le diagramme de flux (flow chart) résume sous forme d’organigramme le suivi
des patients en détaillant les différentes étapes comme l’inclusion et la randomisation. Il permet généralement de repérer les effectifs de la population ITT et
de la population per-protocole (voir fiche 16).
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
144
Essais cliniques
Elé m e n ts i m p ort an ts à re p érer
• Nombre d’inclusions :
- le nombre total de sujets nécessaires est-il atteint ?
- si non : risque d’un manque de puissance ;
- manque de puissance = risque de ne pas réussir à mettre en évidence une
différence qui existe vraiment = inflation du risque p.
• Nombre de patients exclus avant randomisation et raison de ces exclusions :
- patients exclus car ne répondant pas aux critères d’inclusion ou présentant
des critères d’exclusion : cela reste logique et ne pose pas de problème a priori^
hormis le fait que la généralisation des résultats dans la vraie vie ne pourra
être possible que chez des patients avec des caractéristiques identiques ;
- patients exclus pour refus de participation : risque de biais de sélection
(les patients refusant de participer présentent peut-être des caractéristiques
particulières).
• Équilibre des groupes après randomisation :
- le déséquilibre dans l’effectif des groupes est-il lié à des sorties de l’étude
pour des raisons particulières ?
- si oui, ces raisons modifient-elles la comparabilité initiale des groupes ?
- si les groupes ne sont plus comparables, on perd le bénéfice de la randomisation et on voit potentiellement apparaître l’effet de certains facteurs de
confusion.
• Nombre de perdus de vue et raison de ces perdus de vue :
- si le nombre de sujets perdus de vue est faible (< 10 %) et équilibré entre
les deux groupes, le biais d’attrition (biais de suivi) est a priori faible ;
- si le nombre de sujets perdus de vue est élevé (> 10 %) et déséquilibré
entre les deux groupes, le biais d’attrition (biais de suivi) est a priori non
négligeable ;
- les raisons des pertes de suivi et des arrêts de suivi sont si possible précisées :
une perte de suivi liée à l’évolution de la maladie ou à des effets indésirables
du traitement est susceptible d’entraîner un biais dans l’évaluation finale du
traitement.
Biais d'a t tritio n
Définition : biais en rapport avec les sorties d’études. Au cours d’un essai clinique, l’attrition pose deux problèmes :
• si les sorties d’étude sont réparties différemment entre les groupes, l’attrition
détruit le bénéfice de la randomisation, rendant les groupes de traitement non
comparables (habituellement, on a plus de sorties dans le groupe traitement que
dans le groupe placebo, et le profil des sorties d’étude est en faveur des patients
les plus fragiles) ;
• la population d’analyse est sélectionnée si on a trop de sorties d’étude, la
généralisation des résultats devient alors délicate.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Suivi de l’étude et diagramme de flux
145
En pra tique
Ex e m ple 1 (ED N 2018)
Bonjer HJ, Deijen CL, Abis GB, Cuesta MA, van der Pas MHGM, de
Lange-de Klerk ESM, Lacy AM, Bemelman WA, Andersson J, Angenete E,
Rosenberg J, Fuerst A, Haglind E, for the COLOR II Study Group.
A randomized trial of laparoscopie versus open surgery for rectal cancer.
N Engl J Med 2015; 372: 1324-32.
From January 2004 through May 2010, a total of 1,103 patients with rectal
cancer underwent randomization. Of these patients, 739 were assigned to
undergo laparoscopie surgery and 364 to undergo open surgery. After the
exclusion of 59 patients following randomization, 1,044 patients (699 in
the laparoscopic-surgery group and 345 patients in the open-surgery group)
were included in the analysis (Fig. 1). In total, 1,036 patients were included
in the long-term analyses. At the 3-year follow-up, data were available for
771 patients (74%) regarding locorégional récurrence, 923 (89%) regarding
disease-free survival, and 903 (87%) regarding overall survival.
Enrollment and Outcomes.
À propos du flux des patients dans l’étude :
Il aurait fallu cocher...
Commentaires
Le recrutement des patients a été réalisé
entre janvier 2004 et mai 2010
C’est ce qui est précisé dans le texte,
entre janvier 2004 et mai 2010,
1 103 patients ont été randomisés
L’information sur le critère de jugement
principal à 3 ans n’était pas disponible
pour 26 % des patients randomisés
À 3 ans, 74 % des patients avaient des
données disponibles permettant d’estimer
la récidive locorégionale, soit 26 % de
données manquantes
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
146
Essais cliniques
Il aurait fallu cocher...
Commentaires
697 patients ont été inclus dans le
groupe laparoscopie dans l’analyse en
traitement reçu
Dans le groupe laparoscopie, selon le
diagramme de flux, 699 patients ont été
analysés dans l’analyse principale
(intention de traiter modifiée), alors que
seulement 692 ont réellement eu
une laparoscopie (699 — 7 qui ont eu
une chirurgie ouverte). Mais 5 patients
du groupe chirurgie ouverte ont eu
finalement une laparoscopie. Ces 5 patients
ont été analysés dans le groupe
laparoscopie dans l’analyse en traitement
reçu, soit au total 5 + 692 = 697 patients
analysés dans l’analyse en traitement
reçu dans le groupe laparoscopie (voir
fiche 10 pour plus d’informations sur
l’analyse en traitement reçu)
L’information sur les patients éligibles
manque à ce diagramme
En effet, il manque le nombre de patients
évalués pour éligibilité et la raison des
non-inclusions
Il n’aurait pas fallu cocher...
Commentaires
La figure de l’exemple 1 suggère qu’il
s’agissait d’un essai en cross-over
L’essai est en groupes parallèles et non en
cross-over
692 patients du bras laparoscopie ont
été inclus dans l’analyse en intention de
traiter (intention to treat ou ITT)
Dans le groupe laparoscopie, selon le
diagramme de flux, 699 patients ont été
analysés dans l’analyse en ITT
Le strict principe de l’ITT était respecté
dans cette étude
Il existe des patients randomisés qui
n’ont pas été inclus dans l’analyse finale.
Le principe strict de l’ITT n’a pas été
respecté
Il n’y a pas d’attrition dans cette étude
Des patients inclus ne sont pas analysés,
il existe donc des sorties d’étude
Ex e m ple 2 (ED N 2017)
Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML,
Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D,
Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D.
Levosimendan for the prévention of acute organ dysfunction in sepsis.
N Engl J Med 2016; 375: 1638-48.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Suivi de l’étude et diagramme de flux
147
>
Selon le diagramme de flux, dans cet essai :
Il aurait fallu cocher...
Commentaires
Sur les 259 patients randomisés
dans le bras lévosimendan, un
patient a retiré son consentement et
a été exclu de l’analyse principale
C’est précisé dans la 3e case à gauche en
partant du haut
2 patients sont décédés avant de
recevoir le lévosimendan
4 patients n’ont pas reçu de lévosimendan.
Parmi eux, 2 sont décédés
Dans cette étude, la population
as-treated comprend l’ensemble
des patients ayant effectivement
reçu le traitement assigné par
randomisation
Les auteurs ont en effet considéré comme
la population as-treated les malades ayant
reçu le traitement assigné par randomisation,
ce qui correspond plutôt à une analyse
« per-protocole ». Dans une analyse en
traitement reçu, le patient ayant reçu du
lévosimendan dans le groupe placebo aurait
dû être analysé dans le groupe lévosimendan,
et les patients du groupe lévosimendan n’en
ayant pas reçu dans le groupe placebo
Un patient du groupe placebo a
reçu du lévosimedan
Un patient a reçu du lévosimendan en ouvert
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
148
Essais cliniques
Il n’aurait pas fallu cocher...
Commentaires
Les patients du groupe lévosimendan n’ayant pas reçu de
lévosimendan ont été exclus de
l’analyse principale
Non, la seule exclusion concerne un patient
ayant retiré son consentement (on pourrait
parler de modified intention to treat ou mITT
pour la population principale d’analyse)
Tous les patients randomisés ont
été pris en compte dans l’analyse
principale
Dans le groupe lévosimendan, 1 patient a été
exclu de l’analyse principale
Ex e m ple 3 (é preuve t est 2017)
Griffin D, Parsons N, Shaw E, Kulikov Y, Hutchinson C, Thorogood M,
Lamb SE; UK Heel Fracture Trial Investigators. Operative versus
non-operative treatment for closed, displaced, intra-articular fractures of the
calcaneus: randomised controlled trial. BMJ 2014; 349: g4483.
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Suivi de l’étude et diagramme de flux
149
Concernant le flux des participants dans l’étude :
Il aurait fallu cocher...
Commentaires
Plus de la moitié des patients éligibles
ont refusé de participer principalement
en raison d’une préférence pour l’un des
deux traitements
En effet, 351 patients sur les 502 éligibles
ont refusé de participer dont 146 +144 =
190 en raison d’une préférence
L’exclusion de 351 patients éligibles ne
nuit pas à la comparabilité des groupes
Les non-inclusions survenant avant la
randomisation ne nuisent en effet pas
à la comparabilité des groupes, même
si elles sont à l’origine d’un biais de
sélection
Le strict principe de l’ITT {intention to
treat) a été respecté dans cette étude
Les 151 patients randomisés ont été
analysés. On peut supposer que pour
atteindre ce but, les données non
disponibles ont été imputées (c’est-à-dire
remplacées)
Il n’aurait pas fallu cocher...
Commentaires
Tous les patients randomisés ont
reçu l’intervention allouée par la
randomisation
5 patients du groupe chirurgie n’ont pas
été opérés, mais ils ont quand même été
analysés dans le groupe chirurgie
3 patients du groupe traitement médical
ont été opérés et ont été analysés dans le
groupe traitement médical
Le critère de jugement principal était
manquant chez 4 patients dans le bras
opératoire et ces patients ont été exclus
de l’analyse
Effectivement, le critère de jugement
principal n’était pas disponible à 2 ans
pour 4 patients du groupe opératoire.
Pour autant, selon le flow chart, il y a
autant de patients analysés que
randomisés donc ils n’ont pas été « exclus »
mais analysés
2 patients randomisés dans le bras
traitement opératoire ont changé
d’avis et ont été analysés dans le bras
traitement non opératoire
2 patients randomisés dans le groupe
opératoire n’ont pas été opérés, mais
ils sont restés dans le groupe opératoire
pour l’analyse
3 patients randomisés dans le bras
traitement non opératoire ont changé
d’avis et ont été exclus de l’analyse
3 patients randomisés dans le groupe
traitement médical ont été opérés,
mais ils ont été analysés dans le groupe
traitement médical
L’exclusion de patients avant la
randomisation ne pose pas de problème
de biais de sélection
Les groupes restent comparables,
mais l’exclusion de patients éligibles
sélectionne l’échantillon (qui devient
moins représentatif de la population
source)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 16
Population d’analyse
(ITT et per-protocole)
En complément
V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l ’ I T T e t l e P e r-P r o t ocol e :
h t t ps: / / y o u t u. b e / v o G p gJh T Z 9 A
Po p ula tio n p o ur l'analyse en in t e n tio n d e trait er
(intention to tre a t ou ITT)
L’analyse en intention de traiter :
• consiste à prendre en compte chaque patient dans son groupe de randomisation initial, même s’il n’a pas reçu le bon traitement ou s’il est sorti d’étude
(déviation du protocole) ;
• nécessite que tous les malades soient suivis jusqu’à la fin de l’essai. Sinon,
il faut imputer les résultats = attribuer une valeur arbitraire pour le critère de
jugement à un patient ;
• diminue la différence entre les groupes = défavorable à la démonstration de
la supériorité/favorable à la démonstration de la non-infériorité.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
152
Essais cliniques
Si on garde tous les patients dans leur groupe d’origine, sans tenir compte
du fait qu’ils aient réellement pris ou non le traitement alloué par la randomisation, il faut imaginer que l’on « mélange » les groupes. Ils deviennent plus
« proches » pour le critère de jugement principal : on diminue l’effet dans le
groupe traitement, on augmente l’effet dans le groupe placebo.
En ITT, il est plus difficile de montrer la supériorité = c’est l’analyse la plus
conservatrice dans les essais de supériorité (= si l’essai est significatif en ITT, on
a réellement confiance dans les résultats).
L’analyse en ITT est le seul moyen de préserver le bénéfice de la randomisation = groupes comparables en début d’essai.
L’ITT permet de se rapprocher de « la vraie vie » dans laquelle tous les
patients ne prennent pas leur traitement de façon parfaite (oublis, arrêt pour
effets secondaires, arrêt en cas de maladies intercurrentes, etc.).
En résumé, l’analyse en ITT :
• limite le biais d’attrition : ce biais est présent quand l’exclusion de certains
patients par perte de suivi avantage un des groupes de traitement en termes
d’efficacité. Par exemple, si les patients ayant dévié du protocole en raison d’un
manque d’efficacité du traitement étudié ne sont pas inclus dans l’analyse, on
risque de conclure à tort à une efficacité du traitement ;
• diminue la différence entre les groupes et rend plus difficile le fait de montrer
une différence qui existe vraiment.
Gestion des perdus de vue dans l'analyse en ITT : l'imputation
Par définition, un perdu de vue est un sujet dont on ne connaît pas les données
finales d’évaluation. Or, on a vu précédemment que ces individus étaient tout
de même pris en compte dans une analyse en ITT afin de limiter le biais d’attrition. On dispose alors de différentes techniques pour inclure ces sujets dans
l’analyse. Le principe est d’attribuer une valeur arbitraire au critère de jugement
lorsqu’il n’est pas disponible : on parle d’imputation.
Im p u ta tio n p ar l'h y p o t h èse d u biais m a xi m u m
Cette technique consiste, en présence d’une donnée manquante, d’attribuer aux
patients perdus de vue la valeur du critère de jugement la plus défavorable au
traitement étudié. On classera alors un perdu de vue comme étant en échec
s’il fait partie du bras « traitement » et comme succès s’il fait partie du bras
« contrôle ». Dans ce cas, un résultat significatif sera digne de confiance, un
résultat non significatif ne permettra pas de conclure.
Im p u t atio n m ultiple
On attribue une valeur pour le critère de jugement en estimant la probabilité
que le traitement soit un succès à partir des données des autres patients (par
exemple, si 90 % des hommes de plus de 65 ans présentant certaines caractéristiques ont été un succès, on attribue un succès à un patient manquant présentant les mêmes caractéristiques). En résumé, la valeur attribuée aux perdus de
vue est estimée à partir des données disponibles.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Population d’analyse (ITT et per-protocole)
153
Im p u t atio n p ar la d ernière v ale ur co nn u e (l ast observ a tion c a rried
forw a rd o u LO CF)
Dans ce cas, on attribue aux patients perdus de vue ou retirant leur consentement la dernière valeur connue pour le critère de jugement au cours du suivi.
À retenir
Le biais maximum est la méthode d'imputation la plus conservatrice ( = on a moins
de chances de conclure à tort à l'efficacité) pour l'analyse des données dans un
essai de supériorité.
Remplacement des sujets manquants
Les patients perdus de vue ou ayant retiré leur consentement peuvent également
être remplacés par l’inclusion et la randomisation de nouveaux patients, pour
peu que cette possibilité soit prévue par le protocole de l’étude.
Analyse en ITT modifiée (modified intention to treat ou mITT)
• Remplace parfois l’analyse en ITT standard.
• Consiste à exclure néanmoins certains patients de l’analyse finale.
• Les patients exclus sont souvent les perdus de vue ou les patients ayant retiré
leur consentement. C’est une situation acceptable quand leur nombre est faible
pour éviter d’avoir recours à des techniques d’imputation.
Po p ula tion p o ur l ’ analyse p er-pro t ocole (PP)
L’analyse per-protocole :
• consiste à exclure les patients avec des « déviations au protocole », c’est- à-dire
ceux étant sortis de l’étude, les perdus de vue, les inclus à tort, les erreurs de
randomisation, etc. ;
• augmente la différence entre les groupes = défavorable à la démonstration de
la non-infériorité/favorable à la démonstration de la supériorité ;
• peut détruire le bénéfice de la randomisation : les déviations au protocole
ne sont ni aléatoires, ni réparties de manière égale entre les groupes. Ce type
d’analyse est donc à considérer avec la plus grande prudence.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
154
Essais cliniques
Si on exclut tous les patients qui n’ont pas respecté le protocole, on augmente
l’effet dans le groupe traitement, on diminue l’effet dans le groupe placebo.
On augmente donc la différence entre les groupes pour le critère de jugement,
c’est plus facile de montrer que les groupes sont différents (supériorité), mais
plus difficile de montrer qu’ils sont similaires (hypothèse de non-infériorité ou
équivalence).
En PP, il est plus difficile de montrer la non-infériorité = c’est l’analyse la plus
conservatrice dans les essais de non-infériorité (si l’essai est significatif en PP, on
a réellement confiance dans les résultats).
L’analyse en ITT est le seul moyen de préserver le bénéfice de la randomisation. L’analyse PP est toujours une analyse secondaire (ou analyse de sensibilité), même si elle est indispensable pour tirer une conclusion conservatrice dans
un essai de non-infériorité.
Po p ula tio n p o ur l'analyse en traite m e n t reçu
(as tre a ted}
L’analyse en traitement reçu :
• consiste à analyser les résultats d’un patient en fonction du traitement qu’il a
réellement reçu (ce qui peut conduire à analyser des patients dans le groupe A,
même s’ils ont été randomisés dans le groupe B). Les autres déviations au protocole peuvent être soit exclues, soit conservées dans le groupe de randomisation ;
• est plus proche de la réalité de l’effet propre du traitement étudié ;
• augmente la différence entre les groupes = défavorable à la démonstration de
la non-infériorité/favorable à la démonstration de la supériorité ;
• peut détruire le bénéfice de la randomisation : les erreurs de traitement n’ont
aucune raison d’être aléatoires et également réparties entre les groupes. Ce type
d’analyse est donc à considérer avec la plus grande prudence.
Critère de jugement
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Population d’analyse (ITT et per-protocole)
155
En résumé :
Si un patient
reçoit le
traitement...
En ITT, il
sera dans
le bras
Et que le traitement
réellement alloué
est...
A
A
A
A
B
A
En PP, il sera
dans le bras
En traitement
reçu, il sera
dans le bras
A
A
B
Po p ula tion p o ur l'analyse « d e sécurit é »
(sa fety a n a lysis)
Ici, l’objectif est de ne pas sous-estimer les effets secondaires des traitements.
On inclut tous les patients ayant reçu au moins une dose de traitement dans
chaque bras.
Syn t h èse
Il est indispensable de repérer dans le flow chart de l’analyse sur quel groupe de
patients est réalisée une analyse, afin d’en interpréter correctement les résultats.
ITT
PP
As treated
Safety analysis
Principe
Chaque
patient est
analysé dans
son bras de
randomisation
d’origine
Les patients
présentant une
déviation au
protocole sont
exclus
Les patients
ayant reçu
le mauvais
traitement sont
changés de bras
pour l’analyse
On ne garde que
les patients ayant
reçu au moins
une dose du
traitement dans
chaque bras
Utilisation
Conclusion
principale
d’un essai de
supériorité
Conclusion
principale
d’un essai de
non-infériorité
(si concordant
avec l’ITT)
Analyse
secondaire
dans un essai
de supériorité
Parfois analyse
de la tolérance
Conclusion
principale de
certains essais de
non-infériorité
(si concordant
avec l’ITT)
Analyse
secondaire dans
un essai de
supériorité
Parfois analyse
de tolérance
Conclusion
principale de
tolérance dans
un essai de
supériorité et de
non-infériorité
Astuce
Comporte
toujours plus
de patients que
le PP
Comporte
toujours moins
de patients que
l’ITT
Seule situation
où l’on peut ne
pas respecter
le traitement
alloué par la
randomisation
Il est possible
que la conclusion
d’efficacité et
de tolérance ne
repose pas sur les
mêmes patients
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
156
Essais cliniques
En pra tique
Ex e m ple 1 (ED N 2016)
Deslée G, Mal H, Dutau H, Bourdin A, Vergnon JM, Pison C, Kessler R,
Jounieaux V, Thiberville L, Leroy S, Marceau A, Laroumagne S, Mallet JP,
Dukic S, Barbe C, Bulsei J, Jolly D, Durand-Zaleski I, Marquette CH, for the
REVOLENS Study Group. Lung volume réduction coil treatment vs usual
care in patients with severe emphysema: The REVOLENS Randomized
Clinical Trial .JAMA 2016 ; 315(2) : 175-84.
Multicenter 1:1 randomized superiority trial comparing coils with usual care
at 10 university hospitals in France. Patients randomized to usual care (n = 50)
received réhabilitation and bronchodilators with or without inhaled corticosteroids and oxygen; those randomized to bilateral coil treatment (n = 50
received usual care plus additional therapy).
The primary outcome was improvement of at least 54 min the 6-minute walk
test at 6 months (1-sided hypothesis test).
The statistical power to demonstrate a superior success rate (1-sided hypothesis test) in the primary endpoint for the coil group vs the usual care group was
anticipated to be 90% with a significance of a = .05 at a total sample size of
100 patients, based on the hypothesis of a 37% end-point achievement in the
coil group and 5% in the usual care group and with 30% of patients unable
to perform the 6-minute walk test or lost to follow-up at 6 months.
For the primary endpoint, intention-to-treat analyses were conducted using
a multiple imputation method for missing data. A logit model was used to
impute the outcome for participants who did not perform the 6-minute walk
test at 6 months, based on the parameters of FEV, FVC, RV, St George’s Respiratory Questionnaire total score, modified MRC dyspnea scale, and Baseline
Dyspnea Index/Transition Dyspnea Index. Ten imputations were performed.
Bivariable logistic models were then fitted with the imputed values using treatment group as the predictor variable. An additional maximum bias analysis
considering patients who did not perform the 6-minute walk test to be non
responders for the primary end point was also conducted.
Les auteurs indiquent avoir réalisé une analyse supplémentaire selon l’hypothèse
du biais maximum. Théoriquement, dans ce type d’analyse, un patient qui n’a
pas effectué le test de marche de 6 minutes était considéré comme :
Il aurait fallu cocher...
Un échec pour le critère de jugement
principal, dans le groupe « spirales »
Un succès pour le critère de jugement principal, dans le groupe « soins habituels »
Commentaires
Ces deux propositions sont conformes
à la définition de l’hypothèse du biais
maximum
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Population d’analyse (ITT et per-protocole)
157
Il n’aurait pas fallu cocher...
Commentaires
Exclu de l’analyse du critère de jugement
principal, quel que soit son groupe dans
l’essai
C’est ce qui serait fait dans une analyse
per-protocole
Un succès pour le critère de jugement
principal, dans le groupe « spirales »
Ces deux propositions ne seraient pas
conservatrices
Un échec pour le critère de jugement
principal, dans le groupe « soins
habituels »
On attribue au patient une valeur estimée
par un modèle statistique d’imputation
multiple
C’est le principe de l’imputation
multiple et pas du biais maximum
À propos de l’analyse en intention de traiter (ITT) d’un essai clinique :
Il aurait fallu cocher...
Commentaires
L’analyse en ITT concerne toujours plus de
patients que l’analyse per-protocole
En effet, on n’exclut personne de
l’analyse en ITT
L’analyse en ITT est plus conservatrice que
l’analyse per-protocole dans les essais de
supériorité
Le risque de conclure à tort à l’efficacité
est moindre, c’est la définition d’une
analyse conservatrice
L’application du strict principe de l’ITT
peut nécessiter la réalisation d’une
imputation
Lorsque les données ne sont pas
disponibles, il est parfois nécessaire
d’imputer
L’analyse en ITT limite le biais d’attrition
Le principe même de l’ITT est d’analyser
tous les patients pour conserver le
bénéfice de la randomisation
Il n’aurait pas fallu cocher...
Commentaires
L’analyse en ITT est toujours l’analyse
la plus conservatrice d’un essai de
non-infériorité
Dans ce cas, c’est le per-protocole qui
est le plus conservateur
Les patients sortis de l’étude pour
intolérance du traitement sont exclus de
l’analyse en ITT
Aucun patient n’est exclu de l’ITT
D’autres exercices sur les populations d’analyse sont proposés dans la fiche 10.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
158
Essais cliniques
Ex e m ple 2 (é preuve t est 2020)
Bracard S, Ducrocq X, Mas JL, Soudant M, Oppenheim C, Moulin T, et al.
Mechanical thrombectomy after intravenous alteplase versus alteplase alone
after stroke (THRACE): a randomised controlled trial. Lancet Neurol
oct 2016; 15(11) : 1138-47.
Analyses of primary outcome were done in the modified intention-to-treat population (ie, patients lost to foliow up and those with missing data were excluded)
and in the per-protocol population (ie, ail patients who did not foliow the protocol of their randomisation group precisely were excluded from the analysis).
The safety endpoints were analysed in the per-protocol population.
IVT = intravenous thrombolysis. IVTMT = intravenous thrombolysis plus mechanical
thrombectomy. *Because of poor clinical évolution, eight patients had thrombectomy
eventually. fBecause of problems with the catheterisation.
Quelle(s) est(sont) la(les) proposition(s) exacte(s) concernant les patients randomisés (figure ci-dessus) :
Il aurait fallu cocher...
Commentaires
Tous les patients randomisés ont été
analysés, à l’exception des patients
perdus de vue, des patients ayant retiré
leur consentement et des patients avec
des informations manquantes pour les
critères de jugement
Parmi 414 patients randomisés, 2 ont retiré
leur consentement, 2 + 2 = 4 ont été perdus
de vue, 4 + 2 = 6 avaient des données
manquantes. Ce qui fait au total 202 + 200 =
402 patients inclus dans l’analyse d’efficacité
Le nombre de patients perdus de vue
est similaire dans les 2 groupes
Oui, 2 patients perdus de vue dans chaque groupe
ce qui correspond à une proportion identique
La proportion de patients ayant reçu
le traitement à l’étude est supérieure
dans le groupe IVT (thrombolyse)
200/208 patients du groupe thrombolyse
seule (IVT) ont reçu le traitement prévu par
le bras dans lequel ils avaient été randomisés
alors seulement 145/204 patients du groupe
thrombolyse + thrombectomie (IVTMT) ont
reçu la thrombectomie
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Population d’analyse (ITT et per-protocole)
159
Il n’aurait pas fallu cocher...
Commentaires
La proportion de patients ayant reçu le
traitement médical est supérieure dans le
groupe IVT (thrombolyse)
Le traitement médical (la thrombolyse)
était prévu dans les 2 bras de l’essai donc
les 59 patients du groupe thrombectomie
n’ayant pas reçu la thrombectomie ont
bien reçu la thrombolyse
Un potentiel biais de suivi peut être exclu
Cette proposition est trop catégorique
pour être cochée, d’autant plus que
l’essai est réalisé en ouvert du fait de la
nature de l’intervention
Dans cette étude, 59 patients randomisés dans le groupe IVTMT (thrombolyse
et thrombectomie mécanique) n’ont pas bénéficié de la thrombectomie mécanique. Quelle(s) est (sont) la (les) conséquence(s) de ce phénomène ?
Il aurait fallu cocher...
Commentaires
Ces patients ont été traités comme
ceux du groupe IVT (thrombolyse), ce
qui entraîne une perte de puissance de
l’étude
Si les patients du groupe « traité »
n’ont pas pu bénéficier de l’intervention
étudiée (la thrombectomie), cela diminue
l’efficacité de l’intervention. Le calcul
de puissance a priori est fait pour une
efficacité donnée. Si cette efficacité n’est
pas atteinte, la puissance a posteriori est
moindre
Une analyse en traitement reçu détruirait
le bénéfice de la randomisation
L’analyse en traitement reçu consisterait
à analyser ces 59 patients dans le groupe
IVT (thrombolyse seule), ce qui n’est
pas le groupe dans lequel ils ont été
randomisés à la base
L’analyse en intention de traiter consiste
à analyser ces 59 patients dans le groupe
IVTMT
L’analyse en ITT consiste à analyser
tous les patients dans leur groupe de
randomisation peu importe les écarts au
protocole
Une analyse en traitement reçu serait
favorable à la démonstration de la
supériorité
L’analyse en traitement reçu est favorable
à la démonstration de la supériorité car
elle analyse les patients en fonction de
ce qu’ils ont réellement reçu comme
traitement et non en fonction de leur
groupe de randomisation initial
L’analyse qui consiste à analyser ces
59 patients dans le groupe IVTMT
permettrait de garder le bénéfice de la
randomisation
Cela correspond à l’analyse en ITT dont
le principe est d’analyser tous les patients
dans leur groupe de randomisation initial
L’analyse per-protocole n’a inclus que
les patients ayant bénéficié du traitement
alloué et pour lesquels le protocole a été
respecté
= définition littérale de l’analyse
per-protocole
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
160
Essais cliniques
Il aurait fallu cocher...
Commentaires
L’analyse per-protocole peut induire un
déséquilibre dans la distribution des
caractéristiques à l’inclusion entre les
2 groupes de l’essai
Oui, car l’exclusion des patients ayant
présenté des déviations au protocole
peut faire perdre le bénéfice de la
randomisation qui est l’équilibre des
différentes caractéristiques à l’inclusion
entre les groupes
L’analyse per-protocole a exclu plus
de patients du groupe IVTMT que du
groupe IVT
Oui, étant donné que beaucoup plus de
patients ont dévié du protocole dans le
groupe IVTMT
Il n’aurait pas fallu cocher...
Commentaires
Ce phénomène a pu entraîner une
perte de chance pour les patients du
groupe thrombectomie mécanique
On ne sait pas si c’est le cas a priori
car l’objectif de l’essai est justement de
montrer s’il existe un bénéfice à associer la
thrombectomie à la thrombolyse. On pourrait
très bien se trouver dans une situation où il
n’y a aucun bénéfice à la thrombectomie voire
même que la thrombectomie fasse moins bien
que la thrombolyse seule
Comme le score de Rankin modifié
à 3 mois n’a pas pu être évalué
chez ces patients, le résultat est
probablement biaisé
Ces patients ne sont pas des perdus de vue. Ils
n’ont pas reçu le traitement qui leur avait été
alloué par tirage au sort mais ils ont pu être
suivis dans le temps et on a pu recueillir le
critère de jugement principal
L’étude manque de robustesse
en l’absence d’une analyse sous
l’hypothèse du biais maximal
L’analyse sous l’hypothèse du biais maximum
est utile en cas de perdus de vue et donc
de données manquantes pour le critère de
jugement. Dans la situation présente, ces
59 patients ne sont pas perdus de vue et
donc l’information concernant le critère
de jugement n’est pas manquante pour ces
patients. On rappelle que la situation du biais
maximum consisterait à imputer la situation
la plus défavorable aux données manquantes
du critère de jugement du groupe intervention
et la situation la plus favorable aux données
manquantes du critère de jugement du groupe
contrôle
L’effet de la thrombectomie
mécanique est probablement
majoré pour le critère de jugement
principal
Si la thrombectomie apporte réellement un
bénéfice aux patients, le fait que ces 59 ans
patients n’aient pas reçu de thrombectomie
irait plutôt dans le sens d’une diminution
de l’effet (pour rappel = l’analyse en ITT
est défavorable à la démonstration de la
supériorité)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Population d’analyse (ITT et per-protocole)
Il n’aurait pas fallu cocher...
Commentaires
L’analyse en per-protocole inclurait
ces 59 patients dans l’analyse
Le principe de l’analyse en per-protocole est
d’exclure les patients qui ont présenté des
déviations au protocole
L’analyse en per-protocole
favoriserait la démonstration de la
non-infériorité
Non c’est l’inverse, l’analyse protocole
favorise la démonstration de la supériorité
et est défavorable à la démonstration de la
non-infériorité
Le résultat non significatif de
l’analyse per-protocole rend
discutable le résultat de l’analyse en
intention de traiter
L’analyse en per-protocole est ici une analyse
secondaire du critère d’efficacité
161
Ex e m ple 3 (ED N 2020)
Hofmann R, James SK, Jernberg T, Lindahl B, Erlinge D, Witt N, et al.
Oxygen Therapy in Suspected Acute Myocardial Infarction. N Engl J Med
28 sept 2017 ; 377(13) : 1240-9.
Enrollment, Randomization, and Analysis.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
162
Essais cliniques
Qu’est-ce qui explique la différence d’effectifs entre le groupe oxygénothérapie
(n = 3 014 participants) et le groupe air ambiant (n = 3 212 participants) dans
l’échantillon d’analyse per-protocole ?
Il aurait fallu cocher...
Commentaires
L’interruption prématurée du traitement
Si l’on se réfère au diagramme de flux,
les raisons de déviation au protocole
sont les motifs d’interruption prématurée
du suivi indiquées dans le 4e carré en
partant du haut : abandon d’étude, sortie
précoce, modification des circonstances
cliniques, difficultés techniques ou de
communication, raison inconnue
Les retraits volontaires de participation
Il n’aurait pas fallu cocher...
Commentaires
L’administration d’oxygène en dehors
du protocole de l’essai
Si l’on regarde le groupe « oxygène »,
sur 3 311 patients randomisés, 297 n’ont
pas participé jusqu’à la fin de la période
de suivi et ont été exclus de l’analyse
per-protocole (3 311 -297 = 3 014). Les
62 patients ayant reçu de l’oxygène en
dehors de l’étude n’ont pas été exclus de
l’analyse per protocole)
Les décès
La mortalité est le critère de jugement.
Les patients décédés ne sont pas exclus de
l’analyse per-protocole
L’exclusion des patients avec un
diagnostic autre qu’un infarctus du
myocarde
Ce n’est pas indiqué dans le diagramme
de flux
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 17
Essais de non-infériorité
et d’équivalence
En complément
V o us p o u v e z co ns u l t e r c e t t e v i d é o s u r l e s e ss a is d e n o n -i n f é riori t é :
h t t ps: / / y o u t u . b e / a 5 D N v m U k t cs
Princip e
Pourquoi réaliser un essai de non-infériorité ou d’équivalence ? Il y a trois conditions :
1. le traitement de référence existe et a démontré son efficacité contre placebo ;
2. il n’y a pas de supériorité attendue du nouveau traitement par rapport au
traitement de référence ;
3. le nouveau traitement apporte un bénéfice autre comme :
• une galénique plus adaptée,
• une meilleure tolérance attendue,
• des bénéfices pour la société (diminution des coûts, des résistances aux antibiotiques, etc.).
Pour ces nouveaux traitements, il faut alors montrer que les avantages apportés ne le soient pas au détriment de leur efficacité grâce à la réalisation d’essai
de non-infériorité ou d’équivalence.
N o tio ns st a tistiq u es
Seuil de non-infériorité et bornes d'équivalence
• Aucun test statistique ne permet de conclure à une efficacité identique entre
deux traitements.
• On définit donc a priori un seuil de non-infériorité qui correspond à la perte
d’efficacité cliniquement acceptable et négligeable (situation unilatérale).
• Dans certaines situations, on souhaite en plus être sûr que le nouveau traitement ne soit pas plus efficace que le traitement de référence pour différentes
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
164
Essais cliniques
raisons (par exemple, traitement antidiabétique qui induirait une hypoglycémie, ou traitement anti-HTA qui induirait une hypotension). On peut alors
définir des bornes d’équivalence (situation bilatérale).
• La question posée par un essai de non-infériorité est : la différence entre les deux
traitements est-elle significativement inférieure à la marge de non-infériorité ?
Situation unilatérale ou bilatérale
Sit u a tio n u nila t érale
Définition d’un seuil de non-infériorité ; l’intervalle de confiance (IC) du risque
relatif (RR) ne doit pas comprendre ce seuil pour conclure à la non-infériorité.
î
—!-------- —
i
i
IC comprenant 1
-^supériorité non démontrée
i
i
IC comprenant le seuil de non-infériorité
non-infériorité non démontrée
IC ne comprenant pas le seuil de non-infériorité
IC ne comprenant pas 1
-> supériorité démontrée
■
-» non-infériorité démontrée
ii
ii
-*---------‘-------- >
—;-------------- »
0,9
RR = 1
Essai de supériorité
RR = 1
Essai de non-infériorité
Sit u atio n bila t érale
Définition de bornes d’équivalence ; l’intervalle de confiance (IC) du risque
relatif (RR) doit se situer entre ces deux bornes sans les inclure pour conclure
à l’équivalence.
IC comprenant une borne d'équivalence
-à équivalence non démontrée
IC comprenant une borne d'équivalence
—> équivalence non démontrée
—*---------- ■----------- ■---- »
0,9
RR = 1
IC ne comprenant aucune des 2 bornes
-à équivalence démontrée
1,1
Essai d'équivalence
Ex e m ples
Pour s’y retrouver dans un essai de non-infériorité, il faut faire un dessin :
1. tracer le trait représentant la différence d’efficacité entre les deux traitements
avec le 0 au milieu pour une différence attendue en risque absolu (ou le 1 si la
différence attendue est en risque relatif) ;
2. placer la différence observée (résultat principal de l’étude) ;
3. à partir de la différence observée et du taux de réponse dans chaque bras,
vous pouvez placer le traitement de référence et le nouveau traitement à droite
et à gauche, ou l’inverse ;
4. placer la marge de non-infériorité du côté du traitement de référence ;
5. placer les bornes de l’intervalle de confiance ;
6. conclure en comparant les bornes de l’intervalle de confiance à la marge de
non-infériorité :
- si la borne est comprise dans l’intervalle, on ne peut pas accepter la noninfériorité,
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Essais de non-infériorité et d’équivalence
165
- si la borne supérieure (ou inférieure) est inférieure (ou supérieure) à la
marge, on peut conclure à la non-infériorité : la perte d’efficacité est significativement inférieure à la marge. Pour s’y retrouver dans le sens de la différence, il faut regarder la valeur du critère de jugement dans chaque bras.
Ex e m ple 1
On compare l’antibiothérapie par voie intraveineuse (IV) - traitement de référence
- à l’antibiothérapie per os (PO) dans l’endocardite infectieuse. Le critère de jugement principal est un composite de décès, ré-hospitalisations et complications. La
marge de non-infériorité (NI) fixée est de 10 points de pourcentage (on accepte de
perdre au maximum 10 % d’efficacité avec le traitement PO). Le calcul d’effectif
est fait pour un test de non-infériorité unilatéral avec un risque oc à 0,025.
Le taux de mortalité/ré-hospitalisations/complications est de 23,1 % sous
traitement IV et de 20 % sous traitement PO. La différence absolue est + 3,1
en faveur du traitement PO (IC95 : — 3,4 à + 9,6), p-value pour la NI : 0,002.
IV meilleur
<----------
Marge de NI
-10 o/o
PO meilleur
'3-4
Différence
observée
+ 3,1 o/o
----------- »
0%
Voici comment on peut formuler la conclusion de cette étude :
• le traitement PO est non inférieur au traitement IV ;
• la perte d’efficacité liée au traitement PO, si elle existe, est significativement
inférieure à 10 % ;
• il y a 2,5 % de chances que la perte d’efficacité réelle liée au traitement PO
soit de plus de 3,4 %.
Ex e m ple 2
On compare la chirurgie ouverte (traitement de référence) à la chirurgie laparoscopique dans le cancer du rectum. Le critère de jugement principal est la
récidive locorégionale. La marge de non-infériorité fixée est de 5 points de
pourcentage (on accepte de perdre au maximum 5 % d’efficacité avec le traitement laparoscopique). Le calcul d’effectif est fait pour un test de non-infériorité
unilatéral avec un risque a à 0,05.
Le taux de récidive est de 5 % dans les deux bras. La différence absolue est de
0 point de pourcentage (IC95 : — 2,6 à + 2,6), p-value pour la non-infériorité : 0,01.
Type of Lésion and Surgery
Locorégional Récurrence in Intention-to-Treat Population
Rate %
Between-Group Différence 1
percentage points (90 % Cl)
Ail lésions
Laparoscopie surgery
5.0
Open surgery
5.0
0.0 (-2.6 to 2.6)
Source : Bonjer HJ, Deijen CL, Abis GB, et al., for the COLOR II Study Group. A randomized trial of
laparoscopie versus open surgery for rectal cancer. N Engl J Med 2015 ; 372 : 1324-32.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
166
Essais cliniques
Différence de toux de récidive en points de °/o
Marge de
NI : 5o/o
Chir ouverte meilleure
Laparoscopie meilleure
0%
5 °/o
-2,6 o/o
+ 2,6 0/0
La conclusion de cette étude peut être formulée de la façon suivante :
• le traitement laparoscopique est non inférieur à la chirurgie ouverte ;
• la perte d’efficacité liée au traitement laparoscopique, si elle existe, est significativement inférieure à 5 % ;
• il y a 5 % de chances que la perte d’efficacité réelle liée au traitement laparoscopique soit de plus de 2,6 %. Ici, c’est un intervalle de confiance bilatéral à 90 %,
il y a donc 5 % de chances que la valeur vraie de l’estimateur soit supérieure à
la borne supérieure (la seule qui nous intéresse).
Ex e m ple 3
Reprenons la même étude avec les résultats suivants :
• chirurgie laparoscopique : 6 % de récidive ;
• chirurgie ouverte : 3 % de récidive ;
• Différence absolue : 3 % (IC90 % : 0,4 à 5,4).
Différence de taux de récidive en points de °/o
Marge de
NI : 50/0
Laparoscopie meilleure
La conclusion de cette étude est la suivante :
• on ne peut pas conclure à la non-infériorité du traitement laparoscopique ;
• la perte d’efficacité liée au traitement laparoscopique n’est pas significativement inférieure à 5 % ;
• il y a 5 % de chances que la perte d’efficacité dépasse 5,4 %. Compte tenu
du risque oc choisi, on ne peut pas exclure que la perte d’efficacité réelle soit de
plus de 5 %.
Ch oix d e l'analyse st a tistiq u e : in t e n tio n d e trait er
ou p er-pro t ocole / e n trait e m en t reçu ?
Dans un essai de non-infériorité ou d’équivalence, l’analyse en per-protocole ou
en traitement reçu est plus conservatrice contrairement aux essais de supériorité (voir fiche 16).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Essais de non-infériorité et d’équivalence
167
L’analyse en intention de traiter (ITT) doit tout de même être réalisée, car elle
seule conserve le bénéfice de la randomisation.
En résumé, l’analyse du résultat d’un essai de non-infériorité doit faire apparaître
une analyse per-protocole (ou traitement reçu selon les études) et une analyse en
ITT que l’on espère concordantes pour conclure.
À retenir
Piè ges classiq u es à co n n aître
L'absence de significativité sur un test de supériorité ne permet pas de dire « les
traitements sont équivalents » ou « un traitement est non-inférieur à l'autre ».
La définition du seuil de non-infériorité doit reposer sur des arguments cliniques.
Dans les essais de non-infériorité, seul le critère d'efficacité fait l'objet d'une analyse
de type « non-infériorité ». Pour les critères de tolérance, on réalise des hypothèses de
supériorité ! (L'idée est bien de montrer que le nouveau traitement est mieux toléré,
sinon à quoi bon mettre sur le marché un traitement non inférieur sur l'efficacité ?)
En pra tique
Ex e m ple 1 (ED N 2018)
Bonjer HJ, Deijen CL, Abis GB, Cuesta MA, van der Pas MHGM,
de Lange-de Klerk ESM, Lacy AM, Bemelman WA, Andersson J, Angenete E,
Rosenberg J, Fuerst A, Haglind E, for the COLOR II Study Group. A
randomized trial of laparoscopie versus open surgery for rectal cancer.
N Engl J Med 2015 ; 372 : 1324-32.
In this international trial conducted in 30 hospitals, we randomly assigned
patients with a solitary adenocarcinoma of the rectum within 15 cm of the
anal verge, not invading adjacent tissues, and without distant métastasés to
undergo either laparoscopie or open surgery in a 2:1 ratio. The primary end
point was locorégional récurrence 3 years after the index surgery.
Laparoscopie surgery was considered to be non inferior to open surgery if the
one-sided 95% confidence interval for the différence in locorégional récurrence rates excluded an absolute différence of 5 percentage points or more.
With 1,000 patients who could be evaluated at a ratio of 2:1, the power of
the noninferiority test was 80% at a locorégional récurrence rate of 10% in
the open-surgery group. Ail analyses were performed on an intention to-treat
basis. In addition, we performed as-treated analyses for locorégional récurrence, disease-free survival, and overall survival. We used the Kaplan-Meier
method to compare rates of récurrence, disease-free survival, and overall survival at 3 years. The one sided 95% confidence interval for the between group
différence in locorégional récurrence corresponds to the upper limit of the
two-sided 90% confidence interval for this différence. For survival rates, twosided 95% confidence inter intervals were calculated.
At 3 years, the rate of disease-free survival was 74.8% in the laparoscopicsurgery group and 70.8% in the open-surgery group (différence, 4.0 percentage points; 95% CI, -1.9 to 9.9). In patients with stage I or II rectal
cancer, rates of disease-free survival were similar in the two groups, whereas
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
168
Essais cliniques
in patients with stage III disease, the rate of disease-free survival was 64.9%
in the laparoscopic-surgery group and 52.0% in the open-surgery group (différence, 12.9 percentage points; 95% CI, 2.2 to 23.6).
Involved Circumferential Resection Margin and Locorégional Récurrence.
Involved Circumferential
Type of
Resection Margin*
Lésion and
Surgery
Patients
with
Finding!
no./total
no. ( %)
BetweenGroup
Différence*
percentage
points
(95 % Cl)
Locorégional Récurrence in Intentionto-Treat Population
Rate%
Locorégional Récurrence in As-Treated
Population
BetweenGroup
Différence*
percentage
points
(90 % CI)
Rate%
BetweenGroup
Différence*
percentage
points
(90 % CI)
0.0 (-2.6
to 2.6)
4.3
-2.0 (-4.7
to 0.7)
Ail lésions
Laparosco- 56/588 (10) -0.5 (-4.9
pie surgery
to 3.5)
5.0
Open
surgery
5.0
30/300 (10)
6.3
Upper rectal lésion
Laparoscopie surgery
18/196 (9) -0.1 (-8.2
to 6.4)
3.5
Open
surgery
9/ 97 (9)
2.9
0.6 (-2.9
to 4.1)
3.0
-0.9 (-4.6
to 2.8)
3.9
Middle rectal lésion
Laparosco- 22/228 (10) 6.2 (0.1 to
11.2)
pie surgery
6.5
Open
surgery
2.4
4/115 (3)
4.1 (0.7 to
7.5)
5.7
1.6 (-2.3
to 5.5)
4.1
Lower rectal lésion
Laparoscopie surgery
15/164 (9) -12.4
(-23.2 to
-3.0)
4.4
Open
surgery
17/79 (22)
11.7
-7.3
(-13.9 to
-0.7)
3.8
-8.9
(-15.6 to
-2.2)
12.7
* An involved circumferential resection margin was defined as the presence of tumor cells within
2 mm of the latéral surface of the mesorectum. This finding is a risk factor for locorégional
récurrence (i.e., récurrence in the pelvic or périnéal area).
f The denominator for the percentage calculation in this category was the number of patients
without complété remission.
f: Between-group différences were calculated by subtracting the percentage of patients with the
finding in the open-surgery group from the percentage in the laparoscopic-surgery group.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Essais de non-infériorité et d’équivalence
>
169
Quelle(s) est (sont) la(les) caractéristique(s) de l’analyse statistique du critère de
jugement principal ?
Il aurait fallu cocher...
Commentaires
La marge de non-infériorité était fixée à
5 points de pourcentage pour la différence d’incidence du critère de récidive
locorégionale de la chirurgie laparoscopique par rapport à la chirurgie ouverte
C’est bien la formulation de la marge de
non-infériorité
Le calcul du nombre de sujets nécessaires
effectué a priori était égal à 1 000
Comme indiqué dans le texte
L’estimation ponctuelle de la différence
d’incidence du critère de récidive
locorégionale est encadrée d’un intervalle
de confiance unilatéral à 95 %
Il s’agissait bien d’un intervalle de
confiance unilatéral à 95 %, ce qui équivaut à utiliser un intervalle de confiance
bilatéral à 90 % et à ne s’intéresser qu’à
une de ces bornes (tableau ci-dessus)
L’analyse principale a été réalisée en
intention de traiter (ITT)
Bien que ce ne soit pas l’analyse la plus
conservatrice, c’est celle qui préserve le
bénéfice de la randomisation. Les auteurs
indiquent clairement avoir analysé les
résultats en ITT
La chirurgie laparoscopique est non
inférieure à la chirurgie ouverte
La borne supérieure de l’IC exclut
la valeur 5, on peut donc faire cette
conclusion
La perte d’efficacité liée au traitement
laparoscopique, si elle existe, est
| significativement inférieure à 5 %
C’est une autre manière de formuler la
conclusion de non-infériorité
Il n’aurait pas fallu cocher...
Commentaires
Une analyse supplémentaire a été
réalisée en per-protocole
L’analyse additionnelle a été réalisée en
traitement reçu et pas en per-protocole
On ne peut pas conclure à la noninfériorité car l’intervalle de
confiance de la différence absolue
d’efficacité contient la valeur 0
La question n’est pas « y a-t-il une différence
significative entre les traitements ? », mais
« la différence entre les deux traitements estelle significativement inférieure à 5 % ? »
Le « 0 » n’est d’aucune utilité pour répondre
à cette question
Les résultats entre l’analyse en ITT et
l’analyse en traitement reçu ne sont
pas cohérents
La conclusion est la même pour tous les
critères. La différence d’efficacité pour le
critère de jugement principal est significativement inférieure à 5 %. Les résultats sont
donc cohérents entre les deux analyses
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
170
Essais cliniques
En analyse en intention de traiter :
Il aurait fallu cocher...
Commentaires
L’estimation ponctuelle de l’incidence de
la récidive locorégionale à 3 ans était de
5 % dans les deux bras de l’essai
Le taux de 5 % est en effet un estimateur
ponctuel
L’estimation ponctuelle de la différence
d’incidence de la récidive locorégionale à
3 ans entre les deux bras de l’essai était
de 0 point de pourcentage
C’est le sens de between-group différence
Pour plus d’informations sur le terme
« estimateur ponctuel », voir la fiche 5
La borne supérieure de l’intervalle de
confiance bilatéral à 90 % de la différence d’incidence de la récidive locorégionale à 3 ans entre les deux bras de
l’essai était de 2,6 points de pourcentage
Ce qui veut dire que cette différence
à 5 % de chances d’être supérieure à
2,6 points de pourcentage
Il n’aurait pas fallu cocher...
Commentaires
L’estimation ponctuelle de l’incidence de la
récidive locorégionale à 3 ans dans le bras
laparoscopie était égale à la marge de noninfériorité (5 points de pourcentage) de l’essai
C’est faux car on ne peut pas
comparer une différence de point de
pourcentage à l’estimation ponctuelle
du taux de récidive dans un bras
L’incidence de la récidive locorégionale à
3 ans observée dans le bras laparoscopie
(31 patients) est double de celle observée dans
le bras de chirurgie ouverte (15 patients)
Ne jamais oublier qu’il y a 2 fois plus
de patients opérés par laparoscopie
selon le principe de la randomisation
en 2:1. Donc 31 patients versus 15,
cela correspond bien à la même incidence de 5 % dans chaque groupe
Ex e m ple 2
Cooper N, Clark J, Middleton L, Diwakar L, Smith P, Denny E, Roberts T,
Stobert L, Jowett S, Daniels J. Outpatient versus inpatient uterine
polyp treatment for abnormal uterine bleeding: randomised controlled
non-inferiority study. BMJ 2015 ; 350 : hl398.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Essais de non-infériorité et d’équivalence
171
Margin of non-inferiority (0.75)
Intention to treat
■
Six months
>
------- ■-------
One year
i
--------»
Two years
!
----- *■ —
Per protocol
J
Six months
[
■
--------- ■--------
One year
•
------ *-----
Two years
i
------ ■------
0.7
0.5
<-----------
1
Relative risk (95% Cl)
Favours inpatient polypectomy
Primary outcome (successful treatment, determined by the women’s assessment
of their bleeding at six months) compared with margin of non-inferiority.
La figure ci-dessus représente les résultats d’un essai de non-infériorité comparant la polypectomie utérine sous anesthésie générale nécessitant une hospitalisation complète (traitement de référence) à une prise en charge ambulatoire sous
anesthésie locale sur le risque de récidive de saignements utérins. La marge de
non-infériorité est une différence relative de 25 % du taux de récidive de saignement (ce qui correspond à un risque relatif de 0,75).
Que pouvez-vous tirer de cette figure ?
Il aurait fallu cocher...
Commentaires
La perte d’efficacité relative sur les
saignements utérins liés à la procédure ambulatoire est significativement
inférieure à 25 %
Dire que le risque relatif est significativement supérieur à 0,75 équivaut à dire que
la perte d’efficacité relative est significativement moindre que 25 %. Ce résultat est
donné par l’intervalle de confiance du risque
relatif qui exclut la valeur 0,75
Les auteurs avaient prévu de conclure
à la non-infériorité si le risque relatif
de récidive des saignements avec la
procédure en hospitalisation complète
était significativement supérieur à 0,75
Cette phrase équivaut à dire que la perte
d’efficacité relative doit être significativement inférieure à 25 %
La procédure ambulatoire est noninférieure à la procédure classique
(inpatient polypectomy}
C’est une autre manière de formuler les
deux phrases précédentes
Il n’aurait pas fallu cocher...
Commentaires
L’essai est négatif, car l’intervalle de
confiance du risque relatif de récidive des
saignements comprend la valeur 1
Dans ce cas, on ne compare pas la valeur
du risque relatif à 1, mais à la marge de
non-infériorité
Compte tenu du type d’étude, il n’était
pas légitime de réaliser une analyse perprotocole
Il est utile de réaliser une analyse en perprotocole dans un essai de non-infériorité
car c’est la plus conservatrice
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
172
Essais cliniques
Ex e m ple 3 (é preuve t est 2017)
Griffin D, Parsons N, Shaw E, Kulikov Y, Hutchinson C, Thorogood M,
Lamb SE; UK Heel Fracture Trial Investigators. Operative versus
non-operative treatment for closed, displaced, intra-articular fractures of the
calcaneus: randomised controlled trial. BMJ 2014 ; 349 : g4483.
We performed a large, pragmatic, randomised controlled trial in the UK
National Health Service to assess whether operative care leads to better outcomes than non-operative care in patients with typical, closed, displaced intraarticular calcaneal fractures over two years after in jury.
The current situation is one of uncertainty. Some orthopaedic surgeons are
enthusiastic about this surgery for calcaneal fractures, and recommend it to
patients. Others consider the operations to be complex, expensive, risky, and
without proved benefit, and so recommend non-operative care.
Pour quelles raisons les auteurs ont-ils choisi de réaliser un essai de supériorité
plutôt qu’un essai de non-infériorité ?
Il aurait fallu cocher...
Commentaires
Il n’existe pas de traitement de référence
dans cette indication
En l’absence de traitement de référence
défini, il est légitime et éthique de réaliser
un essai de supériorité
Il n’aurait pas fallu cocher...
Commentaires
L’essai de supériorité a plus de
chances d’être publié
De nos jours, de plus en plus d’essais de noninfériorité sont publiés afin de comparer des
traitements n’apportant pas de bénéfice sur
l’efficacité mais une meilleure tolérance
Le nombre de patients à inclure dans
un essai de non-infériorité aurait été
trop important
C’est souvent numériquement vrai, mais ce
n’est pas une raison valable pour ne pas faire
ce type d’essai
Evaluer la non-infériorité d’un traitement chirurgical n’est pas éthique
C’est parfaitement éthique s’il n’y a pas
d’hypothèse de supériorité
Il y avait une forte préférence des
chirurgiens pour l’une des stratégies
Ce n’est pas un argument scientifique pour
choisir le design de l’essai
Ex e m ple 4 (é preuve t est 2019)
The EINSTEIN-PE Investigators. Oral Rivaroxaban for the Treatment of
Symptomatic Pulmonary Embolism. N Engl J Med 5 avr 2012 ; 366(14) : 1287-97.
The primary efficacy outcome was symptomatic récurrent venous thromboembolism. The principal safety outcome was major or clinically relevant nonmajor bleeding.
Rivaroxaban was non-inferior to standard therapy (non-inferiority margin,
2.0; P = 0.003) for the primary efficacy outcome, with 50 events in the
rivaroxaban group (2.1%) versus 44 events in the standard-therapy group
(1.8%) (hazard ratio, 1.12; 95% confidence interval [CI], 0.75 to 1.68).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Essais de non-infériorité et d’équivalence
173
The principal safety outcome occurred in 10.3% of patients in the rivaroxaban group and 11.4% of those in the standard therapy group (hazard
ratio, 0.90; 95% CI, 0.76 to 1.07; P = 0.23). Major bleeding was observed
in 26 patients (1.1%) in the rivaroxaban group and 52 patients (2.2%)
in the standard-therapy group (hazard ratio, 0.49; 95% CI, 0.31 to 0.79;
P = 0.003). Rates of other adverse events were similar in the two groups.
Le rapport de risques instantanés {hazard ratio) de récidive d’événements thromboemboliques veineux est de 1,12 (intervalle de confiance à 95 %, 0,75 à 1,68)
pour le groupe « rivaroxaban » comparativement au groupe « prise en charge
conventionnelle ». Ce résultat permet de conclure à la non-infériorité du rivaroxaban pour le critère principal d’efficacité car :
Il aurait fallu cocher...
Commentaires
Le degré de signification du test de
non-infériorité est de 0,003
Un test de non-infériorité statistiquement significatif permet de conclure à la non-infériorité
La borne supérieure de l’intervalle
de confiance à 95 % du rapport de
risques instantanés est inférieure
à 2,00
Le hazard ratio représente ici le rapport entre
le risque instantané de récidive d’événement
thromboembolique du groupe « rivaroxaban »
sur ce même risque dans le groupe « prise
en charge conventionnelle ». Le choix d’une
marge de non-infériorité à 2,00 (noninferiority
margiri) signifie que si la borne supérieure de
l’intervalle de confiance du hazard ratio ne va
pas au-delà de cette marge, on pourra conclure
à la non-infériorité (voir figure ci-dessous)
Le plus simple pour s’y retrouver dans les études de non-infériorité est de faire
un schéma
Borne inf
IC95-0.75
HR”1'12
Borne sup
IC95-1.68
Borne de
nnn
infériorité
HR = 1
HR = 2
I
I
<----------------------
------------------------------ >
Réduction du risque sous
rivaroxaban par rapport
à la PEC conventionnelle
Augmentation du risque sous
rivaroxaban par rapport à la
PEC conventionnelle
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
174
Essais cliniques
Il n’aurait pas fallu cocher...
Commentaires
Les bornes de l’intervalle de
confiance à 95 % du rapport de
risques instantanés incluent la
valeur 1,00
Le hazard ratio vaut 1 si les risques de survenue de l’événement sont les mêmes dans les
2 groupes. C’est par rapport à cette valeur que
l’on conclut sur un jugement de supériorité
Le test de supériorité est non
significatif (valeur de p = 0,57)
Un test de supériorité permet de conclure sur la
supériorité et non pas sur la non-infériorité
L’estimation ponctuelle du rapport
de risques instantanés (1,12) est
comprise entre les bornes de son
intervalle de confiance à 95 %
Une estimation ponctuelle est par définition
toujours comprise entre les bornes de son
intervalle de confiance
Le rapport de risques instantanés (hazard ratio) d’événement hémorragique majeur est de 0,49 (intervalle de confiance à 95 %, 0,31 à 0,79, valeur de p < 0,003)
pour le groupe « rivaroxaban » comparativement au groupe « prise en charge
conventionnelle ». Ce résultat peut s’expliquer par :
Il aurait fallu cocher...
Commentaires
Le risque d’erreur statistique de première
espèce
Ces deux propositions renvoient
aux raisons possibles d’une résultat
significatif (voir fiche 19). Un résultat
peut être significatif soit en raison du
hasard (risque de première espèce), soit
en raison d’un biais, soit car il existe une
réelle association
Une réduction du risque hémorragique
sous rivaroxaban comparativement à
la prise en charge conventionnelle dans
la population dont est issu l’échantillon
d’étude
Il n’aurait pas fallu cocher...
Commentaires
Un défaut de puissance statistique
Un défaut de puissance statistique pourrait expliquer un résultat non significatif
La valeur choisie pour la
marge de non-infériorité (2,00)
Cette question a été choisie pour illustrer cette
fiche pour bien faire comprendre qu’une analyse de
tolérance (qui fait généralement partie des objectifs
secondaires) est toujours une analyse de supériorité
même au cours d’une étude dont l’objectif principal
est évalué sous l’hypothèse de non-infériorité.
Donc, la borne de non-infériorité n’intervient pas
dans l’interprétation de l’analyse de tolérance ici
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 18
Analyse en sous-groupes
En complément
V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l e s a n a l y s es d e so u s- g ro u p e :
h t t ps: / / y o u t u .b e / SV yl _ A W Jz q Q o
D éfinitio n e t princip e
Dans un essai clinique, une analyse en sous-groupes consiste à étudier l’effet du
traitement séparément dans plusieurs groupes correspondant aux différentes
catégories d’une caractéristique donnée.
Par exemple, on peut découper l’échantillon en deux classes de la caractéristique « âge » (< 65 ans et > 65 ans) ou encore en quatre classes de la caractéristique « stade de la maladie » (stade I, stade II, stade III et stade IV), etc.
L’analyse statistique de l’effet du traitement appliquée dans ces sous-groupes
a pour objectif de mettre en évidence des populations particulières pour lesquelles le traitement paraîtrait particulièrement efficace ou au contraire particulièrement délétère.
L’analyse en sous-groupes permet également la formulation d’hypothèses
quant aux raisons expliquant qu’un essai soit négatif ou positif :
• en cas d’essai négatif (résultat non significatif sur le critère de jugement principal), on cherche à mettre en évidence une population pour laquelle le traitement paraît bénéfique, ce qui permettrait éventuellement de réaliser un nouvel
essai exclusivement avec ce type de population ;
• en cas d’essai positif (résultat significatif sur le critère de jugement principal),
on s’attache à regarder dans quels sous-groupes le traitement paraît le plus efficace. De plus, on regarde dans quels sous-groupes le traitement paraît délétère
malgré la positivité de l’essai, ce qui entraînera un signal de prudence dans une
population particulière.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
176
Essais cliniques
Il s’agit donc d’analyses exploratoires permettant une ouverture ou la formulation d’hypothèses, mais la conclusion principale d’un essai ne repose jamais
sur les résultats de ces analyses en sous-groupes.
L’analyse en sous-groupe de l’effet du traitement est habituellement représentée dans un essai clinique par une figure appelée diagramme en forêt ou forest
plot, permettant de visualiser l’effet du traitement dans tous les sous-groupes.
Co m m e n t in t erpré t er une analyse en so us-gro u p es ?
Existe-t-il une homogénéité entre les sous-groupes ?
On dit que l’effet du traitement est homogène entre les différents sous-groupes
des différentes classes lorsqu’ils ont tous la même tendance (risques relatifs
globalement tous inférieurs à 1 ou tous supérieurs à 1, différences de moyennes
globalement toutes inférieures à 0 ou toutes supérieures à 0, etc.). Si ce n’est pas
le cas, on dit que les résultats sont hétérogènes.
Le traitement a-t-il un effet particulier au sein d'un
sous-groupe ?
On raisonne de la même manière que pour l’analyse du critère de jugement
principal en regardant l’intervalle de confiance (IC) à 95 % de la mesure d’association utilisée :
• pour un risque relatif (RR) ou un hazard ratio (HR), l’association est significative si l’IC95 % ne comprend pas la valeur 1 ;
• pour une différence absolue de moyenne ou de pourcentage, l’association est
significative si l’IC95 % ne comprend pas la valeur 0.
On retrouve dans certains articles en face de chaque ligne de chaque sousgroupe un p de signification [p-value) qui correspond à un test statistique (un
test par sous-groupe) dont les résultats concordent avec les résultats de l’intervalle de confiance à savoir :
• IC95 % d’un RR ne comprenant pas la valeur 1 : p < 0,05 ;
• IC95 % d’un RR comprenant la valeur 1 : p > 0,05.
L'effet du traitement est-il significativement différent
entre les sous-groupes d'une même caractéristique ?
Il est nécessaire pour cela de regarder les résultats du test d’hétérogénéité (ou test
d’interaction). Un test d’interaction compare les résultats entre les sous-groupes
d’une même caractéristique. À la différence des tests de significativité [p-value) de
la mesure d’association dans chaque sous-groupe, il n’y a qu’un seul test (et donc
une seule p-value) pour l’ensemble des catégories de la variable (un test pour les
hommes et un test pour les femmes = test de significativité chez les hommes et les
femmes ; un seul test pour la variable « sexe » = test d’interaction) :
• si le p du test d’interaction est inférieur à 0,05, cela signifie que le traitement a de
manière significative une efficacité différente entre les modalités d’une variable.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse en sous-groupes
177
On peut ainsi qualifier le sous-groupe en question de modificateur de l’effet du
traitement ;
• si le p du test d’interaction est supérieur à 0,05, cela signifie qu’il n’y a pas
de différence d’efficacité significative entre les sous-groupes de la caractéristique correspondante (et ce, même si l’IC95 % d’une des RR ne prend pas
la valeur 1), il n’y a donc pas de modification de l’effet en fonction du sousgroupe.
En pratique
Ex e m ple 1
On compare ici un nouveau traitement, le romosozumab, à l’alendronate dans
le traitement de l’ostéoporose.
Favor Romosozumab
Favor Alendronate
P for interaction
OVERALL
>70 years
<70 years
BMI>30
BMI<30
Previous treatment
No Previous treatment
0.08
North Europe
South Europe
Africa
America
Relative Risk for chmcal fracture
BMI : body mass index.
Le critère de jugement principal est la survenue d’une fracture osseuse. L’analyse en sous-groupes de l’étude est la suivante :
• la ligne verticale grise représente un RR de fracture égale à 1 ;
• les losanges orange clair représentent le RR de chaque sous-groupe positionné
par rapport à la ligne grise représentant le RR = 1 ;
• les carrés orange représentent les bornes des IC95 % de chaque RR ;
• un RR < 1 est en faveur du romosozumab, le groupe « alendronate » étant
choisi comme groupe témoin ;
• la ligne Overall (ou souvent notée aussi Ail patients) correspond au résultat
principal de l’étude, car elle prend en compte tous les patients (ce n’est donc pas
un sous-groupe). Ici, on remarque que le RR < 1 et son IC95 % ne comprend
pas la valeur 1. Donc le résultat principal de l’étude est positif en montrant une
supériorité significative du romosozumab par rapport à l’alendronate ;
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
178
Essais cliniques
• on retrouve ici quatre variables - âge, indice de masse corporelle ou IMC
(body mass index ou BMI), notion de traitement antérieur, origine ethnique elles-mêmes stratifiées en plusieurs sous-groupes (les catégories de la variable) ;
• les valeurs à droite correspondent bien à des tests d’interaction, car on n’en
retrouve seulement une par variable et non pas une à chaque ligne de résultat ;
• on remarque que les résultats sont homogènes, en faveur du romosozumab
puisque la majorité des RR sont inférieurs à 1 ;
• au sein de la caractéristique « âge », le romosozumab a une efficacité statistiquement supérieure à l’alendronate dans le sous-groupe des patients de plus de
70 ans, car l’IC95 % du RR ne comprend pas la valeur 1. L’association n’est par
contre pas significative dans le sous-groupe des patients de moins de 70 ans. Par
contre la valeur du p d’interaction montre qu’il n’y a pas de différence d’efficacité entre ces deux sous-groupes car il est supérieur à 0,05 (p = 0,43) ;
• au sein de la caractéristique IMC, il semble que l’analyse de l’effet du RR
du sous-groupe des patients avec un IM > 30 manque de puissance, l’IC95 %
du RR étant très large. Le nombre de patients avec un IMC > 30 doit être très
faible dans cette étude ;
• l’utilisation ou non d’un traitement antérieur ne semble pas influencer l’efficacité du romosozumab comparé à l’alendronate. Le p d’interaction est supérieur à 0,05, donc pas de différence d’efficacité entre les deux sous-groupes ;
• en revanche, le traitement par romosozumab est significativement plus efficace
en comparaison avec l’alendronate chez les patients d’Europe du Nord et du
continent américain, le p d’interaction étant inférieur à 0,05 (p = 0,03). Il y a une
interaction significative entre l’effet du traitement et l’origine géographique.
Ex e m ple 2
Subgroup
Placebo
Traitement
P Value for
Interaction
Hazard Ratio (95% Cl)
no. ofeve'nts/total no.
Overall
Age
<65 yr
>65 yr
PSA
<10 ng/ml
>10 ng/ml
245/367
223/364
|------ -1
0.84(0.70-1.01)
l_
78/131
167/236
58/122 |------- --------- ÿ
|-------- 1-|
165/242
151/241
93/125
140/238
|------- H
83/126 |---------------- |J
0.56
0.73 (0.52-1.02)
0.88 (0.71-1.09)
i
0.06
«--------------
-------------- >
Treatment bettter
Placebo better
0.91 (0.72-1.14)
0.73 (0.54-0.98)
Source : Wilt TJ, Jones KM, Barry MJ, et al. Follow-up of prostatectomy versus observation for
early prostate cancer. N Engl J Med 2017 ; 377 : 132-42.
• Dans cet exemple, on peut dire que l’effet global du traitement n’est pas
significatif : l’intervalle de confiance du HR pour la ligne Overall comprend la
valeur 1.
• Concernant l’âge :
- l’effet du traitement n’est pas significatif dans le groupe « < 65 ans »
ni dans celui « > 65 ans » (l’intervalle de confiance de ces deux catégories
comprend la valeur 1) ;
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse en sous-groupes
179
- l’effet du traitement n’est pas significativement différent entre les deux
catégories d’âge (p = 0,56), ou encore, il n’y a pas d’interaction significative
entre l’âge et l’effet du traitement. L’âge n’est pas un modificateur de l’effet
du traitement.
• Concernant le prostate-specific antigen (PSA), l’effet du traitement est significatif dans le groupe des patients avec un PSA >10 ng/mL, mais pas chez les patients
avec un PSA <10 ng/mL. Pour autant, le traitement n’est pas significativement
plus efficace chez les patients avec un PSA > 10. Il n’y a pas d’interaction significative entre le traitement et le dosage de PSA.
Ex e m ple 3
No. of Patients
No. of Events
1
I
I I
12-mo
36-mo 12-mo
36-mo
Group
Group
Group
Group
A<9!^
HR
(95o/o Cl)
Favors 36 mo
of Imatinib
>65
121
78
135
63
45
39
32
18
0.47 (0.30-0.74)
0.49 (0.28-0.85)
—■—
Tumor mutation site
KIT exon 9
KIT exon 11
Wild type
Other
12
129
19
28
14
127
14
23
8
55
9
6
8
28
3
4
0.61 (0.22-1.68)
0.35 (0.22-0.56
0.41 (0.11-1.51
0.78 (0.22-2.78)
---------- ■—
—■—
Favors 12 mo
of Imatinib
P Value
<.001
<.00
--- ■---
.34
<.001
.17
.70
■-----
0'1
1. 0
1'0
Source : Joensuu H, Eriksson M, Sundby Hall K, et al. One vs three years of adjuvant imatinib for
opérable gastrointestinal stromal tumor: a randomized trial. JAMA 2012 ; 307(12) : 1265-72.
Dans cet exemple, il existe une p-value pour chaque catégorie. Il est donc
implicite que ce qui est testé est la significativité du HR (information concordante avec celle donnée par l’intervalle de confiance) et non l’interaction entre
l’effet du sous-groupe et l’effet du traitement.
Il faut faire attention à bien faire la différence entre le p d’interaction et la
p-value :
• p d’interaction :
- teste la différence d’efficacité entre plusieurs sous-groupes d’une même
caractéristique,
- un seul test par caractéristique (= un test toutes les deux à trois lignes de
résultats en fonction du nombre de sous-groupes au sein de chaque caractéristique) ;
• p-value :
- teste si l’effet du traitement au sein d’un sous-groupe est significatif ;
- un test par sous-groupe (= un test par ligne de résultat).
Limit es d e l'analyse en so us-gro u p es
• Il s’agit seulement d’une analyse exploratoire : il est tout à fait possible de dire
que le traitement a sur le plan statistique une meilleure efficacité au sein d’un
sous-groupe, mais les résultats principaux de l’étude ne peuvent en aucun cas
reposer sur ce résultat. Si un traitement semble délétère dans un sous-groupe
donné, ceci peut en revanche inciter à la prudence.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
180
Essais cliniques
• Inflation du risque oc : à chaque réalisation d’un test, on rappelle qu’il existe
5 % de risque (risque a) de conclure à tort à une différence. Une analyse en
sous-groupes a comme conséquence de multiplier le nombre de tests statistiques et donc de multiplier par la même occasion ce risque.
• Inflation du risque [3 (= manque de puissance) : en découpant l’échantillon en
plusieurs sous-groupes pour réaliser ce type d’analyse, on diminue le nombre
de sujets par groupe. Or l’effectif de l’étude n’a pas été calculé en prenant en
compte toutes ces analyses. Il existe donc une perte de puissance statistique
ce qui correspond également à une inflation du risque p (rappel : puissance =
1 — P). On diminue le risque de conclure à une différence qui existe réellement.
On remarque généralement les sous-groupes qui manquent le plus de puissance
par la largeur plus importante de leur intervalle de confiance.
En pra tique
Ex e m ple 1 (é preuve t est 2017)
Griffin D, Parsons N, Shaw E, Kulikov Y, Hutchinson C, Thorogood M,
Lamb SE; UK Heel Fracture Trial Investigators. Operative versus
non-operative treatment for closed, displaced, intra-articular fractures of the
calcaneus: randomised controlled trial. BMJ 2014 ; 349 : g4483.
We performed a large, pragmatic, randomised controlled trial to assess whether
operative care leads to better outcomes than non-operative care in patients
with typical, closed, displaced intra-articular calcaneal fractures over two years
after injury.
Patients who consented to participate were randomised 1:1 to receive operative or non-operative care, using a mimimisation algorithm for centre, smoking status, diabètes, bilaterality, and Sanders classification.
The table shows estimated treatment effects for subgroups according to Sanders
classification; a formai interaction test in the régression analysis showed no
evidence (P = 0.697) that the effect of surgery was affected by fracture severity
(Sanders classification).
Différence (95 % Cl)
Non-operative
Operative
Outcomes
No
Ail participants
69
69.8 (21.8) 74
65.7 (23.7)
4.1
0.0 (-7.1 0.993
to 7.0)
Sanders 2
33
74.3 (20.4) 34
70.3 (24.9)
4.0
1.0 (-8.9 0.842
to 10.9)
Sanders 3 or 4
34
66.1 (21.9) 38
63.0 (22.2)
3.3
3.1 (—7.6 0.571
to 13.8)
Values
No
Values
Raw
Adjusted
P value
Primary outcome (Kerr-Atkins score)
Subgroups
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse en sous-groupes
181
Concernant les analyses en sous-groupes :
Il aurait fallu cocher...
Commentaires
Le test d’interaction évalue si l’effet
traitement diffère significativement
selon la classification de Sanders
Ce test permet de savoir si l’effet du
traitement évalué est différent selon le
sous-groupe considéré, ici la sévérité
initiale de la fracture selon la classification
de Sanders
On peut interpréter le résultat pour
la classification de Sanders car cette
analyse était planifiée
On peut tout « interpréter » que ce soit
planifié ou non...
Il n’y a pas d’interaction significative
entre le traitement et la classification de
Sanders
Ce résultat est donné par le test d’interaction dans le texte (p = 0,967)
L’effet du traitement est homogène entre
les catégories de la classification de
Sanders
Ce résultat est donné par le test d’interaction
Il n’aurait pas fallu cocher...
Commentaires
On peut interpréter le résultat pour
la classification de Sanders, car la
randomisation par minimisation a
permis de limiter des déséquilibres
sur ce critère
La randomisation (minimisée sur la classification de Sanders) a vocation à équilibrer le type
d’atteinte selon la classification de Sanders
entre les groupes. La question de l’évaluation
du critère de jugement dans chacun des sousgroupes Sanders est indépendante de cette
randomisation
Les auteurs auraient dû multiplier
les analyses en sous-groupes pour
augmenter la probabilité d’observer
des différences significatives
En multipliant les analyses en sous-groupes,
ils augmentent effectivement la probabilité
d’observer des différences significatives, mais
ils ne « devaient » pas le faire
On peut affirmer qu’il n’y a pas
d’interaction significative entre la
classification de Sanders et l’effet du
traitement car les p-values pour les
deux sous-groupes étudiés sont de
0,842 et 0,571
C’est le test d’interaction qui permet de faire
cette affirmation et non le test de l’effet de
la mesure d’association dans chacune des
catégories
L’effet du traitement n’était pas
significatif dans le groupe Sanders
2, ce qui est cohérent avec l’intervalle de confiance qui comprend la
valeur 1
Il s’agit ici d’une différence absolue (car elle
peut prendre des valeurs négatives) du score
de Kerr-Atkins. On s’intéresse donc à la valeur
neutre 0 et pas au 1 comme pour un risque
relatif
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
182
Essais cliniques
Ex e m ple 2
Atroshi I, Flondell M, Hofer M, Ranstam J. Méthylprednisolone injections
for the carpal tunnel syndrome: a randomized, placebo-controlled trial.
Ann Intern Med 2013 ; 159(5) : 309-17.
Le tableau ci-dessous est issu d’un essai clinique comparant l’injection locale
de méthylprednisolone à un placebo dans le traitement du canal carpien sur la
variation d’un score de symptôme de 0 à 10.
Prespecified Subgroup Analyses of the CTS Symptom Severity Score at 10 Weeks.
Subgroup
Méthylprednisolone''^
Placebo*
Différence in
Score Change
(95 % Cl)*
P Value
for Interaction
Duration of symptoms
>1 y
-1.02
(0.97)
-0.22 (066)
-0.81 (-1.20
to -0.43)
<ly
-1.19(1.0)
-0.78 (0.53)
-0.41 (- 1.51
to 0.69)
Moderately or
severely abnormal
-1.16
(097)
-0.31 (0.70)
-0.87 (-1.25
to -0.48)
Normal or mildly
abnormal
-0.49
(0.85)
-0.23 (0.54)
-0.26 (-1.26
to 0.75)
0.47
Nerve conduction tests
<0.001
Baseline CTS symptom severity score
>3.0
-1.33
(1.06)
-0.30(0.72)
1.02 (-1.54 to
-0.51)
<3.0
-0.68
(0.71)
-0.29 (0.62)
-0.38 (-0.82
to 0.05)
<0.001
CTS = carpal tunnel syndrome.
* Values are mean (SD) changes from baseline. fPatients who received méthylprednisolone
were combined into 1 group because of relatively small number of patients in the prespecified
subgroups. fMixed-model analysis of change in symptom severity score from baseline to 10 weeks,
adjusting for the baseline score.
Il est vrai que :
Il aurait fallu cocher...
Commentaires
L’effet de la méthylprednisone n’est pas
significatif dans le groupe des patients
avec des symptômes datant de moins de
1 an
Ce résultat est donné par la lecture de
l’intervalle de confiance de la différence
dans ce groupe qui exclut la valeur 0
(différence absolue)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse en sous-groupes
Il aurait fallu cocher...
183
Commentaires
La durée des symptômes n’a pas d’influence significative sur l’efficacité du
traitement
C’est la signification du test d’interaction
non significatif (p = 0,47)
Dans le groupe « score CTS à baseline
< 3 », l’effet de la méthyprednisolone
n’était pas significatif
Ce résultat est donné par l’intervalle de
confiance du sous-groupe considéré qui
inclut la valeur 0 (- 0.82 to 0.05)
Il existe une interaction significative
entre la valeur du score CTS à baseline
et l’effet de traitement par méthyprednisolone
C’est attesté par le p d’interaction < 0,05
L’absence d’effet du traitement dans le
sous-groupe des symptômes < 1 an est
possiblement liée à un manque de puissance
L’étude n’ayant pas été conçue pour cette
comparaison, il est tout à fait possible
que l’analyse dans ce sous-groupe souffre
d’un défaut de puissance (pas assez de
patients dans ce groupe)
Il n’aurait pas fallu cocher...
Commentaires
Le traitement est significativement plus
efficace chez les patients avec des symptômes plus anciens que chez les autres
L’interaction entre le traitement et la
durée des symptômes n’est pas significative (p - 0,47), on ne peut donc pas faire
cette conclusion quand bien même l’effet
du traitement est significatif dans un
groupe et pas dans l’autre
L’effet du traitement est homogène dans
les catégories de la variable « anomalies
de la conduction nerveuse »
C’est une autre manière de formuler le
fait que le test d’interaction soit négatif
(ou > 0,05)
Les résultats dans chaque sous-groupe
sont montrés sous la forme d’une
différence relative d’amélioration des
symptômes
C’est une différence absolue de score
(voir fiche 5)
Ce traitement ne doit pas être recommandé chez les patients avec un score
CTS < 3
La conclusion principale de l’essai porte
sur le résultat global, pas sur le résultat
d’un sous-groupe
Ex e m ple 3 (ED N 2021)
Cappuzzo F, Ciuleanu T, Stelmakh L, Cicenas S, Szczésna A, Juhâsz E, et al.
Erlotinib as maintenance treatment in advanced non-small-cell lung cancer:
a multicentre, randomised, placebo-controlled phase 3 study. Lancet Oncol
juin 2010; 11(6): 521-9.
We designed the phase 3, placebo-controlled Sequential Tarceva in Unresectable non-small-cell lung cancer study to assess use of erlotinib as maintenance
therapy in patients with non-progressive disease following first-line platinum
doublet chemotherapy.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
184
Essais cliniques
HR (95«* d)
B
N
Ail
889
I-- ---- 1
0.81 (0.70-0.95)
IIIB
225
664
—f
I------ •--|--- £-- 1
0.81 (0.59-1.11)
IV
I----- •— ----- 1
I--- •-- 1
0.86(0.65-1.13)
Stage
0.81 (0.68-0.97)
ECOG PS
0
280
1
609
0.78 (0.65-0.94)
Smoking status
Never smoker
152
Former smoker
244
Current smoker
493
H
I----- ♦-----I---- •--I—• -I
0.69(0.45-1.05)
0.75 (0.56-1.00)
0.88(0.72-1.08)
Age
<65 years
590
>65 years
299
I-- •-- 1
I--- •— ------ 1
0.78 (0.65-0.95)
0.88(0.68-1.15)
Ethnie origin
White
746
Asian
131
f
0.86 (0.73-1.01)
-|
I------- •-------
0.66(0.42-1.05)
Sex
Male
659
Female
230
H
0.88(0.74-1.05)
I----- •----- 1
0.64 (0.46-0.91)
Histology
Squamous-cell
360
Adenocarcinoma
403
I--- •— —|
I—•--- 1
0.4
0.6
Favours erlotinib
0.8
1.0
0.86(0.68-1.10)
0.77 (0.61-0.97)
1.2
1.4
Favours placebo
Subgroup analyses of overall survival.
For progression-free survival, only the interactions between treatment effect and ethnie
origin (p=0.01) and treatment effect and sex (p=0.04) were significant. For overall
survival, only the interaction between treatment effect and ethnie origin (p=0.03) was
significant. The size of the circles are proportional to the number of patients in each
group. HR= hazard raio. ECOG = Eastern Cooperative Oncology Group.
À propos de la figure B concernant la survie globale (une ou plusieurs propositions attendues) :
Il aurait fallu cocher...
Commentaires
On ne peut pas exclure que le
statut tabagique soit un modificateur de l’efficacité de l’erlotinib
sur la survie globale
Dans la légende de la figure 3, il est précisé que
seul l’effet d’interaction entre le traitement et
l’origine ethnique était significatif. Cependant,
on remarque une tendance à une diminution de
l’effet de l’erlotinib en fonction de la gradation
du statut tabagique avec un HR à 0,69 pour les
non-fumeurs, à 0,75 pour les anciens fumeurs
et à 0,88 pour les fumeurs actifs. Il y a une sorte
d’effet dose qui laisse supposer que l’effet de
l’erlotinib pourrait être modifié par le statut
tabagique. Le test d’interaction non significatif
pourrait s’expliquer par un manque de puissance
et un test non significatif ne permet pas d’exclure
une association.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse en sous-groupes
185
Il aurait fallu cocher...
Commentaires
Le bénéfice de l’erlotinib en
matière de survie globale pourrait
être d’autant plus important
que les patients sont d’origine
asiatique
Le test de l’interaction entre origine ethnique
et effet du traitement est significatif et l’effet du
traitement semble un peu plus important au sein
de la population asiatique par rapport à la population caucasienne (HR à 0,66 vs 0,86) même
si les deux intervalles de confiance comprennent
la valeur 1. L’intervalle de confiance correspondant à la population asiatique est très large
du fait d’un faible effectif et il manque donc
une puissance suffisance pour montrer un effet
significatif dans ce sous-groupe
Il n’aurait pas fallu cocher...
Commentaires
Il n’y a pas d’inflation du risque
alpha car tous les sous-groupes
ont été prédéfinis
Que les tests en question soient prévus à
l’avance ou non ne modifie aucunement ce
risque statistique
Seuls les sous-groupes ayant servi
à la stratification de la randomisation peuvent être testés
Il ne faut pas confondre la stratification de la
randomisation, dont l’objectif est de forcer la
comparabilité des groupes sur certaines caractéristiques initiales, et la stratification de l’analyse
en sous-groupes. L’une est indépendante de
l’autre
L’erlotinib est efficace sur la
survie globale uniquement chez
les patients avec un stade IV
L’effet du traitement chez les patients avec un
stade IIIB correspond à un HR à 0,81 avec un IC à
95 % incluant la valeur 1 alors que l’effet du traitement chez les patients avec un stade IV correspond
à un HR à 0,81 avec un IC à 95 % excluant la
valeur 1. Cependant, il n’y a pas d’interaction
significative entre le stade du cancer et le traitement (le stade du cancer n’est pas un modificateur
de l’effet du traitement). Un manque de puissance
explique très probablement le fait que l’intervalle
de confiance à 95 % de l’effet du traitement des
patients au stade IIIB inclut la valeur 1 car ces
patients sont sous-représentés par rapport aux
stades IV (l’IC est beaucoup plus large)
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
186
Essais cliniques
Ex e m ple 4 (ED N 2019)
Galimberti V, Cole BF, Zurrida S, Viale G, Luini A, Veronesi P, et al. Axillary
dissection versus no axillary dissection in patients with sentinel-node
micrometastases (IBCSG 23-01): a phase 3 randomised controlled trial.
Lancet Oncol avr 2013 ; 14(4) : 297-305.
HR (Cl)
Events/N
AD
No AD
<2 cm
42/316
33/322
0.77 (0.42-1.39)
2-2.9 cm
21/106
16/112
0.73 (0.31-1.72)
>3 cm
6/35
6/28
0.99 (0.21-4.70)
Tumour size
Oestrogen-receptor status
Négative
11/51
11/40
1.14(0.37-3.44)
Positive
58/409
44/425
0.73 (0.44-1.22)
Progesterone-receptor status
Négative
20/108
23/115
1.12 (0.51-2.46)
Positive
49/352
32/350
0.66 (0.37-1.18)
0.39 (0.13-1.17)
Tumour grade
Grade 1
18/118
5/90
Grade II
22/214
24/241
1.03 (0.48-2.22)
Grade III
29/129
26/135
0.78 (0.39-1.57)
Type of surgery
Mastectomy
6/44
3/42
0.52 (0.09-3.10)
Breast-conserving
63/420
52/425
0.81 (0.50-1.32)
AH patients
69/464
55/467
0.78 (0.55-1.11)
99o/o Cl
95% Cl
o.25
Favours no AD
0.5
0.75
1.5
2
Favours AD
Analysis of subgroups defined by tumour size, oestrogen-receptor
status, progesterone-receptor statustumour grade and type of surgery by
intention-to-treat (n= 931)
HRs compare no axillary dissection versus axillary dissection among subgroups of the
intention-to-treat population. Each subgroup HR is shown as a black square being
inversely proportional to the variance of the corresponding log-HR estimate (ie, larger
squares indicate lower variability in the estimate). The Hr for ail patients is shown as a
diamond. The horizontal axis is displayed on a logarithmic scale.
À propos de la figure ci-dessus {une ou plusieurs réponses possibles) :
Il aurait fallu cocher...
Commentaires
Des intervalles de confiance à 99 % ont
été utilisés pour chaque sous-groupe afin
d’être conservateur compte-tenu de la
multiplicité des tests
Les auteurs prennent en compte l’inflation du risque alpha qui est typique
des analyses en sous-groupe du fait de
la multiplicité des tests. Ils fixent donc le
risque de lre espèce à 1 % au lieu de 5 %
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse en sous-groupes
Il aurait fallu cocher...
Commentaires
Il ne semble pas exister de modificateurs
de l’effet de l’absence de curage ganglionnaire sur la survie sans récidive
Il n’y a pas eu de tests d’interaction
réalisés mais visuellement les résultats
des sous-groupes de la catégorie correspondante semblent homogènes
Il n’aurait pas fallu cocher...
Commentaires
La non-infériorité n’est démontrée pour
aucune taille de tumeur, rendant l’étude
non concluante en réalité
Les analyses en sous-groupe sont exploratoires. On ne conclut pas avec ce type
d’analyse qui manquent de puissance
et dont l’interprétation est limitée par
l’inflation du risque de lre espèce
Des intervalles de confiance à 99 % ont
été utilisés pour chaque sous-groupe afin
de tenir compte du défaut de puissance
statistique
La seule manière d’augmenter la puissance de ce type d’analyse serait d’augmenter la taille de l’échantillon
L’effet du curage ganglionnaire axillaire
sur la survie sans récidive varie en
fonction de la présence de récepteurs à la
progestérone
Il existe peut-être un essai visuel mais on
ne peut pas l’affirmer catégoriquement
du fait de l’absence de test d’interaction
réalisé
187
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 19
Conclusion de l’étude
et critique des résultats
Résulta ts sur le crit ère de ju g e m e n t principal
• On rappelle que le critère de jugement principal permet de répondre à la
question posée par la formulation de l’objectif principal.
• Chaque essai est censé avoir été construit avec une puissance suffisante pour
espérer montrer une différence significative sur le critère de jugement principal.
• Donc il faut que l’essai soit significatif sur le critère de jugement principal
pour qu’il soit considéré comme positif.
• Afin de le retrouver de manière certaine, c’est le critère sur lequel se sont
basés les auteurs pour calculer le nombre de sujets nécessaires.
Résult ats sur les crit ères d e ju g e m e n t seco n d aires
• On rappelle que les critères de jugement secondaires permettent de répondre
aux questions posées par la formulation des objectifs secondaires.
• On a le droit de conclure sur la significativité d’un critère de jugement secondaire avec les mêmes exigences sur le plan statistique.
• Mais ce ne sont pas sur ces résultats que va reposer la conclusion principale
de l’essai.
V alidit é in t ern e / validit é e x t ern e
Une fois le résultat d’un essai obtenu, il est nécessaire de se poser la question de
la valeur de ce résultat.
Validité interne
La validité interne renvoie à la notion de rigueur méthodologique. La validité
interne correspond à la fiabilité des résultats à l’intérieur de l’échantillon d’étude.
On se pose la question suivante : les résultats présentés sont-ils fiables (justes ?
exacts ?) au sein de notre échantillon ? Les essais avec la validité interne la plus
forte sont ceux répondant aux critères de bonne qualité méthodologique :
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
190
Essais cliniques
• l’essai est-il randomisé ? Contre placebo ou groupe contrôle ? En double insu ?
• les groupes sont-ils initialement comparables et suivis de manière identique ?
• les perdus de vue ne sont-ils pas trop nombreux et sont-ils pris en compte
dans l’analyse finale par une technique adéquate ?
• les éventuels biais de confusion sont-ils bien identifiés et bien pris en compte ?
• la mesure du critère de jugement principal est-elle objective, bien définie et
réalisée en aveugle de façon identique dans les deux groupes ?
Validité externe
La validité externe correspond à la possibilité ou non de généraliser les résultats à
la population cible. On se pose la question de savoir si les résultats sont fiables au
sein d’une population plus large que celle de notre échantillon. Evaluer la validité
externe d’une étude consiste également à mettre en perspective les résultats avec
ceux déjà publiés dans la littérature sur le même sujet. Cela permet de vérifier
ainsi qu’il existe ou non une cohérence bibliographique. Des résultats reproductibles confèrent une force supplémentaire à la généralisation des résultats.
Gé n éralisa tio n d es résult ats
On a vu que la généralisation des résultats correspond à la validité externe
de l’étude. Les résultats sont-ils fiables à l’extérieur de l’échantillon d’étude ?
Ce qui revient à dire : peut-on généraliser les résultats à une population plus
grande ? Autrement dit, y a-t-il un biais de sélection ?
Dans les essais cliniques, la généralisation des résultats peut être parfois difficile, notamment lorsque l’on sélectionne des populations très particulières.
L’échantillon d’étude devient alors moins représentatif de la population cible.
On pourra alors souvent généraliser les résultats seulement aux patients présentant les mêmes critères d’inclusion et d’exclusion de notre échantillon.
De la même manière, le choix de la population source peut limiter la généralisation lorsqu’on choisit une population elle-même avec des caractéristiques
particulières (exemple : recrutement en centre de référence versus recrutement
dans les cabinets de médecine générale).
De plus, la perte de suivi de certains patients peut aggraver la perte de représentativité (biais d’attrition).
Pertin e nce cliniq u e du résulta t
Quel est l’impact des résultats sur la prise en charge des patients ? Le caractère
significatif sur le plan statistique ne préjuge en rien de l’importance du bénéficie
du traitement attendu pour le patient. On se pose alors principalement les questions suivantes :
• cet effet a-t-il une signification clinique importante ?
• le critère de jugement principal est-il cliniquement pertinent ?
• l’efficacité obtenue est-elle cliniquement intéressante ?
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Conclusion de l’étude et critique des résultats
191
Exemples :
• diminution de 20 % de mortalité à 1 an = impact clinique important, avec efficacité très intéressante portant sur un critère de jugement cliniquement pertinent ;
• amélioration de 10 mètres du périmètre de marche à 6 mois = faible impact
pour le patient, critère de jugement cliniquement pertinent mais efficacité pas
très intéressante cliniquement ;
• diminution plus rapide du taux de C-reactive protein (CRP) sans amélioration de la mortalité et du temps d’hospitalisation = aucun impact pour le
patient, critère de jugement non cliniquement pertinent.
Raiso ns p ossibles d'un essai p ositif ou d'un essai
n é g a tif
• Un essai peut être positif parce que :
- l’effet du traitement est réel (situation idéale) ;
- il existe un biais de mesure différentiel (lié à l’absence d’aveugle, par exemple) entraînant une surestimation de l’effet du traitement ;
- les groupes ne sont pas comparables (échec de la randomisation), un facteur
de confusion explique la différence entre les groupes (patients moins graves
dans le groupe « traitement », par exemple) ;
- le résultat est lié aux fluctuations d’échantillonnage (on se retrouve dans les 5 %
de chances de conclure à tort à une différence, ce qui correspond au risque oc).
• Un essai peut être négatif parce que :
- l’effet du traitement est réellement inexistant ;
- l’effet existe, mais il est masqué par la présence de biais entraînant une
erreur systématique de classification du critère de jugement principal avantageuse dans le groupe contrôle (biais de mesure différentiel), ou une erreur
systématique de classification du critère de jugement principal de manière
équivalente dans les deux groupes (bais de mesure non différentiel) ;
- l’effet existe mais les groupes ne sont pas comparables, un facteur de confusion masquant l’effet du traitement (patients dans le groupe « traitement »
avec une maladie plus grave initialement par exemple) ;
- l’essai manque de puissance, c’est-à-dire que le nombre de sujets nécessaires et/ou le nombre d’événements attendus n’ont pas été atteints. Il faut se
reporter à l’analyse statistique et au calcul du nombre de sujets nécessaires
pour vérifier cela.
En pra tique
Ex e m ple 1 (é preuve t est 2017)
Griffin D, Parsons N, Shaw E, Kulikov Y, Hutchinson C, Thorogood M,
Lamb SE; UK Heel Fracture Trial Investigators. Operative versus
non-operative treatment for closed, displaced, intra-articular fractures of the
calcaneus: randomised controlled trial. BMJ 2014; 349: g4483.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
192
Essais cliniques
We performed a large, pragmatic, randomised controlled trial in the UK
National Health Service to assess whether operative care leads to better outcomes than non-operative care in patients with typical, closed, displaced intraarticular calcaneal fractures over two years after injury.
We recruited participants from 22 UK hospitals in 2007-09. Ail were régional
referral centres for calcaneal fractures, and the surgeons were ail recognised as
specialists in the treatment of these injuries.
Of the 502 eligible patients, 151 consented to participate and were randomised
to the operative (n= 73) and non-operative (n= 78) groups, with a médian of
5 (interquartile range 4-8) participants per centre.
Quels éléments sont en faveur de la bonne validité externe de cette étude ?
Il aurait fallu cocher...
Commentaires
Le nombre important de centres recrutés
Le caractère multicentrique de l’essai
Le grand nombre de centres indique une
bonne représentativité de la population
source par rapport à la population cible
Le choix de l’intervention chirurgicale
de référence pour le bras traitement
chirurgical
L’utilisation du traitement le plus répandu rendra plus facile la comparaison
avec les autres études
Il n’aurait pas fallu cocher...
Commentaires
La randomisation par minimisation
C’est un critère de validité interne
La participation exclusive de chirurgiens
reconnus dans le traitement des fractures
du calcanéum
Au contraire, ceci fait plutôt craindre un
biais de sélection, donc une diminution
de la validité externe
Le taux d’acceptation du protocole
parmi les patients éligibles
Le taux d’acceptation est faible ici
(151/502) et les patients inclus risquent
d’être différents des patients initialement
ciblés dans l’essai
Ex e m ple 2 (ED N 2017)
Gordon AC, Perkins GD, Singer M, McAuley DF, Orme RML,
Santhakumaran S, Mason AJ, Cross M, Al-Beidh F, Best-Lane J, Brealey D,
Nutt CL, McNamee JJ, Reschreiter H, Breen A, Liu KD, Ashby D.
Levosimendan for the prévention of acute organ dysfunction in sepsis.
N Engl J Med 2016; 375: 1638-48.
We conducted a double-blind, randomized clinical trial to investigate whether
levosimendan reduces the severity of organ dysfunction in adults with sepsis.
Enrollment, randomization, and data collection were performed by means
of an online System (InForm, Oracle). Patients were assigned in a 1:1 ratio
to receive levosimendan or placebo, with the use of variable block sizes of
four and six and computer-generated random numbers and with stratification
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Conclusion de l’étude et critique des résultats
193
according to recruitment center. The randomization sequence was prepared by
an independent statistician.
The primary analysis was unadjusted in the intention-to-treat population, and
reported the différence in mean SOFA scores between the two trial groups.
The trial protocol, available with the full text of this article at NEJM.org, was
designed by the trial management committee and has been published previously.
The trial was funded by the National Institute for Health Research and Tenax
Therapeutics and sponsored by Impérial College London. Data management
and analysis were performed by the Impérial Clinical Trials Unit. The funders,
the sponsor, and Orion Pharma had no rôle in designing the trial, gathering or
analyzing the data, writing the manuscript, or making the decision to submit
the manuscript for publication.
Quels sont les éléments en faveur d’une bonne validité interne de cette étude ?
Il aurait fallu cocher...
Commentaires
L’administration du traitement en
aveugle
Evite le biais de mesure différentiel sur le
critère de jugement
L’analyse en intention de traiter
Limite le risque de conclure à tort à
l’efficacité du traitement
La description de la méthode de randomisation
Dans cette étude, la procédure de randomisation est décrite et de bonne qualité
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
194
Essais cliniques
Il n’aurait pas fallu cocher...
Commentaires
Le fait que le protocole soit disponible
Ces deux propositions sont à mettre au
crédit de l’étude mais ne préjugent pas de
la validité interne (le protocole peut être
disponible mais de mauvaise qualité)
La déclaration de la source de financement et des liens d’intérêt
Quels sont les éléments en faveur d’une bonne généralisabilité des résultats de
cette étude ?
Il aurait fallu cocher...
Commentaires
Le recrutement multicentrique
Le caractère multicentrique permet d’avoir
des patients et des pratiques plus divers et
favorise la généralisabilité (les résultats de
l’étude sont applicables à une population
plus large)
L’absence d’effet centre attestée par la
stratification de la randomisation
La stratification par centres permet d’éviter
un effet centre, donc a priori les résultats
obtenus sont bien indépendants du centre,
ce qui améliore la généralisabilité
L’attrition (voir flow chart)
L’attrition (réduction de l’effectif analysé
par rapport à l’effectif randomisé) est
mineure dans cette étude. Dans l’hypothèse
où beaucoup de patients sortent d’une
étude et/ou ne sont pas analysés, cela implique que les résultats ne prennent pas en
compte ces patients
Une prise en charge pour les traitements associés proche de la vraie vie
dans cette étude
Plus les procédures de l’étude sont proches
de la pratique, plus on peut généraliser les
résultats
Il n’aurait pas fallu cocher...
Commentaires
Le taux de mortalité est plus faible que
dans d’autres études sur le lévosimendan
Cet élément n’est pas en faveur de la
validité externe puisque discordant avec
les autres études
Ex e m ple 3 (ED N 2020)
Hofmann R, James SK, Jernberg T, Lindahl B, Erlinge D, Witt N, et al.
Oxygen Therapy in Suspected Acute Myocardial Infarction. N Engl J Med
28 sept 2017; 377(13): 1240-9.
In this registry-based randomized clinical trial, we used nationwide Swedish
registries for patient enrollment and data collection. Patients with suspected
myocardial infarction and an oxygen saturation of 90% or higher were randomly assigned to receive either supplémentai oxygen (6 liters per minute for
6 to 12 hours, delivered through an open face mask) or ambient air.
The 1-year total mortality among patients with myocardial infarction was estimated to be 14.4%. A clinically relevant effect of supplémentai oxygen was
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Conclusion de l’étude et critique des résultats
195
defined as a 20% lower relative risk of death from any cause within 1 year in
the oxygen group than in the ambient-air group. With the chisquare test, to
be able to reject the null hypothesis at a significance level of 0.05 (two-sided)
with a power of 0.90, a total of 2,856 patients per group were needed. To
control for patients Crossing over or not completing the trial, the planned
sample size was increased to 3,300 patients per group, which resulted in a
total of 6,600 patients.
A total of 6,629 patients were enrolled. The médian duration of oxygen therapy was 11.6 hours, and the médian oxygen saturation at the end of the
treatment period was 99% among patients assigned to oxygen and 97%
among patients assigned to ambient air (p< 0.001). The primary end point
of death from any cause within 1 year after randomization occurred in 5.0%
of patients (166 of 3,311) assigned to oxygen and in 5.1% of patients (168
of 3,318) assigned to ambient air (hazard ratio, 0.97; 95% confidence interval [CI], 0.79 to 1.21; P = 0.80). The corresponding 1-year mortality in the
per-protocol population was 4.7% (141 of 3,014) and 5.1% (163 of 3,212),
respectively (hazard ratio, 0.91; 95% CI, 0.72 to 1.14; P = 0.40).
Data on Procedures, Médication, and Complications during Hospitalization.*
Ambient-Air Group
(N-3318)
Oxygen Group
(N-3311)
Variable
Value
among
Patients
with Data
Available
Value among No. (%) of
Patients with
Patients
with Data Missing Data.
Available
P Value
No. (%) of
Patients with
Missing Data.
Médian duration 11.64 (6.03- 243 (7.3)
of oxygen therapy 12.02)
(IQR) - hr
-
-
0
Received oxygen 62 (1.9)
outside the
protocol because
of development
hypoxemia - no.
(%)
99 (97-100) 569 (17.2)
Médian oxygen
saturation at end
of treatment period
(!QR)-(%)
254 (7.7)
0
< 0.001
97 (95-98)
563 (17.0)
< 0.001
Procedures - no. (%)
Coronary
angiography
2797 (84.5)
0
2836 (85.5) 0
0.26
PCI
2183 (65.9)
0
2246 (67.7) 0
0.13
CABG
96 (2.9)
24 (0.7)
110(3.3)
28 (0.8)
0.51
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
196
Essais cliniques
Oxygen Group
(N-3311)
Variable
P Value
Value
among
Patients
with Data
Available
No. (%) of
Patients with
Missing Data.
0
3.0 (0-95)
0
0.87
Value among No. (%) of
Patients with
Patients
with Data Missing Data.
Available
Médian duration 3.0 (0-68)
of hospital stay
(range) - days
Ambient-Air Group
(N-3318)
Médication - no. (%)
Intravenous
diuretic
309 (9.3)
30 (0.9)
322 (9.7)
38 (1.1)
0.58
Intravenous
inotrope+
46 (1.4)
33 (1.0)
70 (2.1)
42 (1.3)
0.02
Intravenous
nitroglycerin
252 (7.6)
32 (1.0)
221 (6.7)
44 (1.3)
0.14
Aspirin
2758 (83.3)
54 (1.6)
2803 (84.5) 55 (1.7)
0.16
P2Y12 receptor 2445 (73.8)
inhibitor
53 (1.6)
2463 (74.2) 54 (1.6)
0.62
Beta-blocker
2702 (81.6)
54 (1.6)
2752 (82.9) 52 (1.6)
0.13
Statin
2782 (84.0)
53 ( 1.6)
2765 (83.3) 55 (1.7)
0.46
ACE inhibitor
or ARB
2586(78.1)
53 (1.6)
2557(77.1) 55 (1.7)
0.32
Calcium
blocker
519 (15.7)
52 (1.6)
547(16.5)
54 (1.6)
0.36
Diuretic
607(18.3)
53 (1.6)
615 (18.5)
53 (1.6)
0.82
Complications - no. (%)
Reinfarction
17(0.5)
34 (1.0)
15 (0.5)
33 (1.0)
0.72
New-onset
atrial fibrillation
94 (2.8)
33 (1.0)
103 (3.1)
32 (1.0)
0.53
Atrioven46 (1.4)
tricular block,
second-degree
or third degree
30 (0.9)
58 (1.7)
30 (0.9)
0.24
Cardiogenic
shock
32 (1.0)
27(0.8)
37(1.1)
27 (0.8)
0.54
Cardiac arrest
79 (2.4)
28 (0.8)
63 (1.9)
28 (0.8)
0.17
Death
53 (1.6)
28 (0.8)
44 (1.3)
26 (0.8)
0.35
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Conclusion de l’étude et critique des résultats
197
La saturation médiane en oxygène significativement plus élevée à la fin de la
période de traitement sous oxygénothérapie qu’en air ambiant peut s’expliquer
par :
Il aurait fallu cocher...
Commentaires
L’administration d’oxygène prévue par le
protocole de l’essai
Réponse logique
Le risque d’erreur statistique de première
espèce (alpha)
Une différence statistiquement significative peut toujours être liée au hasard
Il n’aurait pas fallu cocher...
Commentaires
Une saturation médiane en oxygène plus
élevée à l’inclusion
Il n’y a pas de différence de saturation
entre les 2 groupes à l’inclusion, ce paramètre a été équilibré entre les 2 groupes
par la randomisation
Une proportion de données manquantes
différente entre les 2 groupes
Le taux de données manquante est très
proche dans les deux bras (17,2 % vs 17 %).
Par ailleurs, les différences de caractéristiques entre les patients avec des données
manquantes sont plus pertinentes à
prendre en compte que le pourcentage
des données manquantes en soi
Un recours plus fréquent à une oxygénothérapie en dehors du protocole de l’essai
Le recours à l’oxygène en dehors du
protocole est par définition plus fréquent dans le groupe « air ambiant ».
Cela contribuerait plutôt à réduire les
différences entre les groupes
Cet essai n’a pas mis en évidence de différence significative de la mortalité à 1 an
entre les deux groupes comparés, en analyse en intention de traiter. Quelle est la
principale raison expliquant ce résultat ?
Il aurait fallu cocher...
Commentaires
Une augmentation de 2 points de
pourcentage de la saturation médiane
en oxygène est insuffisante pour réduire
significativement la mortalité
Cette question, compte tenu de sa
formulation, n’attend qu’une seule
réponse correcte. Cette réponse apparaît
la plus convaincante car même si la
puissance prévue initialement n’est pas
atteinte (taux de décès plus faible que
prévu au nombre de sujets nécessaires),
la différence entre les 2 groupes est
numériquement très faible
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
198
Essais cliniques
Il n’aurait pas fallu cocher...
Commentaires
297 (9 %) patients sous oxygénothérapie
n’ont pas complété la période d’oxygénothérapie prévue par le protocole de
l’essai
Ces 2 propositions vont dans le sens
d’une diminution de la différence entre
les 2 groupes. Néanmoins, la formulation
de la question n’attend qu’une seule
réponse correcte et la concordance
entre les analyses per-protocole et en
ITT semble indiquer que les déviations
n’impactent pas beaucoup les résultats
254 (7 %) patients sous air ambiant
ont bénéficié d’une oxygénothérapie en
dehors du protocole de l’essai
1 619 (25 %) participants à l’essai
avaient une pathologie autre qu’un
infarctus du myocarde
La population-source de l’étude est bien
constituée des patients suspects d’infarctus
et pas des patients avec un infarctus
avéré. De plus, les patients avec un autre
diagnostic ont été équilibrés entre les
2 groupes par la randomisation
Le hasard
Le hasard peut expliquer un résultat
négatif, néanmoins la formulation de la
question n’attend qu’une seule réponse
vraie et dans cette situation, la raison
principale ne semble pas être celle-ci
Pour un patient avec une saturation en oxygène supérieure à 90 % à la phase
aiguë d’un infarctus du myocarde, cet essai :
Il aurait fallu cocher...
Commentaires
Ne met pas en évidence de bénéfice significatif de l’oxygénothérapie comparativement à la ventilation en air ambiant
pour la mortalité à 1 an
Il s’agit du résultat principal de l’essai
présenté par la formulation correcte d’un
résultat d’un essai de supériorité négatif
Il n’aurait pas fallu cocher...
Commentaires
Démontre la non-infériorité de la ventilation en air ambiant comparativement
à l’oxygénothérapie pour la mortalité à
1 an
Un essai de supériorité négatif ne permet
jamais de démontrer la non-infériorité
Démontre l’innocuité de l’oxygénothérapie
comparativement à la ventilation en air
ambiant
L’absence de différence significative en
matière d’effet secondaire n’est pas une
démonstration d’innocuité
Démontre la supériorité de l’oxygénothérapie comparativement à la ventilation en
air ambiant pour l’épargne thérapeutique
en médicaments inotropes intraveineux
Un résultat sur un critère de jugement
secondaire n’est pas la conclusion d’un
essai thérapeutique
Démontre l’absence d’effet de l’oxygénothérapie comparativement à la ventilation
en air ambiant sur la mortalité à 1 an
L’absence d’effet significatif ne signifie
pas « l’absence d’effet ». L’effet peut être
existant, mais inférieur aux hypothèses
des auteurs
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Conclusion de l’étude et critique des résultats
199
Quel(s) élément(s) supporte(nt) la validité interne des résultats de cet essai ?
Il aurait fallu cocher...
Commentaires
Le critère de jugement principal était
objectif
Ceci est très souhaitable dans un essai
ouvert pour limiter les biais de mesure
sur le critère de jugement principal
Les caractéristiques des patients à
l’inclusion étaient comparables entre les
2 bras de l’essai
Ceci indique que la randomisation est
correctement réalisée et qu’il n’y a pas de
biais de confusion
Les conclusions étaient similaires en
analyse en intention de traiter et en
analyse per-protocole
Ceci indique que l’effet des déviations au
protocole n’influence pas beaucoup les
résultats de l’étude
Il n’aurait pas fallu cocher...
Commentaires
L’essai a été conduit en ouvert
La nature ouverte de l’essai augmente le
risque de biais de mesure différentiel et
de biais de performance
Les hypothèses formulées a priori pour
le calcul du nombre de sujets nécessaire
ont été vérifiées lors de la réalisation de
l’essai
Dans le calcul du nombre de sujets
nécessaire, il est précisé que le taux de
mortalité attendu à 1 an est de 14,4 %.
Dans cette étude, la mortalité observée
est de 5 % dans les 2 bras ce qui indique
que la puissance calculée a priori n’a pas
été atteinte
Les arguments en faveur de la validité externe des résultats de cet essai pour les
patients occidentaux actuels incluent :
Il aurait fallu cocher...
Commentaires
Le caractère multicentrique de l’essai
L’inclusion de plusieurs centres améliore
la représentativité de la populationsource par rapport à la population cible
La participation à l’essai d’environ 50 %
des 69 hôpitaux recevant des patients
avec un infarctus
À l’échelle d’un pays, une telle participation est remarquable, la population-source
a plus de chance d’être représentative de
la population-cible si les patients sont
répartis dans la moitié des centres du
pays plutôt que dans quelques centres
uniquement
Le recrutement des patients sur une
période récente
Les pratiques changent au fil des années
et un essai récent permet de s’assurer
que les patients sont pris en charge avec
les pratiques les plus à jour, ce qui
permet plus facilement de généraliser les
résultats à la population-cible
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
200
Essais cliniques
Il n’aurait pas fallu cocher...
Commentaires
La conduite de l’essai dans un seul pays
Les résultats d’un essai sont d’autant plus
généralisables à une population plus large
s’il est réalisé dans plusieurs pays
L’inclusion dans l’essai de 21,9 % des
patients avec un infarctus du myocarde
identifiés dans le registre SwedeHeart
Cette proportion apparaît faible et ne
permet pas de s’assurer que l’échantillon
est représentatif de la population-source
Ex e m ple 4 (ED N t est 2019)
The EINSTEIN-PE Investigators. Oral Rivaroxaban for the Treatment of
Symptomatic Pulmonary Embolism. N Engl J Med 5 avr 2012; 366(14):
1287-97.
In a randomized, open-label, event-driven, noninferiority trial involving 4,832
patients who had acute symptomatic pulmonary embolism with or without
deep-vein thrombosis, we compared rivaroxaban (15 mg twice daily for
3 weeks, followed by 20 mg once daily) with standard therapy with enoxaparin
followed by an adjusted-dose vitamin K antagonist for 3, 6, or 12 months. The
primary efficacy outcome was symptomatic récurrent venous thromboembolism. The principal safety outcome was major or clinically relevant nonmajor
bleeding. Rivaroxaban was noninferior to standard therapy (noninferiority
margin, 2.0; P= 0.003) for the primary efficacy outcome, with 50 events in
the rivaroxaban group (2.1%) versus 44 events in the standard-therapy group
(1.8%) (hazard ratio, 1.12; 95% confidence interval [CI], 0.75 to 1.68).
Dans cet essai, quel(s) facteur(s) ont pu contribuer à la non-infériorité du rivaroxaban comparativement à la prise en charge conventionnelle pour le critère
principal d’efficacité ?
Il aurait fallu cocher...
Commentaires
La valeur choisie pour la marge de noninfériorité (2,00)
Par exemple, une marge de non-infériorité
choisie à 1,50 n’aurait pas permis de
conclure à la non-infériorité car la borne
supérieure de l’intervalle de confiance
du HR est à 1,68. On voit bien que le
choix que l’on fixe a priori conditionne
en grande partie la conclusion de l’étude.
À noter ici que le choix de la marge de
non-infériorité est très large puisqu’on
tolère un doublement des récidives
thromboemboliques sous rivaroxaban
par rapport à la prise en charge standard
Le risque d’erreur statistique de première
espèce (alpha)
Le risque alpha peut toujours expliquer
en partie un résultat significatif (= du
fait du simple hasard ou = du fait des
fluctuations d’échantillonnage)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Conclusion de l’étude et critique des résultats
Il n’aurait pas fallu cocher...
Un défaut de puissance statistique
Le risque d’erreur statistique de 2e espèce
(bêta)
201
Commentaires
Un défaut de puissance pourrait expliquer
les résultats d’un essai négatif
L’absence d’aveugle à l’origine d’une
fréquence plus élevée de suspicions de
récidives dans le groupe « rivaroxaban »
Une fréquence plus élevée de récidive
dans le groupe « rivaroxaban » serait
en défaveur de la non-infériorité car le
hazard ratio aurait tendance à augmenter
et donc la borne supérieure de son intervalle de confiance pourrait dépasser la
borne de non-infériorité
Une différence de la prévalence de la
thrombophilie connue à l’inclusion entre
les 2 groupes
Il n’y a pas de différence de prévalence
de thrombophilie entre les groupes car
la randomisation a permis d’équilibrer
correctement les patients atteints de
thrombophilie entre les 2 groupes. On
voit ici l’importance du tableau de description des patients après randomisation
dans l’interprétation des résultats
L’utilisation d’un critère composite
associant des événements de gravité
hétérogène
La nature du critère de jugement n’a
aucune influence sur le sens que pourrait
prendre la relation dans un sens ou dans
un autre
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Pa r t ie III
Études de performances
diagnostiques
Pl a n
Fiche 20
Fiche 21
Fiche 22
Performances diagnostiques
Objectifs et méthodologie des études de performance
diagnostique
Courbe ROC et choix d’un seuil
205
219
235
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 20
Performances diagnostiques
En complément
V o us p o u v e z co ns u l t e r c e t t e v i d é o s u r l e s p e r f o r m a n c es d i a g n ost i q u es :
h t t ps: / / y o u t u .b e / m g 7 g Q gs k r Y g
Classement de référence défini par le gold
standard (test de référence)
Malade
Non malade
Total
TEST +
VP = vrais positifs
FP = faux positifs
Nombre total de tests
positifs = VP + FP
TEST -
FN = faux négatifs
VN = vrais négatifs
Nombre total de tests
négatifs = FN + VN
Total
Nombre total de
Nombre total de
sujets malades
sujets non malades
selon le gold
selon le gold
standard = VP + FN standard = FP + VN
VP
Sensibil it é ’v p Tf n
Soit la probabilité qu'un test
soit positif chez un malade
VP
Valeur prédictive positive = \/p+pp
Soit la probabilité qu'un individu soit malade en
cas de test positif
Valeur prédictive négative =
Nombre total de
participants
= VP + FP + FN + VN
VN
\//\j +pn
Soit la probabilité qu'un individu ne soit pas malade
en cas de test négatif
SPéciflcité=ffW
Soit la probabilité qu'un test soit
négatif chez un non-malade
Caract éristiq u es in trinsè q u es du t est = se nsibilit é
e t sp écificité
On parle de performances intrinsèques car la sensibilité et la spécificité ne
dépendent que de la qualité du test et ne sont pas influencées par la prévalence
de la maladie dans la population sur laquelle ce test est appliqué :
• sensibilité (Se) = probabilité d’obtenir un test positif chez un sujet malade
(dénominateur = tous les malades) ;
• spécificité (Sp) = probabilité d’obtenir un test négatif chez un sujet non malade
(dénominateur = tous les non-malades).
Il s’agit donc d’une probabilité comprise entre 0 et 1 souvent exprimée en
pourcentage (de 0 à 100 %).
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
206
Études de performances diagnostiques
Une sensibilité de 0,5 (ou 50 %) signifie que chez une personne malade, le test
a une chance sur deux d’être positif.
Une spécificité de 0,5 (ou 50 %) signifie que chez une personne non malade,
le test a une chance sur deux d’être négatif.
Donc un test ayant une sensibilité et une spécificité de 0,5 est inutile en pratique puisqu’il reviendrait à tirer à pile ou face pour prouver le diagnostic.
Plus le test est de bonne qualité, plus la spécificité et la sensibilité se rapprochent de 1 (ou 100 %).
• Indice de Youden = Se + Sp - 1
Il associe sensibilité et spécificité en une grandeur unique. La sensibilité et
la spécificité étant chacune comprise entre 0,5 et 1, l’indice de Youden peut
prendre des valeurs variant de 0 à 1. Un test « parfait » avec une Se = 1 et une
Sp = 1 a donc un indice de Youden qui vaut 1.
►
Remarques :
■ chez les malades : Se = pourcentage de vrais positifs ; (1 — Se) = pourcentage de faux négatifs ;
■ chez les non-malades : Sp = pourcentage de vrais négatifs ; (1 — Sp) =
pourcentage de faux positifs.
Pour affirmer un diagnostic, on a besoin d’un test spécifique, donc avec peu
de faux positifs. Exemple du signe de Babinsky :
• un signe de Babinsky affirme un syndrome pyramidal ;
• on peut avoir un syndrome pyramidal sans signe de Babinsky ;
• spécificité = taux de vrais négatifs = 100 % : le signe est pathognomonique ;
• taux de faux positifs (1 - Sp) = 0 %.
Pour éliminer un diagnostic, on a besoin d’un test sensible, donc avec peu de
faux négatifs. Exemple du dosage des D-dimères dans l’embolie pulmonaire :
• une embolie pulmonaire a (presque) toujours des D-dimères positifs ;
• on peut avoir des D-dimères positifs en l’absence d’embolie pulmonaire ;
• sensibilité = taux de vrais positifs = 98 % ;
• taux de faux négatifs (1 — Sp) = 2 %.
Plutôt que de faire des formules, pensez D-dimères et Babinsky !
Caract éristiq u es e x trinsè q u es (vale urs pré dictives =
pro b a bilités p ost-t est)
Définition
On parle de caractéristiques extrinsèques car les valeurs prédictives positives
(VPP) et négatives (VPN) sont liées à :
• la qualité propre du test (représentée par la sensibilité et la spécificité) ;
• la probabilité pré-test d’être atteint de la maladie (c’est-à-dire la prévalence
de la maladie).
La VPP et la VPN sont aussi des calculs de probabilités comprises entre 0 et 1
et sont souvent exprimées en pourcentage (entre 0 et 100 %) :
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Performances diagnostiques
207
• VPP = probabilité que le patient soit malade si le test est positif = probabilité
post-test de maladie (dénominateur = tous les tests positifs) ;
• VPN = probabilité que le patient soit indemne si le test est négatif = probabilité post-test d’absence de maladie (dénominateur = tous les tests négatifs).
La VPP et la VPN sont utiles au lit du malade où on ne connaît pas le statut
du patient pour la maladie recherchée mais où l’on dispose des résultats du test
diagnostique.
In flu e nce d e la prévale nce sur les caract éristiq u es
e x trinsè q u es
La sensibilité et la spécificité sont des caractéristiques intrinsèques au test ne
dépendant que de la qualité de celui-ci.
La VPP et la VPN sont quant à elles dépendantes de la qualité du test mais aussi
de la prévalence de la maladie de la population dans laquelle on applique le test.
L’évolution de la VPP et de la VPN en fonction de la prévalence sont représentées dans la figure ci-dessous :
En d’autres termes :
• la VPP augmente quand la prévalence augmente, quel que soit le test : « plus
une maladie est fréquente, plus on a de chances de l’affirmer » ;
• à l’inverse, la VPN augmente quand la prévalence diminue : « plus une maladie est rare, plus on a de chances de l’éliminer » ;
• la VPP et la VPN n’ont de sens que si la prévalence de la maladie au sein de
l’échantillon est la même que la prévalence de la maladie au sein de la population cible.
Estim a t e ur p o nct uel d es caract éristiq u es du t est
e t in t ervalle d e co n fia nce
• Dans l’échantillon d’étude, la sensibilité, la spécificité et les valeurs prédictives du test sont des estimateurs ponctuels de la valeur réelle de ces paramètres
dans la population cible.
• L’intervalle de confiance permet d’interpréter cet estimateur ponctuel.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
208
Études de performances diagnostiques
• Si l’intervalle de confiance des caractéristiques intrinsèques exclut la valeur
50 %, le test est plus performant que le hasard.
• Si l’intervalle de confiance de la VPP (ou de la VPN) exclut la fréquence de
la maladie (ou 1-fréquence de la maladie), le test augmente signifîcativement la
probabilité diagnostique.
• Un test est meilleur que le hasard si :
- ses caractéristiques intrinsèques sont significativement supérieures à 50 % ;
- sa VPP est significativement supérieure à la probabilité pré-test.
Ex e m ple
Vous souhaitez évaluer l’apport d’un nouveau test diagnostique de l’infection
tuberculeuse latente.
Vous décidez d’appliquer ce même test à deux populations différentes en
termes de prévalence de tuberculose.
La prévalence de la population A est de 10 % et la prévalence de la population B est de 50 %.
Vous tirez alors au sort un échantillon de 1 000 personnes dans chaque population pour réaliser votre étude.
Les résultats vous sont présentés ci-dessous :
• Résultats de l’échantillon provenant de la population A (prévalence 10 %) :
T
Malade
Test +
70
Test -
Total
Non malade
Total
90
160
30
810
840
100
900
1 000
z .
nombre total de malades
100
. ~ n/
prevalence —----------------------------------- —------- —10 /o
effectif de l'échantillon
1000
Se =
Sp =
VPP =
70
100
810
900
70
160
= 70 % (IC95 % : 0,67 - 0,73)
= 90 %(IC95 % : 0,88 - 0,92)
= 43,7 % (IC95 % : 0,41 - 0,47)
VPN = — = 96,4 %(IC95 % : 0,95-0,98)
840
Résultats de l’échantillon provenant de la population B (prévalence 50 %) :
T
Test +
Malade
Non Malade
Total
350
50
400
Test -
150
450
600
Total
500
500
1 000
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Performances diagnostiques
prévalence =
nombre total de malades
500
effectif de l’échantillon
1000
209
= 50%
Se = — = 70 % (IC95 % : 0,67 - 0,73)
500
Sp =
4S0
= 90 %(IC95 % : 0,88-0,92)
3S0
VPP = —— = 87,5 %(IC95 % : 0,85-0,90)
400
v
7
450
VPN = — = 75 % (IC95 % : 0,72 - 0,78)
600
k
7
Ce test est relativement performant pour affirmer une tuberculose, car :
• le taux de vrais négatifs (Sp) est de 90 % ;
• le taux de faux positifs est de 10 % (1 — Sp).
Pourtant, dans une population où la tuberculose est rare, la VPP (probabilité
post-test) n’est que de 43,7 %, ce qui est cependant relativement élevé au regard
de la probabilité pré-test de la maladie (10 %).
Ce test est de qualité médiocre pour éliminer une tuberculose car :
• le taux de vrais positifs (Se) n’est que de 70 % ;
• le taux de faux négatifs est élevé (30 %).
Pourtant, dans une population ou la tuberculose est rare, la VPN est de
96,4 %, ce qui est faible au regard de la probabilité pré-test d’absence de maladie (90 %).
Ra p p orts d e vraise m blance (li kelihood ra tio)
Les rapports de vraisemblance (RV) font la synthèse entre la spécificité et la
sensibilité sous la forme d’un même indicateur grâce aux formules suivantes :
Rapport de vraisemblance en cas de test positif :
„TT
sensibilité
% vrais positifs
RV+ =-------- —
= —7------ - ------ ~T
1 - spécificité % fauxs positifs
Le RV+ varie entre 1 et l’infini.
Rapport de vraisemblance en cas de test négatif :
RV- =
1 - sensibilité
% faux négatifs
spécificité
% vrais négatifs
Le RV— varie entre 0 et 1.
On peut envisager l’interprétation du RV comme celle du risque relatif de test
positif en présence de la maladie (RV+) ou d’absence de maladie (RV-). Si on
étudie le lien entre le test et la maladie, entre 0 et 1, si on est indemne, c’est un
« facteur protecteur d’avoir un test positif ». Entre 1 et plus l’infini, la maladie
est un facteur de risque de test positif.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
210
Études de performances diagnostiques
• Probabilité pré-test : probabilité d’avoir la maladie en présence de certains
facteurs (prévalence, signes cliniques, score de prédiction clinique).
• Probabilité post-test : probabilité d’avoir la maladie après résultats du test.
Cela correspond aux valeurs prédictives.
• Un RV à 1 équivaut à une probabilité post-test identique à la probabilité prétest, le test n’apporte aucune information supplémentaire.
• Un RV + > 10 augmente fortement la probabilité post-test d’être atteint de la
maladie en cas de test positif, c’est-à-dire augmente la VPP.
• Un RV— <0,1 diminue fortement la probabilité post-test d’être atteint de la
maladie en cas de test négatif, c’est-à-dire augmente la VPN.
RV-
RV+
< 0,1
Excellente performance pour éliminer une maladie
0,1-0,2
Performances modérées
> 0,2
Performances médiocres
> 10
Excellente performance pour affirmer une maladie
5-10
Performances modérées
<5
Performances médiocres
Exemple 1. Reprenons l’exemple du test de dépistage de la tuberculose évoqué
plus haut (voir p. 144), qui avait une sensibilité de 0,7 et une spécificité de 0,9 :
• un RV+ de 0,7/(l — 0,9) = 7,0 (performance modérée pour affirmer un diagnostic) ;
• un RV- de (1 - 0,7)/0,9 = 0,33 (performance médiocre pour éliminer un
diagnostic).
Exemple 2. Prenons l’exemple du dosage des D-dimères dans l’embolie pulmonaire, le RV+ est faible (entre 1,5 et 2) et le RV- est fort (< 0,1). En pratique, cela signifie que c’est un excellent examen pour rejeter le diagnostic s’il
est négatif, mais un très mauvais pour l’affirmer s’il est positif :
• probabilité pré-test faible dans le cas d’une patiente de 50 ans sans facteur de
risque particulier et sans antécédents, consulte aux urgences pour une douleur
thoracique non spécifique :
- D-dimères négatifs : probabilité post-test quasi-nulle -> diagnostic réfuté,
- D-dimères positifs : probabilité post-test non modifiée et qui reste donc
toujours faible ;
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Performances diagnostiques
211
• probabilité pré-test élevée dans le cas d’une patiente de 70 ans hospitalisée en
chirurgie orthopédique suite à la pose d’une prothèse de hanche, douleur basithoracique brutale, dyspnéique, tachycardie, auscultation pulmonaire normale :
- D-dimères négatifs : probabilité post-test fortement diminuée,
- D-dimères positifs : probabilité post-test non modifiée mais qui reste toujours élevée, ne permet pas d’affirmer le diagnostic.
N o m o gra m m e d e Fa g an
Il permet la détermination de la valeur prédictive (probabilité post-test) à partir
de la prévalence (probabilité pré-test) et du rapport de vraisemblance, par lecture graphique.
La probabilité post-test donnée à droite est :
• la VPP si on passe par le RV+ ;
• 1-VPN (c’est-à-dire la probabilité de maladie si le test est moins) si on passe
par RV-.
Nomogramme permettant d'utiliser le rapport de vraisemblance pour obtenir la valeur
prédictive positive d’un examen diagnostique en fonction des données
de prévalence.
Prévalence
Rapport de
vraisemblance
Valeur
prédictive
Nomogramme permettant d’utiliser le rapport de vraisemblance pour obtenir la
valeur prédictive positive d’un examen diagnostique en fonction des données de
prévalence et des caractéristiques informationnelles intrinsèques.
Source : Fagan TJ. Nomogram for Baye’s theorem. N Engl J Med 1975; 293(5): 257.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
212
Études de performances diagnostiques
Si on applique notre exemple du test antituberculeux sur le nomogramme de
Fagan ci-dessus, on note l’influence de la prévalence sur la valeur prédictive :
• en cas de probabilité pré-test (prévalence) de 10 % et de RV+ de 7, une
probabilité post-test de 43 % (VPP de 43 %) : flèche en pointillé ;
• en cas de probabilité pré-test de tuberculose (prévalence) de 50 % et de
RV- de 0,33, une probabilité post-test de maladie si le test est négatif de 25 %
(1-VPN : 25 %) : flèche pleine.
En pra tique
Ex e m ple 1 (ED N 2018)
Perrotti A, Chenevier-Gobeaux C, Ecarnot F, Bardonnet K, Barrucand B,
Flicoteaux G, Lassalle P, Chocron S. Is endocan a diagnostic marker for
pneumonia after cardiac surgery? The ENDOLUNG Study. Ann Thorac
Surg 2017; 105(2): 535-41.
Ce tableau est issu d’une étude de performances diagnostiques évaluant l’intérêt
du dosage d’une endotoxine, l’endocan, pour le diagnostic de pneumopathie
de réanimation après une chirurgie cardiaque. Le dosage était réalisé avant la
chirurgie et 6 heures après :
Endocan Preop
Endocan 6H
Sensitivity
65%
71%
Specificity
72%
75%
Cut off
3.7 ng/mL
12.1 ng/mL
Quelle information manque pour l’interprétation des estimations ponctuelles
des caractéristiques informationnelles intrinsèques de l’endocan dans le tableau
ci-dessus ?
Il aurait fallu cocher...
Commentaires
Les intervalles de confiance à 95 %
C’est l’information indispensable pour comparer les performances intrinsèques au hasard,
c’est-à-dire à 50 %
Il n’aurait pas fallu cocher...
Commentaires
Les écarts types
Cette information pourrait être utile, mais ne
permet pas de vérifier que la sensibilité et la
spécificité sont significativement supérieures à
50 %
Les rapports de vraisemblance du
test positif
Cette affirmation ne répond pas à la question
posée
La prévalence de la pneumonie
postopératoire
Les caractéristiques intrinsèques ne sont pas
dépendantes de la prévalence
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Performances diagnostiques
213
Il n’aurait pas fallu cocher...
Commentaires
Les valeurs prédictives négatives
La proposition est de toute façon hors sujet
puisqu’on discute des performances intrinsèques
Une concentration d’endocan inférieure à 12,1 ng/mL à la 6e heure postopératoire a une faible valeur décisionnelle pour le diagnostic d’exclusion de la
pneumonie postopératoire car :
Il aurait fallu cocher...
Commentaires
La sensibilité est de 71 %
Pour exclure un diagnostic, il faut un
test sensible (voir plus haut l’exemple du
dosage des d-dimères). Les auteurs de la
question partent du postulat que ce test
n’est pas utile pour éliminer un diagnostic, ils considèrent donc que la sensibilité
est trop faible
Le taux de faux négatif est de 29 %
Pour exclure un diagnostic, il faut un
faible taux de faux négatifs, ce qui veut
dire exactement la même chose qu’une
forte sensibilité
Il n’aurait pas fallu cocher...
Commentaires
Le rapport de vraisemblance négatif est
inférieur à 0
Un rapport de vraisemblance ne peut pas
prendre une valeur inférieure à 0
Le taux de faux positifs est de 25 %
Le taux de faux positifs (1 — Sp) est
en effet de 25 %, mais ce n’est pas un
argument pour dire que le test n’est pas
utile pour exclure un diagnostic
La spécificité est de 75 %
Cette proposition est fausse car on ne
s’intéresse pas à la spécificité, mais à la
sensibilité
Une concentration d’endocan supérieure ou égale à 12,1 ng/mL à la 6e heure
postopératoire a une faible valeur décisionnelle pour le diagnostic positif de
pneumonie postopératoire car :
Il aurait fallu cocher...
Commentaires
La spécificité est de 75 %
Pour affirmer un diagnostic, il faut
un test spécifique, comme le signe de
Babinsky. Si les auteurs partent du postulat que le test est peu utile, l’argument
est une faible spécificité
Le taux de faux positifs est de 25 %
Le taux de faux positifs vaut 1 — Sp. Il
est trop important pour que l’on puisse
utiliser le test pour affirmer le diagnostic
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
214
Études de performances diagnostiques
Il n’aurait pas fallu cocher...
Commentaires
Le taux de faux négatif est de
29 %
Le taux de faux négatif (1 — Se) est bien de
29 %, mais ce n’est pas un argument pour ne pas
utiliser le test pour exclure un diagnostic
Le rapport de vraisemblance
positif ne peut pas être calculé
Il peut être calculé (sensibilité/1 - Sp) = 2,84, ce
qui indique bien une performance médiocre
La sensibilité est de 71 %
La faible sensibilité est un argument en faveur de
la médiocrité du test pour éliminer un diagnostic
Ex e m ple 2 (ED N 2019)
Kumar P, Mardon M, Bradley M, Gray G, Swinkels A. Assessment of
glenohumeral subluxation in poststroke hemiplegia: comparison between
ultrasound and fingerbreadth palpation methods. Phys Ther 2014; 94(11):
1622-31.
Flow diagram illustrating comparison between the ultrasound method and
the fingerbreadth palpation method based on cut-off point of >0.2 cm
acromion-greater tuberosity différence. GHS = glenohumeral subluxation.
Glenohumeral subluxation (GHS) is a common poststroke complication.
Treatment of GHS is hampered by the lack of objective, real-time clinical
measurements.
The aims of this study were: (1) to compare an ultrasound method of GHS
measurement with the fingerbreadth palpation method using a receiver operating characteristic curve (ROC) and (2) to report the sensitivity and specificity
of this method. A prospective study was conducted. The study was conducted
in local hospitals and day centers in the Southwest of England.
One hundred five patients who had one-sided weakness following a first-time
stroke (51 men, 54 women; mean âge 71 years, SD 11) and who gave informed
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Performances diagnostiques
215
consent were enrolled in the study. Ultrasound measurements of acromion-greater
tuberosity (AGT) distance were used for the assessment of GHS. Measurements
were undertaken on both shoulders by a research physical therapist trained in
shoulder ultrasound with the patient seated in a standardized position. Fingerbreadth palpation assessment of GHS was undertaken by a senior clinical physical therapist based at the hospital, who also visited the day centers.
À partir de la figure ci-dessus, quels paramètres pourrait-on estimer concernant
la procédure échographique par comparaison à l’examen clinique par palpation ? (Une ou plusieurs réponses possibles.)
Il aurait fallu cocher...
Commentaires
La sensibilité et la spécificité
Si l’on considère la palpation clinique comme l’examen de référence, on pouvait reconstituer à partir
de ce diagramme de flux le nombre de vrais positifs,
faux positifs, vrais négatifs et faux négatifs de l’échographie, on pouvait donc calculer les performances
intrinsèques et extrinsèques
La valeur prédictive positive
et la valeur prédictive
négative
La prévalence de la subluxation glénohumérale en postaccident vasculaire cérébral
Si l’on considère cet échantillon comme représentatif,
et l’examen clinique comme l’examen de référence,
on peut calculer la prévalence comme le taux de
positifs selon l’examen clinique
Le pourcentage de patients
non évaluables
Le nombre de patients non évaluables est nul,
compte tenu des données de ce graphique (tous les
patients inclus sont évalués)
Il n’aurait pas fallu cocher...
Commentaires
L’aire sous la courbe ROC
(AUROC)
La légende de la figure de l’exemple 2 indique que
cette figure est donnée pour un cut-off de 0,2 cm,
on ne peut donc calculer qu’une sensibilité et une
spécificité pour ce cut-off et non pas une valeur pour
chaque cut-off
Sensitivity and Specificity With 95 % Cl for Ultrasound Method (AGT Distance
Measurement Différence Between Affected and Unaffected Shoulders )a.
Cut-off
Point
Sensitivity
95% CI
Specificity
95% CI
>0.5
40%
28%, 52%
89%
73%, 96%
>0.4
47%
33%, 57%
83%
69%, 95%
>0.3
55%
39%, 63%
74%
62%, 91%
>0.2
68%
51%, 75%
62%
47%, 80%
>0.1
76%
57%, 80%
50%
38%, 73%
a 95% CI = 95% confidence interval, AGT = acromion-greater tuberosity.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
216
Études de performances diagnostiques
Dans cette étude, par comparaison à l’examen clinique par palpation (tableau
ci-dessus ; une ou plusieurs réponses possibles) :
Commentaires
Il aurait fallu cocher...
68 % des patients avec une subluxation glénohumérale ont une mesure échographique > 0,2 cm
C’est la définition de la
sensibilité
38 % des patients sans subluxation glénohumérale
ont une mesure échographique > 0,2 cm
C’est le taux de faux positifs
qui est décrit ici, soit 1 — Sp
La probabilité d’une mesure échographique < 0,2 cm
en l’absence de subluxation glénohumérale n’est pas
significativement supérieure à 50 %
L’intervalle de confiance
à 95 % de la spécificité
comprend la valeur 50 %
Le taux de faux négatifs est de 24 % pour le seuil >
0,1 cm
Le taux de faux négatifs est
bien de 1 — Se
Commentaires
Il n’aurait pas fallu cocher...
La probabilité de subluxation glénohumérale
est de 68 % si la mesure échographique est
> 0,2 cm
C’est la définition de la VPP, qui
n’est pas donnée dans le tableau
ci-dessus
62 % des subluxations glénohumérales ont une
mesure échographique > 0,2 cm
C’est la définition de la sensibilité, qui est de 68 % pour ce seuil
Le diagnostic de subluxation glénohumérale est
confirmé dans 62 % des cas si la mesure échographique est > 0,2 cm
C’est la définition de la VPP qui
n’est pas donnée ici
Les auteurs rapportent un coefficient de corrélation de Pearson égal à 0,52 entre
la mesure échographique et la mesure clinique (P < 0,001).
Ce résultat {une ou plusieurs réponses possibles) :
Il aurait fallu cocher...
Commentaires
Suggère que la corrélation entre les deux
mesures ne résulte pas de fluctuations
d’échantillonnage
En effet, le coefficient de corrélation
linéaire est significativement supérieur
àO
Il n’aurait pas fallu cocher...
Commentaires
Reflète le fait que les deux
méthodes mesurent la même
distance
On peut parfaitement corréler la mesure de deux
paramètres différents avec un coefficient de corrélation, sans préjuger qu’ils évaluent la même chose
(corrélation taille/poids, par exemple)
Objective une concordance
élevée entre les deux mesures
La concordance indique que les deux mesures sont
égales (ou concordantes). Cette notion est mesurée
par le coefficient kappa (pour deux variables qualitatives) ou un coefficient de corrélation intraclasse
(pour deux variables quantitatives)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Performances diagnostiques
217
Il n’aurait pas fallu cocher...
Commentaires
Montre que 52 % des valeurs
sont concordantes entre les
deux méthodes
Ce n’est pas la signification du coefficient de corrélation linéaire (corrélation concordance). Voir
fiche 5 pour plus d’information sur la corrélation et
la concordance
Montre que 52 % de la
variabilité de la mesure
échographique est expliquée
par la variabilité de la mesure
clinique
Le pourcentage de variabilité expliquée correspond
au coefficient de corrélation au carré (R2)
►
Remarque : le coefficient de corrélation linéaire n’est pas un indicateur
de performance diagnostique. C’est la racine carrée de la part de variabilité de la mesure échographique expliquée par la mesure clinique, si
la relation entre les deux est linéaire. Un coefficient de corrélation à 0
indique l’absence de relation (ou une relation non linéaire). Un coefficient de corrélation à 1 indique une relation linéaire avec une équation de
type y = ax + b. La p-value associée au coefficient teste l’hypothèse (le
coefficient de corrélation est égal à 0). Ici, cette hypothèse est rejetée
avec un risque d’erreur < 0,001. Donc, le coefficient de corrélation est
significativement supérieur à 0.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 21
Objectifs et méthodologie
des études de performance
diagnostique
Principe
On cherche à évaluer la validité d’un test ou examen diagnostique dont l’objectif est de classer les sujets en malades ou non malades.
Ce test peut prendre la forme d’une question, d’un signe clinique ou, le plus
souvent dans le cadre des études de performance diagnostique, d’un examen
complémentaire.
Il est également possible d’évaluer des scores diagnostiques combinant plusieurs tests (ex. : taux de D-dimères + douleur thoracique + signes cliniques de
thrombose veineuse profonde pour faire le diagnostic d’embolie pulmonaire).
Le test idéal est théoriquement :
• non invasif ;
• peu coûteux ;
• très sensible et très spécifique.
Ty p es d e t ests
On distingue les tests qualitatifs des tests quantitatifs.
Tests qualitatifs (qualitative tests)
Il s’agit le plus souvent de tests binaires (positif/négatif) qui classent le sujet en
malade ou non malade. Exemple : bandelette urinaire positive en leucocytes
pour poser le diagnostic d’infection urinaire.
Tests quantitatifs (quantitative tests)
Ils sont fondés sur le calcul d’une moyenne et nécessitent donc la détermination
d’un seuil pour classer le patient en malade/non malade. Exemple : mesure
quantitative du taux de D-dimères pour le diagnostic d’embolie pulmonaire.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
220
Études de performances diagnostiques
La variation du seuil entraîne une variation de la sensibilité et de la spécificité.
Par exemple, on évalue la mesure de la C-reactive protein (CRP) pour diagnostiquer une infection :
• dans le cas du choix d’un seuil très bas (par exemple 8 mg/L), la CRP est
un marqueur très sensible mais peu spécifique. Il est très sensible car tous les
patients infectés auront un test positif, mais il est peu spécifique car beaucoup
de patients non infectés auront également un test positif ;
• dans le cas d’un seuil très haut (par exemple 400 mg/L), la CRP est un marqueur peu sensible mais très spécifique. Il est peu sensible car beaucoup de
patients vraiment infectés auront un test négatif, mais il est très spécifique car
beaucoup de patients non infectés auront également un test négatif.
O bjectifs du t est
Principe
Dans l’idéal, un test doit être le plus acceptable possible par la société et par
le patient (peu coûteux et non invasif), avec une sensibilité et une spécificité
les meilleures possibles. Mais comme le test idéal n’existe pas, il est nécessaire
de faire quelques concessions en fonction de l’objectif final du test. Il est donc
essentiel de déterminer si le test est évalué dans un objectif de dépistage ou dans
un objectif de diagnostic avant d’analyser les résultats de ce type d’étude.
Tests de dépistage (screening tests)
• Ce sont des tests appliqués chez des sujets sains ne présentant aucun symptôme. On utilise donc généralement ces tests à un nombre important de sujets
(ex. : test immunologique de recherche de sang dans les selles pour le dépistage
de masse du cancer du côlon).
• Acceptabilité : ils doivent être faciles à accepter pour les patients (peu invasifs)
et faciles à accepter pour la société (peu coûteux).
• Performances diagnostiques :
- sensibilité élevée : l’objectif est de ne pas ignorer un sujet véritablement
atteint par la maladie. Le nombre de faux négatifs doit donc être faible ;
- la forte sensibilité est au prix d’une faible spécificité : un test peu spécifique comporte de nombreux faux positifs, mais cela n’est pas grave car ils
seront reclassés correctement par un test diagnostique plus spécifique dans un
second temps (coloscopie par exemple).
Tests diagnostiques (diagnosis tests)
• Ce sont des tests appliqués à des personnes malades présentant des symptômes. On utilise donc généralement ces tests à un nombre restreint de sujets.
• Acceptabilité : on accepte que le test soit plus invasif et qu’il soit plus cher car
l’on suspecte fortement la maladie dans cette situation.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Objectifs et méthodologie des études de performance diagnostique
221
• Performances diagnostiques : la spécificité est cette fois-ci plus élevée. L’objectif est de confirmer le diagnostic chez les sujets vraiment malades, le nombre de
faux positifs doit donc être faible.
Schéma d’une étude de performance diagnostique.
D éfinitio n d e la p o p ula tio n so urce
Cette étape vise à limiter le biais de sélection = échantillon non représentatif de
la population source ou population source non représentative de la population
cible (voir fiche 2).
Dans une étude de performance diagnostique, le biais de sélection pose deux
problèmes :
• la difficulté d’extrapoler les résultats à la population cible ;
• la modification potentielle de la probabilité pré-test, qui change considérablement les valeurs prédictives du test (voir fiche 20).
La sélection des cas suspects peut impliquer un score de probabilité clinique
(comme le score de Wells pour la thrombose). Dans l’idéal, la population source
est celle à laquelle on va appliquer le test, par exemple « l’ensemble des patients
se présentant aux urgences pour une douleur thoracique ».
Test d e ré f ére nce (g old st an d ard)
Afin d’évaluer les performances d’un test, il faut adjudiquer (valider) le statut
des sujets (malades ou non malades) par l’application d’un test de référence
(gold standard). Le gold standard classe les patients en malades ou non malades
dans le cadre de l’étude, sa nature détermine donc les performances diagnostiques des examens évalués.
Le gold standard choisi doit être le meilleur test disponible selon les connaissances actuelles.
Parfois, il n’existe pas d’examen de référence ou il n’est pas réalisable en
pratique (autopsie pour la maladie de Creutzfeldt-Jakob, par exemple). Dans
ce cas, on a parfois recours à un comité d’experts ou à un expert qui adjudique
ou non la maladie en fonction de l’ensemble des éléments cliniques et paracliniques à disposition (sauf l’examen évalué idéalement).
L’examen de référence doit être évalué en aveugle du test réalisé quand cela
est possible. Par exemple, on cherche à évaluer les performances diagnostiques
de l’échographie pour le diagnostic de grossesse en considérant l’hormone
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
222
Études de performances diagnostiques
chorionique gonadotrophique (ou P-HCG) comme examen de référence.
L’échographie doit être réalisée en aveugle des résultats de P-HCG, sans
quoi les performances de celle-ci seront artificiellement améliorées (risque de
recherche moins attentive si P-HCG négative et plus poussée si P-HCG positive).
Attention : réaliser l’examen « en aveugle » du gold standard ne fait pas de
l’étude une étude en double aveugle ! Cette terminologie est réservée aux essais
cliniques.
L’examen de référence doit être réalisé chez tous les patients inclus pour le
calcul de la sensibilité et de la spécificité. C’est la seule manière de classer les
patients en vrais positifs (VP), vrais négatifs (VN), faux positifs (FP), faux négatifs (FN).
L’examen de référence doit être réalisé dans des conditions standardisées,
c’est-à-dire reproductibles et identiques pour tous les patients.
Par définition, on ne peut pas calculer la sensibilité et la spécificité de l’examen de référence dans une étude de performance diagnostique, puisqu’il s’agit,
pour cette étude, de « la vérité », c’est-à-dire de la définition des malades et
non-malades.
►
Remarque : certaines études pilotes sont parfois réalisées uniquement
chez les malades (positifs au gold standard), on peut alors obtenir les VP,
FN, et les malades (VP + FN). On peut donc calculer la sensibilité :
VP/(VP + FN), mais pas la spécificité ni les valeurs prédictives. Si on
applique le test seulement aux non-malades, on peut obtenir les VN, FP et
les non-malades (VN +FP), calculer la spécificité : VN/(VN + FP) mais pas
la sensibilité ni les valeurs prédictives.
A p plica tio n du t est é t u dié, n o tio n de
re pro d uctibilité (ou fia bilit é)
Pour calculer la sensibilité et la spécificité, il est indispensable d’appliquer le test
gold standard et le test étudié à tous les sujets.
Avant d’étudier la sensibilité et la spécificité, il est souhaitable de connaître la
reproductibilité (fiabilité ou reliability) du test :
• reproductibilité inter-observateur dnter~rater) : Ie test administré au même
patient par deux observateurs différents aura-t-il le même résultat ?
• reproductibilité intra-observateur dntra~rater) : Ie test administré au même
patient par le même observateur à deux moments différents aura-t-il le même
résultat ?
L’outil statistique de la reproductibilité est :
• pour les tests qualitatifs (scanner positif/négatif, douleur thoracique oui/non,
etc.), le coefficient kappa (k ) de concordance :
- k = 0 si la concordance entre les deux mesures est juste liée au hasard,
- K = 1 si le ou les observateurs sont d’accord pour toutes les mesures,
- On donne habituellement les valeurs suivantes :
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Objectifs et méthodologie des études de performance diagnostique
<0
223
Désaccord plus important que le hasard
0,0-0,20
Accord très faible
0,21-0,40
Accord faible
0,41-0,60
Accord modéré
0,61-0,80
Accord fort
0,81-1,00
Accord presque parfait
• pour les tests quantitatifs (taux de CRP, valeur de la troponine, clairance de la
créatinine, etc.), le coefficient de corrélation intra-classe : il s’agit d’une mesure
entre 0 et 1. Un coefficient de corrélation intraclasse à 1 indique une relation de
type y = x entre les deux mesures.
La reproductibilité est améliorée par la standardisation des conditions de
passation du test : les consignes définissant les modalités de réalisation et
d’interprétation du test doivent être définies, précises et les mêmes pour tous les
patients inclus dans l’étude.
Les données sur la reproductibilité (fiabilité OU reliability) sont indispensables,
car un test peu reproductible a une erreur de mesure qui parasite les performances
diagnostiques et n’est pas applicable en pratique.
E n p r a t iq u e
Ex e m ple 1 (ED N 2018)
Perrotti A, Chenevier-Gobeaux C, Ecarnot F, Bardonnet K, Barrucand B,
Flicoteaux G, Lassalle P, Chocron S. Is endocan a diagnostic marker for
pneumonia after cardiac surgery? The ENDOLUNG Study.
Ann Thorac Surg 2017 ; 105(2) : 535-41.
Introduction
The development of postoperative pneumonia is a frequent complication after
cardiac surgery and is associated with increased in-hospital morbidity and
mortality.
Cardiac surgery and cardiopulmonary bypass trigger an acute and nonspecific
inflammatory reaction. In this context, the diagnosis of infection is challenging, because conventional clinical and biological signs may be misleading.
Early détection of postoperative pneumonia makes it possible to initiate
appropriate therapy more quickly in these patients.
Recent studies hâve underlined the usefulness of endocan as an early predictor
of acute lung injury or respiratory failure after major trauma and in septic
shock patients. The aim of the présent study was to assess whether endocan
can be used as a diagnostic marker for postoperative pneumonia in patients
undergoing cardiac surgery.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
224
Études de performances diagnostiques
The aim of the présent study was to assess whether endocan can be used as a diagnostic marker for postoperative pneumonia in patients undergoing cardiac surgery.
Methods
The prospective Endocan Prédictive Value in Postcardiac Surgery Acute
Respiratory Failure (ENDOLUNG) study was conducted in the Department
of Cardiac Surgery of Besançon University Hospital between January and
July 2016.
The inclusion criteria were adult patients (aged more than 18 years) scheduled to undergo cardiac surgery and who provided written informed consent.
Exclusion criteria were patients aged less than 18 years; emergency surgery;
patients with ongoing pulmonary infection, inflammation, or cancer; pregnancy; patient refusai; and adults under legal protection.
Blood samples for endocan measurements were collected in 5 mL ethylenediaminetetraacetic acid tubes at five timepoints, namely, at induction of general
anesthésia (baseline), and at 6, 24, 48, and 72 hours after the end of surgery. Procalcitonin (PCT)and C-reactive protein (CRP) collected at 24 and
72 hours after the end of surgery.
The diagnosis of postoperative pneumonia was suspected on the basis of new
détection of lung infiltrâtes on chest radiograph associated with at least two of the
following features : fever more than 38.8 °C; leukocytosis (> 11,000 cells/mm3)
or leucopenia (< 3,000 cells/mm3); or purulent sécrétion; and confirmed by microbiologie analysis using bronchoalveolar lavage with fiber-optic bronchoscopy.
Results
Endocan, Procalcitonin, and C-Reactive Protein Levels in Study Population at
Different Measurement Timepoints.
Variable
Total
POP Group
No-POP Group
p Value
Endocan, ng/mL
Preoperative
3.9 ±2.9
5.3 ± 3.6
3.8 ±2.8
0.030
6 hours
10.5 ± 7.9
142 ± 9.4
10.0 ± 7.6
0.013
24 hours
10.9 ± 9.4
14.6 ± 11.7
10.5 ±9.0
0.065
48 hours
8.2 ± 6.5
10.7 ± 7.8
7.9 ± 6.3
0.083
72 hours
7.1 ±4.9
8.6 ±5.9
6.9 ± 4.9
0.154
24 hours
1.1 ±22
1.9 ±2.3
1.0 ±2.1
0.078
72 hours
1.0 ±2.4
1.9 ± 1.8
0.9 ± 2.4
<0.01
7.2 ± 13.5
12.7 ± 18.4
6.5 ± 12.7
0.012
24 hours
153.6 ±52.6
192.3 ± 57.4
148.7 ± 50.1
0.003
72 hours
225.5 ± 68.6
275.1 ±52.9
220.0 ± 68.2
0.004
Procalcitonin, ng/mL
C-reactive protein, mg/L
Preoperative
Values are mean ± SD. Endocan preoperative (n = 155), 6 hours (n = 155), 24 hours (n = 155), 48 hours
(n = 149), 72 hours (n = 141) ; procalcitonin 24 hours (n = 147), 72 hours (n = 137) ; C-reactive protein
preoperative (n = 149), 24 hours (n = 150), 72 hours (n = 140).
POP = postoperative pneumonia.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Objectifs et méthodologie des études de performance diagnostique
225
Le rationnel de cette étude repose sur le fait que :
Il aurait fallu cocher...
La concentration d’endocan est
prédictive d’atteinte respiratoire aiguë
dans le choc septique
Commentaires
L’ensemble des propositions ci-contre
sont formulées dans l’introduction
Le diagnostic précoce de pneumonie
postopératoire permettrait de raccourcir
le délai d’initiation de l’antibiothérapie
Les tests biologiques diagnostiques
actuellement disponibles peuvent être
mis en défaut dans les 2 premiers jours
postopératoires
La pneumonie postopératoire est une
complication fréquente de la chirurgie
cardiaque
La concentration d’endocan dans le sang
circulant augmente en cas de sepsis
Il n’aurait pas fallu cocher...
Commentaires
L’endocan est un marqueur prédictif
avéré de la pneumopathie infectieuse
postopératoire d’une chirurgie cardiaque
C’est un des buts de cette étude de le
démontrer
L’endocan est un marqueur qui
permettrait d’orienter le type
d’antibiothérapie probabiliste en cas
d’atteinte pulmonaire au cours du choc
septique ou après un traumatisme
Aucun élément de l’introduction ne
permet de faire cette affirmation
Il s’agit d’une étude :
H aurait fallu cocher...
Commentaires
Diagnostique
Cette étude a pour objectif d’évaluer les
performances diagnostiques de l’endocan,
c’est donc une étude de performance
diagnostique
De cohorte prospective
L’étude est longitudinale (suivi des
patients dans le temps avec plusieurs
mesures) et prospective. C’est donc bien
une étude de cohorte
Unicentrique
L’étude est bien conduite dans un seul
service
Longitudinale
Les patients sont suivis de la chirurgie à
la survenue (ou pas) d’une pneumopathie
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
226
Études de performances diagnostiques
Il n’aurait pas fallu cocher...
Commentaires
Randomisée
Les groupes « POP » et « no-POP » sont
autodéterminés, il n’y a évidemment pas
de randomisation
Transversale
L’étude est longitudinale
De type cas-témoins
Une étude cas-témoins est par nature
rétrospective
La population cible de l’étude est constituée de patients adultes avec :
Il aurait fallu cocher...
Une chirurgie cardiaque programmée
Il n’aurait pas fallu cocher...
Commentaires
La population cible est la population
à laquelle on souhaite appliquer les
résultats. L’inclusion de tous les
patients majeurs bénéficiant de
chirurgie cardiaque et l’utilisation d’un
prélèvement à l’induction anesthésique
indiquent clairement que l’étude a
pour objet d’évaluer les performances
diagnostiques de l’endocan pour prédire
une pneumopathie bactérienne chez tous
les patients bénéficiant d’une chirurgie
programmée, et pas seulement ceux pour
lesquels une pneumopathie est suspectée
à l’issue de la chirurgie
Commentaires
Une suspicion de pneumonie
postopératoire au décours d’une
chirurgie cardiaque programmée
Non. L’objectif d’utiliser l’endocan
comme un marqueur prédictif de
pneumopathie indique bien que la
population cible est plus large
Une valeur anormale d’endocan à la 6e
heure postopératoire d’une chirurgie
cardiaque programmée
Les patients inclus n’ont pas tous un
endocan anormal à la 6e heure
Une pneumonie postopératoire confirmée
au décours d’une chirurgie cardiaque
programmée
Les patients inclus n’ont pas tous une
pneumopathie
Une valeur normale d’endocan avant une
chirurgie cardiaque programmée
Ce n’est pas un critère d’inclusion
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Objectifs et méthodologie des études de performance diagnostique
227
Les tests diagnostiques de pneumonie postopératoire évalués dans cette étude
incluent :
Il aurait fallu cocher...
Commentaires
La concentration sanguine de la
C-reactive protein mesurée à la 24e heure
postopératoire
Nous considérons qu’un test est évalué
à partir du moment où il a été confronté
à l’examen de référence. Ces trois
propositions répondent à cette définition
(le tableau de l’exemple 1 les compare
entre les groupes « POP » et « no-POP »
définis par l’examen de référence)
La concentration sanguine d’endocan
mesurée à la 6e heure postopératoire
La concentration sanguine de la
procalcitonine mesurée à la 24e heure
postopératoire
H n’aurait pas fallu cocher...
La radiographie pulmonaire
L’analyse microbiologique
du liquide de lavage
broncho-alvéolaire
Commentaires
Gold standard = infiltrats radiologiques + 2
critères parmi : fièvre, hyperleucocytose ou
leucopénie, sécrétion purulente avec confirmation
bactériologique
La radiographie pulmonaire et le lavage
broncho-alvéolaire font partie de l’examen de
référence, ce ne sont donc pas des tests évalués
Dans cette étude, il manque une comparaison des performances en discrimination de l’endocan à celles :
Il aurait fallu cocher...
De la procalcitonine (PCT)
De la C-reactive protein (CRP)
Commentaires
Il serait intéressant de comparer l’AUC (area
under curve) de la courbe ROC (receiver
operating characteristic) obtenue avec l’endocan
avec celles des autres marqueurs habituellement
utilisés pour le diagnostic de pneumopathie
postopératoire, comme la CRP et la PCT afin
d’évaluer l’apport de ce marqueur
Il n’aurait pas fallu cocher...
Commentaires
Des hémocultures réalisées en
préopératoire
Les hémocultures en périopératoire ne répondent
pas tout à fait au même objectif : « diagnostiquer
précocement une pneumopathie »
D’un modèle de prédiction
clinique
L’existence d’un modèle de prédiction clinique
(score permettant d’évaluer la probabilité clinique
de pneumopathie postopératoire) n’est pas
évoquée dans l’article
De l’analyse microbiologique
du liquide de lavage
broncho-alvéolaire
L’analyse du lavage broncho-alvéolaire fait partie
de l’examen de référence et ne peut pas à ce titre
être comparé à l’endocan
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
228
Études de performances diagnostiques
Quelle(s) information(s) manque(nt) à la description de la stratégie pour établir
le diagnostic de référence de pneumonie postopératoire ?
Il aurait fallu cocher...
Commentaires
L’adjudication par un comité
indépendant
Compte tenu de l’implication de l’équipe de cette
étude monocentrique dans cette recherche, il
serait en effet souhaitable que le gold standard
soit évalué par un comité indépendant de l’étude,
afin de garantir l’objectivité de l’évaluation de
l’examen de référence. Cette information n’est pas
donnée dans le texte
L’expertise par plusieurs
évaluateurs
Des variations inter-observateur possibles de
l’évaluation de l’existence d’une pneumopathie
(subjectivité de la lecture de l’imagerie par exemple)
pourraient justifier l’expertise par plusieurs
observateurs
L’adjudication en aveugle de
la concentration sanguine
d’endocan
Il est indispensable que l’évaluation de l’examen
de référence soit faite en aveugle de l’examen
évalué (endocan), ce qui n’est pas précisé dans le
texte
La durée de suivi des patients
La durée de suivi des patients est une information
indispensable. Il n’est pas précisé jusqu’à quelle
date après la chirurgie une pneumopathie
était prise en compte. Cette information est
pourtant capitale, car il est clair que plus les
événements tardifs sont pris en compte, plus les
performances diagnostiques des marqueurs sont
mauvaises
Il n’aurait pas fallu cocher...
Commentaires
L’adjudication en aveugle de
la concentration sanguine de
C-reactive protein (CRP)
La CRP fait partie des examens réalisés en routine
appartenant à l’arsenal diagnostique à disposition
des cliniciens pour effectuer le diagnostic de
pneumopathie. Le test principalement évalué
dans cette étude étant l’endocan, il ne semblait
pas indispensable ou légitime que le diagnostic de
pneumopathie soit retenu en aveugle de la CRP ou
de la procalcitonine
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Objectifs et méthodologie des études de performance diagnostique
>
229
Ex e m ple 2 (ED N 2019)
Kumar P, Mardon M, Bradley M, Gray G, Swinkels A. Assessment of glenohumeral
subluxation in poststroke hemiplegia: comparison between ultrasound
and fingerbreadth palpation methods. Phys Ther 2014 ; 94(11) : 1622-31.
Introduction
Glenohumeral subluxation (GHS) is a common poststroke complication. The
aims of this study were: (1) to compare an ultrasound method of Glenohumeral subluxation (GHS) measurement with the fingerbreadth palpation method
using a receiver operating characteristic curve (ROC) and (2) to report the
sensitivity and specificity of this method.
The fingerbreadth palpation method lacks the sensitivity to detect early signs
of GHS or minor subluxations.
There is a concern that without treatment, subluxation can progress to an
uncorrectable level over time. Radiographs are considered to be objective and
hâve high reliability and validity, but problems relating to cost, time involved,
and risks inhérent to exposure to radiation limit their utility in the clinical
setting.
The ultrasound method is currently being investigated and developed for
the assessment of GHS in these patients; however, it is not routinely used in
clinical settings.
Methods
Using a large, static ultrasound machine, a study reported high intrarater
reliability (intraclass corrélation coefficient [ICC] = .979) of ultrasound measurements of GHS.
Patients over 50 years of âge who had stroke resulting in one-sided weakness
and who were able to sit upright were eligible to participate.
Diagnosis or presence of GHS was not a requirement to be able to participate
in the study.
The therapist undertaking clinical assessment of GHS was blinded to ultrasound measurements of AGT distance, and the therapist undertaking ultrasound measurements was blinded to clinical assessment.
Clinical assessment of GHS by a senior clinical physical therapist using the
fingerbreadth palpation method. A standardized protocol was used. Patients
were seated in a chair or wheelchair with both feet fiat on the ground or on
a footrest.
Ultrasound measurements of acromion-greater tuberosity (AGT) distance by
the chief researcher. For ultrasound measurements of AGT distance, each
patient was placed in the standardized position to allow measurement of AGT
distance. The AGT distance was recorded on the frozen image using an onscreen caliper that automatically calculâtes distances.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
230
Études de performances diagnostiques
À propos du rationnel de cette étude sur le diagnostic de la subluxation glénohumérale {une ou plusieurs réponses possibles) :
Il aurait fallu cocher...
Commentaires
La radiographie est une méthode
diagnostique valide et reproductible mais
coûteuse et exposant aux radiations
Une méthode existe déjà pour faire le
diagnostic de luxation glénohumérale (la
radiographie). On cherche ici à améliorer
ce qui existe déjà en évaluant un test qui
coûte moins cher et avec une meilleure
sécurité
Il est à noter que la radiographie reste
néanmoins sûre et parmi les examens
complémentaires les moins coûteux sur
le marché
En l’absence de diagnostic, la subluxation
glénohumérale peut évoluer défavorablement et devenir non curable
L’objectif d’un test est en priorité de faire
le diagnostic d’une maladie pour laquelle
il existe une sanction thérapeutique
qui permette d’en enrayer l’évolution
défavorable
Il n’aurait pas fallu cocher...
Commentaires
L’examen clinique par palpation
est connu pour avoir trop de faux
positifs pour la détection précoce de la
subluxation glénohumérale
L’examen clinique manque de sensibilité :
lacks the sensitivity. Un manque de
sensibilité revient à dire qu’il y a trop de
faux négatifs par rapport au nombre de
vrais positifs
Trop de faux positifs reviennent à dire
que la spécificité est mauvaise
Une étude antérieure a objectivé la
discordance entre l’examen clinique
par palpation et la radiographie
pour le diagnostic de la subluxation
glénohumérale
Ce n’est pas précisé ici et la réponse
paraît fausse d’emblée. Pourquoi irait-on
évaluer un test dont les résultats ne
concordent pas avec le meilleur examen
à disposition ?
L’examen ultrasonographique a une
reproductibilité inter-opérateur élevée
pour le diagnostic de subluxation
glénohumérale
L’échographie a de manière générale une
reproductibilité inter-opérateur moyenne
(examen opérateur-dépendant), de plus il
est précisé ici que c’est la reproductibiltié
intra-opérateur qui est élevée {intrarater
reliability)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Objectifs et méthodologie des études de performance diagnostique
231
À propos de l’examen clinique par palpation ou fingerbreadtb palpation {une ou
plusieurs réponses possibles} :
Il aurait fallu cocher...
Commentaires
La palpation est utilisée comme méthode
de référence par les auteurs
C’est en effet ce qui a permis de classer
les malades dans cette étude, puisque les
performances diagnostiques de l’examen
échographique sont données par rapport
à l’examen clinique
La palpation est opérateur-dépendante
Malgré la standardisation, il est évident
que l’examen clinique est partiellement
subjectif
Le protocole d’examen clinique par
palpation était standardisé
Ceci est précisé dans le texte
La palpation par un investigateur
expérimenté posait le diagnostic final de
subluxation glénohumérale
Ceci est indiqué par l’adjectif senior
Il n’aurait pas fallu cocher...
Commentaires
La palpation discrimine sans erreur les
patients avec versus sans subluxation
glénohumérale
Le fait que ce soit l’examen de référence
pour cette étude ne permet pas d’affirmer
qu’il est exempt de toute erreur
À propos de la procédure diagnostique échographique {une ou plusieurs réponses possibles} :
Il aurait fallu cocher...
L’échographie a été réalisée par un
opérateur expérimenté qui a reçu une
formation spécifique
Commentaires
Ceci est précisé dans le texte
Les mesures sur l’écran de l’appareil
d’échographie étaient masquées
La distance entre le bord latéral de
l’acromion et la marge supérieure de la
grande tubérosité est la variable mesurée
en échographie
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
232
Études de performances diagnostiques
Il n’aurait pas fallu cocher...
Commentaires
Il s’agit de la méthode diagnostique de
référence (gold standard)
C’est la palpation manuelle
La différence de position du bras entre
l’échographie et l’examen clinique
par palpation rend la comparaison
ininterprétable
Non, ce sont des pré-requis techniques de
chaque examen
Quelles mesures ont été prises pour limiter les biais potentiels dans cette étude ?
(Une ou plusieurs réponses possibles.)
Il aurait fallu cocher...
Commentaires
Les évaluateurs effectuant l’examen
clinique étaient en aveugle des mesures
échographiques
C’est ce qui est indiqué par blinded. Cela
évite que les performances diagnostiques
de l’examen échographique soient
artificiellement améliorées par la
connaissance du résultat de l’examen de
référence
L’opérateur réalisant l’échographie était
en aveugle des résultats de l’évaluation
clinique
Tous les patients ont eu l’échographie
quel que soit le résultat de l’examen
clinique
Il n’aurait pas fallu cocher...
Commentaires
L’ordre de réalisation des examens
(palpation versus échographie) était tiré
au sort
Ce n’est pas précisé dans le texte, bien
que cela serait souhaitable
L’échographie était réalisée par un
opérateur unique
La phrase ultrasound measurements of
acromion - greater tuberosity (AGT)
distance by tbe cbief researcber indique
que l’investigateur principal de l’étude a
conduit tous les examens échographiques
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Objectifs et méthodologie des études de performance diagnostique
233
Ex e m ple 3 (é preuve t est 2021)
Hoffmann MHK, Shi H, Schmitz BL, Schmid FT, Lieberknecht M, Schulze
R, et al. Noninvasive coronary angiography with multislice computed
tomography. JAMA 25 mai 2005 ; 293(20) : 2471-8.
Conventionnal invasive coronary angiography is currently the diagnostic
criterion standard for clinical évaluation of known or suspected coronary
artery disease (CAD). One recently developed modality that may potentially
complément invasive coronary angiography is multislice computed tomography
(MSCT), which may achieve a high level of reliability and accuracy in the
visualization of the coronary tree. We therefore sought to assess the diagnostic
accuracy of 16-slice MSCT, scanning in a large cohort of patients with known
or suspected coronary heart disease.
À propos des examens complémentaires réalisés dans cette étude :
Il aurait fallu cocher...
Le scanner multicoupe 16 barrettes
était le test dont les performances
diagnostiques étaient évaluées
Le diagnostic de référence était établi
par la coronarographie conventionnelle
sélective
Il n’aurait pas fallu cocher...
Commentaires
La réponse est clairement formulée
dans l’introduction. Dans une étude
de performance diagnostique, on doit
repérer immédiatement : le test évalué
(ici, le scanner multicoupe) et le test de
référence qui sert de comparateur (ici, la
coronarographie conventionnelle)
Commentaires
La coronarographie conventionnelle
sélective était le test dont les
performances diagnostiques étaient
évaluées
Ce test est le comparateur (ou gold
standard/ou diagnostic de référence)
L’épreuve d’effort était le test dont les
performances diagnostiques étaient
évaluées
Ces tests n’interviennent pas dans
l’évaluation dont il est question dans
l’article
Le diagnostic de référence était établi par
la scintigraphie myocardique de stress
La troponine T était un marqueur utilisé
pour définir les patients atteints de
coronaropathie obstructive
Le diagnostic de référence était établi
par le recueil prospectif des événements
coronariens
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 22
Courbe ROC et choix
d’un seuil
En complément
V o u s p o u v e z co n s u l t e r c e t t e v i d é o s u r l a c o u r b e R O C :
h t t ps: / / y o u t u .b e / El a W l k J-M Vc
In tro d uctio n
Cette fiche concerne le cas particulier de l’évaluation des tests de nature quantitative
pour lesquels les résultats ne sont pas de nature binaire mais correspondent à une
valeur numérique : par exemple, valeur de la procalcitonine (PCT) pour le diagnostic d’infection bactérienne, valeur des D-dimères pour le diagnostic d’embolie
pulmonaire, valeur de la troponine pour le diagnostic d’infarctus du myocarde, etc.
Le choix d’un seuil est alors nécessaire afin de définir le test comme étant
positif ou négatif.
Il existe donc dans cette situation une sensibilité (Se) et une spécificité (Sp)
pour chaque seuil possible : par exemple, Se et Sp calculées pour des valeurs de
PCT à 0,1 ng/L, 0,2 ng/L, 0,3 ng/L, etc.
La représentation graphique de toutes ces valeurs est possible grâce à la
construction d’une courbe ROC.
La co urb e RO C (receiver o p era tin g ch aract eristic)
La courbe ROC représente graphiquement toutes les valeurs de sensibilité et de
spécificité d’un test en fonction des différentes valeurs du seuil choisi pour discriminer le test comme positif ou négatif.
On représente sur l’axe des ordonnées la sensibilité et sur l’axe des abscisses
la valeur de « 1 — Spécificité ». Cela revient à dire que l’axe des ordonnées
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
236
Études de performances diagnostiques
représente la proportion de vrais positifs et que l’axe des abscisses représente la
proportion de faux positifs.
Chaque point sur cette courbe représente une valeur seuil du test et se positionne sur le graphique selon sa propre spécificité et sensibilité.
On dispose donc une multitude de points correspondant à autant de valeurs
seuils et formant finalement une courbe ROC.
On comprend alors qu’un test de bonne qualité se rapproche le plus possible de la
valeur 1 sur l’axe des ordonnées (sensibilité) et de la valeur 0 sur l’axe des abscisses
(1 — Spécificité), ce qui est en fait le point le plus en haut à gauche sur le graphique.
Autrement dit, on recherche pour un test le seuil pour lequel on a le plus de
vrais positifs et le moins de faux positifs.
Point correspondant à la
valeur seuil du test pour
laquelle la sensibilité est de
90 % et la spécificité de 25 %
Point théorique correspondant
à une sensibilité et une
spécificité de 50 %
A ire so us la co urb e RO C
L’aire sous la courbe {area under curve ou AUC) permet une évaluation globale
des performances en discrimination du test utilisé. Il s’agit d’une valeur entre
Oet 1 :
• une AUC à 0,5 équivaut à tirer au hasard le résultat d’un test à pile ou face.
On retrouve par ailleurs sur cette courbe la valeur seuil pour laquelle la sensibilité et la spécificité sont toutes les deux de 50 % ;
• une AUC à 1 correspond au test parfait. On retrouve dans cette situation un
seuil pour lequel la sensibilité et la spécificité sont toutes les deux de 100 %
(correspondant au point en haut à gauche).
De manière schématique, on peut considérer la performance d’un test en fonction de l’AUC de cette façon :
• AUC - [0,90-1,00] —> très bonne performance ;
• AUC = [0,80-0,90]
bonne performance ;
• AUC = [0,70-0,80] —» performance moyenne ;
• AUC = [0,50-0,70] -à performance médiocre.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Courbe ROC et choix d’un seuil
237
Ch oix d'un seuil
Un gain de sensibilité s’accompagnant toujours d’une perte de spécificité et
vice-versa, le choix du meilleur seuil revient généralement à choisir le meilleur
compromis entre sensibilité et spécificité grâce à la courbe ROC.
Le meilleur compromis correspond au seuil dont le point se situe le plus « en
haut à gauche » sur la courbe ROC. Ce point le plus proche de l’angle supérieur est celui pour lequel l’indice de Youden est maximal (pour rappel, indice
de Youden = Se + Sp - 1).
De plus, en fonction de l’objectif du clinicien, il est possible de choisir un
autre seuil que ce compromis :
• si l’on souhaite gagner en sensibilité, on peut choisir un seuil correspondant
à un point situé plus en haut à droite ;
• si l’on souhaite gagner en spécificité, on peut choisir un seuil correspondant à
un point situé plus en bas à gauche.
Pour un test qui augmente la probabilité diagnostique lorsque sa valeur augmente (ex. : CRP, D-dimères, troponine, etc.), les valeurs seuils les plus élevées
se situent toujours en bas à gauche de la courbe (bonne spécificité) et celles les
plus basses en haut à droite (bonne sensibilité).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
238
Études de performances diagnostiques
Par exemple, vous souhaitez évaluer le dosage de la CRP pour le diagnostic
d’appendicite chez les patients se présentant aux urgences pour une douleur de
la fosse iliaque droite. Vous obtenez la courbe ROC suivante :
Le meilleur compromis est de choisir un seuil de CRP à 60 mg/L, seuil pour
lequel la sensibilité et la spécificité sont de 80 % chacune (indice de Youden à 0,6).
Si l’on décide de diminuer le seuil, on gagnera en sensibilité mais on perdra en
spécificité. C’est le cas pour le choix d’un seuil à 6 mg/L :
• sensibilité à 98 % :
- forte proportion de vrais positifs,
- peu de faux négatifs,
- le test est utile pour éliminer une appendicite aiguë ;
• spécificité à 25 % :
- peu de vrais négatifs,
- forte proportion de faux positifs,
- le test ne permet pas d’affirmer une appendicite aiguë.
Si l’on décide, au contraire, d’augmenter le seuil, on perdra en sensibilité mais
on gagnera en spécificité. C’est le cas pour le choix d’un seuil à 600 mg/L :
• sensibilité à 25 % :
- faible proportion de vrais positifs,
- beaucoup de faux négatifs,
- le test ne permet pas d’éliminer une appendicite aiguë ;
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Courbe ROC et choix d’un seuil
239
• spécificité à 98 % :
- forte proportion de vrais négatifs,
- peu de faux positifs,
- le test est utile pour affirmer une appendicite aiguë.
►
Remarque : si la valeur du test est d’autant plus basse que la probabilité diagnostique est élevée (albumine pour le diagnostic de dénutrition,
consommation du complément pour le diagnostic de lupus, etc.), les
valeurs les plus élevées se situent en haut à droite et celles les plus basses
en bas à gauche.
En pra tique
Ex e m ple 1 (ED N 2018)
Perrotti A, Chenevier-Gobeaux C, Ecarnot F, Bardonnet K, Barrucand B,
Flicoteaux G, Lassalle P, Chocron S. Is endocan a diagnostic marker for
pneumonia after cardiac surgery? The ENDOLUNG Study. Ann Thorac
Surg 2017; 105(2) : 535-41.
The aim of the présent study was to assess whether endocan can be used
as a diagnostic marker for postoperative pneumonia in patients undergoing
cardiac surgery.
Blood samples for endocan measurements were collected in 5 mL ethylenediaminetetraacetic acid tubes at five timepoints, namely, at induction of general
anesthésia (baseline), and at 6, 24, 48, and 72 hours after the end of surgery,
in accordance with preanalytical recommendations. Procalcitonin (PCT) and
C-reactive protein (CRP) collected at 24 and 72 hours after the end of surgery.
The diagnosis of postoperative pneumonia was suspected on the basis of new
détection of lung infiltrâtes on chest radiograph associated with at least two of
the following features: fever more than 38.8 °C; leukocytosis (> 11,000 cells/
mm3) or leucopenia (< 3,000 cells/mm3); or purulent sécrétion; and confirmed by microbiologie analysis using bronchoalveolar lavage with fiberoptic
bronchoscopy.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
240
Études de performances diagnostiques
0.0
0.2
0.6
0.4
0.8
1.0
1 - Specificity
Endocan Preop
Endocan 6H
AUC
0.675
0.702
Sensitivity
650/0
71o/o
Specificity
72o/o
75o/o
Cut off
3.7 ng/mL
12.1ng/mL
Receiver-operating characteristic curves at preoperative (Preop) induction of
anesthésia (grey line) and 6 hours (6H) after surgery (orange line). (AUC =
area under the curve.)
À propos de la courbe présentée dans la figure ci-dessus, il est vrai que :
Il aurait fallu cocher...
Commentaires
L’axe des abscisses représente le taux
de faux positifs
C’est la signification de 1 - Spécificité
L’axe des ordonnées représente
le taux de patients avec une
pneumopathie bien classés par le test
C’est la définition de la sensibilité
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Courbe ROC et choix d’un seuil
241
Il aurait fallu cocher...
Commentaires
La valeur la plus basse de l’endocan
se situe en haut à droite de la courbe
Le test augmente la probabilité diagnostique,
donc les valeurs les plus basses sont les plus
sensibles et les moins spécifiques. Elles se
situent bien en haut à droite
Pour les valeurs élevées d’endocan, le
test à 6 heures est plus spécifique que
le test préopératoire
On remarque que la courbe orange
(correspondant à l’endocan à 6 heures) est
au-dessus de la courbe « Endocan_preop »
pour les valeurs les plus à gauche, donc les
plus élevées
Il manque l’intervalle de confiance de
l’AUC pour affirmer que le test est
significativement plus performant en
discrimination que le hasard
Pour affirmer que l’AUC est significativement
supérieure à 0,5, il serait utile de disposer de
l’intervalle de confiance
Il n’aurait pas fallu cocher...
Commentaires
L’AUC de la courbe ROC de
l’endocan préopératoire n’est pas
significativement supérieure à 0,5 car
elle croise la bissectrice
La lecture graphique ne permet pas de
faire cette affirmation. Seul l’intervalle
de confiance de l’estimateur ponctuel de
l’AUC le permettrait
La courbe suivante a été obtenue pas la
méthode de Kaplan-Meier
Même si l’aspect de la courbe ressemble
à une courbe de survie cumulée, elle
n’a aucun rapport avec la méthode de
Kaplan-Meier
70,2 % des patients évalués par
l’endocan à 6 heures ont été bien classés
L’AUC n’a pas cette signification
La valeur la plus élevée de l’endocan se
situe en haut à droite de la courbe
Les valeurs en haut à droite correspondent
à des seuils très sensibles et peu spécifiques,
ce sont donc les valeurs les plus faibles
L’AUC de l’endocan à 6 h a une
sensibilité de 71 % et une spécificité de
75 %
71 % et 75 % sont les valeurs de
sensibilité et de spécificité de l’endocan à
6 h pour un cut-off choisi à 12,1 ng/mL
Une AUC n’a pas de valeur propre de
sensibilité et spécificité
Ex e m ple 2 (ED N 2019)
Kumar P, Mardon M, Bradley M, Gray G, Swinkels A. Assessment of
glenohumeral subluxation in poststroke hemiplegia: comparison between
ultrasound and fingerbreadth palpation methods.
Phys Ther 2014 ; 94(11) : 1622-31.
Glenohumeral subluxation (GHS) is a common poststroke complication. The
aims of this study were: (1) to compare an ultrasound method of GHS measurement with the fingerbreadth palpation method using a receiver operating
characteristic curve (ROC) and (2) to report the sensitivity and specificity of
this method.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
242
Études de performances diagnostiques
1 - Specificity
Receiver operating characteristic (ROC) curve with area under the receiver
operating characteristic (AUROC) curve value of 0.73 (95% confidence
interval == 0.63-0.83). Curved line shows sensitivity and specificity varied
around different cutoff points. Straight line indicates AUROC curve <0.5
(test not useful). Cutoff points >0.1 to >0.5 cm correspond to sensitivity and
specificity. Optimal cutoff point of >0.2 cm indicates 68% sensitivity and
62% specificity.
À propos de la courbe ROC et de son interprétation (figure ci-dessus ; une ou
plusieurs réponses possibles) :
Il aurait fallu cocher...
Commentaires
La courbe ROC représente la relation entre
la sensibilité et (1 — Spécificité) pour chaque
seuil de la méthode échographique
C’est la définition de la courbe ROC
Les différentes mesures exprimées en
centimètres correspondent aux seuils fixés
arbitrairement par les auteurs pour estimer
la sensibilité et la spécificité de l’échographie
Un seuil de 0,5 cm est à privilégier pour
confirmer le diagnostic par rapport à un
seuil de 0,1 cm
Le seuil de 0,5 cm est plus spécifique,
c’est donc un test plus utile pour
affirmer le diagnostic
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Courbe ROC et choix d’un seuil
Il aurait fallu cocher...
243
Commentaires
Plus de 5 seuils ont été utilisés pour
construire la courbe ROC
Chaque « marche d’escalier » dans la
courbe ROC représente un seuil
L’axe des abscisses représente la probabilité
d’un diagnostic positif en échographie et
négatif à l’examen clinique
L’examen de référence étant l’examen
clinique dans cette étude, l’axe des
abscisses, avec le taux de faux positifs
(1-Sp), répond bien à cette définition
Il n’aurait pas fallu cocher...
Commentaires
La diagonale représente les performances
diagnostiques de l’examen clinique
La diagonale, ou bissectrice, représente
une AUC de 0,5, c’est-à-dire les
performances diagnostiques d’un test
équivalent au hasard
L’axe des ordonnées représente la
proportion de patients positifs à
l’examen clinique parmi les patients
positifs en échographie
Si l’examen de référence est l’examen
clinique, c’est la valeur prédictive
positive qui est définie ici et pas la
sensibilité
Ex e m ple 3 (é preuve t est 2021)
Hoffmann MHK, Shi H, Schmitz BL, Schmid FT, Lieberknecht M, Schulze R,
et al. Noninvasive coronary angiography with multislice computed
tomography. JAMA 25 mai 2005 ; 293(20) : 2471-8.
The AUC for identification of patients with sténoses eligible for revascularization was 0.97 (95% CI, 0.91-1.00; complété study cohort). Conducting the
same analysis after exclusion of patients who had undergone percutaneous
coronary intervention rendered the same AUC value of 0.97, with minimal
widening of the confidence bounds (95% CI, 0.90-1.00). Applying conventional invasive angiography stenosis thresholds of greater than 50%, greater
than 60%, and greater than 70% resulted in AUC values of 0.97 (95% CI,
0.91-0.99), 0.92 (95% CI, 0.84-0.96), and 0.97 (95% CI, 0.92-1.00), respectively. Threshold optimization for identifying patients appropriate for
revascularization occurred at greater than 66% of MSCT stenosis quantification (100% sensitivity, 76.5% specificity). Optimization of both parameters
occurred at greater than 76% MSCT stenosis grading (91.4% sensitivity,
91.2% specificity).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
244
Études de performances diagnostiques
Le seuil de sténose de 76 % déterminé à l’aide de la courbe ROC du scanner
multicoupe 16 barrettes correspond au seuil pour lequel :
Il aurait fallu cocher...
Commentaires
L’évaluation des performances
diagnostiques du scanner
multicoupe 16 barrettes était
optimale
Ce seuil de sténose à 76 % permet d’optimiser la
sensibilité et la spécificité à 91,4 % et 91,2 % ce
qui semble correspondre au meilleur compromis
entre la sensibilité et la spécificité. Cela correspond
au point le plus proche de l’angle supérieur gauche
de la courbe ROC qui est aussi le point pour lequel
l’indice de Youden est maximal (pour rappel indice
de Youden = Se + SP - 1)
Il n’aurait pas fallu cocher...
Commentaires
L’indice de Youden était
maximal
Le scanner multicoupe
16 barrettes était plus performant que la coronarographie
conventionnelle sélective
La coronarographie est l’examen établissant
le diagnostic de référence. Il n’y a donc
théoriquement pas d’examen plus performant
La spécificité était maximale
Il n’est pas donné dans le texte le seuil pour lequel
la spécificité était maximale
La sensibilité était maximale
Le seuil pour lequel la sensibilité est maximale
est le seuil de 66 % (sensibilité à 100 %). Cela
signifie que tous les patients pour lesquels une
revascularisation est appropriée ont une sténose
évaluée au-delà de 66 % en scanner multicoupe.
Cette forte sensibilité est contrebalancée par une
perte de spécificité qui est alors de 76,5 %
Concernant, l’aire sous la courbe ROC de 0,97 (intervalle de confiance à 95 %,
0,90-1,00) du scanner multicoupe dans le diagnostic de coronaropathie obstructive, quelles sont les réponses vraies ?
Il aurait fallu cocher...
Commentaires
Cet examen a de très bonnes
performances diagnostiques
dans le diagnostic de
coronaropathie obstructive
Plus l’aire sous la courbe est proche de 1, plus
les performances diagnostiques du test sont
les meilleurs. Une AUC = 1 correspond à une
spécificité et une sensibilité de 100 %
Cet examen a un très bon
pouvoir de discrimination
dans le diagnostic de
coronaropathie obstructive
Une autre manière de définir la signification de
l’AUC est celle du pouvoir de discrimination. Un
test qui a un excellent pouvoir de discrimination
permet de bien faire le tri entre les non-malades
et les malades. Une AUC = 1 correspond à une
sensibilité de 100 % (tous les malades sont classés
comme malades) et à une spécificité de 100 % (tous
les non-malades sont classés comme non-malades).
Une AUC = 1 permet donc de discriminer
parfaitement les malades des non-malades
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Courbe ROC et choix d’un seuil
245
Il n’aurait pas fallu cocher...
Commentaires
Le scanner multicoupe réduirait les coûts
associés à la prise en charge des patients
avec une suspicion de coronaropathie
comparativement à la coronarographie
conventionnelle sélective
C’est une possible retombée attendue
de la mise en place de cet examen
aux urgences mais ce n’est pas ce
que démontre l’étude. Il faut faire la
distinction entre ce que démontre l’étude
et les retombées attendues des résultats
Le scanner multicoupe pourrait être
recommandé comme test diagnostique
initial en cas de suspicion de syndrome
coronarien aigu avec sus-décalage du
segment ST
Les patients suspects de SCA avec
un sus-décalage du segment-ST ont
une indication à la réalisation d’une
coronarographie diagnostique et
thérapeutique pour revascularisation en
urgence. Ces patients n’étaient pas inclus
dans l’étude et ne font donc pas partie de
la population cible
La valeur de l’aire sous la courbe
ROC est plus élevée que celle de la
coronarographie conventionnelle
sélective
La coronarographie correspond au test
diagnostique de référence. Il n’y a jamais
de courbe ROC construite pour l’examen
de référence
Le scanner multicoupe pourrait réduire
de 16 jours le délai moyen d’attente d’un
examen d’imagerie pour les patients avec
une suspicion de coronaropathie
Idem, c’est une retombée attendue ou
espérée, non pas ce qui est démontré par
l’étude
La valeur de l’aire sous la courbe
risque d’être fortement modifiée si l’on
considérait une population avec une
prévalence de coronaropathie obstructive
différente
La courbe ROC est construite grâce
aux valeurs de sensibilité et spécificité
estimées pour chacun des seuils d’un
test diagnostique de nature quantitative.
Contrairement aux valeurs prédictives,
la sensibilité et la spécificité sont des
caractéristiques intrinsèques du test qui
ne sont pas influencées par la prévalence
de la maladie dans l’échantillon
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Pa r t ie IV
Études observationnelles
(analytiques)
Pl a n
Fiche 23
Fiche 24
Fiche 25
Fiche 26
Fiche 27
Fiche 28
Fiche 29
Objectifs de l’étude
Confusion dans les études observationnelles
Principes généraux des études cas-témoins et des études
de cohorte
Etudes cas-témoins : sélection des participants et définition
de la maladie
Etudes de cohorte : sélection des participants et mesure
de l’exposition
Recueil des données
Analyse des résultats et évaluation de la causalité
249
251
269
279
287
293
303
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 23
Objectifs de l’étude
Et u d es o bserva tio n n elles d escrip tives
Elles comprennent :
• les études transversales de prévalence : étude de la fréquence d’un problème
de santé au sein d’une population à un moment donné. On y calcule une proportion exprimée généralement par un nombre de cas divisé par le nombre de
sujets appartenant à la population d’étude. Cette proportion correspond à la
prévalence de la maladie au sein de la population étudiée. Exemple : prévalence
du diabète de type 2 en France estimée à 4,5 % en 2021 (3 millions de patients
pour une population de 67 millions d’habitants) ;
• les études longitudinales d’incidence : étude de la survenue d’un phénomène
au cours d’une période de temps. On calcule un taux d’incidence qui s’exprime
en nombre de nouveaux cas rapporté à l’effectif de la population d’étude selon
la durée de suivi considérée. Ce taux s’exprime en personnes-années. Exemple :
taux d’incidence du cancer du sein chez les femmes en 2015 en France estimé à
243 pour 100 000 personnes-années (c’est-à-dire 243 nouveaux cas de cancer
pour 100 000 femmes indemnes de la maladie suivies pendant 1 an).
Leur objectif est de décrire l’ampleur d’un phénomène de santé ainsi que
son évolution au sein d’une population. Le but peut être d’orienter par la
suite les politiques de santé publique en ciblant par des actions concrètes les
pathologies les plus fréquentes ou celles dont l’incidence augmente. De plus,
grâce à ce type d’étude, on orientera potentiellement le champ de la recherche
ultérieure après avoir procédé à une étape de description, notamment avec la
réalisation d’études analytiques ou interventionnelles. Par exemple, une étude
observationnelle longitudinale retrouve une incidence plus élevée de cancers au
sein d’un département ; il sera intéressant de construire par la suite une étude
observationnelle analytique afin de mettre en évidence des facteurs de risque de
survenue de cancer présents spécifiquement au sein de ce département.
Ét u des o bserva tio n n elles analytiq u es
Il existe deux grands types d’études :
• l’étude cas-témoins :
- on compare l’exposition à un facteur de risque d’un groupe de sujets atteints
de la maladie à l’exposition d’un groupe de sujets sains. Le recueil de l’exposition est alors réalisé de manière rétrospective,
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
250
Études observationnelles (analytiques)
- exemple : étude de l’association entre myélodysplasie et exposition aux alkylants en comparant l’exposition passée aux alkylants entre un groupe de patients
atteints par la maladie et un groupe de patients non malades ;
• l’étude de cohorte de type exposés/non exposés :
- on suit dans le temps un groupe de sujets exposés à un facteur de risque que
l’on compare à un groupe de sujets non exposés. On recueille alors la survenue
de la maladie de manière prospective,
- exemple : étude de l’association entre myélodysplasie et exposition aux alkylants en comparant l’apparition de la maladie entre un groupe de patients ayant
reçu une chimiothérapie à base d’alkylants et un groupe de patients n’en ayant
pas reçu.
L’objectif est d’évaluer une relation entre une exposition et une maladie. Cette
relation peut être :
• étiologique :
- on recherche alors un ou des facteurs de risque, c’est-à-dire un ou des éléments entraînant une augmentation du risque de déclarer la maladie. On
recherchera éventuellement des facteurs protecteurs qui sont eux associés à
un moindre risque de déclarer la maladie,
- exemple : étude observationnelle étiologique examinant la relation entre
tabagisme et survenue de cancer du poumon ;
• pronostique :
- on recherche ici un ou des éléments associés à une augmentation ou une
diminution de la gravité ou du pronostic d’une maladie chez des malades,
- exemple : étude observationnelle analytique étudiant les facteurs pronostiques de mortalité des patients atteints d’un cancer du poumon.
Dans tous les cas, des mesures d’association entre le facteur de risque et la
maladie étudiée - comme le risque relatif (RR), hazard ratio (HR) et Vodds
ratio (OR) - sont calculées (voir partie I).
Co nsid éra tio ns é t hiq u es
La méthodologie serait plus robuste grâce à la réalisation d’études interventionnelles dans lesquelles l’exposition au facteur de risque serait contrôlée
par l’investigateur. Mais cela n’est le plus souvent pas possible en raison d’un
manque de faisabilité ou parce que l’éthique ne l’accepterait pas.
Par exemple, si l’on cherche à connaître l’influence du tabac sur le poids de
naissance des nourrissons, il serait éthiquement inacceptable de construire une
étude interventionnelle dans laquelle on comparerait le poids de naissance des
nourrissons de deux groupes de patientes dont l’un serait encouragé à fumer
pendant la grossesse et l’autre non. On mettra plutôt en place une étude castémoins où l’on recueillera de manière rétrospective l’exposition au tabac pendant la grossesse entre deux groupes de nourrissons (groupe avec un petit poids
de naissance versus groupe avec un poids de naissance normal).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 24
Confusion dans les études
observationnelles
En complément
V o u s p o u v e z co ns u l t e r c e t t e v i d é o s u r le b i a is d e co n f u sio n d a n s l e s é t u d e s
o bs e r v a t io n n ell e s : h t t ps: / / y o u t u .b e / 2 B 2 assz 8 u a k
Positio n du pro blè m e
Dans un essai clinique randomisé, les patients exposés au médicament sont
parfaitement comparables aux patients non exposés au médicament.. La seule
différence entre les deux groupes est le traitement.
Dans une étude observationnelle analytique :
• les cas ne sont pas comparables aux témoins ;
• les exposés ne sont pas comparables aux non-exposés.
L’absence de randomisation de l’exposition rend extrêmement difficile l’interprétation du lien entre l’exposition et la maladie. Les fumeurs ne sont évidemment pas comparables aux non-fumeurs, les agriculteurs exposés à l’utilisation
de glyphosates ne sont pas comparables à ceux qui refusent de l’utiliser, etc.
En particulier, ces groupes ne sont pas comparables pour les autres facteurs de
risque de la maladie.
C’est la raison pour laquelle une étude observationnelle, même très bien
conduite, ne permet jamais de conclure formellement à la causalité contrairement aux études expérimentales.
Tout l’enjeu de la constitution de l’échantillon et de l’analyse sera donc
d’essayer de prendre en compte les différences entre les groupes et de les interpréter au mieux.
D éfinitio n d e la co n f usio n (v oir fich e 2)
Le biais de confusion (confounding bias) survient en présence d’un ou de plusieurs facteurs de confusion (confounding factors). Un facteur de confusion est
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
252
Études observationnelles (analytiques)
une variable associée à la fois à la maladie et à l’exposition et ne faisant pas
partie de la chaîne causale entre l’exposition et la maladie. On parle de biais
de confusion lorsque le lien apparemment observé entre un facteur de risque
(exposition au café) et une maladie (le cancer du poumon) est pour tout ou
partie dû à un autre facteur (le facteur de confusion : les gros consommateurs
de café sont plus souvent fumeurs ; c’est l’exposition au tabac qui explique le
lien apparent entre café et cancer du poumon).
Prenons l’exemple d’une étude observationnelle qui examine le lien entre vaccination antigrippale et décès chez des patients insuffisants cardiaques :
• les patients vaccinés meurent plus souvent ;
• les patients les plus graves sont plus souvent vaccinés ;
• les patients graves meurent plus souvent.
Le lien entre vaccin et décès est uniquement expliqué par la gravité des
malades. La gravité de l’insuffisance cardiaque est un facteur de confusion dans
l’étude du lien entre la vaccination et le décès. Si on ajuste l’effet de la vaccination sur la gravité de la maladie, le vaccin devient protecteur.
La confusion est un biais dont la prise en compte est essentielle dans les études
observationnelles. La prise en compte d’un facteur de confusion peut modifier
considérablement les mesures d’association : risque relatif (RR), hazard ratio
(HR), odds ratio (OR).
A nalyse du t a bleau d escrip tif de la p o p ula tio n
(co m p aran t les cas e t les t é m oins ou les ex p osés
e t les non ex p osés)
Contrairement aux essais cliniques randomisés, dans lesquels le premier tableau
descriptif permet de vérifier l’équilibre des caractéristiques entre les groupes
obtenus par randomisation (rendant les tests de signification peu utiles, voir
fiche 12 sur la randomisation), les groupes étudiés ne sont habituellement pas
comparables dans une étude observationnelle. Le tableau descriptif a comme
principal intérêt d’identifier les différences entre les groupes (et donc les facteurs de confusion potentiels). L’utilisation de tests statistiques peut trouver ici
son utilité, les différences observées n’était pas, a priori, liées au hasard.
►
Attention ! Dans les études observationnelles de forte puissance (plusieurs
milliers de patients), des différences minimes/non cliniquement pertinentes entre les groupes peuvent être néanmoins significatives (p < 0,05).
Dans ce cas, la pertinence clinique de la différence (la taille de l’effet) est
plus intéressante que le niveau de significativité. Par exemple, dans une
étude portant sur les facteurs prédictifs du décès en hospitalisation chez
100 000 patients hospitalisés, une différence de CRP de 0,2 mg/L (taille
de l’effet : 0,2 mg/L) est significative (degré de signification p < 0,0001),
mais n’a aucune pertinence clinique. La réponse au QCM « la p-value est
peu informative du fait de la grande taille de l’échantillon » est souvent
vraie dans ce cas.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Confusion dans les études observationnelles
253
Co m m e n t pren dre en co m p t e les f act eurs
d e co n f usio n d ans les é t u d es analytiq u es ?
Pour cette partie, nous prendrons pour exemple le lien entre fente labiopalatine
(FLP) et consommation de café pendant la grossesse. Le tabagisme est plus fréquent
chez les grandes consommatrices de café et est associé aux fentes labiopalatines.
On cherche à prendre en compte l’effet du facteur de confusion « tabagisme ».
Au moment de la planification de l'étude
• Restriction de population :
- cette technique consiste à restreindre l’étude aux patients pour lesquels le
facteur de confusion n’est pas observé. On limite l’étude (ou l’analyse) aux
patientes non fumeuses. L’association observée entre café et FLP ne peut donc
pas être liée au tabac ;
- inconvénients : l’échantillon est sélectionné de fait et on ne pourra pas étudier l’effet du tabac ni l’interaction entre le tabac et le café sur le risque de FLP.
• Appariement {matcbing) :
- il s’agit de rendre artificiellement comparables les cas et les témoins (ou les
exposés et les non-exposés) pour un ou plusieurs facteurs de confusion ;
- dans le cas d’une étude cas-témoins, pour chaque cas fumeur, on inclut un
témoin fumeur {idem pour les non-fumeurs). On a donc exactement la même
proportion de fumeurs et de non-fumeurs chez les cas et les témoins ;
- inconvénient : on ne peut pas étudier l’effet du tabac sur la FLP car par
définition, il y a autant de fumeurs chez les cas et les témoins (l’effet du tabac
s’annule).
Au moment de l'analyse de l'étude
• Stratification {stratification) :
- on réalise l’analyse selon différents niveaux (correspondant aux différentes
strates du facteur de confusion). Cela revient à réaliser une analyse en sousgroupes. Dans notre exemple, cela reviendrait à étudier l’effet de la consommation de café dans chaque strate de la variable tabac, c’est-à-dire chez les
fumeurs et les non-fumeurs séparément ;
- avantage : on peut estimer l’effet chez les fumeurs et les non-fumeurs (le
café est peut-être plus délétère chez les mères fumeuses, on parle alors de
modificateur de l’effet ou de facteur d’interaction) ;
- inconvénient : on ne peut plus étudier l’effet de la variable de stratification
(car il y a un groupe avec seulement des fumeurs et un avec seulement des
non-fumeurs).
• Ajustement {adjustment) : cette technique permet par l’intermédiaire d’une
analyse multivariée de calculer des mesures d’association (RR, OR, HR ou
moyenne estimée) ajustées {adjusted en anglais, par opposition aux coefficients
dits bruts ou crude ou unadjusted en anglais) permettant de prendre en compte
le lien entre tabac et FLP.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
254
Études observationnelles (analytiques)
C'est q u oi, m a t hé m a tiq u e m en t, une analyse
m ultivariée ?
C’est une équation qui fournit la probabilité d’une variable qualitative (comme
le décès ou l’apparition d’une maladie) ou la valeur d’une variable quantitative
(comme le nombre de jours passés en réanimation) en fonction de tous les
facteurs de risque et de tous les facteurs de confusion.
L’équation se présente comme suit :
Probabilité (fente labiopalatine) = a (si consommation de café) + b (si sexe
masculin) + c (si tabac) + d (si supplémentation vitaminique)
• La maladie est la variable dépendante (ou à expliquer) ;
• la consommation de café, le sexe, le tabac et la supplémentation vitaminique
sont les variables indépendantes (ou explicatives) ;
• la consommation de café est l’exposition d’intérêt ;
• le sexe, le tabac et la consommation vitaminique sont des variables d’ajustement, facteurs de confusion potentiels.
Ce modèle permet d’étudier le lien entre le café et la FLP, indépendamment de
toutes les autres variables.
a, b, c, et d sont les coefficients associés à chaque variable, on peut calculer,
à partir de leur valeur, des HR, RR, OR ou moyennes ajustées selon le type de
modèle utilisé.
Chaque coefficient est estimé indépendamment de l’effet des autres (c’est
pour cela que l’on parle de variables indépendantes).
►
Remarque : on peut réaliser une analyse multivariée dans chaque strate
d’une analyse stratifiée.
Cas p articulier d'ajuste m e n t / a p p arie m e n t : le score
d e pro pensio n
Un score de propension est une variable qui estime la probabilité d’être exposé
ou d’être non exposé, en fonction de toutes les variables associées à l’exposition. Pour rendre les exposés et les non-exposés comparables le plus possible,
on peut ensuite soit apparier les exposés et les non-exposés sur le score de
propension, soit ajuster l’analyse de la relation entre l’exposition et la maladie
sur le score de propension.
Prenons l’exemple d’une étude observationnelle évaluant le risque hémorragique en fonction de la reprise on non des anticoagulants après une hémorragie
digestive. Cette étude n’est pas randomisée, ce sont les médecins qui décident
quel patient reçoit le traitement anticoagulant :
• un patient âgé ayant déjà fait plusieurs épisodes hémorragiques sans antécédent cérébrovasculaire ischémique a un score de propension très faible (probabilité de reprise des anticoagulants faible) ;
• un patient ayant une embolie pulmonaire récente a un score de propension
très élevé.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Confusion dans les études observationnelles
255
L’ajustement sur le score de propension se fait en ajoutant, dans l’équation
du modèle multivarié, la valeur du score de propension comme variable indépendante.
En ce qui concerne l’appariement sur le score de propension, pour chaque
patient ayant reçu des anticoagulants avec un score de propension faible, on
apparie un autre patient n’en ayant pas reçu et ayant aussi un score faible. Les
exposés et les non-exposés sont donc plus ou moins comparables... Malheureusement, cet exercice demande de très grandes cohortes de malades, car il y a très
peu de malades ayant reçu des anticoagulants avec un score de propension
faible, et très peu n’en ayant pas reçu avec un score de propension élevé.
Ex e m ple
Une étude cas-témoins s’intéresse à la relation entre consommation d’alcool
et cancer de la vessie. L’OR brut calculé est : OR = 2,5 (IC95 % : 1,8-3,2).
L’interprétation du résultat brut est de conclure que la consommation d’alcool
est associée à la survenue du cancer de la vessie étant donné que OR > 1 et
que l’intervalle de confiance (IC) de l’OR ne comprend pas la valeur 1. Mais les
résultats présentés ainsi sont difficiles à interpréter car le facteur de confusion
« tabagisme » n’a pas été pris en compte.
Les différentes stratégies possibles de prise en compte du biais de confusion
dans cette étude sont présentées ci-dessous :
• restriction de population : la restriction de population consisterait à exclure
chez les témoins et les cas tous les patients consommant du tabac. On pourrait
ainsi évaluer l’association entre l’alcool et le cancer de vessie en s’affranchissant de l’effet de confusion lié au tabac. L’inconvénient de cette technique est
qu’elle exclut une partie des patients, ce qui rend la population d’étude moins
représentative de la population cible ;
• appariement : l’appariement consisterait à sélectionner un témoin fumeur
pour chaque cas fumeur et un témoin non-fumeur pour chaque cas nonfumeur. Le facteur de confusion « tabac » serait alors équilibré entre les deux
groupes. Cette technique nécessiterait que l’on prenne en compte l’importance
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
256
Études observationnelles (analytiques)
du tabagisme (pour ne pas associer un témoin avec une consommation de 50
paquets-années à un cas avec une consommation de 5 paquets-années) ;
• stratification : la stratification consisterait ici à calculer un OR dans des
groupes différents (un groupe de sujets fumeurs et un groupe de sujets nonfumeurs, par exemple). Cela permet d’interpréter les résultats dans chacune des
strates du facteur de confusion afin d’en effacer l’effet. En général, les auteurs
présentent un tableau par strate avec l’effet du facteur de risque étudié :
- strate 1 : tabagisme actif
Analyse univariée : OR brut (IC95 %)
0,97 (0,7-1,24)
Consommation d’alcool
- strate 2 : tabagisme sevré et non-fumeurs
Analyse univariée : OR brut (IC95 %)
Consommation d’alcool
1,04 (0,90-1,18)
On lit dans ce tableau que la consommation d’alcool n’entraîne pas de surrisque de cancer de vessie après stratification selon la consommation de tabac,
les OR étant proches de 1 ;
• ajustement : il consisterait, à l’aide d’une analyse multivariée, à calculer un
OR ajusté qui prendrait en compte le facteur de confusion en « effaçant » son
effet sur l’analyse.
Analyse univariée : OR
brut (IC95 %)
Consommation d’alcool
2,5 (1,8-3,2)
Analyse multivariée : OR
ajusté (IC95 %)
1,41 (0,88-1,94)
Ce tableau indique le risque de survenue du cancer de vessie en cas de consommation d’alcool en analyse univariée et multivariée. L’OR est donné après ajustement
sur la consommation de tabac, l’âge et le sexe. On remarque que la consommation
d’alcool n’est pas associée significativement à la survenue du cancer de vessie après
analyse multivariée car l’IC à 95 % de l’OR comprend la valeur 1. On dit que l’OR
ajusté correspond à l’effet de l’alcool indépendamment de la consommation de tabac.
En pra tique
Ex e m ple 1 (ED N 2016)
Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai
consumption of coffee and caffeine-containing beverages and oral clefts:
a population-based case-control study in Norway. Am J Epidemiol 2009 ;
169 : 1216-22.
Introduction: Orofacial clefts are among the most common birth defects, and
the prevalence in Norway (2.2 per 1,000 livebirths) is particularly high. The
etiology of clefts is complex and largely unknown. The high risk of récurrence
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Confusion dans les études observationnelles
257
of clefts among first-degree relatives (as much as 56 times the background
prevalence) suggests a strong genetic component. However, environmental
factors such as maternai nutrition, vitamin supplément, smoking, and binge
alcohol consumption also appear to contribute.
Methods: There were 676 women in Norway who delivered infants requiring
surgery for orofacial clefts during 1996-2001. We excluded 24 mothers who
did not speak Norwegian or whose infant died after birth, leaving 652 eligible
mothers. Of these, 88% (n = 573) agreed to participate. We randomly selected
1,022 control mothers of livebirths via the national Medical Birth Registry
within 6 weeks of delivery. After excluding 16 who were not Norwegian speakers or whose infant died, 1,006 mothers of Controls were eligible, of whom
76% (n = 763) agreed to participate.
Pourquoi, dans cette étude, le tabagisme actif est-il un facteur de confusion potentiel de l’association observée entre la consommation de café au cours du premier trimestre de grossesse et le diagnostic de fente labiopalatine à la naissance ?
Il aurait fallu cocher...
Commentaires
Le tabagisme est un facteur de risque
de fente labiopalatine identifié dans la
littérature
Un facteur de confusion est par définition lié à la maladie et à l’exposition
sans relation de chaîne causale entre les
deux. Le tabagisme est bien un facteur
de risque de fente labiopalatine comme
souligné dans l’introduction, ce facteur
est donc lié à la maladie
Car il est possible que les femmes
fumeuses consomment plus de café que
les non-fumeuses
De plus, il est tout à fait possible qu’il
existe un lien entre la consommation de
tabac et la consommation de café, ce qui
indique que le tabac est potentiellement
lié à l’exposition
Il n’aurait pas fallu cocher...
Commentaires
Car la prévalence du tabagisme actif au
premier trimestre de grossesse diffère
entre les cas et les témoins dans cette
étude
Il s’agit d’une conséquence de la relation
entre le tabac et la survenue de fentes
labiopalatines et ça ne justifie donc pas la
prise en compte a priori du tabac comme
facteur de confusion potentiel
Car l’information sur le tabagisme a été
recueillie rétrospectivement par questionnaire dans cette étude
C’est un choix méthodologique qui n’a
aucun rapport avec l’identification des
facteurs de confusion potentiels
Car le tabagisme passif et l’absence de
tabagisme ont été regroupés au sein
d’une seule et même catégorie dans cette
étude
C’est un choix méthodologique qui n’a
aucun rapport avec l’identification des
facteurs de confusion potentiels
Statistical analysis: The risk of delivering offspring with an orofacial cleft was
estimated by odds ratios with 95% confidence intervals in unconditional
logistic régression models.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
258
Études observationnelles (analytiques)
Adjustments were made for potential confounders (factors associated with
clefts in other studies, most of which were also associated in our study), namely,
dietary vitamin A (quartiles), dietary folate (quartiles), folie acid supplément
(400 Ig/day, yes or no), vitamin supplément use (yes or no), consumption of
alcohol in early pregnancy (number of drinks per sitting), smoking (ordinal
linear with 5 categories: none; passive only; and 1-5, 6-10, and >11 cigarettes a day), nausea during the first trimester (yes or no), employment in early
pregnancy (yes or no), éducation (ordinal linear with 6 categories), father’s
income (ordinal linear with 3 categories), and year of birth.
Results: The association between coffee consumption and cleft palate persisted among nonsmokers (among whom there would presumably be no residual
confounding by smoking) and among mothers of isolated cleft cases.
Quelle(s) stratégie(s) les auteurs ont-ils utilisée(s) pour s’affranchir, dans cette
étude, de l’effet du facteur de confusion « tabagisme actif au cours du premier
trimestre de grossesse » ?
Il aurait fallu cocher...
Commentaires
La restriction aux mères non fumeuses
La restriction de population a consisté
ici à s’intéresser au sein d’une analyse en
sous-groupes aux mères non fumeuses
permettant de s’affranchir de l’effet du
tabac dans cette population
L’ajustement à l’aide d’un modèle de
régression logistique multivariée non
conditionnelle
Les modèles d’analyse statistique multivariée permettent de calculer des OR
ajustés (contrairement aux OR bruts des
analyses univariées) qui représentent la
relation entre l’exposition et la maladie
en s’affranchissant de l’effet des facteurs
de confusion inclus dans le modèle
Il n’aurait pas fallu cocher...
Commentaires
L’estimation d’OR bruts
Les OR bruts correspondent aux résultats de l’analyse univariée qui ne prend
par définition pas en compte l’implication d’éventuels facteurs de confusion
Un test de tendance sur la consommation
de café
L’intérêt d’un test de tendance est la
recherche d’une relation dose-effet entre
l’exposition et la maladie (voir fiche 29)
L’appariement de témoins à chaque cas
L’appariement sur le facteur de confusion
« tabagisme » aurait consisté à inclure
un témoin avec tabagisme pour un
cas avec tabagisme permettant ainsi
d’équilibrer la distribution du facteur de
confusion dans les 2 groupes. Mais cela
n’a pas été le cas ici
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Confusion dans les études observationnelles
259
Discussion: There is no known mechanism by which coffee intake might
increase the risk of CLP. Effects on homocystéine is one potential pathway.
Evidence suggests that maternai hyperhomocysteinemia may be linked to
increased risk of CLP. Coffee intake increases the plasma concentration of
homocystéine, as does smoking, a well-established risk factor for CLP. [...]
Folie acid suppléments are consistently associated with reduced risk of CLP,
and such suppléments reduce plasma homocystéine.
Women may reduce their coffee consumption as they develop pregnancy
symptoms of nausea and vomiting. Given that closure of the lip and palate
occurs relatively late in the first trimester (8-12 weeks after the last menstrual period), it is possible that reported coffee intake is greater than actual
consumption at the crucial stage of embryonic development.
Sur la base des informations données dans cet article, quel(s) facteur(s) de
confusion potentiel(s) supplémentaire(s) les auteurs auraient-ils pu prendre en
compte ?
Il aurait fallu cocher...
Commentaires
Les antécédents familiaux
Les antécédents familiaux sont décrits dans l’introduction
comme étant un facteur de risque de fente labiopalatine
mais ne sont pas pris en compte dans l’analyse statistique
ajustée
Il n’aurait pas fallu cocher...
Commentaires
La consommation de café
au deuxième trimestre
Ce n’est pas une variable d’ajustement judicieuse à
prendre en compte car la fermeture labiopalatine
intervient entre 8 et 12 semaines d’aménorrhée, c’està-dire au cours du premier trimestre
L’homocystéinémie chez la
mère
Impossible à recueillir dans une étude rétrospective,
ce facteur interviendrait en outre dans la « chaîne
causale » entre consommation de café et développement d’une fente labiopalatine
L’âge gestationnel
Réponse fausse pour la même raison que la consommation de café au deuxième trimestre
L’activité physique
La relation entre l’activité physique et les fentes
labiopalatines ou la consommation de café n’est pas
mentionnée dans l’article
Ex e m ple 2 (ED N 2017)
Fondell E, Fitzgerald KC, Falcone GJ, O’Reilly EJ, Ascherio A. Early-onset
alopecia and amyotrophie latéral sclerosis: a cohort study. Am J Epidemiol
2013 ; 178(7) : 1146-9.
We explored the association of early-onset alopecia and ALS in the Health
Professionals Follow-up Study, a large cohort of 51,529 US men. In 1992, the
participants (then aged 46-81 years) were asked to report their hair line pattern at âge 45 years. There are few established risk factors for either alopecia
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
260
Études observationnelles (analytiques)
or ALS (Amyotrophie Latéral Sclerosis). Smoking has been suggested to increase the risk of ALS, as well as alopecia. High premorbid body mass index
(weight (kg)/height (m)2) and vitamin E intake hâve been reported to be associated with a lower ALS risk. However, these variables are not known to be
associated with alopecia and were therefore included in secondary analysis
only. In a subanalysis, we excluded users of finasteride, a drug that blocks
dihydrotestosterone production and that is used to treat enlarged prostate and
alopecia; in this subanalysis, we used as baseline the date of return of the 1996
questionnaire, which was the first to inquire about finasteride use.
To avoid the potential influence of alopecia-associated drug use, we excluded
finasteride users in a secondary analysis (2 cases among 716 users).
Relative Risk of Amyotrophie Latéral Sclerosis by Level of Balding In Men In
the Health Professionals Follow-up Study, 1992-2008.
Multivariate
Relative
Riska
95 % CI
Multivariate
Relative
Riskb
95 % CI
Referent
1.00
Referent
1.00
Referent
1.45
0.71,
2.97
1.47
0.72,
2.99
1.44
0.71,
2.95
2.69
1.20,
6.01
2.74
1 23,
6.13
2.75
1.23,
6.15
Level of
Balding
No.of
ALS
Cases
Age95 % CI
Adjusted
Relative
Risk
No
alopecia
13
1.00
Moderate
alopecia
18
Extensive
alopecia
11
Pfrend
0.020
0.018
0.018
Abbreviations: ALS, amyotrophie latéral sclerosis; Cl, confidence interval.
a Adjusted for âge (in single years) and smoking status (current, previous, or never).
b Adjusted for âge (in single years), smoking status (current, previous, or never), body mass index
(weight (kg)/height (m)2) (in categories of underweight, normal, overweight, and obese), and
vitamin E supplément use (yes or no).
Pourquoi le tabagisme aurait pu constituer un facteur de confusion expliquant,
en partie, l’association observée entre l’alopécie et la survenue d’une sclérose
latérale amyotrophique dans cette étude ?
Il aurait fallu cocher...
Commentaires
Le tabagisme est un facteur de risque
potentiel de sclérose latérale amyotrophique (SLA) rapporté dans la littérature
Un facteur de confusion est par définition lié à la maladie et à l’exposition sans
relation de chaîne causale entre les deux
Le tabagisme est un facteur de risque de
SLA, ce facteur est donc lié à la maladie
Le tabagisme est associé à un risque
accru d’alopécie dans la littérature
Comme souligné dans le texte, le tabagisme est un facteur de risque d’alopécie,
ce facteur est donc lié à l’exposition
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Confusion dans les études observationnelles
261
Il n’aurait pas fallu cocher...
Commentaires
L’information recueillie sur le tabagisme
est de nature déclarative dans cette étude
La manière de recueillir un facteur de
confusion n’a aucun rapport avec les
relations éventuelles qu’il pourrait avoir
avec la maladie et l’exposition
L’ajustement sur le tabagisme en analyse
multivariée modifie peu l’estimation
ponctuelle du risque relatif
L’ajustement permet de gommer l’effet
d’un facteur de confusion sur l’évaluation de la relation entre l’exposition et la
maladie. Donc au contraire, une analyse
multivariée modifierait davantage l’estimation du risque relatif si le tabagisme
était un vrai facteur de confusion
La prévalence du tabagisme décroît avec
la sévérité de l’alopécie
C’est le contraire dans cette étude, et la
réponse paraît fausse à la première lecture car si le tabagisme était un facteur
de confusion, on s’attendrait plutôt à une
augmentation de la prévalence
Quelle(s) stratégie(s) emploient les auteurs pour s’affranchir de l’effet de l’utilisation de finastéride dans l’analyse de l’association entre l’alopécie et la sclérose
latérale amyotrophique ?
Il aurait fallu cocher...
Commentaires
La restriction de l’analyse aux
non-utilisateurs de finastéride
Les auteurs ont exclu 2 cas de SLA ayant
consommé du finastéride. La restriction de
population consiste ici à exclure tous les individus
ayant consommé ce médicament, permettant ainsi
de s’affranchir de l’effet de ce possible facteur de
confusion dans l’évaluation de l’association entre
alopécie et SLA
Il n’aurait pas fallu cocher...
Commentaires
L’ajustement à l’aide d’un
modèle multivarié
Un modèle multivarié a bien été mis en place mais
celui-ci ne prend pas en compte l’utilisation de
finastéride (voir les annotations en bas du tableau
de résultats : ajustement sur l’âge, tabagisme, body
mass index et supplémentation en vitamine E)
La stratification sur la prise ou
non de finastéride
Une stratification aurait consisté à réaliser une
analyse en sous-groupes et donc à calculer un
risque relatif chez les utilisateurs de finastéride et
un risque relatif chez les non-utilisateurs de finastéride. Cela n’aurait de toute façon pas été possible
vu le faible nombre d’individus (à savoir deux)
avec SLA parmi les consommateurs de finastéride
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
262
Études observationnelles (analytiques)
Il n’aurait pas fallu cocher...
Commentaires
L’appariement des cas et des
témoins sur l’utilisation de
finastéride
Il s’agit d’une étude de cohorte prospective, non
d’une étude cas-témoins. L’appariement aurait
consisté à recruter pour chaque cas de SLA ayant
utilisé du finastéride un témoin ayant également
utilisé du finastéride, et de recueillir de manière
rétrospective l’exposition « alopécie à 45 ans ». La
répartition du facteur de confusion aurait donc été
équilibrée entre les 2 groupes
La standardisation sur la prise
de finastéride
La standardisation est une technique utilisée
généralement au cours d’études épidémiologiques
descriptives. Elle permet par exemple de comparer
des taux de mortalité de deux populations qui
ne sont pas comparables à la base sur un facteur
donné (l’âge le plus souvent)
Ex e m ple 3 (ED N 2018)
Perrotti A, Chenevier-Gobeaux C, Ecarnot F, Bardonnet K, Barrucand B,
Flicoteaux G, Lassalle P, Chocron S. Is endocan a diagnostic marker for
pneumonia after cardiac surgery? The ENDOLUNG Study. Ann Thorac
Surg 2017; 105(2) : 535-41.
Multivariate Analysis of Predictors of Acute Lung Injury Before Surgery and at
6 Hours.
Variables
p Value
OR (95 % CI)
Preoperative
0.06
Body mass index > 27 kg/m2
3.34 (0.96-11.65)
Intervention duration, minutes
0.03
1.01 (1.00-1.02)
Preoperative endocan >3.67 ng/mL
0.01
4.38 (1.35-14.25)
0.02
4.91 (1.32-18.33)
At 6 hours after surgery
Body mass index > 27 kg/m2
Intervention duration, minutes
0.048
1.01 (1.00-1.02)
Endocan at 6 hours >12.1 ng/mL
0.001
7.36 (2.16-25.07)
Cl = confidence interval; OR = odds ratio.
L’indice de masse corporelle supérieur à 27 kg/m2 et la durée d’intervention ont
été introduits dans le modèle d’analyse multivariée (tableau ci-dessus) pour :
Il aurait fallu cocher...
Commentaires
S’affranchir de l’effet de ces
deux facteurs de confusion
potentiels
D’une manière générale, l’analyse multivariée permet
de contrôler l’effet des facteurs de confusion lorsque
les 2 groupes comparés (pneumopathie postopératoire
et pas de pneumopathie postopératoire) ne sont pas
comparables. Les facteurs significativement associés à
la maladie en analyse multivariée le sont indépendamment des autres facteurs introduits dans le modèle
Identifier les prédicteurs
indépendamment associés à
la pneumonie postopératoire
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
263
Confusion dans les études observationnelles
>
Il n’aurait pas fallu cocher...
Commentaires
Déterminer le seuil optimal de la concentration sanguine d’endocan (3,67 ng/mL)
en période préopératoire
Le seuil de 3,67 a été fixé avant cette
analyse par l’analyse de la courbe ROC
(une analyse multivariée ne permet pas
de fixer un seuil pour un marqueur
diagnostique)
Contrôler les fluctuations aléatoires
d’échantillonnage
L’analyse multivariée ne permet pas de
limiter les fluctuations d’échantillonnage
Corriger le biais lié à la subjectivité du
diagnostic de référence de pneumonie
postopératoire
L’analyse multivariée ne permet pas de
corriger les erreurs de classement éventuelles sur la définition de la pneumopathie (la mesure des variables est déjà faite
au moment de l’analyse !)
Ex e m ple 4 (ED N 2020)
Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for
Pancreatic Cancer in China: A Multicenter Case-Control Study. J Epidemiol
2016 ; 26(2) : 64-70.
We assessed risk factors of pancreatic cancer in China. A case-control study
design was conducted using data from four hospital-based cancer registries.
A total of 646 participants were recruited, including 323 pathologically verified cancer cases and 323 Controls selected from family members of other
inpatients in the same hospital who did not hâve pancreatic cancer. Cases
and control were 1:1 matched by gender and âge; 110 pairs were recruited
from Henan Provincial Cancer Hospital, 105 from Beijing Cancer Hospital,
73 from Hebei Cancer Hospital, and 35 from the Cancer Institute &C Hospital
of the Chinese Academy of Medical Sciences.
Characteristics of 323 pancreatic cancer cases and 323 Controls
Controls3
Cases3
Variables
n
X2
P
0.000
1.000
n
%
110
(34.1)
Beijing Cancer Hospital
105
(32.5)
105
(32.5)
Hebei Cancer Hospital
73
(22.6)
73
(22.6)
CICAMSb
35
(10.8)
35
(10.8)
Male
181
(56.0)
181
(56.0)
Female
142
(44.0)
142
(44.0)
0.000
1.000
Age, yearsc
58.7
(11.2)
58.0
(11.2)
0.790
0.430
%
Center
Henan Cancer Hospital
110
(34.1)
Sex
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
264
Études observationnelles (analytiques)
À propos de l’appariement sur l’âge :
Il aurait fallu cocher...
Commentaires
Il vise à contrôler le biais de
confusion lié à la différence
d’âge entre les cas et les témoins
Le but de l’appariement est de contrôler le biais
de confusion. Mais attention, l’appariement
contrôle le biais de confusion qui concerne
seulement le ou les facteurs sur lesquels on
réalise l’appariement. Il ne fait donc pas aussi
bien qu’une randomisation qui a comme objectif
d’équilibrer les groupes sur tous les facteurs de
confusion connus et inconnus
La différence d’âge moyen observée après appariement entre les
cas et les témoins s’explique par
un intervalle d’appariement de
± 5 ans
Dans le tableau, il existe une petite différence
d’âge entre les cas et les témoins (58,7 ans en
moyenne pour les cas et 58 ans pour les témoins).
Cette différence est faible et s’explique tout à fait
par l’intervalle d’appariement spécifié (pour un cas
de 51 ans, on prend un témoin entre 50 et 55 ans)
Il n’aurait pas fallu cocher...
Commentaires
Il permet d’augmenter la précision de l’estimation de Vodds
ratio de cancer du pancréas associé à l’âge
L’estimation d’un odds ratio pour l’âge est inutile
car par définition les cas et les témoins ont le
même âge. L’objectif de l’appariement est de supprimer l’effet de l’âge sur le risque de cancer du
pancréas afin de limiter le biais de confusion lié à
l’âge. S’il était calculé il serait donc proche de 1
Il consiste à associer à chaque
cas masculin de cancer du pancréas un cas féminin de cancer
du pancréas d’âge identique à
± 5 ans
Non, l’appariement sur l’âge consiste à associer
pour chaque cas de cancer du pancréas un
témoin du même âge. Pour le sexe, il consiste
à associer à chaque cas masculin de cancer du
pancréas, un témoin masculin indemne de cancer
du pancréas
Ex e m ple 5 (ED N 2021)
von Ehrenstein OS, Ling C, Cui X, Cockburn M, Park AS, Yu F, et al.
Prénatal and infant exposure to ambient pesticides and autism spectrum
disorder in children: population based case-control study. B MJ 20 mars
2019 ; 364 : 1962.
Objective: To examine associations between early developmental exposure to
ambient pesticides and autism spectrum disorder.
Design: Population based case-control study. 2,961 individuals with a diagnosis of autism spectrum disorder, were identified through records maintained
at the California Department of Developmental Services and linked to their
birth records. Controls derived from birth records were matched to cases
10:1 by sex and birth year. Data from California State mandated Pesticide
Use Reporting were integrated into a géographie information System tool to
estimate prénatal and infant exposures to pesticides.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Confusion dans les études observationnelles
>
265
Study population characteristics by autism spectrum disorder status and
population Controls in the Central Valley, CA*
ASD (ail ;
n=2961)
ASD with ID
(n=445)
ASD without
ID (n=2516)
Controls
(n=35 370)
2403 (81.2)
558 (18.8)
354 (79.6)
91 (20.4)
2049 (81.4)
467(18.6)
29 255 (82.6)
6145 (17.4)
1033 (34.9)
1928 (65.1)
243 (54.6)
202 (45.4)
790 (31.4)
1726 (68.6)
14 390 (40.7)
20 980 (59.3)
233 (7.9)
808 (27.3)
884 (29.9)
592 (20.0)
443 (15.0)
1 (0.0)
38 (8.5)
136 (30.6)
117(26.3)
96 (21.6)
58 (13.0)
195 (7.8)
672 (26.7)
767 (30.5)
469 (19.7)
385 (15.3)
1 (0.0)
4931 (13.9)
10 253 (29.0)
9779 (27.6)
6712 (19.0)
3964 (10.4)
1 (0.0)
1100 (37.1)
166 (37.3)
934 (37.1)
9943 (28.1)
1424 (48.1)
149 (5.0)
205 (46.1)
33 (7.4)
1219 (48.4)
116 (4.6)
20 802 (58.8)
1562 (4.4)
214 (7.2)
74 (2.5)
35 (7.9)
6(1.3)
179 (7.1)
68 (2.7)
2155 (6.1)
908 (2.6)
2133 (72.0)
828 (28.0)
314 (70.6)
131 (29.4)
1819 (72.3)
697 (27.7)
22 152 (62.6)
13 209 (37.3)
9 (0.0)
174 (5.9)
435 (14.7)
34 (7.6)
69 (15.5)
140 (5.6)
366 (14.5)
4518 (12.8)
7583 (21.4)
937(31.6)
152 (34.2)
785 (31.2)
10 909 (30.8)
923 (31.2)
455 (15.4)
37(1.2)
131 (29.4)
48 (10.8)
11 (2.5)
792 (31.5)
407(16.2)
26 (1.0)
7854 (22.2)
3925 (11.1)
581 (1.6)
Sex
Males
Females
Year of birth
1998-2004
2005-2010
Maternai âge
< 19
20-24
25-29
30-34
> 35
Missing data
Maternai race or ethnicity
White to nonHispanic
Hispanic to any
race
Black
Asian/Pacific
Islanders
Others
US born
Yes
No
Missing data
Maternai éducation
Less than 8th grade
9th to 12th grade
High School
graduate
Some degrees less
than college
College or more
Missing data
ASD - autism spectrum disorder; ID - intellectual disability. Data are number (%) or individuals.
* Central Valley counties include San Joaquin, Stanislaus, Merced, Madera, Fresno, Kings, Tulare
and Kern.
. >
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
266
Études observationnelles (analytiques)
À propos du tableau ci-dessus (une ou plusieurs réponses attendues) :
Il aurait fallu cocher...
Commentaires
Le niveau d’éducation des mères des
enfants avec un trouble du spectre
autistique pourrait être un facteur de
confusion car il est plus élevé que celui
des mères des témoins
Environ 20 % des mères des cas ont un
niveau d’éducation inférieur à celui du
lycée alors qu’il est à presque 35 % chez
les mères des témoins
Il n’aurait pas fallu cocher...
Commentaires
81,2 % des enfants de sexe masculin ont
un trouble du spectre autistique
La formulation juste est : 81,2 % des cas
de troubles du spectre autistique sont de
sexe masculin
Le degré de signification (valeur de p) des
tests statistiques de comparaison n’est
pas nécessaire dans ce type d’étude
Contrairement aux essais randomisés au
cours desquels le degré de signification
n’est pas nécessaire dans la comparaison
des 2 groupes de randomisation, dans
le cadre d’études observationnelles les
différences entre les différents groupes de
comparaison ne sont probablement pas
liées au hasard
La majorité des enfants avec un trouble
du spectre autistique ont un déficit
intellectuel
Parmi 2 961 enfants avec un troubles du
spectre autistique, seulement 445 ont un
déficit intellectuel associé
Les différences observées entre les
cas et les témoins pour les caractéristiques sociodémographiques résultent
de l’exposition aux pesticides ambiants
d’origine agricole
On suppose plutôt que l’exposition aux
pesticides ambiants d’origine agricole
pourrait être différente selon les caractéristiques démographiques considérées.
Il y a donc un risque de confusion des
caractéristiques sociodémographiques
dans la relation entre pesticides et
troubles du spectre autistique
Randomly selected Controls from birth records were matched to each case
10:1 by birth year and sex. From the statewide sample (n= 33,921 cases,
n = 339 210 Controls), we excluded 3,401 (10%) case records and 42,519
(12.5%) control records with missing, implausible, or non-viable gestational
âges (included range 147-322 days) or birth weights (included range 5006,800 g), and non-singleton births. We also excluded 1,296 (0.4%) Controls
who died before âge 6 (identified by linkage to the California death registry).
We restricted our sample to the eight major agricultural counties; 38,331
participants (2,961 cases and 35,370 Controls) resided here at the time of
birth and diagnosis.
En dépit de l’appariement sur l’année de naissance, la proportion d’enfants
nés entre 2005 et 2010 diffère entre les cas (65,1%) et les témoins (59,3%)
(tableau 1). Quelle est l’explication la plus probable à ce déséquilibre entre les
deux groupes d’étude (une seule réponse attendue) ?
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Confusion dans les études observationnelles
267
Il aurait fallu cocher...
Commentaires
La restriction de l’échantillon
aux comtés ruraux après
appariement
Les auteurs ont d’abord réalisé un appariement
sur le sexe et sur l’année de naissance en appariant
10 témoins pour un cas (ce qui correspond à
33 921 cas et 339 210 témoins), puis dans un second
temps ils ont exclu un certain nombre de sujet (ceux
décédés avant 6 ans, ceux avec des données manquantes, etc.) et ont restreint l’analyse aux sujets
provenant des 8 régions agricoles majeures. Cette
sélection de l’échantillon réalisée après appariement entraîne ici une exclusion très importante
de sujets surtout pour le groupe contrôle (plus de
200 000 sujets exclus). On perd donc en grande
partie l’intérêt de l’appariement, ce qui entraîne une
perte de comparabilité des groupes sur les variables
d’appariements
Il n’aurait pas fallu cocher...
Commentaires
La surreprésentation masculine dans l’échantillon d’étude
Il s’agit d’une étude en population, la surreprésentation masculine de l’échantillon des cas est donc
probablement le reflet de la réalité épidémiologique.
Pour l’échantillon des témoins, sélectionnés par
appariement sur le sexe, la proportion de sujets
masculins du groupe témoin est donc très proche de
celle du groupe des cas
Un problème technique lors de
l’appariement sur l’année de
naissance et le sexe
Les auteurs ont sélectionné leur échantillon d’étude
après avoir réalisé l’appariement. Il s’agit là d’une
limite importante de l’étude puisque le souhait de
forcer la comparaison entre les cas et les témoins
sur l’âge et le sexe n’est pas respecté
La surmortalité des témoins
avant l’âge de 6 ans
La proportion de témoins exclues en raison d’un
décès avant l’âge de 6 ans est très faible (1 296 sujets soit 0,4 % de l’échantillon), cela a donc peu
d’impact sur le déséquilibre induit après l’appariement en regard du nombre de sujets exclus du fait
de la restriction de la population des zones agricoles
rurales (+ de 200 000 sujets exclus)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 25
Principes généraux des études
cas-témoins et des études
de cohorte
Ce type d’étude a pour but de faire le lien entre :
• un facteur de risque et une maladie chez des sujets initialement indemnes
(études à visée étiologique). Exemple : consommation de café pendant la grossesse et risque de fente labiopalatine ;
• un facteur pronostique et une complication chez des sujets malades (études
à visée pronostique). Exemple : lien entre C-reactive protein (CRP) élevée et
risque de thrombose au cours des cancers digestifs.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
270
Études observationnelles (analytiques)
Études cas-témoins
Études de cohorte de type exposés/non
exposés
Principe
Début de
l'étude
Début de
l'exposition
Début de
l'exposition
Fin du suivi
II
Il
Cohorte
prospective
EXPOSITION
EXPOSITION
Début de
l'exposition
Début de
l'étude
Début de l'étude :
- identification des cas
- appariement de témoins
- recueil de l'exposition
Fin du suivi
Cohorte
historicoprospective
EXPOSITION
Fin du
suivi
Début de
l'exposition
Début de
l'étude
Cohorte
rétrospective
EXPOSITION
- Des patients indemnes de la maladie
étudiée exposés ou non à un facteur de
risque sont suivis au cours du temps :
• suivi prospectif
• suivi historicoprospectif (tout ou
partie de l’exposition est recueillie dans
le passé)
• étude rétrospective (ou cohorte
historique) : on recueille l’information
dans le passé, ou bien on va la chercher
dans des systèmes de recueils (dans ce
cas, le recueil est prospectif, mais l’étude
reste rétrospective, car elle est planifiée
après la fin du suivi)
- Le recueil de la survenue de la maladie
est prospectif grâce à un suivi dont la
durée est définie en avance
- On part toujours de l’identification
des cas (à l’aide d’un registre, de
l’interrogation des cliniciens, des bases de
données médico-administratives, etc.)
- On apparie aux cas des témoins qui
doivent être issus de la même population
source que les cas
- On recueille des informations sur
l’exposition :
• le plus souvent de manière
rétrospective (questionnaire ou interview)
• parfois de manière prospective (base
de données médico-administratives
permettant l’enregistrement continu de
certaines expositions)
- Que le recueil de l’exposition soit
prospectif ou rétrospectif, une étude
cas-témoins est toujours une étude
rétrospective, car l’étude est planifiée après
le début de la maladie
Durée de l’étude
Longue (dépendante de la durée nécessaire
d’exposition pour déclencher la maladie)
Brève : limitée au recueil de l’exposition
Biais de sélection
- Si étude en population à partir de bases
de données : potentiellement aucun
- Sinon, dépend du taux de refus de
participation et des critères de sélection de
l’étude
- Cas : les cas inclus dans l’étude doivent
être représentatifs des cas de la population
cible
- Témoins : ils doivent être issus de la
même population source que les cas.
Difficile +++ et problème des refus de
participation
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Principes généraux des études cas-témoins et des études de cohorte
Études de cohorte de type exposés/non
exposés
271
Études cas-témoins
Recueil des données
Données sur l’exposition recueillies de manière prospective ou rétrospective, mais le
plus souvent l’enregistrement des données
sur l’exposition est fait sans connaissance
de la maladie (car chronologiquement
impossible)
Recueil de l’exposition réalisé de manière
rétrospective, donc pouvant souffrir d’un
biais de mémorisation (biais de classement)
Biais de mesure différentiel
Il n’y a pas de risque d’erreur différentielle
sur la mesure de l’exposition si elle est
recueillie rétrospectivement. En revanche,
risque d’erreur différentielle sur la mesure
de la maladie si elle est recueillie/recherchée en fonction de l’exposition
Le risque d’erreur différentielle sur
l’exposition (pouvant modifier la mesure
d’association dans le sens de l’augmentation de la différence) est très important si
l’on recueille l’exposition en connaissance
du statut malade ou non-malade
Maladie rare et exposition rare
Adaptée pour les expositions rares et peu
adaptée aux maladies rares
Adaptée aux maladies rares et peu adaptée
pour les expositions rares
Délai entre exposition et maladie
Plus facile à mettre en place lorsque le
délai entre l’exposition et la survenue de la
maladie est court
Adaptée aux maladies avec un long délai
d’apparition depuis l’exposition
Possibilité d’étudier plusieurs expositions/plusieurs maladies
- Étude de plusieurs expositions : possible
- Étude possible de la survenue de
plusieurs maladies au cours du temps
- Étude possible de plusieurs expositions
par recueil rétrospectif de ces expositions
- Étude d’une seule maladie possible en
même temps
Perdus de vue
D’autant plus nombreux que l’étude est
longue, prospective, que le délai de survenue de la maladie après exposition est
long et que le suivi est difficile
Pas de perdu de vue par définition étant
donné qu’il n’y a pas de suivi dans le
temps des patients
Mesures d’association
- Possibilité de calculer l’incidence de
la maladie dans chacun des groupes
« exposés » et « non exposés » permettant
le calcul d’un risque relatif (RR)
- NB : on peut également calculer et
utiliser un odds ratio pour des raisons
techniques statistiques
- Rappel : le RR reflète le surrisque de
déclarer la maladie en cas d’exposition au
facteur de risque (ex. : RR = 3 signifie que
l’on a 3 fois plus de risque de déclencher la
maladie)
- Le calcul de l’incidence de la maladie
n’est pas possible et donc le calcul du
risque relatif (RR) non plus. On calcule un
rapport de côte ou odds ratio (OR)
- Rappel : l’OR permet seulement
d’évaluer si l’exposition est associée à une
augmentation de la survenue de la maladie
sans en estimer l’importance (ex. : OR = 3
ne signifie pas que l’on a 3 fois plus de
risque de déclencher la maladie en cas
d’exposition). Cependant lorsque la maladie
étudiée est rare (< 10 % de l’échantillon),
l’OR est une bonne estimation du RR
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
272
Études observationnelles (analytiques)
Études cas-témoins
Études de cohorte de type exposés/non
exposés
Causalité (voir critères de Bradford-Hill, fiche 29)
Plus de critères pour évaluer la causalité :
- la chronologie entre exposition et
maladie peut être étudiée précisément
- la force de l’association peut être
évaluée par le RR
Moins de critères pour évaluer la causalité :
- la chronologie entre exposition et
survenue de la maladie ne peut pas être
étudiée précisément (il est souvent difficile
d’affirmer que l’exposition a précédé la
maladie)
- la force de l’association n’est pas évaluée
par l’OR
Niveau de preuve
Niveau de preuve maximal des études de
cohorte = niveau 2, pouvant entraîner
la mise en place de recommandations de
niveau B (présomption scientifique)
Niveau de preuve maximal des études
cas-témoins = niveau 3, pouvant entraîner
la mise en place de recommandations de
niveau C (faible niveau de preuve scientifique)
Mise en œuvre
Nécessité d’effectifs souvent importants
Coût plus élevé
Effectifs moins importants et moindre coût
Parfois la seule méthodologie réalisable
En pra tique
Ex e m ple 1 (ED N 2016)
Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai
consumption of coffee and caffeine-containing beverages and oral clefts:
a population-based case-control study in Norway. Am J Epidemiol 2009 ;
169 : 1216-22.
We aimed to evaluate the association of maternai consumption of coffee and
caffeinated beverages in early pregnancy with the risk of delivering an infant
with an orofacial cleft. Ail infants born with facial clefts in Norway are treated at government expense in surgical centers at university hospitals located
in Oslo and Bergen. In collaboration with these 2 centers, we identified ail
babies born from 1996 to 2001 who were referred for treatment for either
cleft lip with or without cleft palate (CLP) or cleft palate only (CPO). Controls
were recruited during the same period by randomly selecting approximately
4 births per 1,000 from the National Medical Birth Registry (which includes
ail births in the country). These births served as Controls for both case groups,
with the target of 2 Controls per case of CLP (nearly 4 Controls for each case
of CPO). Both cases and Controls were recruited during their first weeks of
life. Mothers completed a 32-page questionnaire covering démographie characteristics, reproductive history, and exposures during pregnancy (including
smoking, alcohol consumption, coffee intake, médication use, and occupational and household exposures).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Principes généraux des études cas-témoins et des études de cohorte
273
Le choix d’une étude de type cas-témoins a été guidé par le ou les faits suivants :
Il aurait fallu cocher...
Commentaires
La prévalence de la fente
labiopalatine à la naissance est
faible
Les études cas-témoins sont, de manière générale,
adaptées aux maladies rares et aux expositions
fréquentes. Par ailleurs Vodds ratio qui est calculé
dans les études cas-témoins est un bon estimateur
du risque relatif lorsque la prévalence de la
maladie est faible (< 10 %)
La consommation de café au
cours du premier trimestre de
grossesse est fréquente
Une étude prospective aurait
nécessité des effectifs beaucoup
plus importants
Etant donné la rareté de la pathologie étudiée, le
nombre de femmes enceintes nécessaires à suivre
dans une étude prospective devrait être très élevé,
afin que le nombre de naissance d’enfants malades
soit suffisant pour permettre le calcul d’un risque
relatif fiable
Il n’aurait pas fallu cocher...
Commentaires
Ce type d’étude permet de
montrer une relation causale
Ce type d’étude permet en général de suggérer
une association entre une exposition et une
maladie. Cependant le caractère causal est difficile
à démontrer du fait de la présence habituelle de
nombreux biais et de la difficulté d’établir une
séquence temporelle fiable à cause du caractère
rétrospectif du recueil de l’exposition
Ce type d’étude ne présente
généralement pas de biais
Les études cas-témoins sont généralement
entachées de nombreux biais :
- biais de sélection des cas et des témoins par
refus de participation ou difficulté de recrutement
- biais de confusion par l’absence de contrôle de
tiers facteurs interférant dans l’association étudiée
(les groupes ne sont pas randomisés !)
- biais de classement par difficulté du recueil
rétrospectif de l’exposition
Le niveau d’exposition aux
facteurs de risque étudiés peut
être déterminé précisément
La déclaration de consommation de café par
questionnaire est soumise à deux types de biais de
classement dans cette étude :
- biais de classement non différentiel par biais de
mémorisation
- biais de classement différentiel lié à la
connaissance de la présence ou non de la maladie
chez l’enfant qui peut sous- ou surestimer la
déclaration de consommation de café par la mère
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
274
Études observationnelles (analytiques)
Quels sont les biais potentiels de cette étude ?
Commentaires
Il aurait fallu cocher...
Biais de sélection des
populations étudiées
On parle de biais de sélection lorsque les cas ou les
témoins ne sont pas représentatifs de la population
cible, ou lorsque les témoins ne sont pas issus de la
même population que les cas. Ici, tous les cas et tous
les témoins potentiels de la population source ont été
sélectionnés pour participer à l’étude, et les témoins
ont été tirés au sort à partir de la même population que
celle des cas (l’ensemble des enfants nés en Norvège
entre 1996 et 2001). Néanmoins, on note que seulement
88 % des cas identifiés et 76 % des témoins tirés au sort
ont accepté de participer à l’étude. Il est probable que
les mères ayant refusé de participer à l’étude aient des
caractéristiques particulières, ce qui définit un biais de
sélection. De plus, les mères ne parlant pas norvégien ont
été exclues, de même que les mères d’un enfant décédé
Biais lié à la présence de
facteurs de confusion
Le biais de confusion est toujours un problème dans les
études observationnelles car les groupes comparés ne
sont pas randomisés
Biais de classement sur
l’exposition, lié à
l’absence de souvenir
Le recueil rétrospectif de l’information sur la
consommation de café expose à un biais de classement
sur ce paramètre. En revanche, l’inclusion des cas référés
dans un des deux centres de référence pour la chirurgie
des fentes labiopalatines rend le risque d’erreur de
classement sur la définition des cas peu vraisemblable
Il n’aurait pas fallu cocher...
Commentaires
Biais de classement sur les critères
définissant les cas
L’inclusion des cas référés dans un
des deux centres de référence pour la
chirurgie des fentes labiopalatines rend
le risque d’erreur de classement sur la
définition des cas peu vraisemblable
Biais d’attrition des populations étudiées
C’est un biais de sélection qui survient
lorsque l’échantillon perd en
représentativité de la population cible,
car le nombre de perdus de vue est trop
important au cours du suivi. Il n’y a, par
définition, pas de perdus de vue dans
cette étude
Biais de classement non différentiel
lié à la connaissance du statut malade
de l’enfant lors de la déclaration de la
consommation de café par la mère
La connaissance du statut malade ou
non malade de l’enfant par la mère
peut entraîner un biais de classement
différentiel par surestimation de
l’exposition chez les mères qui ont un
enfant malade
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Principes généraux des études cas-témoins et des études de cohorte
275
Ex e m ple 2 (ED N 2017)
Fondell E, Fitzgerald KC, Falcone GJ, O’Reilly EJ, Ascherio A. Early-onset
alopecia and amyotrophie latéral sclerosis: a cohort study.
Am J Epidemiol 2013 ; 178(7) : 1146-9.
Amyotrophie latéral sclerosis (ALS) is a neurodegenerative disease with a
médian survival of 1.5-3 years after diagnosis. The cause of ALS is largely unknown, and there is no effective treatment to date. Several observations suggest
a link between early balding (alopecia) and ALS.
The Health Professionals Follow-up Study is a longitudinal study of 51,529 male
health professionals, aged 40-75 years at enrollment, who completed a mailed
questionnaire about lifestyle and medical history in 1986 and similar biennial
questionnaires since then.
In 1992, participants reported their balding status at âge 45 years by choosing
from 5 crown-view pictograms based on Norwood’s classification of malepattern baldness (Norwood’s I, III, IV, V, and VII).
In each biennial follow-up questionnaire, participants were asked to report a
spécifie list of medically diagnosed conditions and “any other major illness”.
ALS was added to the list of spécifie conditions beginning in 2000.
Person-time was calculated from the date of return of the 1992 questionnaire
until the date of first onset of ALS symptoms (37 cases), death from ALS or
any other cause (5 cases), or the end of follow-up (December 31, 2008).
De quel type d’étude s’agit-il ?
Commentaires
Il aurait fallu cocher...
Epidémiologique
On s’intéresse à un phénomène de santé au sein d’une
population
Observationnelle
Il n’y a pas d’intervention, le facteur d’exposition
(alopécie) n’est pas contrôlé par l’étude
À visée étiologique
L’objectif est de rechercher s’il existe un lien entre
alopécie et SLA
Prospective
Il existe un suivi par questionnaires sur plusieurs années
Analytique
Oui, le but est de faire le lien entre un facteur de risque
(l’alopécie) et une maladie (la SLA)
Il n’aurait pas fallu cocher...
Commentaires
Etude cas-témoins nichée
dans une cohorte
L’information est recueillie de manière prospective,
alors que dans une étude cas-témoins nichée dans une
cohorte, les participants sont sélectionnés au sein d’une
cohorte déjà existante et l’exposition est recueillie
rétrospectivement
Etude transversale
Une telle étude étudie un phénomène de santé à un
instant T, comme dans une étude de prévalence. Ce n’est
pas le cas ici, il y a un suivi
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
U6
Études observationnelles (analytiques)
Il n’aurait pas fallu cocher...
Commentaires
Étude de cohorte historique
Dans une cohorte historique, le début de l’étude est
postérieur au début de la maladie (on parle aussi de
cohorte rétrospective)
Étude descriptive
Une étude descriptive décrit un phénomène de santé
(étude de prévalence/d’incidence), ici on recherche des
liens entre facteur de risque éventuel et survenue d’une
maladie (= étude analytique)
Étude interventionnelle
Le facteur d’exposition n’est pas contrôlé par l’étude.
Un essai clinique est une étude interventionnelle, on
décide le plus souvent par randomisation qui aura le
traitement A et qui aura le traitement B (ou le placebo)
Quel plan d’étude alternatif aurait pu être proposé pour répondre à cette question ?
Il aurait fallu cocher...
Commentaires
Une étude cas-témoins comparant
un groupe de patients atteints de
sclérose latérale amyotrophique et un
groupe de témoins indemnes de cette
pathologie
Une étude cas-témoins aurait été adaptée
ici, notamment du fait de la rareté de la
pathologie étudiée
Une étude de cohorte prospective
en population générale comparant
l’incidence de la sclérose latérale
amyotrophique en fonction de la
présence ou non d’une alopécie
Correspond à une étude de type exposés/
non exposés. Ce schéma aurait été possible
mais extrêmement lourd à mettre en place.
Du fait de la rareté de la maladie et du
délai long entre exposition et survenue de
la maladie, beaucoup d’individus seraient
nécessaires avec un suivi de plusieurs années,
voire de plusieurs dizaines d’années
Il n’aurait pas fallu cocher...
Commentaires
Une étude évaluant la prévalence de
l’alopécie chez les patients atteints de
sclérose latérale amyotrophique
Une étude de prévalence fait partie des études
épidémiologiques descriptives et n’est donc
pas adaptée pour identifier des facteurs de
risque de maladie
Une étude cas-témoins comparant un
groupe de patients atteints d’alopécie
et un groupe de témoins indemnes
d’alopécie
Cette étude n’est pas pertinente puisque la
pathologie d’intérêt est la sclérose latérale
amyotrophique et non l’alopécie. L’alopécie
est l’exposition d’intérêt dans cette étude
Une étude rétrospective à partir
d’un registre spécifique des patients
atteints de sclérose latérale
amyotrophique
Cette étude ne met pas à disposition des
patients indemnes de la maladie et ne permet
donc pas de comparer l’exposition entre des
malades et des non-malades
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Principes généraux des études cas-témoins et des études de cohorte
277
Ex e m ple 3 (ED N 2020)
Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for
Pancreatic Cancer in China: A Multicenter Case-Control Study. J Epidemiol
2016 ; 26(2) : 64-70.
Despite having one of the highest mortality rates of ail cancers, the risk factors
of pancreatic cancer remain unclear. We assessed risk factors of pancreatic
cancer in China. A case-control study design was conducted using data from
four hospital-based cancer registries.
Quel(s) élément(s) a (ont) conduit les auteurs à choisir un schéma d’étude « cas
témoin » ?
Commentaires
Il aurait fallu cocher...
L’incidence du cancer du
pancréas est faible
Même si l’incidence augmente, la maladie reste
(heureusement) peu fréquente
Une étude cas témoin permet
d’explorer plusieurs expositions
simultanément
Oui et c’est le cas ici avec le tabac, l’alcool,
l’obésité, le diabète, les antécédents familiaux
Le temps d’apparition du
cancer du pancréas peut durer
plusieurs années
C’est un problème de faisabilité car pour une étude
de cohorte prospective de type exposé-non exposé
il faudrait certainement plusieurs dizaines d’années
pour conclure
Il n’aurait pas fallu cocher...
Commentaires
Le taux de mortalité par cancer du
pancréas est élevé
Le critère de jugement est ici l’apparition
du cancer et pas la mortalité
Les études cas témoin sont moins
propices aux biais que les études de
cohorte
C’est faux, principalement en raison
du caractère rétrospectif du recueil des
facteurs d’exposition
Ex e m ple 4 (é preuve t est 2019)
Liperoti R, Pedone C, Lapane KL, Mor V, Bernabei R, Gambassi G.
Venons Thromboembolism Among Elderly Patients Treated With Atypical
and Conventional Antipsychotic Agents. Arch Intern Med 12 déc 2005 ;
165(22) : 2677.
The aim of this study was to estimate the effect of atypical and conventional
antipsychotic agents on the risk of hospitalization for Venous Thromboembolism (VTE) among elderly patients. We conducted a rétrospective cohort study
on nursing home residents in 5 States. We used data from the Minimum Data
Set to identify 19,940 new users of antipsychotic agents and 112,078 nonusers. Hospitalization with VTE as primary discharge diagnosis was determined during a 6-month follow-up period using Medicare inpatient daims.
Cox proportional hazards models provided estimâtes of effect adjusted for
confounders.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
278
Études observationnelles (analytiques)
Par rapport à cette étude de cohorte historique analytique :
Il aurait fallu cocher...
Commentaires
Une étude cas-témoins aurait aussi été
adaptée pour estimer l’association entre
les traitements antipsychotiques et le
risque d’événements thromboemboliques
veineux
On aurait pu réaliser une étude cas
témoins en comparant les antécédents
d’exposition aux antipsychotiques de
patients ayant présenté un épisode
thromboembolique à des témoins n’en
ayant pas présenté
Une étude cas-témoins aurait permis de
limiter l’effectif de l’échantillon d’étude
Il s’agit d’un avantage pratique des
études cas-témoins par rapport aux
études exposés-non exposés. Dans les
études de cohorte exposés-non exposés,
il faut suivre un nombre important
de patients pour recueillir un nombre
d’événements suffisant afin d’avoir la
puissance nécessaire pour conclure, ceci
d’autant plus si la maladie est rare
Une étude cas-témoins n’aurait pas
permis d’estimer le taux d’incidence
d’événements thromboemboliques
veineux
Dans les études cas-témoins, le ratio
cas/témoins (donc la fréquence de la
maladie dans l’échantillon) étant fixé par
les auteurs, on ne peut donc estimer ni
incidence, ni prévalence
Il n’aurait pas fallu cocher...
Commentaires
Une étude monocentrique aurait
amélioré la représentativité de la
population étudiée
C’est le caractère multicentrique qui
permet une meilleure représentativité de
la population-source par rapport à la
population-cible
Une étude randomisée aurait été
plus adaptée pour estimer le risque
d’événements thromboemboliques sous
antipsychotiques
Une telle étude ne serait ni éthique, ni
faisable
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 26
Etudes cas-témoins : sélection
des participants et définition
de la maladie
D éfinitio n d e la m aladie
Elle doit être la plus précise, standardisée et objective possible. Elle ne doit
idéalement pas pouvoir être influencée par l’exposition.
La définition de certaines maladies peut évoluer au cours du temps (critères
diagnostiques, amélioration des méthodes diagnostiques). La période de prise
en compte des cas doit être précisée et un changement éventuel de définition au
cours de l’étude explicitée.
Sélectio n d es cas
Le recrutement des cas se doit d’être le plus exhaustif possible parmi l’ensemble
des patients atteints de la pathologie étudiée pour une région géographique et
une période de temps données. L’objectif principal est de minimiser le risque
de biais de sélection. Le meilleur choix est d’utiliser un registre de maladie
recensant tous les cas au sein d’une région, mais ce n’est pas toujours possible.
Un recrutement fondé sur un « appel à observation » a beaucoup plus de risque
de sélectionner des patients particuliers et d’induire un biais de sélection.
Préférer l’inclusion de cas incidents sur les cas prévalents :
• dans une étude cas-témoins, il est toujours préférable d’inclure les cas incidents que les cas prévalents :
- les cas incidents sont les nouveaux cas apparus pendant une période donnée (par exemple, 1 an),
- les cas prévalents sont tous les cas connus à un moment donné (par exemple, le 1er décembre 2019) ;
• les cas prévalents sont sélectionnés, car ce sont les survivants un jour donné
(dans le cas d’une maladie rapidement létale, comme le cancer du pancréas par
exemple, les cas les moins graves avec une meilleure survie seront surreprésentés dans les cas prévalents) ;
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
280
Études observationnelles (analytiques)
• en cas d’inclusion des cas prévalents :
- il existe un biais de sélection car a priori les cas prévalents sont en moins
mauvaise santé, les plus graves étant décédés au moment de l’inclusion,
- il existe un biais de mesure sur le facteur de risque en lien avec des changements d’habitudes et notamment des modifications concernant d’éventuelles
expositions depuis le diagnostic de la maladie.
Sélectio n d es t é m oins
• Pour limiter le biais de mesure (biais de classement), il faut s’assurer que les
témoins n’ont pas la maladie étudiée (c’est-à-dire classés dans le bon groupe).
• Pour limiter le biais de sélection, il faut s’assurer que :
- les témoins sont issus de la même population source que les cas ;
- tous les témoins potentiels ont la même probabilité d’être inclus ;
- le fait d’être exposé ou non n’influence pas la probabilité d’être choisi
comme témoin (en cas d’appel à volontaires, des témoins fumeurs pourraient
être plus tentés de participer à une enquête concernant les risques liés au
tabac) ;
- les témoins ayant refusé de participer à l’étude ont les mêmes caractéristiques que ceux qui y ont participé (en pratique rarement vrai).
• Le recrutement peut se faire en population générale ou dans certaines populations particulières. Chaque situation a ses avantages et ses inconvénients. Il
faut toujours se demander quelles sont les caractéristiques des patients éligibles
et s’ils ont des rapports particuliers avec l’exposition :
- les témoins sur les listes électorales : doivent être inscrits sur les listes
(majeurs, souvent situation sociale stable, citoyens français, etc.) ;
- les témoins en milieu hospitalier : sont potentiellement plus exposés à certaines pathologies ;
- les témoins issus du monde du travail : ont habituellement moins de problèmes de santé que le reste de la population (healty worker effect).
Sommairement, si on compare des cas de lymphome recrutés dans un centre
hospitalier à des témoins recrutés dans un service de médecine du travail de
l’entreprise voisine, il est évident que le profil d’exposition aux différents facteurs de risque en rapport avec la maladie ne sera pas le même, rendant l’interprétation très délicate.
A p p arie m e n t
• Pour chaque cas, on inclut un ou plusieurs témoins (le nombre de témoins est
toujours un multiple du nombre de cas).
• L’appariement consiste à supprimer certains facteurs de confusion (classiquement au moins l’âge et le sexe) en recrutant pour chaque cas un ou plusieurs
témoins ayant les mêmes caractéristiques pour les variables d’appariement
(voir fiche 24).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Études cas-témoins : sélection des participants et définition de la maladie
281
• Si les variables d’appariement sont trop nombreuses ou trop liées à l’exposition, on parle de « surappariement » : les témoins et les cas sont trop proches et
on ne peut plus montrer de lien sur le facteur d’exposition. Par exemple, on étudie le lien entre bronchiolite et tabagisme passif. Si l’on apparie chaque enfant
avec son frère ou sa sœur, ils auront exactement le même niveau d’exposition à
tous les facteurs de risque et notamment au tabagisme passif, et on ne pourra
rien montrer.
• L’appariement nécessite l’utilisation de techniques statistiques particulières
(statistiques pour séries appariées, voir fiche 5).
• Combien de témoins par cas ?
- si l’exposition est rare, on peut augmenter le nombre de témoins afin d’augmenter le nombre de patients exposés au facteur de risque pour obtenir une
puissance plus importante ;
- pour un même nombre de cas, on a plus de puissance (c’est-à-dire risque de
conclure à une différence qui existe vraiment) si on inclut par exemple trois
témoins pour un cas au lieu d’un seul (étude avec 30 cas et 90 témoins plus
puissante qu’une étude avec 30 cas et 30 témoins) ;
- pour un même nombre de patients totaux, augmenter le nombre de témoins
par nombre de cas n’augmente pas la puissance (une étude avec 100 cas et
100 témoins n’est pas plus puissante qu’une étude avec 50 cas et 150 témoins).
Cas p articulier de l'é t u d e cas-té m oins nichée d ans
u ne co h ort e (nested c ase-control study)
Dans ce design, les cas et les témoins sont tous issus d’une cohorte. On isole
les patients ayant développé la maladie, on leur apparie des patients ne l’ayant
pas développée, et on étudie le lien avec un facteur de risque recueilli ou non
pendant l’étude prmceps.
Exemple : étude cas-témoins nichée dans une cohorte étudiant le lien entre
consommation d’alcool et pathologie hépatique. On apparie aux patients
cirrhotiques des patients n’ayant pas développé cette maladie et on étudie le lien
avec des biomarqueurs prélevés en début d’étude et la consommation d’alcool
également recueillie en début d’étude. L’avantage est que le recueil prospectif
protège du risque de biais de mesure différentiel (il est impossible que la
connaissance de la cirrhose influence le recueil de la consommation d’alcool,
car l’information a été enregistrée avant la survenue de la maladie).
E n p r a t iq u e
Ex e m ple 1 (ED N 2016)
Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai
consumption of coffee and caffeine-containing beverages and oral clefts:
a population-based case-control study in Norway. Am J Epidemiol 2009;
169:1216-22.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
282
Études observationnelles (analytiques)
Coffee is a commonly consumed beverage among prégnant women, and even
a small increase in malformation riskcould be a matter of concern. We used
data from a population based case-control study to evaluate the association of
maternai consumption of coffee and caffeinated beverages in early pregnancy
with the risk of delivering an infant with an orofacial cleft.
Ail infants born with facial clefts in Norway are treated at government expense in surgical centers at university hospitals located in Oslo and Bergen.
In collaboration with these 2 centers, we identified ail babies born from 1996
to 2001 who were referred for treatment for either cleft lip with or without
cleft palate (CLP) or cleft palate only (CPO). Controls were recruited during
the same period by randomly selecting approximately 4 births per 1,000 from
the National Medical Birth Registry (which includes ail births in the country). These births served as Controls for both case groups, with the target of
2 Controls per case of CLP (nearly 4 Controls for each case of CPO). Both cases
and Controls were recruited during their first weeks of life.
Concernant le recrutement des cas et des témoins dans cette étude :
Il aurait fallu cocher...
Commentaires
Le recrutement des cas
est représentatif de la
population source
Les auteurs ont recruté tous les enfants adressés
pour une chirurgie de fente labiopalatine (FLP) dans
les deux seuls centres norvégiens pratiquant cette
chirurgie. On imagine que le nombre d’enfants avec
une FLP n’ayant pas été adressés pour une chirurgie
doit être négligeable
La population source des
témoins est la même que
celle des cas
Les témoins sont tous issus de la population générale
(registre exhaustif des naissances). Si on considère que
les cas sont recueillis exhaustivement, la population
source est bien la même : l’ensemble de la population
norvégienne. Cela limite le biais de sélection
Le caractère exhaustif du
recueil des cas limite le
biais de sélection
Un recueil exhaustif des cas permet un recrutement le
plus représentatif possible de l’ensemble des enfants
norvégiens nés avec une FLP
Il n’aurait pas fallu cocher...
Commentaires
Il est responsable d’un biais
de classement dans cette étude
La définition de la maladie est claire ici et n’est pas
soumise à l’interprétation d’un professionnel. Il
semble donc impossible de classer un nouveau-né
sain dans la catégorie des cas et vice-versa
Il aurait été préférable de
recruter les témoins seulement
dans les deux hôpitaux
pratiquant la chirurgie
Les cas sont originaires de toute la Norvège, car
seulement deux centres pratiquent la chirurgie
en question dans le pays. Le recrutement parmi
toutes les naissances norvégiennes permet a priori
une sélection des témoins avec des caractéristiques
sociodémographiques proches des cas
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Études cas-témoins : sélection des participants et définition de la maladie
283
Il n’aurait pas fallu cocher...
Commentaires
Les auteurs auraient dû
apparier les cas et les témoins
sur la consommation de café
L’appariement sur un ou des facteurs de confusion
peut être utile pour limiter le biais de confusion.
La consommation de café correspond au facteur
d’exposition d’intérêt. L’objectif est justement de
rechercher une différence de consommation de café
entre les cas et les témoins
On peut garantir que
les témoins inclus sont
représentatifs de la population
source
En raison des refus de participation, il n’est pas
possible de garantir cet aspect
Dans cette étude, approximativement deux témoins ont été recrutés pour un cas
de fente labiale (avec ou sans fente palatine) dans le but de :
Il aurait fallu cocher...
Commentaires
Augmenter la puissance
De manière générale, augmenter le nombre de
participants augmente la puissance. Choisir un risque p
très faible (c’est-à-dire une puissance forte car
puissance = 1 — p) entraîne mathématiquement une
augmentation du nombre de sujets nécessaires
Augmenter les chances de
mettre en évidence une
différence entre les cas et
les témoins
Augmenter les chances de mettre en évidence une
différence qui existe est synonyme d’une augmentation
de la puissance
Réduire la largeur de
l’intervalle de confiance
des odds ratios estimés
En augmentant le nombre de sujets dans une étude, on
diminue les fluctuations d’échantillonnage et on améliore
la précision des estimations (ce qui revient à réduire la
largeur des intervalles de confiance des estimateurs)
Il n’aurait pas fallu cocher...
Commentaires
Limiter un potentiel biais
de sélection lié aux sujets
perdus de vue en cours de
suivi
Il n’y a pas de suivi dans une étude cas-témoins car le
recueil des données est rétrospectif
Calculer des risques relatifs
Les risques relatifs ne sont pas calculables dans une
étude cas-témoins, ils le sont seulement dans les études
prospectives
Procéder à un appariement
sur les facteurs de confusion
potentiels
Aucun appariement n’a été réalisé ici et de toute
façon ce n’est pas l’objectif. On peut très bien
apparier un témoin pour chaque cas sans augmenter
le nombre de témoins par cas
Diminuer le risque a
Le risque a n’est pas lié aux nombres de participants
à une étude, contrairement au risque p
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
284
Études observationnelles (analytiques)
Ex e m ple 2 (ED N 2020)
Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for
Pancreatic Cancer in China: A Multicenter Case-Control Study. J Epidemiol
2016 ; 26(2) : 64-70.
We assessed risk factors of pancreatic cancer in China. A case-control study
design was conducted using data from four hospital-based cancer registries. A
total of 646 participants were recruited, including 323 pathologically verified
cancer cases and 323 Controls selected from family members of non-pancreatic cancer patients in the same hospital. Cases and control were 1:1 matched
by gender and âge; 110 pairs were recruited from Henan Provincial Cancer
Hospital, 105 from Beijing Cancer Hospital, 73 from Hebei Cancer Hospital,
and 35 from the Cancer Institute & Hospital of the Chinese Academy of Medical Sciences.
Les témoins ont été sélectionnés parmi les membres de la famille de patients hospitalisés et indemnes de cancer du pancréas. Quel(s) principe(s) aurai(en)t guidé
le choix de la population source des témoins ?
Il aurait fallu cocher...
Commentaires
Des témoins sélectionnés parmi les
patients hospitalisés ont une probabilité
d’exposition à certains facteurs de risque
étudiés plus élevée que les sujets non
hospitalisés
Des facteurs de risques comme le
tabac, le diabète ou l’obésité sont plus
fréquemment retrouvés chez des patients
hospitalisés car sources de nombreuses
complications. Il y aurait donc un
risque de ne pas mettre en évidence une
association qui existe entre ces facteurs
de risque et la survenue de cancer du
pancréas si on sélectionnait les témoins
parmi une population de patients
hospitalisés
Des témoins sélectionnés parmi les
membres de la famille des cas ont une
probabilité d’exposition à certains
facteurs de risque étudiés plus élevée que
les sujets non apparentés aux cas
Les habitudes de vie et les habitudes
alimentaires de personnes de la même
famille étant le plus souvent proches,
il est donc possible de ne pas mettre en
évidence certains facteurs de risque de
cancer du pancréas qui seraient présents
de manière identique chez les cas et les
témoins
Des témoins sélectionnés en population
générale chinoise ont une probabilité
d’exposition à certains facteurs de risque
étudiés différente de la population du
bassin de recrutement de l’hôpital des cas
Sélectionner des témoins trop différents
notamment en matière d’exposition
environnementale entraîne un risque
de biais trop important. Dans l’idéal,
les témoins doivent être issus de la
population-source des cas
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Études cas-témoins : sélection des participants et définition de la maladie
285
Il aurait fallu cocher...
Commentaires
Des témoins sélectionnés parmi les
patients hospitalisés ont une probabilité
d’exposition à certains facteurs de risque
étudiés plus élevée que les cas
Même principe que pour la première
proposition. Dans la situation d’une
exposition plus importante à un facteur
de risque chez les témoins hospitalisés
par rapport aux cas (le tabac, par
exemple), on pourrait retrouver de
manière biaisée une association
statistique protectrice de ce facteur de
risque sur le risque de survenue de cancer
du pancréas
Il n’aurait pas fallu cocher...
Commentaires
Des témoins sélectionnés parmi les
patients hospitalisés ont une probabilité
de cancer du pancréas authentifié
histologiquement plus élevée que les
sujets non-hospitalisés
Les cas sont des sujets atteints
d’un cancer du pancréas prouvé
histologiquement et les témoins sont des
sujets indemnes de cancer de pancréas.
On ne va pas aller faire des biopsies du
pancréas aux témoins afin d’être certains
de l’absence de la maladie
Ex e m ple 3 (ED N 2021)
von Ehrenstein OS, Ling C, Cui X, Cockburn M, Park AS, Yu F, et al.
Prénatal and infant exposure to ambient pesticides and autism spectrum
disorder in children: population based case-control study. B MJ 20 mars 2019 ;
364:1962.
Records of autism spectrum disorder cases were retrieved from the registry
maintained at the California department of Developmental Services (DDS),
based on diagnostic data collected by contracted régional centers. We included
ail individuals with a primary diagnosis of autistic disorder (code 299.00)
reported on the DDS client development évaluation report, which implements
criteria of the Diagnostic and Statistical Manual of Mental Disorders, fourth
édition, revised (DSM-IV-R)15 up to 31 December 2013 (“autistic disorder” is
the most severe diagnosis of autism spectrum disorder under DSM-IV criteria).
La surreprésentation des enfants de sexe masculin chez les cas s’explique le plus
probablement par (une seule réponse attendue) :
Il aurait fallu cocher...
Commentaires
La prévalence plus élevée des troubles du
spectre autistique chez les sujets de sexe
masculin
Les cas ont été sélectionné sur la base
d’un registre de population et il est
précisé que tous les cas de trouble du
spectre autistique ont été sélectionnés à
partir de ce registre. La prédominance
masculine est donc très probablement
une réalité épidémiologique
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
286
Études observationnelles (analytiques)
Il n’aurait pas fallu cocher...
Commentaires
Un biais de sélection lié au mode de
recrutement des cas
Il s’agit d’un recrutement en population
sur la base d’un registre et il est d’autant
plus précisé : We included ail individuals
with a primary diagnosis of autistic
disorder. Il n’y a donc pas de biais de
sélection dans cette situation
L’appariement des cas aux témoins
Les modalités de sélection des témoins ne
modifient pas les caractéristiques des cas
L’effet des pesticides ambiants sur la
différenciation sexuelle embryonnaire
Aucun élément du texte ne permet de le
supposer
La réalisation de l’étude dans une zone
rurale à prédominance masculine
Même si cela avait été le cas, il n’y a pas
de raison que cela influe sur le sex-ratio
des enfants !
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 27
Études de cohorte : sélection
des participants et mesure de
l’exposition
Une cohorte est un groupe de patients possédant une caractéristique commune
et suivis dans le temps. Cette caractéristique commune peut être de plusieurs
types (une maladie, une origine géographique, une caractéristique socioéconomique, etc.). Exemples : cohorte de patients avec un diabète de type 2 ; cohorte
de patients ayant consulté dans le même service de cardiologie ; cohorte de
patients originaire d’un même département.
O bje t d e l'é tu d e de co h ort e
• Cohorte à visée étiologique : on étudie le lien entre un facteur de risque et une
maladie chez des sujets initialement indemnes.
• Cohorte à visée pronostique : on étudie le lien entre un facteur pronostique et
la complication d’une maladie chez des patients tous atteints de cette maladie.
M o d alit és de sélectio n d es p articip a n ts
On distingue trois modalités de sélection des participants :
• études de cohorte prospective : les sujets sont initialement tous indemnes et
inclus prospectivement sans tenir compte de leur exposition au facteur de risque ;
• études de cohorte exposés/non exposés : on constitue deux groupes en fonction de l’exposition ou non au facteur étudié. Dans ce cas, un appariement des
sujets exposés et non exposés est possible ;
• études de cohorte historique (ou « rétrospective ») : dans ce cas, la cohorte est
reconstituée à partir de données recueillies dans le passé. L’étude est planifiée à
partir des données déjà disponibles. Elle se distingue d’une étude cas-témoins,
car on part des caractéristiques initiales de la cohorte (cohorte de patients travaillant dans l’industrie, cohorte de professionnels de santé, etc.) et pas des cas
d’une pathologie donnée dont on veut étudier l’apparition.
Biais d e sélectio n e t n o tio n de re présen t a tivit é (v oir
fich e 2)
Dans une étude de cohorte, le biais de sélection est essentiellement lié au fait
que les patients inclus sont volontaires et que les refus d’étude ne sont évidemment pas aléatoires.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
288
Études observationnelles (analytiques)
Une exception notable à cette règle est celle des études dites « en population » :
• dans ce type d’étude, on utilise un système d’enregistrement exhaustif des
individus constituant une cohorte (par exemple, registre de tous les patients
atteints d’insuffisance cardiaque en Suède) ;
• dans ce cas, l’échantillon est constitué par la population source.
Dans les études de cohorte prospective, de type exposés/non exposés ou non,
les perdus de vue au cours de l’étude sont à l’origine d’une perte de représentativité (sélection, on parle de biais d’attrition).
Dans une étude rétrospective, il n’y a habituellement pas de problème lié au
suivi (les patients non suivis ne sont pas inclus), il faut néanmoins se demander
si l’échantillon est représentatif de la population source.
En résu m é
• Les critères de sélection d’une cohorte sont habituellement beaucoup plus
larges que ceux d’un essai clinique, ce qui en facilite la généralisation, même
si la validité interne de l’étude est moins forte (les résultats sont moins fiables,
notamment à cause du biais de confusion, mais plus facile à généraliser).
• Une étude en population est indemne de biais de sélection.
• Les principales sources de biais de sélection sont : les refus de participation et
les sorties d’étude.
• Si les refus de participation ou les sorties d’étude sont liés à l’exposition, il existe
un risque de biais différentiel pouvant impacter fortement les résultats de l’étude.
E n p r a t iq u e
Ex e m ple (é pre uve t est 2018)
Johansson K, Cnattingius S, Nâslund I, Roos N, Trolle Lagerros Y, Granath F,
Stephansson O, Neovius M. Outcomes of pregnancy after bariatric surgery.
N Engl J Med 2015; 372: 814-24.
Maternai obesity is associated with increased risks of gestational diabètes, largefor-gestational-age infants, preterm birth, congénital malformations, and stillbirth. The risks of these outcomes among women who hâve undergone bariatric surgery are unclear. We investigated the risks of gestational diabètes and
adverse périnatal outcomes among women with a history of bariatric surgery as
compared with women without such a history but with similar characteristics.
We therefore conducted a population-based study using data from nation
wide Swedish registries, including information on presurgery BMI among
women who had undergone bariatric surgery. We investigated the risks of
gestational diabètes and adverse périnatal outcomes among women with a
history of bariatric surgery as compared with women without such a history
but with similar characteristics.
The Swedish Medical Birth Register includes information on more than 98%
of ail births in Sweden since 1973. Information is prospectively collected from
standardized prénatal, obstétrical, and néonatal records.
We identified 627,693 singleton pregnancies in the Swedish Medical Birth
Register from 2006 through 2011, of which 670 occurred in women who
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Études de cohorte : sélection des participants et mesure de l’exposition
289
had previously undergone bariatric surgery and for whom presurgery weight
was documented. For each pregnancy after bariatric surgery, up to five control
pregnancies were matched for the mother’s presurgery body-mass index (BMI;
we used early-pregnancy BMI in the Controls), âge, parity, smoking history,
educational level, and delivery year. We assessed the risks of gestational diabètes, large-for-gestational-age and small-for-gestational-age infants, preterm
birth, stillbirth, néonatal death, and major congénital malformations.
Identification of the Study Population and the Matched Control Population.
The exclusions for multiple births and incorrect or missing maternai personal
identification numbers do not sum to 22,783 because there were 80 exclusions for both a multiple birth and an incorrect or missing maternai personal
identification number. BMI dénotés body-mass index, and SOReg Scandinavian Obesity Surgery Registry.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
290
Études observationnelles (analytiques)
Il s’agit d’une étude :
Il aurait fallu cocher...
Commentaires
Avec groupe contrôle
Il s’agit d’une étude de type exposés/non exposés.
La maladie étudiée est le diabète gestationnel et
le facteur d’exposition la chirurgie bariatrique.
L’information est recueillie prospectivement à
l’aide de registres nationaux. Les exposés (patientes
opérées) sont comparés à un groupe contrôle de
patientes non opérées issues du registre national
Observationnelle
L’exposition (la chirurgie bariatrique) n’est pas
randomisée, c’est donc une étude observationnelle
De cohorte
Les malades sont suivis dans le temps (par
l’intermédiaire des registres). La caractéristique
commune est la grossesse
Analytique
On cherche à étudier le lien entre un facteur de
risque et une maladie, c’est donc bien une étude
observationnelle
Il n’aurait pas fallu cocher...
Commentaires
Randomisée
L’exposition (la chirurgie bariatrique) n’est pas
randomisée. Le tirage au sort de témoins ne fait pas
de cette étude une étude randomisée !
Cas-témoins
Dans cette étude, le recueil est prospectif. On ne
part pas de cas de la maladie étudiée (le diabète
gestationnel) pour les apparier à des témoins sans
diabète. Ici, on part des malades exposés pour les
apparier à des sujets non exposés
Interventionnelle
Non, puisqu’elle est observationnelle
Descriptive
Non, puisqu’elle est analytique
Pourquoi l’effectif du groupe « contrôle » est-il très différent de l’effectif du
groupe « chirurgie bariatrique » en dépit de l’appariement ?
Il aurait fallu cocher...
Commentaires
Entre une à cinq naissances
du groupe contrôle ont été
appariées à chaque naissance
du groupe « chirurgie
bariatrique »
Dans cette étude, le nombre d’exposés et de
non-exposés (opérés et contrôles) est déséquilibré par
construction. Cinq témoins sont tirés au sort dans le
registre. Le nombre de témoins par patiente opérée
dépend de la rareté de la combinaison des variables
d’appariement. Pour chaque patiente opérée, on lui
apparie une patiente de même âge, poids, etc.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Études de cohorte : sélection des participants et mesure de l’exposition
Il n’aurait pas fallu cocher...
291
Commentaires
On n’a pas trouvé de contrôle pour
74 naissances du groupe « chirurgie
bariatrique »
Les 74 exclusions n’expliquent pas le
déséquilibre final, puisque les patientes
non appariées sont exclues de l’analyse
La randomisation était déséquilibrée avec
un ratio 5 :1
Cette étude n’est pas randomisée
L’effectif de naissances multiples différait
entre les 2 groupes comparés
Nous n’avons pas cette information. De
toute façon, c’est un critère d’exclusion,
donc aucune grossesse multiple ne doit
être incluse quel que soit le groupe
1085 naissances du groupe « chirurgie
bariatrique » ont été exclues du fait d’un
poids maternel préopératoire non renseigné
Ces exclusions ont lieu avant
l’appariement
Ex e m ple 2 (é preuve t est 2019)
Liperoti R, Pedone C, Lapane KL, Mor V, Bernabei R, Gambassi G.
Venous Thromboembolism Among Elderly Patients Treated With Atypical
and Conventional Antipsychotic Agents. Arch Intern Med 12 déc 2005;
165(22): 2677.
The aim of this study was to estimate the effect of atypical and conventional
antipsychotic agents on the risk of hospitalization for VTE among elderly
patients. We conducted a rétrospective cohort study on nursing home residents
in 5 States. We used the Systematic Assessment of Gériatrie Drug Use via Epidemiology (SAGE) database, which contains data from the Minimum Data Set
(MDS) to identify 19,940 new users of antipsychotic agents and 112,078 nonusers. Hospitalization with VTE as primary discharge diagnosis was determined
during a 6-month follow-up period using Medicare inpatient daims.
Il s’agit d’une étude de cohorte :
Il aurait fallu cocher...
Commentaires
Historique
Dans une étude de cohorte historique, le
début de l’étude est postérieur au début de
la maladie ou de l’évènement étudié, ce qui
est bien le cas ici
Sur base médico-administrative
La base est citée par les auteurs : Gériatrie
Drug Use via Epidemiology (SAGE)
database
Avec collecte prospective des données
Les données ont déjà été collectées au
moment de la réalisation cette étude
Observationnelle
Il n’y pas d’intervention
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
292
Études observationnelles (analytiques)
Il n’aurait pas fallu cocher...
De patients ayant comme
caractéristique commune d’être traités
par antipsychotique
De patients ayant comme caractéristique commune d’avoir présenté un
épisode thrombo-embolique veineux
Commentaires
La caractéristique commune des patients
est d’être résidents en maison de retraite
(nursing home résident). Certains sont
traités par antipsychotique et d’autres
non et certains ont présenté un épisode
thromboembolique et d’autres non
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 28
Recueil des données
Ex p ositio n
• La mesure doit être objective et non biaisée, idéalement non influencée par la
connaissance de la maladie.
• Le ou les facteurs d’exposition (facteurs de risque ou facteurs pronostiques)
peuvent être très variés : exposition environnementale, géographique, socioéconomique, biologique, médicamenteuse, etc.
• L’exposition doit être mesurée de manière valide (appareils fiables, mesures
objectives, reproductibles, etc.) : l’objectif est d’éviter des biais de mesures (ou
biais de classement).
• L’exposition doit être cliniquement pertinente : l’exposition telle qu’elle est
définie dans l’étude doit avoir une plausibilité clinicobiologique d’entraîner la
survenue de la maladie.
• L’exposition doit être au mieux chronologiquement décrite : cela permet de
vérifier que la séquence temporelle est cohérente entre l’exposition et la survenue de la maladie et que la durée d’exposition est suffisante pour entraîner la
maladie.
M aladie (ou évé n e m en t é t u dié)
La définition de la maladie (embolie pulmonaire, infarctus du myocarde, etc.)
ou de l’état de santé (amélioration de la qualité de vie, quotient intellectuel,
etc.) doit être la plus précise, standardisée et objective possible. Elle ne doit
idéalement pas pouvoir être influencée par l’exposition.
La définition de certaines maladies peut évoluer au cours du temps (critères
diagnostiques, amélioration des méthodes diagnostiques). La période de prise
en compte des cas doit être précisée et un changement éventuel de définition au
cours de l’étude explicitée.
• Les événements ou les états de santé peuvent être (voir fiche 10) :
- objectifs (décès, taux de C-reactive protein) ;
- subjectifs (échelle de douleur, qualité de vie) ;
- simples ou composites.
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
294
Études observationnelles (analytiques)
• La mesure doit se faire :
- quand c’est possible, en aveugle (insu) du facteur de risque étudié (ce qui
ne fait pas des études analytiques des études en « double aveugle » ou « en
aveugle » ; ce terme est réservé aux essais cliniques) ;
- de la même manière pour tous les sujets (mêmes procédures diagnostiques,
mêmes questionnaires), jusqu’à la fin du suivi, quel que soit le niveau d’exposition.
D ans les é t u d es cas-té m oins
Modalités du recueil
Les données à recueillir concernent donc l’exposition. Différents modes de
recueil sont possibles : dossiers médicaux, interrogatoires, autoquestionnaires.
Le recueil de l’exposition étant rétrospectif, les informations à récupérer peuvent dater de plusieurs années, ce qui a pour conséquence des biais importants
(notamment le biais de mesure lié à un biais de mémorisation).
Biais de mesure ( = biais de classement, voir fiche 2)
Le biais de mesure se manifeste principalement par un biais de mémoire concernant l’exposition. La fiabilité du recueil de données datant de plusieurs années
est en cause. Ce biais est d’autant plus important que l’exposition est ancienne
et qu’elle nécessite une quantification précise (se souvenir que l’on a bu de
l’alcool la semaine dernière est plus facile que de se souvenir que l’on buvait
exactement trois verres par jour il y a 10 ans).
Le biais de classement (ou mesure) peut être différentiel ou non différentiel :
il est défini comme non différentiel lorsqu’il affecte de la même façon les cas et
les témoins, et comme différentiel dans la situation inverse. Un exemple classique de biais de classement différentiel dans les études cas-témoins est la surestimation de l’exposition par les cas se sachant atteints de la maladie. Ce type
de biais de classement différentiel peut être à l’origine d’une surestimation de
l’association entre le facteur de risque suspecté et la maladie.
Comment limiter les biais dans le recueil de l'exposition ?
• Recueillir les données selon le même mode opératoire chez les cas et les
témoins.
• Recueillir les données en « aveugle » du statut sain ou malade (cela est souvent
difficile à mettre en place notamment pour le patient, au mieux l’investigateur
ne connaîtra pas le statut cas ou témoin).
• Utiliser des instruments de mesure de l’exposition standardisés les plus objectifs
possible : données numériques (biologiques, environnementales, autres), questionnaires standardisés rédigés à l’avance laissant peu de place à l’interprétation, etc.
• Les questionnaires peuvent être longs et conçus pour limiter la surestimation
de l’exposition par les cas.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Recueil des données
295
Ét u d es de co h ort e d e t y p e ex p osés/ n o n ex p osés
Modalités du recueil
Le recueil des données concerne l’apparition de la maladie d’intérêt et s’effectue
dans le cadre d’un suivi au cours du temps. Les modalités de suivi ainsi que sa
durée doivent être définies à l’avance et appliquées de manière identique chez
les exposés et les non-exposés :
• durée de suivi : elle est définie selon le délai attendu entre l’exposition et la
survenue de la maladie. Un délai attendu long nécessite une durée de suivi plus
importante. La durée doit être identique entre les deux groupes, afin de permettre une comparabilité des résultats au final (une durée de suivi plus longue dans
un des groupes entraînera une augmentation du nombre d’événements dans ce
groupe) ;
• modalités de suivi : les patients sont suivis grâce à plusieurs visites au cours
du temps avec recueil de l’information recherchée à chaque fois. Il est nécessaire
que le contenu et la fréquence des visites soient les mêmes dans les deux groupes.
Par exemple, si les visites sont plus fréquentes dans un des deux groupes, cela
entraînera une augmentation de la détection de la maladie dans ce groupe par
rapport à l’autre.
Sources de biais dans le suivi
• Biais de mesure dans le recueil de l’information : une recherche plus attentive
du diagnostic de la maladie étudiée peut être induite par la connaissance du statut exposé du sujet. Cela entraîne un biais de classement différentiel en faveur
du groupe exposé et surestime ainsi l’association. Ce risque est d’autant plus
important que la définition du critère de jugement (du statut malade ou autre
condition) est subjective et mal précisée.
• Perdus de vue : c’est un des principaux problèmes dans une étude de cohorte,
d’autant plus important que le suivi est long et difficile. La diminution de la
taille de l’échantillon provoque une perte de puissance (diminution du risque de
conclure à une association qui existe vraiment). De plus, si la perte de suivi est
liée au statut exposé ou non exposé, cela peut entraîner un biais dans la mesure
d’association (biais de suivi ou biais d’attrition).
Comment limiter les biais au cours du suivi dans les études
de cohorte ?
• Suivi défini à l’avance et appliqué de manière identique dans les deux groupes.
• Visites réalisées en aveugle du statut exposé ou non exposé afin de ne pas
rendre possible une part d’interprétation dans la mesure de la maladie.
• Limiter autant que possible les perdus de vue et documenter les raisons ayant
entraîné une perte de suivi.
• Choisir un critère de jugement le plus objectif possible avec une définition
claire, précise et définie à l’avance.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
296
Études observationnelles (analytiques)
En pra tique
Ex e m ple 1 (ED N 2016)
Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai
consumption of coffee and caffeine-containing beverages and oral clefts :
a population-based case-control study in Norway. Am J Epidemiol 2009 ;
169 : 1216-22.
Coffee is a commonly consumed beverage among prégnant women, and even
a small increase in malformation risk could be a matter of concern. We used
data from a population based case-control study to evaluate the association of
maternai consumption of coffee and caffeinated beverages in early pregnancy
with the risk of delivering an infant with an orofacial cleft.
Mothers completed a 32-page questionnaire covering démographie characteristics, reproductive history, and exposures during pregnancy (including
smoking, alcohol consumption, coffee intake, médication use, and occupational and household exposures). Médian time from delivery to completion
of the questionnaire was 14 weeks for cases and 15 weeks for Controls. The
questionnaire included items on maternai consumption of caffeine-containing
beverages (coffee, tea, and soft drinks) during the first 3 months of pregnancy.
For each beverage, there was 1 question with 5 response categories : none,
number of cups per day, number of cups per week, number of cups per month,
and number of cups per year (without specifying the size of the cup).
Dans cet article, les facteurs d’exposition d’intérêt incluent :
Il aurait fallu cocher...
Commentaires
La consommation de boissons contenant
de la caféine au cours du premier
trimestre de grossesse
La consommation de café au cours du
premier trimestre de grossesse
Les facteurs d’exposition sont des
facteurs que l’on suspecte comme
favorisant l’apparition de la maladie
étudiée. On les recherche de manière
rétrospective dans les études cas-témoins.
L’expression « exposition d’intérêt »
dans l’énoncé suppose que l’on s’intéresse
ici aux facteurs recherchés pour répondre
à la question posée par l’étude
Il n’aurait pas fallu cocher...
Commentaires
La consommation de thé au cours du
troisième trimestre de grossesse
Il est bien précisé que l’on s’intéresse à la
consommation de boissons caféinées au
cours des 3 premiers mois de grossesse.
La raison de ce choix, exposée dans
la discussion, est que la fermeture
labiopalatine intervient entre 8 et 12
semaines d’aménorrhée, c’est-à-dire au
cours du premier trimestre
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Recueil des données
Il n’aurait pas fallu cocher...
La supplémentation vitaminique,
au cours du premier trimestre de la
grossesse
297
Commentaires
Cette question distingue les facteurs
d’exposition d’intérêt permettant de
répondre à la question posée et les
facteurs d’exposition ayant un rôle
de variable d’ajustement en tant que
potentiels facteurs de confusion comme
la supplémentation vitaminique et le
tabagisme
Le tabagisme au cours du premier
trimestre de grossesse
L’information sur la consommation quotidienne de café au cours du premier
trimestre de grossesse :
Il aurait fallu cocher...
Commentaires
A été de nature déclarative
C’est souvent le cas dans les études
cas-témoins, l’exposition survenant
avant le début de l’étude. Cela pose un
problème de biais de classement :
- non différentiel d’une part : par biais
de mémorisation, identique chez les cas
et les témoins, la déclaration de l’exposition
faisant appel à la mémoire des participants
- différentiel d’autre part : par
surestimation de l’exposition en faveur
des cas en raison de la connaissance du
statut malade (un sujet se connaissant
malade aura tendance à surestimer
l’exposition au facteur d’intérêt)
A été quantifiée en nombre de tasses
Avec toute l’imprécision que cela peut
comporter
Il n’aurait pas fallu cocher...
Commentaires
A été recueillie de manière prospective
L’exposition est toujours recueillie de
manière rétrospective dans une étude
cas-témoins
A été extraite de la base de données du
registre national des naissances
A été recueillie par questionnaire soumis
aux mères participantes
A été recueillie uniquement chez les
mères de nouveau-nés avec une fente
labiopalatine (FLP)
Cela ne serait pas logique puisque l’on
cherche à comparer la consommation de
café entre les mères de nouveau-nés avec
FLP et les mères de nouveau-nés sans FLP
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
298
Études observationnelles (analytiques)
Ex e m ple 2 (ED N 2017)
Fondell E, Fitzgerald KC, Falcone GJ, O’Reilly EJ, Ascherio A. Early-onset
alopecia and amyotrophie latéral sclerosis: a cohort study. Am J Epidemiol
2013 ; 178(7) : 1146-9.
The Health Professionals Foliow-up Study is a longitudinal study of 51,529 male
health professionals (dentists, optometrists, osteopaths, podiatrists, pharmacists, andveterinarians), aged 40-75 years at enrollment, who completed
amailed questionnaire about lifestyle and medical history in 1986 and similar
biennial questionnaires since then.
In 1992, participants reported their balding status at âge 45 years by choosing
from 5 crown-view pictograms based on Norwood’s classification of malepattern baldness (Norwood’s I, III, IV, V, and VII). The original 5-category
classification of alopecia was collapsed into 3 categories as follows: no alopecia (Norwood’s I), moderate alopecia (Norwood’s III or IV), and extensive
alopecia (Norwood’s V or VII) for analysis purposes. This study was approved
by the human subjects committee at the Harvard School of Public Health
(Boston, Massachusetts).
In each biennial follow-up questionnaire, participants were asked to report a
spécifie list of medically diagnosed conditions and “any other major illness”.
ALS was added to the list of spécifie conditions beginning in 2000. We requested permission to contact the treating neurologists for release of relevant
medical records from participants who reported a diagnosis of ALS on the
open question on major illnesses or on the spécifie question about ALS.
L’information sur l’alopécie à l’âge de 45 ans est déclarative et recueillie de
manière rétrospective en 1992, source potentielle d’erreur de classement. Cette
erreur de classification ou de classement :
II aurait fallu cocher...
Commentaires
Peut potentiellement biaiser l’estimation
du risque relatif de survenue de sclérose
latérale amyotrophique (SLA)
S’il existe une erreur de classement sur le
facteur d’exposition principal, cela peut
entraîner une mauvaise estimation du
risque relatif de SLA
Est liée à la mémoire potentiellement
défaillante des participants
La mémoire des patients peut aggraver
cette erreur
Tendrait à rapprocher l’estimation du
risque relatif de SLA de la valeur neutre 1
Le questionnaire sur l’alopécie n’a été
envoyé qu’une fois en 1992, et il est
indiqué dans la discussion que les patients
n’avaient pas connaissance de la SLA,
l’erreur est donc non différentielle
Est susceptible de concerner davantage
les participants plus âgés
Pour des raisons de mémorisation, cette
erreur est plus susceptible d’affecter les
sujets les plus âgés
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Recueil des données
299
Il n’aurait pas fallu cocher...
Commentaires
Diffère selon la survenue d’une sclérose
latérale amyotrophique (SLA) au cours
du suivi
Le questionnaire sur l’alopécie n’a été
envoyé qu’une fois en 1992, et il est
indiqué dans la discussion que les patients
n’avaient pas connaissance de la SLA,
l’erreur est donc non différentielle
Ex e m ple 3 (ED N 2020)
Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for
Pancreatic Cancer in China: A Multicenter Case-Control Study. J Epidemiol
2016; 26(2) : 64-70.
We assessed risk factors of pancreatic cancer in China. A case-control study
design was conducted using data from four hospital-based cancer registries.
Ail study subjects were asked to fill out a self-administered questionnaire,
which was designed by experts. The questionnaire included questions assessing cigarette smoking, alcohol drinking, tea drinking, exposure to carcinogens, environmental factors, dietary habits, family history of pancreatic
disease (pancreatitis, pancreatic cyst, cholecystitis, gallstone, peptic ulcer, or
cancer), and psychological factors (personal characteristics and dépréssion).
The recruitment period was between November 2011 and February 2013.
Most questionnaires were filled out by the subjects themselves, although some
(0.3%) were completed by their close relatives. The interviewers were trained
on study aims, contents of the questionnaire, and interview skills. Ail questionnaires were cross-checked daily.
Les caractéristiques méthodologiques de l’étude ayant pu biaiser la qualité de
l’information sur les habitudes alimentaires incluent :
Il aurait fallu cocher...
Commentaires
Le recueil rétrospectif des
habitudes alimentaires
Le caractère rétrospectif du recueil déclaratif des
données est responsable d’un biais de mémorisation
qui peut être différentiel
La connaissance des objectifs
de l’étude par les enquêteurs
en interaction avec les
patients
L’absence d’aveugle des enquêteurs sur le statut cas
ou témoins peut entraîner un biais de classement
différentiel par une recherche plus attentive des
facteurs de risque chez les cas par rapport aux
témoins
L’évaluation grossière des
habitudes alimentaires par le
questionnaire d’enquête
Même si le questionnaire n’est pas disponible pour
en juger, on imagine aisément qu’un questionnaire
ne permet pas de mesurer avec exactitudes la
consommation alimentaire passée (biais de
classement)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
300
>
Études observationnelles (analytiques)
Commentaires
Il n’aurait pas fallu cocher...
L’appariement d’un témoin
non-hospitalisé à chaque cas
Le type d’appariement n’influence en
aucune manière la qualité du recueil de
l’information sur l’exposition
Le contrôle de cohérence quotidien de la
qualité du remplissage des questionnaires
Le contrôle de cohérence quotidien a
comme objectif d’améliorer la qualité du
recueil de l’information et limite donc les
erreurs de remplissage du questionnaire
On peut suspecter que le biais concernant l’information recueillie sur les habitudes alimentaires :
Il aurait fallu cocher...
Commentaires
Est différentiel entre les
cas et les témoins
Dans ce type d’étude les cas se sentent plus impliqués
dans la recherche de facteurs de risque liés à leur
maladie et ont tendance à rechercher de manière plus
attentive certaines exposition voire à les surestimer par
rapport aux cas. Le biais est donc différentiel car l’erreur
est différente dans un groupe par rapport à l’autre et car
elle est influencée par la connaissance de la maladie
Contribue à surestimer
les odds ratios de cancer
du pancréas
Si les cas surestiment leur exposition à certains facteurs
de risques (biais de classement différentiel), le risque est
donc de surestimer les odds ratios
A pu être amplifié par les
enquêteurs
Oui, dans le cas où les enquêteurs ont connaissance du
statut cas ou témoins du sujet
Il n’aurait pas fallu cocher...
Commentaires
Est contrôlé par l’appariement
des cas et des témoins
Les cas et les témoins ne sont pas appariés sur
les habitudes alimentaires et cela n’aurait aucun
sens de l’être car les habitudes alimentaires sont
un des facteurs d’exposition étudiés
Est en partie contrôlé par
l’analyse multivariée
Les techniques d’analyses ne permettent pas de
corriger des erreurs dans le recueil des données
Ex e m ple 4 (EC N t est 2019)
Liperoti R, Pedone C, Lapane KL, Mor V, Bernabei R, Gambassi G.
Venous Thromboembolism Among Elderly Patients Treated With Atypical
and Conventional Antipsychotic Agents. Arch Intern Med 12 déc 2005;
165(22) : 2677.
The aim of this study was to estimate the effect of atypical and conventional
antipsychotic agents on the risk of hospitalization for VTE among elderly patients. We conducted a rétrospective cohort study on nursing home residents
in 5 States.
Eligible candidates were residents 65 years or older. Residents with a diagnosis
of schizophrenia were excluded from the study population because they might
hâve presented noticeable différences in their cardiovascular risk profile.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Recueil des données
301
The thromboembolie effect of antipsychotic agents may be manifest within
3months of the initiation of therapy. We defined the length of follow-up to
be 6 months. The outcome of this study was defined as any hospitalizations
for VTE that occurred during that time. We identified ail hospitalizations
in which the primary discharge diagnosis was one of the following: deep
venons thrombosis (ICD-9 code 453.8), fémoral vein thrombi (ICD-9 code
451.11), popliteal vein thrombi (ICD-9 code 451.19), iliac vein thrombi (ICD-9
code 451.81), deep vessels of lower extremity thrombophlebitis (ICD-9 code
451.1), and pulmonary embolism and infarction (ICD-9 code 415.1). We used
the first hospitalization for VTE among persons with multiple events (n = 29).
Les événements thromboemboliques veineux saisis dans la base médico-administrative :
Commentaires
Il aurait fallu cocher...
Reposaient sur le diagnostic
principal de sortie
We identified ail hospitalizations in which the
primary discharge diagnosis was one of the
following
Etaient codés de façon variable
selon les centres
La manière de coder les actes et diagnostics en
pratique clinique courante n’étant pas harmonisée
selon les centres, qu’il y ait des différences est donc
certain (comme pour notre PMSI)
Le diagnostic de l’événement
d’intérêt était indépendant
de l’exposition aux
antipsychotiques
Il s’agit d’une cohorte historique, mais les données
ont été recueillies prospectivement, les cliniciens
qui ont codé le diagnostic n’étaient pas au courant
de l’existence de l’étude. Ils n’ont donc pas été
influencés par l’exposition aux antipsychotiques
Il n’aurait pas fallu cocher...
Commentaires
Etaient exclus si l’événement était déjà
présent à l’initiation du traitement
antipsychotique
Dans cette étude historique (rétrospective),
il est inconcevable qu’une recherche
systématique de thrombose ait été faite à
l’inclusion
Le diagnostic de l’événement d’intérêt
reposait sur des examens invasifs
Le critère de jugement était défini par
l’hospitalisation pour un événement
thromboembolique codé en tant que
diagnostic principal
Ex e m ple 5 (ED N 2021)
von Ehrenstein OS, Ling C, Cui X, Cockburn M, Park AS, Yu F, et al. Prénatal
and infant exposure to ambient pesticides and autism spectrum disorder in
children: population based case-control study. BMJ 20 mars 2019 ; 364 :1962.
Objective: To examine associations between early developmental exposure to
ambient pesticides and autism spectrum disorder.
Design: Population based case-control study.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
302
Études observationnelles (analytiques)
Methods: Use of these pesticides in an agriculturally intensive région of California, United States, were recorded in the California State mandated Pesticide
Use Reporting (CA-PUR) program. These records were integrated in our géographie information System tool, which links exposure records to addresses
from birth records of the study population.
L’information sur l’exposition aux pesticides ambiants est dérivée d’un système
d’information géographique basé sur les données de la base CA-PUR. Quelles
sont les limites méthodologiques de cette source ?
Il aurait fallu cocher...
Elle n’intègre pas l’exposition aux
pesticides d’usage domestique
Elle ne prend pas en compte les autres
sources d’exposition aux pesticides,
notamment alimentaires
Elle peut être mise en défaut en cas de
déménagement en cours de grossesse
Elle repose sur l’hypothèse que les
individus étaient présents à domicile aux
dates d’application des pesticides par les
agriculteurs
Commentaires
On ne trouve que ce que l’on cherche !
Ce qui n’est pas mesuré ne peut donc pas
être pris en compte
Les outils de mesure de pollution basés
sur la localisation géographique et sur
l’adresse de domiciliation du patient
nécessitent de faire l’hypothèse forte que
les participants à l’étude sont présents
à leur adresse pendant la majeure
partie de leur temps. Il n’est donc pas
pris en compte le temps passé ailleurs,
en lien avec l’activité professionnelle
par exemple, le temps passé dans une
éventuelle résidence secondaire, les
déménagements, etc.
Il n’aurait pas fallu cocher...
Commentaires
Elle est propice aux biais de mémorisation,
compte tenu de son caractère rétrospectif
et subjectif
Il s’agit de données officielles probablement
enregistrées de manière prospective. Il n’y
a donc pas de subjectivité dans la mesure,
donc pas de risque de biais de classement
différentiel
Elle est déclarative
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Fic h e 29
Analyse des résultats
et évaluation de la causalité
A nalyse d es résulta ts d es é t u d es o bserva tio n n elles
analytiq u es
1re étape : tableau de contingence
Suite au recueil des données, la première étape consiste à créer un tableau de
contingence comme ceux présentés ci-dessous. Les lettres a, b, c et d représentent les effectifs correspondants.
Tableau de contingence d’une étude de cohorte.
Survenue de la maladie
(M+)
Absence de survenue
de la maladie (M—)
Exposés (E+)
a
b
Non exposés (E-)
c
d
Tableau de contingence d’une étude cas-témoins.
Cas (M+)
Témoins (M—)
Exposition présente (E+)
a
b
Exposition absente (E—)
c
d
2 e étape : calcul des mesures d'association et de leurs
intervalles de confiance
Ét u d e d e co h orte = calcul d'un risq u e rela tif (RR)
Le RR est le rapport d’incidence entre les sujets exposés et les sujets non exposés.
| a |
Incidence chez les exposés _ l a + b J
R R —---- ----------------------------------- — — y—-—4
Incidence chez les non exposés
c
[ c+d J
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
304
Études observationnelles (analytiques)
Exemple : vous comparez 60 patients exposés à 60 patients non exposés au
facteur de risque et vous recueillez de manière prospective la survenue de la
maladie sur une période d’un an. Quel est le risque relatif correspondant au
tableau de contingence suivant ?
Absence de survenue
de la maladie (M-)
Survenue de la maladie
(M+)
Exposés (E+)
40
20
Non exposés (E-)
20
40
• taux d’incidence chez les exposés : 40/60 = 2/3 = 66,7 % ;
• taux d’incidence chez les non-exposés : 20/60 = 1/3 = 33,3 % ;
. RR = 111 = 2 ;
V3
• un RR à 2 signifie que le risque de développer la maladie est multiplié par 2
chez les exposés par rapport aux non-exposés.
Ét u d e cas-t é m oins = calcul d'un o d ds ra tio (OR)
Dans les études cas-témoins, le calcul de l’incidence n’est pas possible étant donné
l’absence de suivi, donc le calcul du RR ne l’est pas non plus. On calcule un OR
qui correspond à un rapport des cotes (OR = cote des cas/cote des témoins). La
cote des cas est le rapport des exposés sur les non-exposés chez les cas ; et la
cote des témoins est le rapport des exposés sur les non-exposés chez les témoins.
a/a + c
OR =
Cote des cas
Cote des témoins
^c/a + c
b/b + d
d/b + d
Exemple : vous comparez 60 cas à 60 témoins et vous recueillez rétrospectivement la mesure de l’exposition au facteur de risque. Le calcul des taux d’incidence est impossible car vous ne mesurez pas la survenue de la maladie au cours
du temps. Vous devez donc calculer un odds ratio :
Cas (M+)
Témoins (M-)
Exposition présente (E+)
40
20
Exposition absente (E-)
20
40
• cote des cas - 40/20 = 2 (2 fois plus d’exposés que de non-exposés chez les cas) ;
• cote des témoins = 20/40 = 0,5 (2 fois moins d’exposés que de non-exposés
chez les témoins) ;
• OR (rapport des cotes) = 2/0,5 = 4 ou avec la formule : OR = — = -9 X = 4 ;
cxb 20x20
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse des résultats et évaluation de la causalité
305
• un OR à 4 ne signifie pas (contrairement au RR) que le risque de développer
la maladie est multiplié par 4 chez les exposés par rapport aux non-exposés
(comparez les résultats avec ceux du calcul du RR au cours d’une étude de
cohorte dans l’exemple précédent ; les effectifs ont volontairement été choisis à
l’identique afin de permettre la comparaison).
Calcul de l'intervalle de confiance de l'OR ou RR
Une valeur d’OR ou RR sans son intervalle de confiance n’est pas suffisante.
Un OR ou RR à 1 correspond à un risque identique entre les deux groupes,
donc afin de définir une association statistique significative, il est nécessaire que
l’intervalle de confiance (IC) à 95 % ne comprenne pas la valeur 1 :
• IC comprenant 1 = association non significative (on ne rejette pas l’hypothèse
nulle). Exemple : RR (ou OR) = 2,43 [IC95 % : 0,86-4,00] ;
• IC ne comprenant pas 1 = association significative (on rejette l’hypothèse
nulle). Exemple : RR (ou OR) = 1,78 [IC95 % : 1,31-2,25].
On distingue deux situations en fonction de la valeur de l’OR/RR :
• OR ou RR < 1 (par exemple, OR = 0,78 [IC95 % : 0,71-0,85]) : l’association
entre la maladie et le facteur d’exposition est négative avec un caractère significatif. L’exposition étudiée est donc un facteur protecteur potentiel concernant
la survenue de la maladie ;
• OR ou RR > 1 (par exemple, OR = 4,78 [IC95 % : 3,80-5,76]) : l’association
entre la maladie et le facteur d’exposition est positive avec un caractère significatif. L’exposition étudiée est donc un facteur de risque potentiel de la survenue
de la maladie.
►
Remarque : la situation présentée ici ne concerne pas le cas des variables
quantitatives continues où le calcul d’un RR n’est pas possible. Par
exemple, on réalise une étude exposés/non exposés évaluant le volume
d’expiration maximale seconde (VEMS) entre des sujets exposés au tabagisme et d’autres sujets non exposés. On pourra utiliser comme outils de
comparaison dans cette situation les moyennes de VEMS ou encore la
diminution du pourcentage de VEMS (voir fiche 5).
Lecture des odds ratios et risques relatifs dans les tableaux
de résultats
Le tableau ci-dessous représente des données fictives relatives au lien entre
consommation de café et ulcère de l’estomac dans une étude cas-témoins.
Odds ratio
p-value
95%CI
1.11
(1.04-1.18)
0.04
None
1.00
REF
-
0-3 cups/day
1.37
(0.83-1.66)
0.080
> 3 cups/day
1.59
(1.11-1.73)
0.001
Coffee (quantitative)
p for trend
Coffee (categorical)
0.01
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
306
Études observationnelles (analytiques)
On peut tirer de ce tableau les informations suivantes :
• lorsque le café est traité comme une variable quantitative, l’OR s’interprète
comme l’augmentation de risque pour l’augmentation d’une unité de la consommation de café : le risque est multiplié par 1,11, soit augmenté de 11 % quand
on passe de 1 tasse à 2 tasses par jour, ou quand on passe de 3 à 4 tasses. Cette
augmentation est significative (l’intervalle de confiance exclut 1). Le risque
d’erreur en affirmant que le lien n’est pas lié au hasard est 0,04 ;
• lorsque le café est traité comme une variable qualitative :
- lorsqu’une variable a plus de deux catégories, il faut identifier la catégorie
de référence (c’est le groupe auquel on compare tous les autres pour définir
l’augmentation du risque). Elle est soit indiquée dans le tableau, soit dans les
notes de bas de page, soit implicite (c’est la catégorie qui n’est pas représentée), ainsi quand on affiche le risque pour les hommes, il est évident que c’est
par rapport aux femmes. Ici, si la catégorie « pas de café » avait été absente,
on aurait dû en déduire que c’était la catégorie de référence,
- la consommation de 0-3 tasses augmente non significativement le risque de
37 % par rapport à la non-consommation,
- la consommation de plus de 3 tasses augmente significativement le risque
de 59 % par rapport à la non-consommation,
- ce tableau ne permet pas de comparer les consommateurs de 0-3 tasses aux
consommateurs de plus de 3 tasses ;
• le p de tendance (p for trend) teste l’hypothèse : « le risque d’ulcère gastrique
augmente avec la consommation de café ». On peut ici affirmer que l’augmentation de la consommation de café est significativement liée à l’augmentation
du risque d’ulcère. C’est un argument en faveur d’une relation dose-effet.
Raiso ns p ossibles d'u ne associa tio n sig nîfica tive / n o n
sig nifica tive
Raisons possibles d'une association non significative
• L’association n’existe pas dans la population cible.
• L’association existe dans la population cible mais l’étude manque de puissance pour démontrer l’association sur le plan statistique (le nombre de
sujets nécessaires ou le nombre d’événements n’est pas assez important) :
risque p.
• L’association existe mais est inférieure aux hypothèses initiales des auteurs.
• L’association existe mais des biais trop importants la masquent :
- biais de sélection (dans cet échantillon précis, qui n’est pas représentatif) on
ne peut pas voir une association qui existe vraiment ;
- biais de classement non différentiel (peut rapprocher le RR de 1) ou différentiel (peut éloigner ou rapprocher le RR de 1) ;
- biais de confusion (voir fiche 24).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse des résultats et évaluation de la causalité
307
Raisons possibles d'une association significative
• L’association existe réellement dans la population cible (situation idéale).
• L’association n’existe pas mais la présence d’un ou plusieurs biais fausse les
résultats :
- biais de sélection (l’échantillon a sélectionné des individus chez qui l’association existe alors qu’à l’échelle de la population, elle n’existe pas) ;
- biais de classement (biais de classement différentiel comme par exemple
la surestimation de l’exposition chez des patients se sachant atteints de la
maladie) ;
- biais de confusion (voir fiche 24).
• L’association n’existe pas mais les résultats retrouvés sont liés à une erreur
aléatoire (fluctuations d’échantillonnage) : risque a, cette probabilité est donnée par la p-value.
Evalua tio n d e la ca usalit é
Principe
La présence d’une association statistiquement significative entre deux éléments
n’est pas synonyme pour autant de la présence d’un lien de cause à effet entre
ces deux éléments. Une association statistique doit être interprétée avec prudence, notamment en raison des nombreux biais présents dans les études observationnelles. Association n’est pas synonyme de causalité !
Critères de causalité de Bradford-Hill (1965)
Critères in tern es à l'é t u d e (re nv oie n t à la m é th o d olo gie
e t a u x résult a ts pro pres d e l'é tu d e)
• Force de l’association (ou taille de l’effet) : la présence d’un RR ou OR élevé
(un RR à 14 n’a pas la même valeur qu’un RR à 1,2 même s’ils sont tous les
deux statistiquement significatifs).
• Relation dose-effet : augmentation de la maladie en cas d’exposition plus
importante au facteur de risque (se remarque quand des sous-groupes à différents niveaux d’exposition sont constitués). Ce type d’effet est évalué par un p
de tendance (p for trend).
• Séquence temporelle : l’apparition de la maladie survient avec un délai logique
depuis l’exposition au facteur de risque (difficile à évaluer précisément dans les
études cas-témoins rétrospectives).
• Spécificité de l’association : présence du facteur de risque chez presque tous
les malades, uniquement chez eux et dans cette seule maladie. Ce critère signifie
qu’une cause doit conduire à un seul effet, c’est-à-dire qu’à une exposition de
nature causale ne doit être associée qu’une seule maladie causée par l’exposition (exemple : amiante et mésothéliome).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
308
Études observationnelles (analytiques)
Critères e x t ern es à l'é t u d e (re nv oie n t à l'a n alyse d e la lit t éra t ure
sur le suje t)
• Résultats cohérents et reproductibles dans la littérature : résultats équivalents
à ceux des autres études publiées sur le sujet, y compris dans le cadre d’autres
situations avec différentes populations, dans des zones géographiques différentes, etc.
• Cohérence avec la recherche expérimentale : résultats en accord avec la
recherche fondamentale in vitro et chez l’animal.
• Plausibilité biologique : mécanisme physiopathologique connu et apportant
un lien logique avec les résultats de l’étude.
• Réversibilité : association non retrouvée en cas de suppression du facteur de
risque.
• Analogie : il s’agit de l’analogie par rapport à d’autres relations causales et à
leurs mécanismes.
► Remarque : la persistance de l’association après prise en compte des
principaux facteurs de confusion est un argument indirect en faveur de
la causalité, car elle est en faveur de la force de l’association. Cette proposition a déjà été considérée comme juste aux EDN. En revanche, « la
prise en compte de tous les facteurs de confusion existants » est toujours
fausse, car il est impossible de s’assurer que tous ces facteurs, connus ou
inconnus, aient été pris en compte.
En pra tique
Ex e m ple 1 (ED N 2016)
Johansen AMW, Wilcox AJ, Lie RT, Andersen LF, Drevon CA. Maternai
consumption of coffee and caffeine-containing beverages and oral clefts:
a population-based case-control study in Norway. Am J Epidemiol 2009;
169 : 1216-22.
We aimed to evaluate the association of maternai consumption of coffee and
caffeinated beverages in early pregnancy with the risk of delivering an infant
with an orofacial cleft.
Data from animal studies suggest that large single doses of caffeine may cause
palatal clefts in a systematic review of 3 studies of orofacial clefts and caffeine,
high coffee intake was associated with a slight increase in risk.
Ail infants born with facial clefts in Norway are treated at government expense in surgical centers at university hospitals located in Oslo and Bergen. In
collaboration with these 2 centers, we identified ail babies born from 1996 to
2001 who were referred for treatment for either cleft lip with or without cleft
palate (CLP) or cleft palate only (CPO). Controls were recruited during the
same period by randomly selecting approximately 4 births per 1,000 from the
National Medical Birth Registry (which includes ail births in the country). These
births served as Controls for both case groups, with the target of 2 Controls per
case of CLP (nearly 4 Controls for each case of CPO). Both cases and Controls
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse des résultats et évaluation de la causalité
309
were recruited during their first weeks of life. Mothers completed a 32-page
questionnaire covering démographie characteristics, reproductive history, and
exposures during pregnancy (including smoking, alcohol consumption, coffee
intake, médication use, and occupational and Household exposures).
Cleft Lip With or Without Cleft
Palate
Ail Cases
Cleft Palate Only
AH Cases
Crude Analysis Adjusted Analysis Crude Analysis Adjusted Analysis
(n = 377/763)
(n = 318/653)
(n = 196/763)
(n = 178/653)
Odds
Ratio
95% CI Odds
1.04,
1.1 8
1.07
> 0- < 3 cups/ 1.37
day
1.03,
1.81
>3 cups/day
1.80
1.29,
2.53
P for trend
< 0.001
Odds
Ratio
95%
1.11
Coffee, percup increase
CI
95%
Odds
Ratio
95% CI
0.92,
1.09
0.98
0.88,
1.09
1.17
0.83,
1.66
1.26
0.85,
1.86
1.07
0.68,
1.70
0.96
0.55,
1.67
Ratio
CI
1.00,
1.16
1.00
1.39
1.01,
1.92
1.59
1.05,
2.39
Coffee, categoricald
0.566
0.013
0.760
Tea, categoricald
>0- < 3 cups/ 0.68
day
0.52,
0.88
0.74
0.55,
1.01
0.65
0.46,
0.91
0.66
0.45,
0.95
>3 cups/day
0.50
0.31,
0.80
0.55
0.32,
0.95
0.68
0.39,
1.18
0.58
0.31,
1.07
P for trend
0.001
0.014
0.033
0.025__________
d Reference category : 0 cups/day.
En analyse multivariée (tableau ci-dessus), les auteurs indiquent qu’il existe une
relation croissante entre l’odds ratio (OR) de fente labiale (avec ou sans fente
palatine) et la consommation de café codée en tasses par jour. Sur quel(s) arguments) repose(nt) cette affirmation ?
Il aurait fallu cocher...
Commentaires
L’estimation ponctuelle de l’OR
ajusté est égale, respectivement, à
1,00 pour 0 tasse, 1,39 pour 0 à
3 tasses, et 1,59 pour 3 tasses et plus
Le test de tendance p for trend indique s’il
existe une augmentation significative du
risque avec l’augmentation des doses de
café. L’augmentation croissante des valeurs
des OR en fonction de la dose de café est un
argument en faveur de la relation « dose-effet » :
1 pour 0 tasse (catégorie de référence),
1,39 pour 1-3 tasses et 1,59 pour plus de
3 tasses. Cette impression est confirmée par
la significativité du test de tendance
Le degré de signification (valeur de p)
du test de tendance (soit 0,013)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
310
Études observationnelles (analytiques)
Il n’aurait pas fallu cocher...
Commentaires
Le recouvrement partiel des intervalles
de confiance à 95 % des OR ajustés pour
les catégories 0 à 3 tasses et 3 tasses et
plus, respectivement
L’OR d’une catégorie s’interprète
comme l’indicateur du risque pour cette
catégorie par rapport à la catégorie de
référence. Si l’OR est supérieur à 1 et
que son intervalle de confiance exclut
1, cela veut dire que le risque de FLP
est significativement plus fort dans la
catégorie considérée que chez les femmes
ne consommant pas de café (catégorie de
référence). Ces intervalles de confiance
ne permettent pas de comparer le risque
associé à la catégorie 0-3 avec celui de la
catégorie > 3
L’exclusion de l’échantillon d’analyse
des mères ne consommant pas de café
pendant le premier trimestre de grossesse
Cette proposition est sans rapport avec
la relation dose-effet
L’OR de fente labiale chez les femmes
consommant 3 tasses par jour ou plus de
café par rapport aux femmes consommant moins de 3 tasses par jour est de
1,59 (IC95 % : 1,05-2,39)
La catégorie de référence est erronée
Le risque de conclure à tort à la responsabilité de la consommation de café au
cours du premier trimestre de la grossesse dans cette étude peut s’expliquer par :
Il aurait fallu cocher...
Commentaires
Le risque d’erreur statistique de première espèce (a)
= par hasard
Le risque a correspond dans toute étude au risque de
conclure à une différence qui n’existe pas en réalité.
Cela correspond au risque de montrer une différence
par hasard en raison des fluctuations d’échantillonnage
(si les témoins qui sont tirés au sort sont par hasard
peu consommateurs de café par rapport à la population générale dont ils sont issus, on peut alors montrer
à tort une responsabilité du café dans la survenue de
fentes labiopalatines)
Le caractère rétrospectif du
recueil des données
= par biais de classement différentiel
Le fait de recueillir rétrospectivement les données
entraîne toujours un biais de mesure (= biais de classement). Le caractère différentiel s’explique par le fait
que les mères d’enfants ayant développé une fente
labiopalatine auront plus ou moins tendance à surestimer leur consommation de café pendant le premier
trimestre, ce qui peut donc contribuer à augmenter
l’association
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse des résultats et évaluation de la causalité
Il aurait fallu cocher...
L’existence de facteurs
de confusion résiduels
méconnus
311
Commentaires
Il existe potentiellement des tiers facteurs non connus
ou non pris en compte qui jouent un rôle dans l’augmentation du risque de la maladie. L’absence de randomisation dans les études observationnelles ne permet
pas une bonne répartition de ces tiers facteurs dans
les différents groupes comparés. Cette proposition est
donc toujours vraie dans les études observationnelles
Il n’aurait pas fallu cocher...
Commentaires
L’existence d’une relation
entre la dose de caféine
ingérée quotidiennement et
l’OR de fente labiale
L’existence d’un effet dose fait partie des critères de
causalité. C’est donc plutôt un argument pour des
résultats non erronés
Un défaut de puissance
statistique
Un défaut de puissance expliquerait plutôt l’absence
de démonstration d’une association qui existe réellement
Un biais de classement
différentiel en faveur du
groupe témoin
Un tel type de biais maximiserait l’exposition dans
le groupe témoin au détriment des cas. Ce serait
alors possible que cette surestimation ait comme
conséquence de masquer une association qui existe
réellement
Citez le ou les arguments en faveur de la nature causale de l’association, retrouvée dans cette étude, entre la consommation de café pendant le premier trimestre
de grossesse et le risque accru de fente labiale (avec ou sans fente palatine) à la
naissance :
Il aurait fallu cocher...
Commentaires
L’existence d’une relation
dose-effet statistiquement
significative
La relation dose-effet est démontrée par :
d’une part, l’augmentation de l’OR avec l’augmentation de la consommation de café d’autre part, la
valeur du test de tendance (p for trend) qui montre
que cette augmentation de risque est significative
Le risque de fente labiopalatine induit par l’exposition
à une dose unique élevée de
caféine chez l’animal
Cet argument cité dans l’introduction correspond à
la preuve expérimentale des critères de causalité
Le risque de fente labiopalatine ayant déjà été mis en
évidence dans des études
antérieures
La cohérence avec la littérature déjà publiée et la
reproductibilité des résultats est en faveur de la
causalité
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
312
Études observationnelles (analytiques)
Il n’aurait pas fallu cocher...
Commentaires
L’ajustement sur tous les facteurs
de confusion possibles
Il n’est pas impossible que des facteurs
de confusion n’aient pas été pris en
compte. On ne peut jamais prendre
en compte tous les facteurs de confusion
possibles
La séquence temporelle entre l’exposition
et l’événement de santé étudié
La séquence temporelle est toujours
difficile à évaluer dans les études castémoins en raison du caractère rétrospectif des données. De plus, dans cette étude,
il est difficile de superposer exactement
la consommation de café à la période
au cours de laquelle s’est formée la fente
labiopalatine chez chaque fœtus
L’absence d’association similaire entre
la consommation de café et la fente
palatine seule
On n’a aucune raison de penser que la
consommation de café soit un facteur de
risque de fente labiopalatine et non de
fente palatine seule. Cela ne rend pas les
résultats très cohérents
Parmi les implications potentielles de cette étude pour la prévention des fentes
labiopalatines, il paraît pertinent de :
Il aurait fallu cocher...
Commentaires
Informer les femmes enceintes concernées
sur l’absence de preuve de l’innocuité
d’une consommation de café supérieure à
3 tasses par jour
Un niveau de preuve faible comme celui
d’une étude cas-témoins (niveau III =
présomption scientifique) ne permet pas
la mise en place de recommandations
« dures »
Conseiller d’éviter les boissons contenant de la caféine au cours du premier
trimestre de grossesse
Cependant, l’absence de preuve de
l’innocuité de la consommation de café
doit inciter au principe de précaution
et à conseiller aux femmes enceintes
de limiter leur consommation de café
pendant le premier trimestre
Il n’aurait pas fallu cocher...
Commentaires
Réaliser une étude randomisée portant
sur la consommation de thé versus café
chez les femmes enceintes
Il n’est pas éthique de réaliser un essai
clinique randomisé qui obligerait d’exposer des femmes enceintes volontairement
à une consommation de café, alors qu’il
existe un doute sur la responsabilité des
boissons caféinées dans le développement
des fentes labiopalatines
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse des résultats et évaluation de la causalité
Il n’aurait pas fallu cocher...
Commentaires
Inciter les femmes enceintes à consommer plus de 3 tasses de thé par jour
pendant le premier trimestre de grossesse
Une étude cas-témoins a un niveau de
preuve faible (niveau III = présomption
scientifique). Cela ne permet pas de
recommander la consommation de plus
de 3 tasses de café par jour malgré un
effet protecteur significatif sur le plan
statistique (OR à 0,55 avec intervalle de
confiance excluant 1 )
Renforcer la surveillance échographique
morphologique de l’extrémité céphalique
chez les femmes enceintes consommant
plus de 3 tasses de café par jour
Une étude cas-témoins a un niveau de
preuve faible (niveau III = présomption
scientifique) ne permettant pas de
recommander un tel type de surveillance
qui entraînerait une surmédicalisation et
un stress pour les futurs parents
313
Ex e m ple 2 (é preuve t est 2018)
Johansson K, Cnattingius S, Nâslund I, Roos N, Trolle Lagerros Y, Granath F,
Stephansson O, Neovius M. Outcomes of pregnancy after bariatric surgery.
N Engl J Med 2015 ; 372 : 814-24.
Maternai obesity is associated with increased risks of gestational diabètes,
large-for-gestational-age infants, preterm birth, congénital malformations,
and stillbirth. The risks of these outcomes among women who hâve undergone bariatric surgery are unclear. We investigated the risks of gestational
diabètes and adverse périnatal outcomes among women with a history of
bariatric surgery as compared with women without such a history but with
similar characteristics.
We therefore conducted a population-based study using data from nation
wide Swedish registries, including information on presurgery BMI among
women who had undergone bariatric surgery. We investigated the risks of
gestational diabètes and adverse périnatal outcomes among women with a
history of bariatric surgery as compared with women without such a history
but with similar characteristics.
The Swedish Medical Birth Register includes information on more than 98%
of ail births in Sweden since 1973. Information is prospectively collected from
standardized prénatal, obstétrical, and néonatal records.
We identified 627,693 singleton pregnancies in the Swedish Medical Birth
Register from 2006 through 2011, of which 670 occurred in women who had
previously undergone bariatric surgery and for whom presurgery weight was
documented. For each pregnancy after bariatric surgery, up to five control
pregnancies were matched for the mother’s presurgery body-mass index (BMI;
we used early-pregnancy BMI in the Controls), âge, parity, smoking history,
educational level, and delivery year. We assessed the risks of gestational diabètes, large-for-gestational-age and small-for-gestational-age infants, preterm
birth, stillbirth, néonatal death, and major congénital malformations.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
314
Études observationnelles (analytiques)
Dans cette étude prospective, les arguments en faveur de la nature causale de
l’association observée entre la chirurgie bariatrique et la réduction du risque de
diabète gestationnel incluent :
Il aurait fallu cocher...
Commentaires
L’intensité de l’association quantifiée par
l’estimation ponctuelle de Vodds ratio
(OR = 0,25)
Ceci argumente la force de l’association :
OR = 0,25 = diminution de risque de
75 % = risque divisé par 4
La cohérence avec les résultats d’une
étude antérieure citée dans les références
de l’article
Ceci prouve la reproductibilité de l’association
Le respect de la séquence temporelle
L’étude étant prospective, on n’a pas de
doute sur ce point
Il n’aurait pas fallu cocher...
Commentaires
L’existence d’une relation
« dose-effet »
Est non applicable pour une exposition qualitative binaire (oui/non). La chirurgie bariatrique
(exposition d’intérêt) ne peut pas être catégorisée
autrement
La taille de l’échantillon
d’analyse
Ce n’est pas un critère de causalité. Si l’association
est forte, elle pourra être mise en évidence, même
sur un petit échantillon
La chirurgie bariatrique était associée à un odds ratio de diabète gestationnel
égal à 0,25 (intervalle de confiance à 95 % : 0,13 à 0,47, p < 0,001). Ce résultat
peut s’expliquer par :
Il aurait fallu cocher...
Commentaires
L’existence de facteurs de confusion résiduels
C’est en théorie toujours possible d’imaginer
l’existence de facteurs de confusion résiduels
modifiant une association dans une étude
observationnelle, il faudrait que ce facteur soit
plus fréquent chez les patientes opérées et lié
au diabète gestationnel (par exemple, la prise
en charge plus fréquente par une diététicienne
en post-chirurgie : les patientes feraient moins
d’erreurs diététiques et seraient moins sujettes
au diabète, non pas parce qu’elles ont été
opérées, mais grâce à cette prise en charge)
L’efficacité de la chirurgie bariatrique pour la réduction du risque
de diabète gestationnel
C’est bien sûr possible, même si cette étude n’a
pas le niveau de preuve pour s’assurer que cette
relation soit causale
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse des résultats et évaluation de la causalité
315
Il aurait fallu cocher...
Commentaires
Une prévalence plus élevée de
diabète préconceptionnel méconnu
dans le groupe « contrôle »
La connaissance de l’antécédent de chirurgie
bariatrique et donc d’une obésité morbide
pourrait en effet inciter les cliniciens à une recherche plus active de diabète dans le groupe
opéré que chez les contrôles. Il en résulterait une
sous-estimation de la prévalence réelle du diabète
préconceptionnel chez les contrôles. Les patientes
avec un diabète préconceptionnel sont exclues de
l’analyse. On aurait donc exclu plus de patientes
diabétiques du groupe « chirurgie » et donc
possiblement augmenté la force de l’association
La différence de l’indice de masse
corporelle (IMC) moyen en début
de grossesse entre les 2 groupes
d’étude
Les patientes opérées ont un IMC plus bas et
c’est probablement le mécanisme principal qui
explique la diminution du risque de diabète
gestationnel
Une relation causale entre la chirurgie bariatrique et la diminution
du risque de diabète gestationnel
Même si ce type d’étude n’a pas le niveau de
preuve pour affirmer une relation causale, c’est
une des explications possibles à ce résultat
Il n’aurait pas fallu cocher...
La différence d’effectif entre les
2 groupes d’étude
Commentaires
La différence d’effectif est liée au ratio
exposés/non exposés de 5
La chirurgie bariatrique était associée à un odds ratio d’occurrence du critère
composite de mort fœtale ou néonatale égal à 2,39 (intervalle de confiance à
95 % : 0,98 à 5,85 ; p = 0,06). Ce résultat peut s’expliquer par :
Il aurait fallu cocher...
Commentaires
L’absence d’association
entre la mortalité fœtale ou
néonatale et la chirurgie
bariatrique
Un résultat non significatif peut s’expliquer par
l’absence de lien (probabilité 1 — a)
Le risque d’erreur statistique
de deuxième espèce (P)
Un résultat non significatif peut s’expliquer par un
manque de puissance (risque p = risque de ne pas mettre en évidence une association qui existe pourtant)
Un défaut de puissance
statistique
En l’absence de calcul de puissance a priori^ on peut
toujours penser que le test manque de puissance
Il n’aurait pas fallu cocher...
Commentaires
Le caractère composite du
critère
Au contraire, un critère composite génère plus
d’événements et augmente la puissance du test
La nature causale de l’association
Au contraire, une association causale serait plutôt
fortement significative
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
316
Études observationnelles (analytiques)
Ex e m ple 3 (ED N 2020)
Zheng Z, Zheng R, He Y, Sun X, Wang N, Chen T, et al. Risk Factors for
Pancreatic Cancer in China : A Multicenter Case-Control Study. J Epidemiol
2016 ; 26(2) : 64-70.
We assessed risk factors of pancreatic cancer in China. Methods : A case-control
study design was conducted using data from four hospital-based cancer registries. Controls were equally matched and selected from family members of nonpancreatic cancer patients in the same hospitals. Face-to-face interviews were
conducted by trained staff using questionnaires. Conditional logistic régression
models were used to assess odd ratios (ORs) and 95 % confident intervals (CIs).
Lifestyles associated with risk of pancreatic cancer
Risk
Adjusted OR 1 Adjusted OR 2
Cases
Controls
Crude OR
(95% CI)b
(95% CI)a
factors
(95% CI)
n
n
%
%
Smoking
No
190 -58.8 210 -65.0 1.00 (reference) 1.00 (reference) 1.00 (reference)
Yes
133 -41.2 113 -35.0 1.50(1.01-2.24) 1.64(1.08-2.48) 1.78(1.02-3.10)
Cigarettes per day
50
-37.6 72
-63.7 1.00 (reference) 1.00 (reference) 1.00 (reference)
<20
20-29 61
-45.9 34
-30.1 2.04(1.04-4.02) 1.97(1.03-4.01) 1.55(0.73-3.31)
22
-16.5 7
-6.2 3.67(1.07-12.66) 3.85(1.09-13.59) 1.94(0.52-7.36)
>30
Pack-years
44
<20
-33.1 58
-51.3 1.00 (reference) 1.00 (reference) 1.00 (reference)
89
-66.9 55
-48.7 1.48(1.03-2.13) 1.45(1.01-2.09) 1.39(0.86-2.23)
>20
Alcohol consumption
272 -84.2 274 -84.8 1.00 (reference) 1.00 (reference) 1.00 (reference)
No
Yes
51
-15.2 1.07(0.65-1.76) 1.18(0.70-1.99) 1.22(0.60-2.48)
-15.8 49
Tea consumption
No
240 -75.9 208 -64.8 1.00 (reference) 1.00 (reference) 1.00 (reference)
-24.1 113 -35.2 0.53(0.36-0.79) 0.55(0.36-0.83) 0.49(0.25-0.84)
Yes
76
Coffee consumption
No
308 -96.9 297 -96.4 1.00 (reference) 1.00 (reference) 1.00 (reference)
Yes
10
-3.1 11
-3.6 0.90(0.37-2.22) 0.89(0.33-2.37) 0.91(0.30-2.78)
Cooking
No
140 -44.7 130 -40.4 1.00 (reference) 1.00 (reference) 1.00 (reference)
Yes
170 -55.3 192 -59.6 0.73(0.49-1.10) 0.69(0.45-1.05) 0.63(0.37-1.06)
Mental jressure
No
265 -83.1 286 -89.1 1.00 (reference) 1.00 (reference) 1.00 (reference)
1 Yes
54
-16.9 35
-10.9 1.73(1.07-2.81) 1.67(1.02-2.74) 1.32(0.73-2.39)
Cl, confidence interval ; OR, odds ratio.
Ail bold ORswere statistically significant as indicated by their 95% CIs.
a Adjusted for âge, sex, race, and residential areas.
b Adjusted for âge, sex, race, residential areas, smoking, tea drinking, mental pressure, family history
of pancreatic cancer, BMI, diabètes, gallstone, pickle consumption, and vegetable consumption.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse des résultats et évaluation de la causalité
317
D’après le tableau ci-dessus, quel(s) argument(s) va (vont) à l’encontre d’une association statistiquement significative entre la pression psychologique au travail
{mental pressure) et le risque de cancer du pancréas en analyse multivariée ?
Il aurait fallu cocher...
Commentaires
Les bornes de l’intervalle de confiance à
95 % (0,73 à 2,39) de Vodds ratio ajusté
incluent la valeur neutre 1,00
Le résultat à prendre est celui de l’analyse
multivariée ajustée sur tous les facteurs
de confusion mis en évidence et correspond au résultat de la dernière colonne
(OR2). On ne retrouve pas d’association
statistiquement significative entre la pression psychologique au travail et le risque
de cancer du pancréas car l’intervalle de
confiance de Vodds ratio correspondant
comprend la valeur 1
Il n’aurait pas fallu cocher...
Commentaires
L’estimation ponctuelle de Vodds ratio
ajusté (1,32) est comprise entre les bornes
de son intervalle de confiance à 95 %
(0,73 à 2,39)
L’estimation ponctuelle d’un odds
ratio ou d’un risque relatif est toujours
comprise entre les bornes de son intervalle de confiance. Cela va de même avec
la moyenne ou la médiane ou toute autre
estimation pour laquelle on associe un
intervalle de confiance
Le pourcentage de cas rapportant une
pression psychologique au travail est
négatif
Il ne s’agit pas de valeur négative. Les
pourcentages sont simplement représentés avec un tiret
L’estimation ponctuelle de Vodds ratio
ajusté de cancer du pancréas est égale à
1,00 pour les sujets sans pression psychologique au travail
Le groupe des personnes sans pression
psychologique au travail correspond
au groupe de référence. L’odds ratio du
groupe de référence est toujours égal à 1
Seulement 16,9 % des patients subissant
une pression psychologique au travail ont
développé un cancer du pancréas
La lecture juste du tableau est que 16,9 %
des patients avec un cancer du pancréas
sont exposés à une pression psychologique
au travail
Characteristics of patients associated with risk of pancreatic cancer
Cases
Controls
n
n
Characteristics
%
Crude OR
(95% CI)
Adjusted OR1
(95% CI)a
Adjusted OR2
(95% CI)b
o//o
Family history of pancreatic cancer
No
312 -96.6 320 -99.1 1.00 (reference) 1.00 (reference) 1.00 (reference)
Yes
11
-3.4
3
-0.9
3.67 (1.02-13.14) 4.04 (1.08-15.07) 1.23 (1.11-3.70)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
318
Études observationnelles (analytiques)
Cases
Controls
n
n
Characteristics
%
Crude OR
(95% CI)
Adjusted OR1
(95% CI)a
Adjusted OR2
(95% CI)b
%
BMI
< 24.0
197 -61.0 230 -71.2 1.00 (reference) 1.00 (reference) 1.00 (reference)
> 24.0
126 -39.0 93
-28.8 1.67(1.18-2.38) 1.78 (1.23-2.58) 1.77 (1.22-2.57)
Diabètes
No
174 -78.0 255 -90.7 1.00 (reference) 1.00 (reference) 1.00 (reference)
Yes
49
-9.3
-22.0 26
2.69 (1.51-4.77) 2.60 (1.41-4.79) 2.96 (1.48-5.92)
Cholecystitis
No
272 -94.1 195 -96.7 1.00 (reference) 1.00 (reference) 1.00 (reference)
Yes
17
-5.9
10
-3.3
1.89 (0.84-4.24) 1.91 (0.83-4.38) 1.35 (0.50-3.68)
Gallstone
No
274 -95.1 300 -98.4 1.00 (reference) 1.00 (reference) 1.00 (reference)
Yes
14
-4.9
-1.6
5
2.80 (1.01-7.77) 2.58 (0.89-7.44) 2.68 (0.65-11.07)
Cl, confidence interval ; OR, odds ratio.
Ail bold ORs were statistically significant as indicated by their 95% Cls.
a Adjusted for âge, sex, race and residential areas.
b Adjusted for âge, sex, race, residential areas, smoking, tea drinking, mental pressures, family
history of pancreatic cancer, BMI, diabètes, gallstone, pickles and vegetables.
Characteristics of patients associated with risk of pancreatic cancer
Cases
Controls
n
n
Dietary
factors
(%)
Crude OR
(95% Cl)
Adjusted OR1
(95% Cl)a
Adjusted OR2
(95% Cl)b
(%)
Pickles
No
312 -96.6 320 -99.1 1.00 (reference) l.OO(reference) l.OO(reference)
Yes
11
-3.4
3
-0.9
3.67(1.02-13.4) 1.59(0.99-2.57) 0.99(0.39-1.68)
Sometimesc 29
-9.1
13
-4.0
l.OO(reference) 1.00 (reference) 1.00 (reference)
Vegetables
Alwaysd
290 -90.9 309 -96.0 0.42(0.22-0.84) 0.45(0.22-0.90) 0.41(0.14-1.20)
Fruits
Sometimesc 144 -45.1 132 -41.0 1.00 (reference) 1.00 (reference) 1.00 (reference)
Alwaysd
175 -54.9 190 -59.0 0.80(0.57-1.14) 0.80(0.56-1.14) 0.62(0.37-1.04)
Fish
Sometimesc 135 -42.3 134 -41.6 1.00 (reference) 1.00 (reference) 1.00 (reference)
184 -57.7 188 -58.4 0.97(0.70-1.35) 0.94(0.67-1.33) 0.59(0.35-1.00)1
Alwaysd
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse des résultats et évaluation de la causalité
Dietary
factors
Cases
Controls
n
n
(%)
Crude OR
(95% Cl)
Adjusted OR1
(95% Cl)a
319
Adjusted OR2
(95% Cl)b
(%)
Bean
Sometimesc 187 -58.6 204 -63.4 1.00 (reference) 1.00 (reference) 1.00 (reference)
Alwaysd
132 -41.4 118 -36.6 1.22(0.88-1.69) 1.18(0.84-1.65) 1.35(0.86-2.10)]
Cl, confidence interval ; OR, odds ratio.
Ail bold ORs were statistically significant as indicated by their 95% Cls.
a Adjusted for âge, sex, race and residential areas.
b Adjusted for âge, sex, race, residential areas, smoking, tea drinking, mental pressure, family
history of pancreatic cancer, BMI, diabètes, gallstone, pickles and vegetables.
c <2 times per week
d >3 times per week
Dans cette étude, les expositions indépendamment associées à un risque augmenté de cancer du pancréas incluent :
Il aurait fallu cocher...
Commentaires
Les antécédents familiaux
de cancer du pancréas
Les expositions indépendamment associées à un risque
augmenté de cancer du pancréas sont celles pour lesquelles V odds ratio ajusté sur les tous les facteurs de
confusion (OR2 dans les tableaux) est supérieur à 1 avec
un intervalle de confiance ne comprenant pas la valeur 1
(dans le premier et le deuxième tableau de cet exemple
on retrouve donc le tabac, les antécédents familiaux de
cancer du pancréas, l’IMC > 24 et le diabète)
Un IMC supérieur ou égal
à 24 kg/m2
Il n’aurait pas fallu cocher...
Commentaires
La consommation d’alcool
Odds ratio à 1,22 avec intervalle de confiance
comprenant la valeur 1
La lithiase biliaire {gallstone)
Odds ratio à 2,68 avec intervalle de confiance
comprenant la valeur 1
La consommation de cornichons au
vinaigre {pickles)
Odds ratio à 0,99 avec intervalle de confiance
comprenant la valeur 1
Les arguments en faveur d’une relation causale entre le tabagisme et le cancer
du pancréas incluent :
Il aurait fallu cocher...
Commentaires
La persistance d’une association
statistiquement significative en
analyse multivariée
Cette proposition ne fait pas directement partie
des critères de causalité de Bradford-Hill mais
on peut considérer que c’est un argument en
faveur de la force de l’association
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
320
Études observationnelles (analytiques)
H aurait fallu cocher...
Commentaires
L’existence d’une relation croissante entre le nombre de cigarettes
fumées quotidiennement et le
risque de cancer du pancréas
L’OR passe de 1,55 pour 20-29 cigarettes fumées à 1,94 pour plus de 10 cigarettes fumées.
Cela correspond à l’effet-dose (critère interne à
l’étude)
La cohérence avec les résultats
d’études antérieures
Cela correspond à un des critères externes de
causalité
Il n’aurait pas fallu cocher...
Commentaires
L’ajustement sur tous les facteurs de
confusion potentiels
Cette formulation incite à la prudence. Il
est impossible d’envisager connaître tous
les facteurs de confusion de la relation
entre une exposition et un phénomène
La spécificité de la relation entre le tabagisme et le risque de cancer du pancréas
La relation est bien entendu non
spécifique quand on connaît la diversité
de pathologies induites par le tabac
Quel(s) mécanisme(s) pourrai(en)t expliquer l’association observée entre le diabète et le risque augmenté de cancer du pancréas ?
Il aurait fallu cocher...
Commentaires
Un dysfonctionnement des cellules
endocrines des îlots de Langerhans serait
impliqué dans le développement d’adénocarcinome pancréatique
Argument présenté en discussion, cela
correspond à une hypothèse physiopathologique qui expliquerait une réelle
association entre le diabète et le risque
de cancer du pancréas
Le diabète serait une complication du
cancer du pancréas
Oui, d’autant plus que l’étude présentée
ici est une étude-cas témoin et donc
par définition rétrospective. Il est donc
délicat d’affirmer que le diabète précédait
systématiquement la survenue du cancer
du pancréas
L’existence de facteurs de confusion
résiduels qui ne sont pas pris en compte
dans l’analyse multivariée
Le biais de confusion résiduel pourrait
expliquer une association statistiquement
significative alors qu’il n’existe pas de
réelle association
Un biais dans le recueil de l’information
sur le diabète
Il est difficile dans le cadre d’une étude
rétrospective de s’assurer de la séquence
temporelle entre survenue du diabète
puis survenue d’un cancer du pancréas
>
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse des résultats et évaluation de la causalité
321
Characteristics of 323 pancreatic cancer cases and 323 Controls
Variables
Cases3
Controls3
n
%
n
%
110
(34.1)
■
X2
P
0.000
1.000
Center
Henan Cancer Hospital
110
(34.1)
Beijing Cancer Hospital
105
(32.5)
105
(32.5)
Hebei Cancer Hospital
73
(22.6)
73
(22.6)
CICAMSb
35
(10.8)
35
(10.8)
Male
181
(56.0)
181
(56.0)
Female
142
(44.0)
142
(44.0)
0.000
1.000
Age, yearsc
58.7
(11-2)
58.0
(11.2)
0.790
0.430
Han
312
(96.6)
314
(97.2)
Other
9
(2.8)
9
(2.8)
0.000
1.000
Unmarried
5
(1-5)
4
Married
294
298
(1.3)
(93.1)
Divorced
7
(91-3)
(2.2)
2
(0.6)
Widowed
16
(5.0)
16
(5.0)
3.248
0.517
76
(25.0)
75
(23.7)
6-12
111
(36.5)
118
(37.2)
>12
117
(38.5)
124
(39.1)
0.152
0.927
Urban
163
(50.6)
156
(48.9)
Rural
159
(49.4)
163
(51.1)
0.189
0.664
29
(9.2)
32
(10.1)
1.622
0.951
Sex
Ethnie group
Marital status
Education, years
<6
Residential areas
Occupation
Worker
Peasant
117
(37.3)
117
(36.9)
Manager
76
(24.2)
82
(25.9)
Other
92
(29.3)
86
(27.1)
a Sums may not add up to total because of missing values.
b Cancer Institute & Hospital, Chinese Academy of Medical Sciences.
c Values given are mean (standard déviation).
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
322
Études observationnelles (analytiques)
Quel(s) élément(s) limite(nt) les possibilités d’extrapolation des résultats de cette
étude à la population française ?
Il aurait fallu cocher...
La proportion d’agriculteurs dans
l’échantillon
L’ethnie majoritaire des participants
Il n’aurait pas fallu cocher...
Le schéma d’étude cas-témoin
Le recrutement des cas dans des hôpitaux
Les modalités de recueil de l’information
sur les expositions étudiées
Commentaires
Cette question fait référence à la validité
externe, c’est-à-dire la capacité d’extrapolation des résultats à une population
plus large. Cette étude a eu lieu en Chine
auprès de membres de l’ethnie Han
majoritaire à plus de 95 % et avec une
proportion d’agriculteurs supérieure à
35 %. Ces 2 éléments sont donc une
limite importante à l’extrapolation des
résultats à la population française
Commentaires
Ces différentes propositions correspondent à des choix méthodologiques
internes à l’étude. Ils permettent donc
d’apprécier la validité interne mais
n’interviennent pas dans l’extrapolation
ou la généralisation des résultats (validité
externe)
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse des résultats et évaluation de la causalité
323
Ex e m ple 4 (ED N 2021)
von Ehrenstein OS, Ling C, Cui X, Cockburn M, Park AS, Yu F, et al.
Prénatal and infant exposure to ambient pesticides and autism spectrum
disorder in children: population based case-control study. B MJ 20 mars
2019 ; 364 : 1962.
Odds ratios and 95 % confidence intervals for association between ail cases of
autism spectrum disorder combined and pesticide exposure during pregnancy
and first year of life in logistic régression models, by pesticide substance
Pesticide Pregnancy
substance
Model 1*
No of
exposed
cases/
Controls
First year of life
Model 2+
No of
exposed
cases/
Controls
Model 1*
Model 2+
Glyphosate*
2293/26
660
1.12
1.16
2256/26
(1.06 to 1.27) (0.99 to 1.27) 390
1.15
1.17
(1.05 to 1.26) (1.04 to 1.32)
Chlorpyrifos
1799/20
914
1.07
1876/22
1.13
(1.05 to 1.23) (0.96 to 1.19) 125
1.04
1.10
(1.02 to 1.20) (0.93 to 1.16)
Diazinon
764/9176 1.11
1.09
787/9890 1.04
1.00
(0.95 to 1.14) (0.90 to 1.11)
(1.01 to 1.21) (0.98 to 1.20)
Acephate
341/4047 1.09
1.06
381/4783 1.00
0.96
(0.97 to 1.23) (0.93 to 1.19)
(0.90 to 1.13) (0.85 to 1.08)
Malathion 642/7277 1.11
1.05
784/8911 1.11
1.07
(1.01 to 1.22) (0.95 to 1.16)
(1.02 to 1.21) (0.97 to 1.18)
Permethrin 930/10
773
1.04
1047/12 1.10
1.10
1.05
(1.01 to 1.20) (0.94 to 1.14) 129
(1.01 to 1.19) (0.96 to 1.16)
Bifenthrin 638/7
300
0.96
886/9671 1.09
1.05
1.03
(0.94 to 1.13) (0.87 to 1.07)
(1.00 to 1.19) (0.95 to 1.15)
Methyl
bromide
1.04
0.95
761/8986 1.08
657/8085 1.03
(0.99 to 1.18) (0.94 to 1.15)
(0.94 to 1.13) (0.86 to 1.05)
Imidacloprid
1123/14
490
1323/16
0.81
0.93
(0.86 to 1.00) (0.74 to 0.89) 771
0.95
0.86
(0.88 to 1.02) (0.78 to 0.95)
Avermectin
1513/17
212
1.12
1.10
1719/20
(1.04 to 1.22) (1.00 to 1.22) 100
1.07
1.01
(0.99 to 1.15) (0.90 to 1.12)
Myclobutanil
1254/15
222
1.04
0.99
1375/16
(0.96 to 1.12) (0.90 to 1.09) 871
1.01
0.95
(0.93 to 1.09) (0.86 to 1.05)
*Logistic régression; adjusted for year of birth, sex, maternai race or ethnicity, maternai âge,
maternai éducation, and NOx (CALINE4) as a marker of traffic related air pollution; pesticide
exposure defined as ever versus never to spécifie substance in considered developmental period.
+Logistic régression; adjusted as model 1; pesticide exposure defined as ever versus never to
spécifie substance in considered developmental period with ail considered pesticides in the model.
^Glyphosate compounds include glyphosate isopropylamine sait, glyphosate potassium sait,
glyphosate monoammonium sait, glyphosate diammonium sait, glyphosate trimesium, and
glyphosate dimethylamine sait.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
324
Études observationnelles (analytiques)
Quelle(s) exposition(s) pendant la première année de vie est (sont) indépendamment associée(s) à une augmentation significative du risque de trouble du spectre
autistique dans le modèle multivarié ajusté sur l’ensemble des pesticides (tableau ci-dessus) ?
Il aurait fallu cocher...
Glyphosate
Commentaires
L’information concernant l’exposition au cours de la
première année de vie est située dans la partie droite du
tableau. L’expression « indépendamment associée » renvoie à
la mesure d’association ajustée sur les facteurs de confusion ;
et l’ajustement sur l’ensemble des pesticides correspond au
modèle 2. Le seul pesticide pour lequel une exposition au
cours de la première année de vie est associée à une augmentation du risque de troubles du spectre autistique est le
glyphosate car Vodds ratio correspondant est supérieur à 1 et
que son intervalle de confiance ne comprend pas la valeur 1
Il n’aurait pas fallu cocher...
Perméthrine
Imidaclopride
Diazinon
Avermectine
Commentaires
Tous les odds ratios correspondant à ces
pesticides comprennent la valeur 1 dans
le modèle 2
L’association entre l’exposition au glyphosate ambiant pendant la première année de
vie et le développement de troubles du spectre autistique (tableau 3) peut résulter :
Il aurait fallu cocher...
Commentaires
De fluctuations aléatoires d’échantillonnage
Cette question renvoie aux raisons possibles d’un résultat significatif
Soit l’effet est réel, soit il est lié au
hasard, soit il est la conséquence de biais
(comme la confusion)
De facteurs de confusion méconnus
De l’effet du glyphosate sur le système
nerveux central en développement
Il n’aurait pas fallu cocher...
Commentaires
D’une erreur de classement sur l’exposition au glyphosate, non différentielle
entre les cas et les témoins
Le biais de classement non différentiel a
tendance à diminuer les différences entre
les groupes comparés : il pourrait plutôt
expliquer un résultat non significatif
D’un défaut de puissance statistique
Un défaut de puissance peut expliquer un
résultat non significatif
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Analyse des résultats et évaluation de la causalité
325
Ex e m ple 5 (é preuve t est 2020)
Billioti de Gage S, Moride Y, Ducruet T, Kurth T, Verdoux H, Tournier M,
et al. Benzodiazépine use and risk of Alzheimer’s disease: case-control study.
BMJ 9 sept 2014 ; 349 : g5205.
Objectives : To investigate the relation between the risk of Alzheimer’s disease
and exposure to benzodiazépines started at least five years before, considering
both the dose-response relation and prodromes (anxiety, dépréssion, insomnia)
possibly linked with treatment.
Le fait de ne considérer que les expositions antérieures d’au moins 5 ans (ou
6 ans dans l’analyse de sensibilité) à la date de diagnostic permet de :
Il aurait fallu cocher...
Commentaires
S’assurer que la prescription de benzodiazépines n’était pas motivée par les
premiers symptômes de la maladie
d’Alzheimer
Cette question renvoie à la nature
causale de l’association observée et plus
particulièrement à la notion de séquence
temporelle. S’assurer que l’exposition
précède bien la survenue de la maladie
et non pas l’inverse, c’est apporter un
argument (parmi d’autres) en faveur de
la nature causale de l’association. Si les
benzodiazépines sont prescrites pour
les premiers symptômes de la maladie
d’Alzheimer, on pourra bien constater
une association entre les deux mais la
relation causale sera en réalité inverse par
rapport à l’hypothèse émise initialement
Mieux appréhender la séquence temporelle entre l’exposition et l’événement
Renforcer les arguments en faveur de la
nature causale de l’association
Il n’aurait fallu cocher...
Commentaires
Recruter des cas incidents
La mesure de l’exposition est indépendante de la notion de recrutement de cas
incidents
Limiter les biais de confusion
Même si la séquence temporelle est respectée, cela ne permet en aucun cas de
maîtriser l’importance de tiers facteurs à la
fois associés à la maladie et à l’exposition
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
In d e x
A
c
Agence nationale de sécurité du médicament,
83
Aire sous la courbe, 236
Ajustement (adjustment), 253
Allocation aléatoire, 113
Analyse
- de sécurité, 155
- de survie, 63
- en intention de traiter, 151
- en ITT modifiée, 153
- en sous-groupes, 175
— homogénéité, 176
- en traitement reçu, 154
- multivariée, 54, 254
- per-protocole, 153
- univariée, 54
Appariement (matching), 253, 280
Association
- non significative
— raisons possibles, 306
- significative
— raisons possibles, 307
Attrition, 14
Autorisation de mise sur le marché, 95
Caractéristique extrinsèque, 206
Cas, 279
- incidents, 279
- prévalents, 279
Causalité, 303, 307
Choix d’un seuil, 237
Clause d’ambivalence, 110
Coefficient
- de corrélation intra-classe, 223
- kappa k de concordance, 222
Comité
- de protection des personnes, 83
- national de l’informatique et des libertés, 83
Comparabilité
- des groupes, 114
Concordance, 48
Conflit d’intérêt, 86
Confusion, 251
Corrélation, 48
Courbe ROC, 235
- aire sous la courbe ROC, 236
Critère
- d’exclusion, 109
- d’inclusion, 109
- de causalité de Bradford-Hill, 307
- de jugement
— clinique, 100
— cliniquement pertinent, 100
— de substitution, 100
— final, 100
— intermédiaire, 100
— multiple, 98
— objectif, 99
— principal, 97
— secondaire, 97
— subjectif, 100
— unique, 98
- externe à l’étude, 308
- interne à l’étude, 307
B
Biais, 13
- d’attrition, 144, 190
- d’information, 15
- de classement, 15
— différentiel, 294
— non différentiel, 294
- de confusion, 17, 251
- de mémoire
- de mesure, 15
— différentiel, 127
- de performance, 128
- de publication, 74
- de sélection, 14, 109,190, 287
- de suivi, 144
- maximum
— hypothèse, 152
Boîte à moustaches (boxplot), 29
Bornes d’équivalence, 163
()
D
Date
- d’origine, 64
- de point, 64
- des dernières nouvelles, 64
La LCA en anglais facile aux EDN
© 2022 Elsevier Masson SAS. Tous droits réservés.
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
328
Index
Degré de signification, 50
Diagramme
- de flux (flou chart), 143
-
en forêt (ou forest plot), 176
Dispersion
- écart type (standard déviation), Y7
- intervalle interquartile (interquartile range),
27
- variance, 27
Données censurées à droite, 64
E
Échantillon, 14, 109
Échantillonnage (fluctuation), 13, 36
Effectifs marginaux, 31
Effet
- nocebo, 128
- placebo, 128
— double placebo, 129
— indistinguable, 129
Erreur
- aléatoire, 13
- différentielle, 15
- non différentielle, 16
Essai
- clinique de phase III, 93
- d’équivalence, 163
- de non-infériorité, 163
- en cross-over, 140
- en groupes parallèles, 139
Étude
- analytique
- cas-témoins nichée dans une cohorte,
281
- cas-témoins, 249
- de cohorte
— exposés/non exposés, 250, 270, 287
— historique (ou rétrospective), 287
— prospective, 287
- descriptive, 5
- en population, 288
- étiologique, 5
- expérimentale, 3
- historicoprospective, 5
- historique, 5
- longitudinale d’incidence, 249
- observationnelle, 3
- primaire, 73
- pronostique, 5
- prospective, 5
- rétrospective, 5
- suivi
— longitudinal, 4
— transversal, 4
- transversale de prévalence, 249
F
Facteur
- de confusion, 251
- de risque, 63, 269
- pronostique, 63, 269
Faux
- négatif, 206
- positif, 206
Fraction étiologique, 45
Fréquences
- conditionnelles, 32
- partielles, 32
- relatives, 31
Funnel plot, 78
G
Gestion des perdus de vue, 152
H
Hazard ratio, 45, 67
Histogramme, 28
Hypothèse
- alternative Hl, 49
- nulle H0, 49
- tests, 49
I
Imputation, 154
- multiple, 152
- par la dernière valeur connue, 153
Incidence, 34
Indicateurs de mortalité fœto-infantile, 35
Indice de Youden, 206
Intervalle de confiance, 36, 47
L
Létalité, 35
Lien d’intérêt, 86
Loi
- Informatique et liberté, 83
- Jardé, 83
M
Médiane de survie, 66
Médicament
- phases de développement, 94
— phase clinique, 94
------ phase I, 94
------ phase II, 94
------ phase III, 94
------ phase Illb, 95
------ phase IV, 95
— phase préclinique, 94
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Index
Mesure
- d’association, 43
- de l’exposition, 287
- répétée (donnée appariée), 55
Méta-analyse, 24
Méthode de Kaplan-Meier, 66
Modèle de Cox, 55, 67
Mortalité prématurée, 35
N
Nombre
- de patients à traiter (number needed
to treat), 45
- de sujets nécessaires, 52
Nomogramme de Fagan, 211
0
Odds ratio, 46, 304
P
Perdus de vue, 295
Personnes-temps à risque, 33
Pharmacoépidémiologie, 95
Pharmacovigilance, 95
Plan
- expérimental, 139
- factoriel, 141
Plausibilité clinicobiologique, 293
Population
- cible, 14, 109
- ITT, 143
- per-protocole, 143
- restriction, 253
- source, 14, 109
Position
- déciles, 26
- étendue (range), T7
- médiane, 26
- mode, 27
- moyenne, 26
- percentiles, 26
- quartiles, 26
Pratiques (évaluation), 4
Preuve (niveau), 23
Prévalence, 34
Procédure d’aveugle, 127
- comité de suivi indépendant, 129
- essais en double insu (ou double aveugle),
127
- essais en ouvert, 127
- essais en simple insu (ou simple aveugle),
127
Puissance, 51
p-value, 49, 50
329
R
Randomisation
- centralisée, 115
- déséquilibrée, 114
- équilibrée, 114
- imprévisibilité, 116
- indépendante, 115
- individuelle, 113
- minimisée, 115
- par blocs, 114
- par grappes, 114
- ratio de, 114
- stratifiée, 115
Rapport de vraisemblance, 209
Ratio de randomisation, 114
Recherche
- impliquant la personne humaine, 84
— investigateur, 85
— promoteur, 85
- interventionnelle
Régression
- linéaire multiple, 55
- logistique, 55
Relation
- étiologique, 250
- pronostique, 250
Représentativité, 287
Reproductibilité
- fiabilité ou reliability, 223
- inter-observateur (inter-rater), 222
- intra-observateur (intra-rater), 222
Résultat
- généralisation, 190
- pertinence clinique, 190
Risque
- a (inflation), 180
- [3 (inflation), 180
- de deuxième espèce (risque P), 51
- de première espèce (risque a), 50
- différence absolue du risque, 43
- relatif, 43, 45, 303
S
Score de propension, 254
Sécurité des patients, 110
Sélection, 109
Sensibilité, 205
Séquence temporelle, 293
Séries indépendantes, 55
Seuil de non-infériorité, 163
Spécificité, 205
Standardisation
- directe, 36
- indirecte, 36
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
330
Index
Stratification (stratification), 253
Survie
- globale (overall survival), 64
- sans rechute (progression free survival), 64
- spécifique, 64
T
Taille globale de l’effet, 73
Taux, 34
- d’incidence, 33
- de mortalité, 34
Témoins, 280
Test
- caractéristique
— extrinsèque (valeurs prédictives), 206
— intrinsèque, 205
- d’hétérogénéité, 176
- d’interaction, 176
- de dépistage, 220
- de Mann-Whitney, 55
- de McNemar, 55
- de référence, 221
- de Student, 55
— apparié, 55
- de Wilcoxon, 55
- diagnostique, 220
- du Chi2, 55
- du log rank, 55
- non paramétrique, 55
- paramétrique, 55
- qualitatif, 219
- quantitatif, 219
Transparence, 86
V
Valeur prédictive
- négative, 206
- positive, 206
Validité
- externe, 190
- interne, 109, 189
Variable, 25, 30
- à expliquer (ou dépendante), 54
- dépendante (ou à expliquer), 254
- explicative (ou indépendante), 54
- indépendante (ou explicative), 254
- qualitative
— nominale, 30
— ordinale, 30
- quantitative
— continue, 25
— discrète (discontinue), 25
477638 - (I) - (4,5) - Quatro Silk 90
Elsevier Masson SAS. 65, rue Camille-Desmoulins,
92442 Issy-les-Moulineaux cedex
Dépôt légal : octobre 2022
Composition : Thomson
Imprimé en Pologne par Dimograf
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009
Il a été diffusé exclusivement sur la libairie SM-librairiepdf.com le forum © SBA-MEDECINE ,
pour plus des livres médicaux gratuits, préparation ECNi R2C,.... visitez: www.sba-medecine.com depuis 2009