B. Falissard Introduction à la recherche clinique et épidémiologique J. Warszawski, Faculté de médecine Paris-Sud Synthese Illustration vidéo sur les types d’enquêtes en épidémiologie (5 mn) https://youtu.be/PxEevvWLlRw POUR VOUS ENTRAINER : Quizz en ligne Les 6 quizz ci-dessous portent sur les différents types d'études. Ils ont été commentés en cours 5 et 6. Vous pouvez faire et refaire ces quizz à volonté. Vous recevrez par mail une note avec les réponses commentées. Le but est de vous auto-évaluer. Les notes ne seront pas prises en compte pour l'examen. Quizz 1a Quizz 1b Quizz 1c Quizz 1d Quizz 1e Quizz 1f 1 1 Types d’objectifs en épidémiologie • Mesurer l’ampleur, l’évolution au cours du temps et la distribution géographique de phénomènes liés à la santé au sein des populations humaines • Décrire l’histoire naturelle d’une maladie et son pronostic Epidémiologie descriptive La terminologie n’est pas toujours consensuelle (mais les approches méthodologiques sont communes) : • on parle quelquefois d’épidémiologie clinique ou de recherche clinique pour les études portant sur des sujets malades • Les essais thérapeutiques et les études diagnostiques sont plutôt considérées comme de la recherche clinique • Identifier les déterminants des maladies (étiologie, facteurs de risque) et des comportements de santé • Identifier les facteurs pronostiques d’une maladie (dont les traitements reçus dans le cadre du soins) Epidémiologie analytique • Evaluer l’efficacité et/ou la sécurité d’interventions en situation expérimentale – En population (programmes de prévention…) – Auprès de personnes malades (diagnostic, pronostic, thérapeutique, prévention des complications…) Epidémiologie évaluative Objectifs sources de données Objectifs descriptifs - Fréquence, distribution d’un indicateur M - Répartition de l’indicateur dans l’espace - Evolution de l’indicateur dans le temps - Corrélation écologique entre plusieurs indicateurs - Pronostic M (= survie par ex) d’une pathologie Objectifs analytiques : recherche d’associations à visée explicatives entre M et E - Etiologie (causes) et facteurs de risque de maladie - Facteurs pronostiques - Déterminants de comportements Objectifs évaluatifs (1) : évaluer l’efficacité M / la sécurité M d’une intervention E : - Traitement - Stratégie médicale - Programme de prévention - Stratégie diagnostique / dépistage Objectifs évaluatifs (2) : performances d’une méthode de classement - Méthode diagnostique, questionnaire … Sur données groupées / surveillance épidémiologiques Taux d’incidence brut et standardisé Étude de corrélation écologique Sur données individuelles / enquête observationnelle • Enquête de cohorte taux d’incidence • Enquête transversale prévalence Enquêtes observationnelles sur échantillon d’individus • Enquête de cohorte RR, HR, OR dont étude exposés/non exposés • Enquête cas-témoins OR • Enquête transversale : moins optimale OR,RR Etudes expérimentales • Essai contrôlé randomisé (OR, RR, HR, RRR) Etudes quasi-expérimentales • Etude avant/après (transversale répétée ou cohorte interventionnelle) • Etude ici/ailleurs Hypothèses éventuelles pour mener des études observationnelles à visée explicative La causalité des associations entre E et M mises en évidence ne peut être affirmée par l’étude Apporte la preuve de la nature causale d’une association significative entre E et le critère de jugement principal M Niveau de preuve plus faible Causalité non démontrée Etudes diagnostiques interventionnelles (si la méthode à évaluer ou la méthode de référence est administrée pour l’étude) ou observationnelles • Etude transversale avec étalon-or 2 UNITES D’ANALYSE 3 Unité de recueil = groupe d’individu (PAYS par ex) Données collectives Recueil de paramètres caractérisant des groupes d’individus (ex : pays, régions, …) ‐ Taux de mortalité cardio‐vasculaire de chaque pays ‐ Taux d’incidence de cancer du sein de chaque pays ‐ Consommation moyenne de cigarettes par habitants de chaque pays ‐ Prévalence de malformation congénitale de chaque pays Unité de recueil = individu (personnes par ex) Données individuelles Recueil de donnée recueillies au niveau de chaque individu d’un échantillon ‐ Statut vital individuel ‐ Survenue ou non de la maladie (éventuellement date de survenue, etc…) ‐ Consommation de cigarettes (nombre par jour, durée, âge au début, etc…) ‐ Existence ou non d’une malformation congénitale 3 Utilisation de données groupées issus des systèmes d’enregistrement continue Sources de données de santé : données d’enregistrement continue • SURVEILLANCE EPIDEMIOLOGIQUE et STATISTIQUES VITALES Utilisation des données groupées • • • Unité de recueil de M et d’autres indicateurs = groupe d’individu (PAYS par ex) Données collectives Estimation de taux d’incidence (approximation) Etude des variations géographique ou temporelles Etude de corrélation écologique pas de conclusion causale Evolution des systèmes de surveillance de la grippe dans le monde The number of viruses from which sequence data have been uploaded to the GISAID platform between 1967 and 2016 https://www.who.int/ 3 Utilisation de données individuelles issues d’enquêtes observationnelles sur échantillon 3 Sources de données individuelles : enquêtes observationnelles ‐ ENQUETE DE COHORTES ‐ ENQUETES CAS‐TEMOINS ‐ ENQUETES TRANSVERSALES Les enquêtes sur échantillon d’individus permettent : de recueillir des informations individuelles sur la maladie et les expositions : de sélectionner une population cible et des indicateurs adaptés aux objectifs d’intégrer la dimension chronologique des événements d’étudier des associations au niveau individuel de prendre en compte des facteurs de confusion Utilisation des données individuelles Unité de recueil de M +/- E = individu • Estimation de mesures de fréquence de M caractérisant la population dont est issu l’échantillon • Comparaison des mesures de fréquence de M entre plusieurs groupes de l’échantillon pour identifier des facteurs associés au risque de survenue de M E = Facteur (exposition) susceptible d’influencer le risque de survenue ou de modification de M • • • • • Facteurs étiologiques, causes de maladie Facteurs pronostiques Facteurs socio‐démographique Déterminants de comportements stratégie thérapeutique, stratégie de prise en charge ‐ ‐ Etat de santé : ‐ Maladies ‐ Signes /anomalie clinique ou biologique Paramètres biologiques ou génétique ‐ Comportements en relation avec la santé ou l’accès aux soins ‐ Stratégie médicale ‐ Stratégie de prévention M = phénomène étudié • Critère de jugement / Outcome (en anglais) • Notation : M (= maladie) / D (= disease) ‐ Décès ‐ Décès pour une cause spécifique ‐ Etat de santé : ‐ ‐ Maladies ‐ Signes /anomalie clinique ou biologique Paramètres biologiques ou génétique ‐ Comportements en relation avec la santé ou l’accès aux soins ‐ Stratégie médicale ‐ Stratégie de prévention 4 Définition opérationnelle des objectifs Objectifs à visée • Descriptive • Explicative en approche observationnelle • Evaluative de l’effet d’une intervention expérimentale • Evaluative des performances d’une méthode de classement Approche : Observationnelle ou expérimentale /interventionnelle Unité d’analyse : Individu ou groupe (données agrégées) Définition des variables d’intérêt • Critère(s) de jugement M : principal/secondaires • Expositions ou intervention (E) • Méthode(s) diagnostique(s) T à évaluer Définition de la population cible (critères d’éligibilités X) = population à laquelle on souhaite appliquer les résultats Objectifs « Fréquence » ou « niveau » d’indicateurs M en lien avec la santé Etudes descriptives = observationnelle Recherche d’associations au niveau d’individus (comparaison) Etudes analytiques à visée explicative = observationnelle sur données individuelles ‐ Estimation pour une population cible ‐ Description des évolutions dans le temps et comparaison entre plusieurs zones géographiques ‐ Rechercher un (des) FACTEUR(s) de RISQUE de M = expositions E (non attribuées pour l’étude) associées statistiquement au risque de M, recueillis pour chaque individu ‐ Corrélations écologiques entre plusieurs indicateurs collectés au niveau des mêmes unités groupées générer des hypothèses L’étude est dite « descriptive » même si on effectue des comparaisons ou recherche des corrélations entre indicateurs qui caractérisent des groupes de sujets Études expérimentales ‐ Evaluer l’effet (positif ou négatif) sur un paramètre M d’une intervention E réalisée pour l’étude (=situation expérimentale) 5 SOURCES DE DONNEES Processus continu et systématique de recueil, analyse, interprétation et diffusion de données descriptives pour surveiller des problèmes de santé. 1°) Systèmes de surveillance épidémiologique 2°) Enquêtes observationnelles à partir d’échantillon d’individus Le niveau des paramètres étudiés est recueilli pour chaque sujet de l’échantillon 3°) Etudes expérimentales Les différents « bras » de l’intervention à évaluer sont attribués par tirage au sort aux sujets inclus Données de surveillance épidémiologique Population ouverte résidant dans une zone géographique déterminée: en constant renouvellement naissances, décès, immigrations, émigrations M+ M+ M+ M+ M+ M+ M+ M+ M+ M+ M+ M+ temps M+ REGISTRE OU SYSTÈME DE RECUEIL EXHAUSTIF DE NOUVEAUX CAS Recensement Recensement N N On ne recueille pas de données sur les sujets ne développant à M Couverture nationale Recueil M exhaustif + Recueil prospectif Cas incidents Recueil uniquement vrai vrai actif Réseaux sentinelles de labo ou de cliniciens souvent Déclaration obligatoire vrai vrai vrai vrai passif Registres de pathologies rarement vrai vrai vrai actif Statistiques vitales et causes de décès vrai vrai vrai vrai passif 6 Enquêtes OBSERVATIONNELLES ‐ ENQUETES DE COHORTE ‐ ENQUETES CAS‐TEMOINS ‐ ENQUETES TRANSVERSALES https://youtu.be/PxEevvWLlRw Définies par les modalités de sélection (échantillonnage) et de recueil de données Population cible Qui, où, quand dans l’idéal? Population cible Qui, où, quand en pratique ? Population source Objectifs M+ Modalités pratiques Population source Recrutement permettant identifier et sélectionner les sujets éligibles : Échantillon initial Inclus = participants Modalités de recueil avec ou sans suivi longitudinal Recueil de données VIDEO 7 Enquête transversale Population cible E+ Population source M+ Tirage au sort ou sélection exhaustive E+ M+ Sujets inclus temps Recueil de données à l’inclusion M+/M‐ À E+/E‐ l’inclusion Recueil simultané de E et M M + E+ M+ Sujets analysés M+ M- E+ a c Eb d Enquête cas ‐ témoins Population cible Population source M+ Recrutement séparé des M+ et M‐ M+ M‐ Sujets inclus temps Recueil de données à l’inclusion Expositions passées : E+/E‐ M+ M‐ M+ Interrogatoire RETROSPECTIF sur leur exposition passée E+ ou E- À l’inclusion E+ Sujets analysés E+ E- M+ a b M- c d 8 Enquête de cohorte à recrutement transversal Population cible E+ Population source M+ Tirage au sort ou sélection exhaustive N E+ M+ Exclusion des sujets déjà M+ E+ Sujets inclus PT E+ ∆𝑡 E‐ ∆𝑡 M+ DCD PDV temps Recueil de données ATCD avant l’inclusion (facultatif) À l’inclusion E+/E‐ Recueil de M E+ E‐ Suivi longitudinal +/‐ évolutions de E Fin du suivi prévu par l’étude Ou date de point intermédiaire Échantillon final ? ? Enquête de cohorte de type exposé/non exposé Population cible E+ Population source M+ Recrutement séparé des E+ et E‐ Tous M‐ E+ Sujets inclus E‐ N PT E+ ∆𝑡 E‐ ∆𝑡 M+ DCD PDV temps Recueil de données ATCD avant l’inclusion (facultatif) À l’inclusion E+ E‐ E+ E‐ Recueil de M Suivi longitudinal +/‐ évolutions de E ? ? Fin du suivi prévu par l’étude Ou date de point intermédiaire Échantillon final 9 Enquête de cohorte PROSPECTIVE Population cible E+ Population source M+ Période d’inclusions ciblée : contemporaine de la conception de l’étude Conception de l’étude E+ Sujets inclus (M‐) temps Recueil de données ? PDV ATCD avant l’inclusion (facultatif) Décès (si ≠ M+) M+ Recueil de la survenue de M+ Suivi longitudinal À l’inclusion E+/E‐ Fin du suivi de l’étude Ou date de point Échantillon final inclusions PROSPECTIVES Recueil des données au cours du suivi longitudinal PROSPECTIF Enquête de cohorte RETROSPECTIVE OU HISTORIQUE Population cible E+ Population source M+ Période d’inclusions ciblée : antérieure à la conception de l’étude E+ Conception de l’étude Sujets inclus (M‐) temps ? PDV ATCD avant l’inclusion (facultatif) À l’inclusion E+/E‐ Décès (si ≠ M+) M+ Recueil de la survenue de M+ Suivi longitudinal Fin du suivi de l’étude Ou date de point Échantillon final inclusions RETROSPECTIVES Reconstitution rétrospective du suivi longitudinal non planifié initialement 10 ESSAI RANDOMISE ETUDE EXPERIMENTALE = schéma de la cohorte exposé/non exposé prospective M‐ et E‐ Conception de l’étude Attribution par tirage au sort de E+ (intervention) E+ Sujets inclus E‐ temps Recueil de données À l’inclusion E+ Suivi longitudinal Recueil du critère de jugement M E‐ Fin du suivi prévu par l’étude Ou date de point intermédiaire Échantillon final ? ? Attention aux usages du « tirage au sort » ENQUETE TRANSVERSALE (étude observationnelle) ESSAI RANDOMISE (étude expérimentale) Population E- E- M+ M- E- E- Échantillon E+ M+ Tirage au sort des sujets inclus dans l’étude Tirage au sort de l’exposition (randomisation) E+ population M+ E+ Échantillon M+ M- Exemple : efficacité de la progestérone pour diminuer le risque de prématurité Exemple : relation entre progestérone et accouchement prématuré Population : femmes enceintes E = progestérone pendant la grossesse M = accouchement prématuré Population : accouchements E = progestérone reçue pendant grossesse M = accouchement prématuré 11 Type d’étude Descriptive Estimation de fréquence de M dans le temps et dans l’espace Explicative Expérimentale = analytique ou quasi‐expérimentale Recherche de facteur E de risque de M Evaluation de l’effet d’une intervention E, réalisée pour l’étude, sur le risque de M Variations conjointes de plusieurs indicateurs dans temps ou espace Pas d’exposition E ou indicateurs groupés (corrélation écologique) Approche («quasi » si E non randomisée, avec ou sans groupe contrôle) TOUJOURS au moins un CRITERE DE JUGEMENT M E= FACTEUR DE E= INTERVENTION (sur individus ou sur populations) RISQUE OBSERVATIONNELLE groupées Recueil et analyse sur données Surveillance épidémiologique à partir d’enregistrement de cas M active ou passive Etude de corrélation écologique + individuelles INTERVENTIONNELLE individuelles + individuelles Evaluation des performances d’une méthode T de classement de M Pas d’exposition E (Test ≠ E) (1) ou (2) individuelles Analyse série chronologique Enquête transversale + + Enquête de cohorte groupées Diagnostique + + recrutement transversal Enquête cas‐témoins répétée avant/après E + recrutement transversal ou E+/E‐ + recrutement E+/E‐ + +/- si besoin d’un suivi longitudinal pour classer a posteriori M + Rarement même si essai en grappe Essai randomisé + (randomisation individuelle ou en grappe) Estimation de paramètres selon les différentes enquêtes observationnelles « Fréquence » de M Mesures d’association entre E et M Prévalence Taux Risque * OR d’incidence Enquête de Non cohorte Enquête Non cas-témoins Enquête Oui transversale RR HR * Oui Oui Oui Oui Oui Non Non Oui Non Non Non Non Oui Oui Non * Risque et Hazard Ratio ne sont pas au programme de cette UE 12 Prévalence = Proportion de malades dans une population donnée, à un instant donné P Taux d’incidence = vitesse moyenne d’apparition de nouveaux cas TI M M M P p 1 , 96 Var( p ) m PT IC95% : TI o 1,96 Var (TI ) Var ( p ) Var (TI ) m 2 p (1 p ) PT n 1 – Calcul PT dans cohorte n PT t i i1 2 – Calcul PT dans population ouverte PT N t (PDV M) N0 N1 PT N0 t 2 t 2 Prévalence Estimation à partir d’une enquête transversale = Proportion de malades dans une population donnée, à un instant donné P Population cible M+ Population source M M M M N pourcentage pas d’unité C’est une photographie Tirage au sort ou sélection exhaustive M+ Recueil de données à l’inclusion M+ échantillon P p 1 , 96 M + p Var ( p ) Cond : npi 5 m n Var( p ) p (1 p ) n nps 5 nqi 5 nqs 5 13 Estimation exacte ou approchée de taux d’incidence (ou de mortalité) à partir de données d’une enquête de cohorte Date de point Sujet 10 X Sujet 7 X PDV M Sujet 2 PDV M PDV Sujet 1 1993 1995 1997 1999 :Temps de participation. : Suivi après la maladie (pdv :perdu de vue ou non-malade avant la date de point) X : censure Nombre d’événement=M TI nbre de cas pendant t PT m t ou approché i n Estimation exacte possible si on dispose pas de la base de données individuelle m ( PDV M ) N 0 t 2 Somme des temps de participation individuels ti « durée d’exposition au risque » Taux d’incidence = vitesse moyenne d’apparition de nouveaux cas (1) Estimation à partir d’une enquête de cohorte Population cible M+ Population source N PT M+ DCD PDV Tirage au sort ou sélection exhaustive ∆𝑡 Exclusion des sujets déjà M+ on connaît exactement le temps d’exposition individuel Sujets inclus =M‐ temps Recueil de données Suivi longitudinal Recueil de M À l’inclusion ? ? Fin du suivi prévu par l’étude Ou date de point intermédiaire Échantillon final 14 Taux d’incidence (ou de mortalité) = vitesse moyenne d’apparition de nouveaux cas Recensement effectif population N0 (2) Estimation à partir de données de surveillance Recensement effectif population N1 Population cible ouverte : en constant renouvellement naissances, décès, immigrations, émigrations M+ M+ M+ M+ M+ M+ M+ M+ M+ M+ REGISTRE OU SYSTÈME DE RECUEIL EXHAUSTIF DE NOUVEAUX CAS temps Registre tous les nouveaux cas de maladie M sont enregistrés pendant Δt Registre TI nbre de cas pendant t m m ou PT N t N0 N1 t 2 on ne connait pas le temps d’exposition individuel Recensement t : période d’enregistrement PT = 98 personnes-années =1 sujet suivi pendant 98 années = 98 sujets suivis pendant 1 année = 98 sujets suivis pendant 12 mois = 1176 sujets suivis pendant 1 mois = 1176 personnes-mois = 0,98 sujets suivis pendant 1 siècle = 0,98 personnes-siecle m 2 0,0204 cas/PA 20,4 cas pour 1000PA PA 98 2 m TI 0,0017 cas/PM 1,7 cas pour 1000 PM PM 1176 TI 15 M+ E+ a c Em1 Hypothèses testées : • H0 : RR=1 ou OR=1 ou RAR(=Δ)=0 pas d’association entre E et M (en vrai) • H1 : RR1 ou OR 1 ou RAR 0 association entre E et M (en vrai) Seuil de rejet de H0 au risque α : défini a priori (=risque consenti de conclure à tort à l’association à partir de l’échantillon, souvent =5%) Réduction relative du risque Δ= RRR=1-RR Odds ratio = rapport du risque de M+ chez exposés E+ versus non exposés E- 𝑅𝑅 = Test statistique : Chi2 à 1 ddl • Réduction absolue du risque Δ= RAR=RE+-RE- Risque relatif Echantillon : différence observée • Mb n 1 d n0 m0 Degré de signification p = probabilité d’observer cette différence sous H0 (=risque de conclure par erreur à l’association) ⁄ 𝑂𝑅 = ⁄ IC 95% : Ln ( Rˆ R )1 , 96 var Ln ( Rˆ R ) Défaut de puissance β = probabilité d’observer sous H0 vraie une différence correspondant au seuil de rejet α (= risque de ne pas voir par erreur l’association) V ar ( LnRˆ R ) b d a (a b) c(c d ) • (rétrospective ou prospective) • Recueil de l’exposition E antérieure à la survenue de M+ (éventuellement reconstitution rétrospective de la cohorte) • Suivi longitudinal +++ Date de survenue de la maladie • Recueil des expositions E : antérieures à l’inclusion dans l’étude (rétrospectifs) • Estimations: • Prévalence de(s) exposition(s) si enquête transversale initiale • Risque et taux d’incidence • RR, OR, HR Modèles de survie (données censurées) +++ Cas-témoin Inclusion : M+ et M(n2=n1 ou n2=2n1 ou n2=3n1 …) Pas de suivi longitudinal Estimations: • prévalence des expositions chez témoins (+/- représentatif de la population source?) • OR mais pas RR, ni risque ni incidence Régression logistique IC 95% : Ln ( Oˆ R ) 1 , 96 var Ln ( Oˆ R ) Var ( Ln Oˆ R ) 1 1 1 1 a b c d Non estimable dans une enquête cas-témoins Cohorte • Inclusion : M- = rapport du ratio M+/M- chez exposés E+ versus non exposés E- Estimable dans toutes les enquêtes interprétation moins concrète Transersale • Inclusion : tirage au sort de préférence • Recueil de M +/- E présentes à l’inclusion (avec l’historique passé éventuel) • Pas de suivi longitudinal Estimations: • PEVALENCES de M et/ou E • RR, OR • ni risque ni incidence Régression logistique 16 STANDARDISATION But : comparer des taux d’incidence observés dans des régions, des époques ou des groupes différents, en prenant en compte des facteurs dont on sait déjà qu’ils expliquent en partie des différences observées : âge, sexe, CSP… Standardisation directe Standardisation indirecte (pas au programme de cette UE) 12ddl ( O AA 0,5) 2 SMR (ou SIR) Taux standardisés tS p xRef t x SMR SIR O A O cas observés= maladie ou décès (PT x A cas attendus Cohorte observée tx =TI spécifiques (par âge) Population de référence pxref =répartition des classes x tx ) (PT x t x Re f ) Cohorte observée PTx = PT par classes x (d’âge) O = nbre total de cas observés Population de référence txref =TI spécifiques (par âge) Etude de la relation entre E et M Exposition =E ? E est‐elle SIGNIFICATIVEMENT associée à M ? E est‐elle FORTEMENT associée à M ? E est‐elle une CAUSE de M ? Maladie =M test statistique p‐value Ou IC95% des mesures d’association (pour les expositions à 2 catégories) Mesures d’association Odds ratio, Risque relatif… Différence absolue Pas de preuve scientifique possible Sauf si essai randomisé Ensemble de critères / philosophie… Quelle serait la CONTRIBUTION de E au taux d’incidence totale de M? Fractions de risque attribuables 17 Interprétation des résultats pour la relation entre E et M Jugement de signification Test statistique ou IC des mesures d’association M et E sont significativement associés au seuil 5% si : - Test statistique p<0.05 - ou 1 IC 95% de l’OR ou du RR ou 0 IC 95% du Test statistique Degré de signification (p) Le risque de se tromper en concluant qu’il existe une association entre E et M est d’autant plus faible que la valeur de p est petite Mesures d’association : , OR, RR Force de l’association Le lien entre E et M est d’autant plus fort que la valeur du , de l’OR ou du RR est élevée Proportion de cas attribuable à E Mesures d’impact : Risque attribuable N’a de sens que si la relation entre E et M est supposée causale (hypothèse non Pe( RR 1) PCA démontrable à partir d’une enquête observationnelle unique) 1 Pe( RR 1) Sources d’erreur dans une enquête épidémiologique OR RR HR Différences Prévalence Taux d’incidence Moyennes Médianes Mesures de fréquence Mesures d’association - Erreurs aléatoires - Erreurs systématiques 18 3 types de biais BIAIS DE SELECTION : La population source ne correspond pas à la population cible - Liés aux modes d’inclusion et de suivi des sujets Différentiel BIAIS DE CLASSEMENT Non différentiel (ou d’information) Recomposition des catégories d’exposition et/ou de maladie BIAIS DE CONFUSION Reflète la « nature » des liens existants entre différents facteurs dans la population cible - Liés aux erreurs ou imprécisions de mesure - Liés à un tiers facteur associé à la maladie et à l’exposition DIAGRAMME DE FLUX BIAIS Qui, où, quand dans l’idéal? Population cible Qui, où, quand en pratique ? Population source permettant identifier et sélectionner les sujets éligibles : Population cible E+ Objectifs M+ Biais de sélection Recrutement Modalités pratiques Refus de participation Contacts non réalisés Dossiers non retrouvés Biais de sélection Inclus = participants Non réponse partielle Sujets inclus dans les analyses (avec ou sans erreurs de classement) Modalités de recueil avec ou sans suivi longitudinal Échantillon initial Biais de sélection Recueil de données Biais de sélection Traitement des données manquantes Population source Données manquantes pour E +/‐ M Biais de classement Non imputées (exclus) Imputées (inclus) Biais de classement Échantillon final 19 Principales situations susceptibles de générer des biais de sélection 1 – Dans une enquête cas‐témoins : ‐ Constitution du groupe « témoin », qui devrait être issue de la même population que les cas ‐ Biais de survie sélective : si recrutement de cas à distance du diagnostic (interrogeables seulement si toujours vivants) = recrutement « prévalent » 2 – Dans une enquête de cohorte ‐ Perdus de vue liés au phénomène étudié (ex plu fréquent chez moins concernés et moins malades E‐M‐) ‐ Constitution du groupe « non exposé » dans une cohorte de type E+/E‐ 3 – « Healthy worker effect » dans les enquêtes transversales et de cohorte : = problème lié à la sélection du groupe « exposé » : meilleur état de santé des sujets maintenus dans les postes professionnels les plus à risque (association paradoxale) 4 – Non réponses et refus de participation dans toutes les enquêtes en relation avec le phénomène étudié Comment limiter les biais de sélection? Au moment de la planification de l’enquête - éviter le plus possible la non participation des sujets éligibles - s’assurer du bon suivi des sujets inclus dans une cohorte - rechercher des populations sources comportant des phénomènes de sélection comparables pour l’inclusion des témoins et des cas dans une enquête castémoins (choisir éventuellement plusieurs groupes témoins) Au moment de l’analyse - chercher à déterminer la direction du biais (qualitatif) - importance de la reproduction des conclusions lors d’enquêtes indépendantes 20 Principales situations susceptibles de générer des biais de classement 1 – Erreurs de mesure Biais de classement NON DIFFERENTIEL 2 – Imprécision de mesure inhérentes à la qualité imparfaite des méthodes de recueil, de mesure et de classement et conduisent à sous-estimer les associations 3 – Erreurs de diagnostic Perte de puissance Biais de classement DIFFERENTIEL quand les mécanismes d’erreurs ne sont pas les mêmes dans les groupes comparés elles doivent être anticipées car le sens de l’erreur (sur ou sous-estimation) est variable peut surestimer ou sous-estimer une association Comment limiter les biais de classement Au moment de la planification de l’enquête 1°) Eviter que les erreurs soient différentielles ‐ choisir groupes de cas et témoins (ou d’exposés et non exposés) dont la coopérativité, les capacités de mémorisation ou la surveillance médicale soient a priori comparables ‐ évaluer l ’exposition à l ’aveugle du statut M+ /M‐ (ou le diagnostic de M à l ’aveugle du statut E+ ou E‐), à chacune des étapes ‐ standardiser les conditions de recueil de l’information 2°) Limiter les erreurs elles‐mêmes ‐ méthodes de diagnostic et de classement des expositions les plus sensibles et spécifiques possibles ‐ questionnaires validés et testés, ‐ examens possédant une moindre subjectivité Au moment de l’analyse ‐ discuter les biais de classement éventuels et leur impact possible sur les estimations 21 Indices informationnels diagnostiques Méthode de ref Valeurs intrinsèques (sensibilité et spécificité) Se VP VP FN M Sp VN FP VN M Valeurs prédictives positives et négatives VPP VP VP FP T VPN VN FN VN T RVP Probabilités Pré-test (a priori) =prévalence =P(M) Post-test=VPP=P(M si T+) Rapports de vraisemblance (de 0 à l’infini) RV+ VPP = VP / M Se P(T / M ) FP / M 1 Sp P(T / M ) VPN= RV- FN / M 1 Se P (T / M ) VN / M Sp P(T / M ) 3 – (Biais) de CONFUSION et INTERACTION Les facteurs E et M sont en partie mélangés avec d’autres facteurs F qui peuvent « brouiller » la relation entre E et M E ? M F 22 Comment prendre en compte les facteurs de confusion pour l’étude de la relation entre E et M ? 1 – Lors de la conception de l’enquête A – Recueil des informations : Identifier à partir des connaissances, littérature, plausibilité, « intuitions » - les facteurs de risque connu du phénomène M étudié - des facteurs de risque possible - les facteurs d’interaction potentiels Collecter ces variables pour chaque sujet inclus B - Modalités d’échantillonnage Supprimer « artificiellement » dans l’échantillon la relation E-F ou M-F - randomiser l’exposition (essai randomisé) - restreindre la population d’étude à une catégorie du facteur de confusion - stratifier ou apparier sur un ou plusieurs facteurs de confusion 2 – Lors de l’analyse statistique - analyses univariées : identifier les facteurs associés à M - analyses stratifiées : rechercher des interactions entre facteurs vis-à-vis de M - analyses multivariées : prendre en compte plusieurs facteurs de confusion simultanément avec des variables catégorielles et/ou continues Essai contrôlé randomisé permet de minimiser les biais BIAIS DE SELECTION Comparabilité initiale assurée par la randomisation de l’intervention pour l’attribution aux sujets : Importance de la clause d’ambivalence (les sujets doivent pouvoir recevoir les deux bras de l’intervention sans CI), de la clause d’ignorance (ne pas savoir avant la rando quel traitement le patient recevra) avec assignation secrète si pas d’aveugle possible, du délai court entre randomisation et attribution des traitements pour éviter les PDV précoce avant le mise sous TT Maintien de la comparabilité au cours du suivi par l’administration en double aveugle de l’intervention (quand c’est possible) : Mais perdus de vue peuvent être plus fréquents si effets secondaires plus fréquents liés aux TT Validité externe : repose sur les critères d’éligibilité pour définir à qui s’appliqueront les résultats (généralisibilité) BIAIS DE CLASSEMENT Non différentiels : limités par la standardisation de toutes les procédures de recueil de données et de définition des critères (essai contrôlé) Différentiels : supprimé par l’évaluation du critère de jugement à l’aveugle BIAIS DE CONFUSION Limités par la randomisation de l’intervention pour l’attribution aux sujets Limités par la stratification sur certains critères pronostique (éviter une répartition inégale due au hasard malgré la randomisation– fluctuation d’échantillonnage) 23 PUISSANCE 1‐ beta La puissance d’une étude pour mettre en évidence une association est d’autant plus grande que: - Le risque alpha est grand (mais il est généralement fixé à 5%, sans avoir à définir la différence attendue pour l’hypothèse alternative) - La formulation du test est unilatérale (mais elle doit être généralement de formulation bilatérale sauf situation particulière exceptionnelle dans les essais randomisés et jamais en épidémiologie observationnelle) - Le nombre de sujet est grand (la situation optimale étant d’équilibrer les deux groupes à comparer ; pas toujours possible ou souhaitable s’il existe une nombre limité de cas M+ dans une enquête castémoins, ou d’exposé E+ dans une enquête de cohorte E+/E-, ou si l’on souhaite attribuer à plus de sujets l’intervention E+, etc…) - La variance du caractère étudié est petite (indépendante de la moyenne pour un caractère quantitatif, dépendant du pourcentage pour un caractère binaire,c’est-à-dire d’autant plus petite que le pourcentage attendu dans le groupe de référence est éloigné de 50%) - L’écart à mettre en évidence est la plus grande (ce qui impose de définir l’hypothèse alternative pour calculer beta) Conclusion 1 – Utilisation de données groupées (épidémiologie descriptive) Comparaisons des évolutions géographiques et temporelles Etude de corrélation écologique Aucune conclusion causale; niveau de preuve très faible Permet d’émettre des hypothèses pour mener des enquêtes individuelles 2 ‐ Utilisation d’enquêtes observationnelles (épidémiologie analytique) Définition : un facteur de risque E est un facteur associé statistiquement au risque de M, quel que soit le sens (augmentation ou diminution du risque), et sans préjuger de la nature causale de la relation Comparaison de groupes au sein de l’échantillon Estimation de mesures d’association Pas de conclusion causale, qu’il y ait ou non une association significative entre une exposition et un phénomène étudié M nécessité d’un faisceau d’arguments 3 ‐ Etudes expérimentales (épidémiologie évaluative) Essai randomisé Permet d’affirmer une relation de cause à effet en cas d’association significative Etude avant/après une intervention niveau de preuve plus faible, car pas de groupe controle 24 Critères de causalité de Bradford-Hill pour la relation entre E et M Internes à l’étude • 1 – Association statistique • 2 – Forte intensité de la relation (OR ou RR) • 3 – Relation type dose-effet • 4 – spécificité de la relation maladie-exposition • 5 – Pas d’ambigüité temporelle Externes à l’étude • 6 – Concordance avec autres études de méthodologie différente • 7 – Plausibilité biologique • 8 – Concordance avec expérimentations animales • 9 – Gradients géographiques parallèles de l’exposition et de la maladie • 10 – Diminution de la maladie lorsque l’exposition est supprimée 25