Telechargé par manilou92

C Synthese2018-19

publicité
B. Falissard
Introduction à la recherche clinique et épidémiologique
J. Warszawski, Faculté de médecine Paris-Sud
Synthese
Illustration vidéo sur les types d’enquêtes en épidémiologie (5 mn)

https://youtu.be/PxEevvWLlRw
POUR VOUS ENTRAINER : Quizz en ligne






Les 6 quizz ci-dessous portent sur les différents types d'études.
Ils ont été commentés en cours 5 et 6.
Vous pouvez faire et refaire ces quizz à volonté.
Vous recevrez par mail une note avec les réponses commentées.
Le but est de vous auto-évaluer.
Les notes ne seront pas prises en compte pour l'examen.
Quizz 1a Quizz 1b Quizz 1c
Quizz 1d Quizz 1e Quizz 1f
1
1
Types d’objectifs en épidémiologie
• Mesurer l’ampleur, l’évolution au cours du temps et la distribution
géographique de phénomènes liés à la santé au sein des populations humaines
• Décrire l’histoire naturelle d’une maladie et son pronostic
 Epidémiologie descriptive
La terminologie n’est pas
toujours consensuelle
(mais les approches
méthodologiques sont
communes) :
•
on parle quelquefois
d’épidémiologie
clinique ou de
recherche clinique
pour les études
portant sur des
sujets malades
•
Les essais
thérapeutiques et
les études
diagnostiques sont
plutôt considérées
comme de la
recherche clinique
• Identifier les déterminants des maladies (étiologie, facteurs de risque) et des
comportements de santé
• Identifier les facteurs pronostiques d’une maladie (dont les traitements reçus
dans le cadre du soins)
 Epidémiologie analytique
• Evaluer l’efficacité et/ou la sécurité d’interventions en situation expérimentale
– En population (programmes de prévention…)
– Auprès de personnes malades (diagnostic, pronostic, thérapeutique, prévention des
complications…)
 Epidémiologie évaluative
Objectifs  sources de données
Objectifs descriptifs
- Fréquence, distribution d’un indicateur M
- Répartition de l’indicateur dans l’espace
- Evolution de l’indicateur dans le temps
- Corrélation écologique entre plusieurs indicateurs
- Pronostic M (= survie par ex) d’une pathologie
Objectifs analytiques : recherche d’associations à visée
explicatives entre M et E
- Etiologie (causes) et facteurs de risque de maladie
- Facteurs pronostiques
- Déterminants de comportements
Objectifs évaluatifs (1) : évaluer l’efficacité M / la
sécurité M d’une intervention E :
- Traitement
- Stratégie médicale
- Programme de prévention
- Stratégie diagnostique / dépistage
Objectifs évaluatifs (2) : performances d’une méthode
de classement
- Méthode diagnostique, questionnaire …
Sur données groupées / surveillance épidémiologiques
 Taux d’incidence brut et standardisé
 Étude de corrélation écologique
Sur données individuelles / enquête observationnelle
• Enquête de cohorte  taux d’incidence
• Enquête transversale  prévalence
Enquêtes observationnelles sur échantillon
d’individus
• Enquête de cohorte  RR, HR, OR
dont étude exposés/non exposés
• Enquête cas-témoins  OR
• Enquête transversale : moins optimale  OR,RR
Etudes expérimentales
• Essai contrôlé randomisé (OR, RR, HR, RRR)
Etudes quasi-expérimentales
• Etude avant/après (transversale répétée ou cohorte
interventionnelle)
• Etude ici/ailleurs
 Hypothèses éventuelles pour
mener des études observationnelles
à visée explicative
 La causalité des associations
entre E et M mises en évidence ne
peut être affirmée par l’étude
 Apporte la preuve de la nature
causale d’une association
significative entre E et le critère de
jugement principal M
 Niveau de preuve plus faible
Causalité non démontrée
Etudes diagnostiques interventionnelles (si la méthode à évaluer ou la
méthode de référence est administrée pour l’étude) ou observationnelles
• Etude transversale avec étalon-or
2
UNITES D’ANALYSE
3
Unité de recueil = groupe d’individu (PAYS par ex)  Données collectives
Recueil de paramètres caractérisant des groupes d’individus (ex : pays, régions, …)
‐ Taux de mortalité cardio‐vasculaire de chaque pays
‐ Taux d’incidence de cancer du sein de chaque pays
‐ Consommation moyenne de cigarettes par habitants de chaque pays
‐ Prévalence de malformation congénitale de chaque pays
Unité de recueil = individu (personnes par ex)  Données individuelles
Recueil de donnée recueillies au niveau de chaque individu d’un échantillon
‐ Statut vital individuel
‐ Survenue ou non de la maladie (éventuellement date de survenue, etc…)
‐ Consommation de cigarettes (nombre par jour, durée, âge au début, etc…)
‐ Existence ou non d’une malformation congénitale
3
Utilisation de données groupées issus des systèmes d’enregistrement continue
Sources de données de santé : données d’enregistrement continue
• SURVEILLANCE EPIDEMIOLOGIQUE et STATISTIQUES VITALES
Utilisation des données groupées
•
•
•
Unité de recueil de M et
d’autres indicateurs =
groupe d’individu (PAYS par
ex)  Données collectives
Estimation de taux d’incidence (approximation)
Etude des variations géographique ou temporelles
Etude de corrélation écologique  pas de conclusion causale
Evolution des systèmes de surveillance de la grippe dans le monde
The number of viruses from which sequence data have been
uploaded to the GISAID platform between 1967 and 2016
https://www.who.int/
3
Utilisation de données individuelles issues d’enquêtes observationnelles sur échantillon
3
Sources de données individuelles : enquêtes observationnelles
‐ ENQUETE DE COHORTES
‐ ENQUETES CAS‐TEMOINS
‐ ENQUETES TRANSVERSALES
Les enquêtes sur échantillon d’individus permettent :
 de recueillir des informations individuelles sur la maladie et les expositions :
 de sélectionner une population cible et des indicateurs adaptés aux objectifs
 d’intégrer la dimension chronologique des événements
 d’étudier des associations au niveau individuel
 de prendre en compte des facteurs de confusion
Utilisation des données individuelles
Unité de recueil de M +/- E = individu
• Estimation de mesures de fréquence de M caractérisant la population dont est issu l’échantillon
• Comparaison des mesures de fréquence de M entre plusieurs groupes de l’échantillon pour
identifier des facteurs associés au risque de survenue de M
E = Facteur (exposition) susceptible
d’influencer le risque de survenue ou de
modification de M
•
•
•
•
•
Facteurs étiologiques, causes de maladie
Facteurs pronostiques
Facteurs socio‐démographique
Déterminants de comportements
stratégie thérapeutique, stratégie de prise en charge
‐
‐
Etat de santé :
‐
Maladies
‐
Signes /anomalie clinique ou biologique
Paramètres biologiques ou génétique
‐ Comportements en relation avec la santé ou
l’accès aux soins
‐
Stratégie médicale
‐
Stratégie de prévention
M = phénomène étudié
• Critère de jugement / Outcome (en anglais)
• Notation : M (= maladie) / D (= disease)
‐
Décès
‐
Décès pour une cause spécifique
‐
Etat de santé :
‐
‐
Maladies
‐
Signes /anomalie clinique ou biologique
Paramètres biologiques ou génétique
‐ Comportements en relation avec la santé ou
l’accès aux soins
‐
Stratégie médicale
‐
Stratégie de prévention
4
Définition opérationnelle des objectifs
Objectifs à visée
• Descriptive
• Explicative en approche observationnelle
• Evaluative de l’effet d’une intervention expérimentale
• Evaluative des performances d’une méthode de classement
Approche : Observationnelle ou expérimentale /interventionnelle
Unité d’analyse : Individu ou groupe (données agrégées)
Définition des variables d’intérêt
• Critère(s) de jugement M : principal/secondaires
• Expositions ou intervention (E)
• Méthode(s) diagnostique(s) T à évaluer
Définition de la population cible (critères d’éligibilités X)
= population à laquelle on souhaite appliquer les résultats
Objectifs
« Fréquence » ou « niveau »
d’indicateurs M en lien avec la santé
Etudes descriptives
= observationnelle
Recherche d’associations au niveau d’individus
(comparaison)
Etudes analytiques à visée explicative
= observationnelle sur données individuelles
‐ Estimation pour une population cible
‐ Description des évolutions dans le temps et
comparaison entre plusieurs zones géographiques
‐ Rechercher un (des) FACTEUR(s) de RISQUE de M
= expositions E (non attribuées pour l’étude) associées
statistiquement au risque de M, recueillis pour chaque individu
‐ Corrélations écologiques entre plusieurs
indicateurs collectés au niveau des mêmes unités
groupées
 générer des hypothèses
L’étude est dite « descriptive » même si on
effectue des comparaisons ou recherche des
corrélations entre indicateurs qui
caractérisent des groupes de sujets
Études expérimentales
‐ Evaluer l’effet (positif ou négatif) sur un paramètre M d’une intervention E
réalisée pour l’étude (=situation expérimentale)
5
SOURCES DE DONNEES
Processus continu et systématique de
recueil, analyse, interprétation et
diffusion de données descriptives pour
surveiller des problèmes de santé.
1°) Systèmes de surveillance épidémiologique
2°) Enquêtes observationnelles à partir d’échantillon d’individus
Le niveau des paramètres étudiés est
recueilli pour chaque sujet de
l’échantillon
3°) Etudes expérimentales
Les différents « bras » de l’intervention
à évaluer sont attribués par tirage au
sort aux sujets inclus
Données de surveillance épidémiologique
Population ouverte résidant dans une zone géographique déterminée: en constant renouvellement
naissances, décès, immigrations, émigrations
M+ M+
M+ M+
M+
M+
M+
M+
M+ M+ M+
M+
temps
M+
REGISTRE OU SYSTÈME DE RECUEIL EXHAUSTIF DE NOUVEAUX CAS
Recensement
Recensement
N
N
 On ne recueille pas de données sur les sujets ne développant à M
Couverture
nationale
Recueil M
exhaustif +
Recueil
prospectif
Cas incidents Recueil
uniquement
 vrai
 vrai
 actif
Réseaux sentinelles de labo ou de cliniciens
 souvent
Déclaration obligatoire
 vrai
 vrai
 vrai
 vrai
 passif
Registres de pathologies
 rarement
 vrai
 vrai
 vrai
 actif
Statistiques vitales et causes de décès
 vrai
 vrai
 vrai
 vrai
 passif
6

Enquêtes OBSERVATIONNELLES
‐ ENQUETES DE COHORTE
‐ ENQUETES CAS‐TEMOINS
‐ ENQUETES TRANSVERSALES
https://youtu.be/PxEevvWLlRw
Définies par les modalités de
sélection (échantillonnage) et
de recueil de données
Population cible
Qui, où, quand dans l’idéal?
 Population cible
Qui, où, quand en pratique ?
Population source
 Objectifs
M+
 Modalités pratiques
Population source
Recrutement
 permettant identifier et sélectionner les sujets éligibles :
Échantillon initial
Inclus = participants
 Modalités de recueil
avec ou sans suivi longitudinal
Recueil de données
VIDEO
7
Enquête transversale
Population cible
E+
Population source
M+
Tirage au sort ou sélection exhaustive
E+
M+
Sujets inclus
temps
Recueil de données à l’inclusion
M+/M‐ À
E+/E‐ l’inclusion
Recueil simultané de E et M
M
+
E+
M+
Sujets analysés
M+
M-
E+
a
c
Eb
d
Enquête cas ‐ témoins
Population cible
Population source
M+
Recrutement séparé des M+ et M‐
M+
M‐
Sujets inclus
temps
Recueil de données à l’inclusion
Expositions passées :
E+/E‐
M+
M‐
M+
Interrogatoire RETROSPECTIF sur
leur exposition passée E+ ou E-
À
l’inclusion
E+
Sujets analysés
E+
E-
M+
a
b
M-
c
d
8
Enquête de cohorte à recrutement transversal
Population cible
E+
Population source
M+
Tirage au sort ou sélection exhaustive
N
E+
M+
Exclusion des sujets déjà M+
E+
Sujets inclus
PT
E+
∆𝑡
E‐
∆𝑡
M+
DCD PDV
temps
Recueil de données
ATCD avant l’inclusion (facultatif)
À l’inclusion E+/E‐
Recueil de M
E+
E‐
Suivi longitudinal
+/‐ évolutions de E
Fin du suivi prévu par l’étude
Ou date de point intermédiaire
Échantillon
final
?
?
Enquête de cohorte de type exposé/non exposé
Population cible
E+
Population source
M+
Recrutement séparé des E+ et E‐
Tous M‐
E+
Sujets inclus
E‐
N
PT
E+
∆𝑡
E‐
∆𝑡
M+
DCD PDV
temps
Recueil de données
ATCD avant l’inclusion (facultatif)
À
l’inclusion
E+
E‐
E+
E‐
Recueil de M
Suivi longitudinal
+/‐ évolutions de E
?
?
Fin du suivi prévu par l’étude
Ou date de point intermédiaire
Échantillon
final
9
Enquête de cohorte PROSPECTIVE
Population cible
E+
Population source
M+
Période d’inclusions ciblée :
contemporaine de la conception
de l’étude
Conception de
l’étude
E+
Sujets inclus (M‐)
temps
Recueil de données
? PDV
ATCD avant l’inclusion
(facultatif)
Décès (si ≠ M+)
M+
Recueil de la survenue de M+
Suivi longitudinal
À l’inclusion E+/E‐
Fin du suivi de l’étude
Ou date de point
Échantillon
final
 inclusions PROSPECTIVES
 Recueil des données au cours du suivi longitudinal PROSPECTIF
Enquête de cohorte RETROSPECTIVE OU
HISTORIQUE
Population cible
E+
Population source
M+
Période d’inclusions ciblée :
antérieure à la conception de l’étude
E+
Conception de
l’étude
Sujets inclus (M‐)
temps
? PDV
ATCD avant l’inclusion
(facultatif)
À l’inclusion E+/E‐
Décès (si ≠ M+)
M+
Recueil de la survenue de M+
Suivi longitudinal
Fin du suivi de l’étude
Ou date de point
Échantillon
final
 inclusions RETROSPECTIVES
 Reconstitution rétrospective du suivi longitudinal non planifié initialement
10
ESSAI RANDOMISE
ETUDE EXPERIMENTALE
= schéma de la cohorte exposé/non exposé prospective
M‐ et E‐
Conception de l’étude
Attribution par tirage au
sort de E+ (intervention)
E+
Sujets inclus
E‐
temps
Recueil de données
À
l’inclusion
E+
Suivi longitudinal
Recueil du critère de jugement M
E‐
Fin du suivi prévu par l’étude
Ou date de point intermédiaire
Échantillon
final
?
?
Attention aux usages du « tirage au sort »
ENQUETE TRANSVERSALE
(étude observationnelle)
ESSAI RANDOMISE
(étude expérimentale)
Population
E-
E-
M+
M-
E-
E-
Échantillon
E+
M+
Tirage au sort des sujets
inclus dans l’étude
Tirage au sort de
l’exposition
(randomisation)
E+
population
M+ E+
Échantillon
M+
M-
Exemple : efficacité de la progestérone
pour diminuer le risque de prématurité
Exemple : relation entre progestérone et
accouchement prématuré
Population : femmes enceintes
E = progestérone pendant la grossesse
M = accouchement prématuré
Population : accouchements
E = progestérone reçue pendant grossesse
M = accouchement prématuré
11
Type d’étude
Descriptive
Estimation de fréquence de M dans
le temps et dans l’espace
Explicative
Expérimentale
= analytique
ou quasi‐expérimentale
Recherche de facteur E de
risque de M
Evaluation de l’effet d’une intervention E,
réalisée pour l’étude, sur le risque de M
Variations conjointes de plusieurs
indicateurs dans temps ou espace
Pas d’exposition E
ou indicateurs groupés
(corrélation écologique)
Approche
(«quasi » si E non randomisée, avec ou sans
groupe contrôle)
TOUJOURS au moins un CRITERE DE JUGEMENT M
E= FACTEUR DE
E= INTERVENTION
(sur individus ou sur populations)
RISQUE
OBSERVATIONNELLE
groupées
Recueil et analyse sur données
Surveillance épidémiologique à
partir d’enregistrement de cas M
active ou passive
Etude de corrélation écologique
+
individuelles
INTERVENTIONNELLE
individuelles
+
individuelles
Evaluation des
performances d’une
méthode T de
classement de M
Pas d’exposition E
(Test ≠ E)
(1) ou (2)
individuelles
Analyse série
chronologique
Enquête transversale
+
+
Enquête de cohorte
groupées
Diagnostique
+
+
recrutement
transversal
Enquête cas‐témoins
répétée avant/après E
+ recrutement
transversal ou E+/E‐
+
recrutement
E+/E‐
+
+/- si besoin d’un suivi
longitudinal pour
classer a posteriori M
+
Rarement même si
essai en grappe
Essai randomisé
+ (randomisation
individuelle ou en
grappe)
Estimation de paramètres
selon les différentes enquêtes observationnelles
« Fréquence » de M
Mesures d’association
entre E et M
Prévalence Taux
Risque * OR
d’incidence
Enquête de Non
cohorte
Enquête
Non
cas-témoins
Enquête
Oui
transversale
RR
HR *
Oui
Oui
Oui
Oui
Oui
Non
Non
Oui
Non
Non
Non
Non
Oui
Oui
Non
* Risque et Hazard Ratio ne sont pas au programme de cette UE
12
Prévalence
= Proportion de malades
dans une population
donnée, à un instant donné
P
Taux d’incidence
= vitesse moyenne
d’apparition de nouveaux cas
TI 
M
M M
P  p  1 , 96 
Var( p ) 
m
PT
IC95% : TI o  1,96  Var (TI )
Var ( p )
Var (TI )  m 2
p (1  p )
PT
n
1 – Calcul PT dans cohorte
n
PT    t i
i1
2 – Calcul PT dans population
ouverte
PT  N  t
(PDV M) 
 N0  N1 

PT  N0 
  t   2   t
2




Prévalence
Estimation à partir d’une
enquête transversale
= Proportion de malades dans une population donnée,
à un instant donné
P
Population cible
M+
Population source
M
M
M M N
pourcentage
pas d’unité
C’est une photographie
Tirage au sort ou sélection exhaustive
M+
Recueil de données à l’inclusion
M+
échantillon
P  p  1 , 96 
M
+
p
Var ( p )
Cond : npi  5
m
n
Var( p ) 
p (1  p )
n

nps  5

nqi  5
nqs  5

13
Estimation exacte ou approchée de taux d’incidence (ou de mortalité)
à partir de données d’une enquête de cohorte
Date de point
Sujet 10
X
Sujet 7
X
PDV
M
Sujet 2
PDV
M
PDV
Sujet 1
1993
1995
1997
1999
:Temps de participation.
: Suivi après la maladie
(pdv :perdu de vue ou non-malade avant la date de point)
X : censure
Nombre d’événement=M
TI 
nbre de cas pendant t

PT
m
 t
ou approché 
i
n
Estimation exacte possible si on
dispose pas de la base de données
individuelle
m
( PDV  M ) 

 N 0 
  t
2
Somme des temps de participation individuels ti
« durée d’exposition au risque »
Taux d’incidence
= vitesse moyenne d’apparition de nouveaux cas
(1) Estimation à partir
d’une enquête de cohorte
Population cible
M+
Population source
N
PT
M+ DCD PDV
Tirage au sort ou sélection exhaustive
∆𝑡
Exclusion des sujets déjà M+
 on connaît exactement le temps d’exposition individuel
Sujets inclus
=M‐
temps
Recueil de données
Suivi longitudinal
Recueil de M
À l’inclusion
?
?
Fin du suivi prévu par l’étude
Ou date de point intermédiaire
Échantillon
final
14
Taux d’incidence (ou de mortalité)
= vitesse moyenne d’apparition de nouveaux cas
Recensement
 effectif population N0
(2) Estimation à partir de
données de surveillance
Recensement
 effectif population N1
Population cible ouverte : en constant renouvellement
naissances, décès, immigrations, émigrations
M+ M+
M+
M+
M+
M+
M+
M+
M+ M+
REGISTRE OU SYSTÈME DE RECUEIL EXHAUSTIF DE NOUVEAUX CAS
temps
Registre  tous les nouveaux cas de
maladie M sont enregistrés pendant Δt
Registre
TI 
nbre de cas pendant t
m
m

ou 
PT
N t
 N0  N1 

 t
 2 
 on ne connait pas le temps d’exposition individuel
Recensement
t : période
d’enregistrement
PT = 98 personnes-années
=1 sujet suivi pendant 98 années
= 98 sujets suivis pendant 1 année
= 98 sujets suivis pendant 12 mois
= 1176 sujets suivis pendant 1 mois = 1176 personnes-mois
= 0,98 sujets suivis pendant 1 siècle = 0,98 personnes-siecle
m
2

 0,0204 cas/PA  20,4 cas pour 1000PA
PA 98
2
m
TI 

 0,0017 cas/PM  1,7 cas pour 1000 PM
PM 1176
TI 
15
M+
E+ a
c
Em1
Hypothèses testées :
• H0 : RR=1 ou OR=1 ou RAR(=Δ)=0
pas d’association entre E et M (en vrai)
• H1 : RR1 ou OR 1 ou RAR  0
association entre E et M (en vrai)
Seuil de rejet de H0 au risque α : défini a
priori (=risque consenti de conclure à tort à
l’association à partir de l’échantillon, souvent
=5%)
Réduction relative du risque
Δ= RRR=1-RR
Odds ratio
= rapport du risque de M+ chez
exposés E+ versus non exposés E-
𝑅𝑅 =
Test statistique : Chi2 à 1 ddl
•
Réduction absolue du risque
Δ= RAR=RE+-RE-
Risque relatif
 Echantillon : différence observée
•
Mb n
1
d
n0
m0
Degré de signification p = probabilité
d’observer cette différence sous H0
(=risque de conclure par erreur à
l’association)
⁄
𝑂𝑅 =
⁄

IC 95% : Ln ( Rˆ R )1 , 96 var Ln ( Rˆ R )
Défaut de puissance β = probabilité
d’observer sous H0 vraie une différence
correspondant au seuil de rejet α (= risque
de ne pas voir par erreur l’association)
V ar ( LnRˆ R ) 
b
d

a (a  b) c(c  d )
•
(rétrospective ou prospective)
• Recueil de l’exposition E
antérieure à la survenue de M+
(éventuellement reconstitution rétrospective de la
cohorte)
• Suivi longitudinal +++
 Date de survenue de la maladie
• Recueil des expositions E :
antérieures à l’inclusion
dans l’étude (rétrospectifs)
•
Estimations:
• Prévalence de(s) exposition(s) si
enquête transversale initiale
• Risque et taux d’incidence
• RR, OR, HR
Modèles de survie (données censurées) +++
Cas-témoin
Inclusion : M+ et M(n2=n1 ou n2=2n1 ou n2=3n1
…)
Pas de suivi longitudinal
Estimations:
• prévalence des expositions
chez témoins (+/- représentatif de
la population source?)
• OR mais pas RR, ni risque ni
incidence
 Régression logistique


IC 95% : Ln ( Oˆ R ) 1 , 96 var Ln ( Oˆ R )

Var ( Ln Oˆ R )  1  1  1  1
a b c d
Non estimable
dans une enquête cas-témoins
Cohorte
• Inclusion : M-
= rapport du ratio M+/M- chez
exposés E+ versus non exposés E-
Estimable dans toutes les enquêtes
interprétation moins concrète
Transersale
• Inclusion : tirage au sort de préférence
• Recueil de M +/- E présentes à
l’inclusion (avec l’historique passé
éventuel)
• Pas de suivi longitudinal
Estimations:
• PEVALENCES de M et/ou E
• RR, OR
• ni risque ni incidence
 Régression logistique
16
STANDARDISATION
But : comparer des taux d’incidence observés dans des régions, des époques ou des
groupes différents, en prenant en compte des facteurs dont on sait déjà qu’ils
expliquent en partie des différences observées : âge, sexe, CSP…
Standardisation directe
Standardisation indirecte
(pas au programme de cette UE)
12ddl  ( O  AA 0,5)
2
SMR (ou SIR)
Taux standardisés
tS   p xRef t x
SMR  SIR 
O
A
O  cas observés=
maladie ou décès
 (PT
x
A  cas attendus 
Cohorte observée
 tx =TI spécifiques (par âge)
Population de référence
 pxref =répartition des classes x
 tx )
 (PT
x
 t x Re f )
Cohorte observée
 PTx = PT par classes x (d’âge)
 O = nbre total de cas observés
Population de référence
 txref =TI spécifiques (par âge)
Etude de la relation entre E et M
Exposition
=E
?
E est‐elle SIGNIFICATIVEMENT associée à M ?
E est‐elle FORTEMENT associée à M ?
E est‐elle une CAUSE de M ?
Maladie
=M
test statistique  p‐value
Ou IC95% des mesures d’association
(pour les expositions à 2 catégories)
Mesures d’association
Odds ratio, Risque relatif…
Différence absolue
Pas de preuve scientifique possible
Sauf si essai randomisé
Ensemble de critères / philosophie…
Quelle serait la CONTRIBUTION de E au taux d’incidence totale de M?
Fractions de risque attribuables
17
Interprétation des résultats pour la relation entre E et M
Jugement de signification 
Test statistique ou IC des mesures d’association
M et E sont significativement associés au seuil 5% si :
- Test statistique  p<0.05
- ou 1  IC 95% de l’OR ou du RR ou 0  IC 95% du 
Test statistique
Degré de signification (p) 
Le risque de se tromper en concluant qu’il existe une association entre E et M
est d’autant plus faible que la valeur de p est petite
Mesures d’association : , OR, RR
Force de l’association 
Le lien entre E et M est d’autant plus fort que la valeur du , de l’OR ou du RR
est élevée
Proportion de cas attribuable à E 
Mesures d’impact : Risque attribuable
N’a de sens que si la relation entre E et M est supposée causale (hypothèse non Pe( RR  1)
PCA 
démontrable à partir d’une enquête observationnelle unique)
1  Pe( RR  1)
Sources d’erreur dans une enquête épidémiologique
OR
RR
HR
Différences
Prévalence
Taux d’incidence
Moyennes
Médianes
Mesures de fréquence
Mesures d’association
- Erreurs aléatoires
- Erreurs systématiques
18
3 types de biais
BIAIS DE SELECTION :
La population source ne
correspond pas à la population
cible
- Liés aux modes d’inclusion et de suivi des sujets
Différentiel
BIAIS DE CLASSEMENT
Non différentiel
(ou d’information)
Recomposition des catégories d’exposition
et/ou de maladie
BIAIS DE CONFUSION
Reflète la « nature » des liens existants
entre différents facteurs dans la
population cible
- Liés aux erreurs ou imprécisions de mesure
- Liés à un tiers facteur associé à la maladie et
à l’exposition
DIAGRAMME DE FLUX
BIAIS
Qui, où, quand dans l’idéal?
 Population cible
Qui, où, quand en pratique ?
Population source
 permettant identifier et sélectionner les sujets éligibles :
Population cible
E+
 Objectifs
M+
Biais de
sélection
Recrutement
 Modalités pratiques
Refus de participation
Contacts non réalisés
Dossiers non retrouvés
Biais de
sélection
Inclus = participants
Non réponse partielle
Sujets inclus dans les analyses
(avec ou sans erreurs de classement)
 Modalités de recueil
avec ou sans suivi longitudinal
Échantillon initial
Biais de
sélection
Recueil de données
Biais de
sélection
 Traitement des données
manquantes
Population source
Données manquantes
pour E +/‐ M
Biais de
classement
Non imputées (exclus)
Imputées (inclus)
Biais de
classement
Échantillon final
19
Principales situations susceptibles de générer des
biais de sélection
1 – Dans une enquête cas‐témoins :
‐ Constitution du groupe « témoin », qui devrait être issue de la même population que les cas
‐ Biais de survie sélective : si recrutement de cas à distance du diagnostic (interrogeables seulement si
toujours vivants) = recrutement « prévalent »
2 – Dans une enquête de cohorte
‐ Perdus de vue liés au phénomène étudié (ex plu fréquent chez moins concernés et moins malades E‐M‐)
‐ Constitution du groupe « non exposé » dans une cohorte de type E+/E‐
3 – « Healthy worker effect » dans les enquêtes transversales et de cohorte : = problème lié à la sélection
du groupe « exposé » : meilleur état de santé des sujets maintenus dans les postes professionnels les
plus à risque (association paradoxale)
4 – Non réponses et refus de participation dans toutes les enquêtes
en relation avec le phénomène étudié
Comment limiter les biais de sélection?
Au moment de la planification de l’enquête
- éviter le plus possible la non participation des sujets éligibles
- s’assurer du bon suivi des sujets inclus dans une cohorte
- rechercher des populations sources comportant des phénomènes de sélection
comparables pour l’inclusion des témoins et des cas dans une enquête castémoins (choisir éventuellement plusieurs groupes témoins)
Au moment de l’analyse
- chercher à déterminer la direction du biais (qualitatif)
- importance de la reproduction des conclusions lors d’enquêtes indépendantes
20
Principales situations susceptibles de générer des
biais de classement
1 – Erreurs de mesure
Biais de classement NON DIFFERENTIEL
2 – Imprécision de mesure
inhérentes à la qualité imparfaite des
méthodes de recueil, de mesure et de
classement et conduisent à sous-estimer les
associations
3 – Erreurs de diagnostic
Perte de puissance
Biais de classement DIFFERENTIEL
quand les mécanismes d’erreurs ne sont pas les
mêmes dans les groupes comparés  elles
doivent être anticipées car le sens de l’erreur (sur
ou sous-estimation) est variable
peut surestimer ou sous-estimer une association
Comment limiter les biais de classement
Au moment de la planification de l’enquête
1°) Eviter que les erreurs soient différentielles
‐ choisir groupes de cas et témoins (ou d’exposés et non exposés) dont la coopérativité, les capacités de
mémorisation ou la surveillance médicale soient a priori comparables
‐ évaluer l ’exposition à l ’aveugle du statut M+ /M‐ (ou le diagnostic de M à l ’aveugle du statut E+ ou E‐), à
chacune des étapes
‐ standardiser les conditions de recueil de l’information
2°) Limiter les erreurs elles‐mêmes
‐ méthodes de diagnostic et de classement des expositions les plus sensibles et spécifiques possibles
‐ questionnaires validés et testés,
‐ examens possédant une moindre subjectivité
Au moment de l’analyse
‐ discuter les biais de classement éventuels et leur impact possible sur les estimations
21
Indices informationnels diagnostiques
Méthode de ref
Valeurs intrinsèques (sensibilité et spécificité)
Se 
VP
VP  FN  M 
Sp 
VN
FP  VN  M 
Valeurs prédictives positives et négatives
VPP 
VP
VP  FP  T 
VPN 
VN
FN  VN  T 
RVP
Probabilités
Pré-test (a priori) =prévalence =P(M)
Post-test=VPP=P(M si T+)
Rapports de vraisemblance (de 0 à l’infini)
RV+
VPP =
VP / M 
Se
P(T  / M  )


FP / M  1  Sp P(T  / M  )
VPN= 
RV-
FN / M  1  Se P (T  / M  )


VN / M 
Sp
P(T  / M  )
3 – (Biais) de CONFUSION et INTERACTION
Les facteurs E et M sont en partie mélangés avec d’autres
facteurs F qui peuvent « brouiller » la relation entre E et M
E
?
M
F
22
Comment prendre en compte les facteurs de confusion pour l’étude de
la relation entre E et M ?
1 – Lors de la conception de l’enquête
A – Recueil des informations :
 Identifier à partir des connaissances, littérature, plausibilité, « intuitions »
- les facteurs de risque connu du phénomène M étudié
- des facteurs de risque possible
- les facteurs d’interaction potentiels
 Collecter ces variables pour chaque sujet inclus
B - Modalités d’échantillonnage
 Supprimer « artificiellement » dans l’échantillon la relation E-F ou M-F
- randomiser l’exposition (essai randomisé)
- restreindre la population d’étude à une catégorie du facteur de confusion
- stratifier ou apparier sur un ou plusieurs facteurs de confusion
2 – Lors de l’analyse statistique
- analyses univariées : identifier les facteurs associés à M
- analyses stratifiées : rechercher des interactions entre facteurs vis-à-vis de M
- analyses multivariées : prendre en compte plusieurs facteurs de confusion simultanément avec des
variables catégorielles et/ou continues
Essai contrôlé randomisé  permet de minimiser les biais
BIAIS DE SELECTION
 Comparabilité initiale assurée par la randomisation de l’intervention pour l’attribution aux sujets :
 Importance de la clause d’ambivalence (les sujets doivent pouvoir recevoir les deux bras de l’intervention
sans CI), de la clause d’ignorance (ne pas savoir avant la rando quel traitement le patient recevra) avec
assignation secrète si pas d’aveugle possible, du délai court entre randomisation et attribution des
traitements pour éviter les PDV précoce avant le mise sous TT
 Maintien de la comparabilité au cours du suivi par l’administration en double aveugle de l’intervention
(quand c’est possible) :
 Mais perdus de vue peuvent être plus fréquents si effets secondaires plus fréquents liés aux TT
 Validité externe : repose sur les critères d’éligibilité pour définir à qui s’appliqueront les résultats
(généralisibilité)
BIAIS DE CLASSEMENT
 Non différentiels : limités par la standardisation de toutes les procédures de recueil de données et de
définition des critères (essai contrôlé)
 Différentiels : supprimé par l’évaluation du critère de jugement à l’aveugle
BIAIS DE CONFUSION
 Limités par la randomisation de l’intervention pour l’attribution aux sujets
 Limités par la stratification sur certains critères pronostique (éviter une répartition inégale due au hasard
malgré la randomisation– fluctuation d’échantillonnage)
23
PUISSANCE 1‐ beta
La puissance d’une étude pour mettre en évidence une association est d’autant plus grande
que:
- Le risque alpha est grand (mais il est généralement fixé à 5%, sans avoir à définir la différence
attendue pour l’hypothèse alternative)
- La formulation du test est unilatérale (mais elle doit être généralement de formulation bilatérale
sauf situation particulière exceptionnelle dans les essais randomisés et jamais en épidémiologie
observationnelle)
- Le nombre de sujet est grand (la situation optimale étant d’équilibrer les deux groupes à comparer ;
pas toujours possible ou souhaitable s’il existe une nombre limité de cas M+ dans une enquête castémoins, ou d’exposé E+ dans une enquête de cohorte E+/E-, ou si l’on souhaite attribuer à plus de
sujets l’intervention E+, etc…)
- La variance du caractère étudié est petite (indépendante de la moyenne pour un caractère
quantitatif, dépendant du pourcentage pour un caractère binaire,c’est-à-dire d’autant plus petite que
le pourcentage attendu dans le groupe de référence est éloigné de 50%)
- L’écart à mettre en évidence est la plus grande (ce qui impose de définir l’hypothèse alternative
pour calculer beta)
Conclusion
1 – Utilisation de données groupées (épidémiologie descriptive)

Comparaisons des évolutions géographiques et temporelles

Etude de corrélation écologique
 Aucune conclusion causale; niveau de preuve très faible
 Permet d’émettre des hypothèses pour mener des enquêtes individuelles
2 ‐ Utilisation d’enquêtes observationnelles (épidémiologie analytique)

Définition : un facteur de risque
E est un facteur associé
statistiquement au risque de M,
quel que soit le sens
(augmentation ou diminution du
risque), et sans préjuger de la
nature causale de la relation
Comparaison de groupes au sein de l’échantillon  Estimation de mesures d’association
 Pas de conclusion causale, qu’il y ait ou non une association significative entre une
exposition et un phénomène étudié M
 nécessité d’un faisceau d’arguments
3 ‐ Etudes expérimentales (épidémiologie évaluative)
 Essai randomisé  Permet d’affirmer une relation de cause à effet en cas d’association
significative
 Etude avant/après une intervention  niveau de preuve plus faible, car pas de groupe
controle
24
Critères de causalité de Bradford-Hill
pour la relation entre E et M
Internes à l’étude
• 1 – Association statistique
• 2 – Forte intensité de la relation (OR ou RR)
• 3 – Relation type dose-effet
• 4 – spécificité de la relation maladie-exposition
• 5 – Pas d’ambigüité temporelle
Externes à l’étude
• 6 – Concordance avec autres études de méthodologie différente
• 7 – Plausibilité biologique
• 8 – Concordance avec expérimentations animales
• 9 – Gradients géographiques parallèles de l’exposition et de la maladie
• 10 – Diminution de la maladie lorsque l’exposition est supprimée
25
Téléchargement