Téléchargez la présentation

publicité
Modèles dynamiques en
épidémiologie
Daniel Commenges
INSERM E0338 Biostatistique
http://biostat.isped.u-bordeaux2.fr
« Epidémiologie »
• Il n’y a pas « santé » mais « demos »,
c’est-à-dire « population »
• Le lien entre « population » et
« statistique » est naturel
• L’épidémiologie ne couvre pas tous les
enjeux de l’utilisation des statistiques en
santé
« Modèles »
• Objectifs: décrire, comprendre, prédire,
agir; modèles descriptifs ou explicatifs
• Modèles mathématiques, avec un
aspect statistique: c’est-à-dire une
famille de probabilités (Pq) ; le
paramètre doit être estimé à partir des
observations (maximum de
vraisemblance, approche Bayesienne)
« dynamiques »
• Le monde biologique est immergé dans (ou émergent
du) monde physique
• Le monde physique a 10 dimensions (théorie des
cordes)
• Nous le simplifions en général à 4 dimensions :
3 dimensions d’espace, une de temps
• Les modèles spatio-temporels sont extrêmement
complexes, en particulier parce que l’espace
géographique, social, biologique n’est pas isotrope
• Il est souvent intéressant de ne retenir que la
dimension temporelle; en particulier parce que les
liens causaux impliquent un ordre temporel
Modèles non dynamiques
• Beaucoup de modèles statistiques sont en
dimensions zéro
• Exemple: modèle de régression logistique:
P(Yi=1) =exp(xib)/[1+exp(xib)]
Yi=1 si le sujet i présente une maladie
xi est un vecteur de variables explicatives (âge,
sexe, fumeur,…)
Le temps est implicite: le sujet fumait avant de
développer la maladie… mais il n’est pas
explicite.
Types de données indexées par
le temps
• Données quantitatives mesurées pour
l’individu i au temps tij: Yij
• Evènement survenant pour l’individu i au
temps Ti
• Données groupées: nombre d’événements
survenant dans des périodes de temps
(exemple: nombre de cas de SIDA déclarés
par mois)
Données quantitatives répétées
• Exemple 1: résultats de tests
psychométriques effectués à chaque
visite, diagnostic de démence, dans une
étude de cohorte de personnes âgées;
• Exemple 2: concentrations de
lymphocytes CD4, charge virale,
mesurés à des visites répétées pour
des sujets VIH+
Evènements
• On s’intéresse pour le sujet i au temps Ti
entre un événement origine et un événement
d’intérêt;
• Les observations sont souvent censurées à
droite: pour certains sujets on n’observe pas
Ti mais l’événement {Ti>C}.
• Exemples d’événements d’intérêt: décès,
survenue d’une maladie, rémission
• Exemples d’événements origine: naissance,
mise en place d’un traitement.
Modèles pour données répétées
Les modèles on évolué à partir de l’analyse
de variance par l’application du modèle
linéaire général (Laird and Ware, 1982):
Yi=Xib+Zibi+ei
Il n’y a rien de spécifiquement dynamique
dans ce modèle: les temps tij peuvent
intervenir dans les matrice Xi et Zi.
Modèle dynamique pour données
répétées
• Un modèle dynamique (inspiré de
l’automatique, voir Kalman) a été
proposé par Jones et Ackerson (1990):
• Equation d’état: dSi(t)=FSi(t) dt + dhi (t)
• Equation d’observation: Yij=Si(tij)+eij
Modèles pour l’analyse
d’événements
• Modèle non-dynamique: étudier la
distribution de T comme n’importe
quelle variable aléatoire
• Modèles dynamiques: modéliser la
fonction de risque (Cox, 1972):
ai(t)=a0(t)exp(xib)
Processus de dénombrement
Processus de dénombrement
• Modéliser le risque revient à modéliser
la partie déterministe de l’équation
différentielle:
dNi(t)=Yi (t) ai(t) dt + dMi(t)
Extensions multivariées
• Données longitudinales multivariées:
pas de problème si on fait l’hypothèse
de normalité
• Analyse d’événements multiples:
- Modèles multi-états
- Modèles de processus de
dénombrement multivariés
Le modèle « sain-malade-mort »
Modèles conjoints
• Modéliser conjointement des données
longitudinales quantitatives et des
événements
• Plus généralement des données de nature
différentes
• Des variables latentes, ou des processus
latents sont utilisés pou faire le lien entre les
différents type de données
Modéliser conjointement un test
psychométrique et la démence
• Nous avons des mesures répétées d’un test
psychométrique (le MMS) à des temps tij
• Nous avons des diagnostics répétés de
démence aux mêmes temps
• Nous considérons que les deux types
d’observations sont des mesures d’un même
processus (latent) représentant un
fonctionnement cognitif global et vivant en
temps continu.
Modèle à processus latent
(J Ganyaire)
• Processus latent des capacités cognitives
fonction:
-du temps t
-du niveau d’éducation, Edi
-d’un effet aléatoire a1,i
-d’un mouvement Brownien
Liens entre processus latent et
observations
• Diagnostic de démence si le processus latent
est inférieur à un certain seuil
• Le MMS prend la valeur m si le proc latent est
compris entre les points de coupure cm et
cm+1
• On peut compliquer les équations de liens en
les faisant dépendre de variables explicatives
(par exemple l’éducation), et d’effets
aléatoires
Evolution des marqueurs chez
les VIH+
• Principaux marqueurs: concentration de
lymphocytes CD4 et charge virale
• Utilisation de modèles mixtes pour
décrire l’évolution de chacun des
marqueurs, ou d’un modèle bivarié pour
décrire un modèle conjoint
Modèles explicatifs d’interaction
VIH-système immunitaire
• Les modèles mixtes peuvent être utilisés pour
construire des modèles descriptifs élaborés,
et on peut les utiliser pour évaluer la
différence entre traitements
• Cependant ils n’expliquent rien de nouveau et
ils n’utilisent pas les connaissances
biologiques acquises
• Utilisant ces connaissance on peut
développer des modèles qui représentent
l’évolution du système biologique par un
système d’équation différentielles
Le scoop de 1995
• En 1995 deux articles publiés dans
Nature (Wei et al; Ho et al.) utilisant des
modèles biomathématiques simples
change la vision de l’infection par le VIH
• Ces articles ont un impact majeur (plus
de 500 citations dans l’année) et sont
suivis sont le point de départ du
développement de ces modèles.
Modèle initial
Modèle initial
Cellules cibles
Cellules infectées
Virus
dT
   dT  kVT
dt
dI
 kVT  I
dt
dV
 pI  cV
dt
Modèle sous traitement
INTI
IP
Modèle sous traitement
Cellules cibles
Cellules infectées
Virus infectant
Virus non infectant
dT
   dT  1  e RT kVT
dt
dI
 1  e RT kVT  I
dt
dVI
 1  e PI  pI  cVI
dt
dVNI
 e PI pI  cVNI
dt
Résultats ( Perelson et al.,Science 1996)
Résultats (Science 1996)
• Réplication continue et intensive du
virus y compris pendant la phase de
latence
Résultats (Science 1996)
• Dans la période de quasi équilibre 109
lymphocytes CD4 sont détruits et 1010 virus
produits par jour
• Un traitement ARV efficace devrait faire
chuter la charge virale significativement en
quelques jours
• Chaque mutation à chaque position dans le
génome devrait survenir plusieurs fois par
jour (utilité des multi-thérapies)
Développements
(J Guedj, R Thiébaut)
• Des modèles plus complexes sont
considérés
• Des modèles populationnels sont
développés: les paramètres ont une
distribution dans la population (ce qui
rend les procédures d’estimation
beaucoup plus difficiles)
Téléchargement