S TATISTIQUES DE SCAN : THÉORIE ET APPLICATIONS 1 M ICHAËL G ENIN1,2 Centre d’Etudes et de Recherche en Informatique Médicale, Université de Lille 2 2 MΘDAL Team, INRIA Lille Nord Europe Financement : MENRT P ROBLÉMATIQUE Sujet : Détection d’agrégats d’évènements atypiques d’un point de vue temporel, spatial et spatio-temporel. Méthode : Tests statistiques basés sur les statistiques de scan Problèmes : – Pas de forme analytique des distributions des statistiques de scan → Approximation de la distribution par méthode de Monte-Carlo → Très coûteuse en temps de calcul – Cas spatial : fenêtre de scan uniquement rectangulaire ou circulaire → Difficulté à détecter des agrégats de forme arbitraire E NJEUX ET COLLABORATIONS De nombreuses applications : – Epidémiologie spatiale – Zone géographique présentant un sur-risque de maladie – Système de surveillance en santé – Emergence d’épidémie – Fiabilité – Machine-outil défectueuse Collaborations – Registre EPIMAD (CHRU Lille) / EA 2694 / EA 4483 (Lille 2) – Registre LymphoNor (Univ. Catholique de Lille) – Fédération de Recherche en Santé Mentale (Lille) M ÉTHODOLOGIE ET TRAVAUX EN COURS Théorie Applications à l’épidémiologie Problématique : – L’étiologie de la maladie de Crohn est incertaine. – Mise en évidence de clusters spatiaux (sous et sur-incidence) – Emettre des hypothèses sur les causes de la maladie – Causes environnementales, génétiques... Données : – Registre EPIMAD (1erregistre mondial, 9.3% population française) – Départements couverts : Nord, Pas-De-Calais, Somme, Seine Maritime – 6472 cas de MC recensés depuis 1990 Résultats : – 24 clusters significatifs – 12 clusters de sur-incidence ; 12 clusters de sous-incidence – Cluster à haut risque dans la zone de Metal-Europe P ERSPECTIVES C OMPÉTENCES DÉVELOPPÉES Théoriques – Etude de l’influence de la forme de la fenêtre sur l’approximation de la distribution de la statistique de scan – Approximation de la distribution dans le cas de fenêtres à taille variable – Détection de cluster de forme arbitraire Techniques – Statistique mathématique – Statistique spatiale – Programmation / Optimisation / Calcul parallèle – Système d’Information Géographique Appliquées – Mise en place de système prospectif de surveillance (Registre EPIMAD) – Etude de la répartition spatiale des lymphomes non-hodgikiniens dans le Nord-Pas-De-Calais (NPDC) – Etude de la répartition spatiale des tentative de suicide dans le NPDC. Humaines – Gestion de projet – Communication orale et écrite – Esprit d’équipe / Vulgarisation – Autonomie