21/04/2009 Gestion des bases de données et requêtes Malika Mahloul Centre de référence des maladies respiratoires rares - Trousseau Schéma d’étude retenu Dossiers patient informatisé « e-Pi » « e-Cil » « e-Dev » « e-R » Base Nationale de données phénotypiques Corrélations Analyses génotype statistiques phénotype Analyses fonctionnelles, microscopiques, génétiques … Centres de référence/ compétence Banques « biologiques » 12 mars 2009 RespiRare 2009 2 1 21/04/2009 Le gestionnaire de bases de données (data manager) Rôle : Responsable du bon fonctionnement de la base de données Position : ARC Data manager Statisticien Missions : Créer les bases de données pour centraliser les informations relatives à la pathologie et au patient Prendre en charge le contrôle et la cohérence de ces bases. RespiRare 2009 12 mars 2009 3 La législation des bases de données Soumission aux autorités compétentes : CCTIRS : Comité Consultatif sur le Traitement de l’Information en matière de Recherche dans le domaine de la Santé CNIL : Commission Nationale Informatique et Libertés avis favorable le 28 mars 2008 avis favorable le 17 septembre 2008 Dépôt des logiciels : APP : Agence pour la Protection des Programmes 12 mars 2009 le 24 septembre 2008 RespiRare 2009 4 2 21/04/2009 La conception des bases de données Création des dossiers patients maladies rares courant 2007 : Phase de test pour le centre de référence : 2008 Mise en production pour les centres de compétence fin 2008 Modifications de la base demandées par les centres : 12 mars 2009 Basés sur e-Muco dont la structure a été reprise et adaptée Recueillies et validées Mises à jour régulières de la base effectuées RespiRare 2009 5 Les logiciels maladies rares 12 mars 2009 RespiRare 2009 6 3 21/04/2009 Intégrité de la base Sécurité = Intégrité physique Validité = Intégrité logique et sémantique Protection + confidentialité = Intégrité «juridique» Contrôle d'utilisation et protection de la base : Droits d’accès aux données paramétrables Mots de passe utilisateurs personnels et anonymes Intégrité physique : Existence de moyens de sauvegardes et de restauration des bases RespiRare 2009 12 mars 2009 7 Intégrité logique et sémantique PROTECTION SAISIE VALIDITE Bases de données CONFIDENTIALITE SECURITE VALIDITE Vérification de l’intégrité des données de la base UTILISATION Contraintes sur les champs Gestion des données manquantes … Vérification de la cohérence des données : 12 mars 2009 Tests de détection Queries RespiRare 2009 8 4 21/04/2009 La qualité des données 12 mars 2009 RespiRare 2009 9 Interrogation de la base : les requêtes Formation à la création de requêtes En cas d’étude multicentrique, l’accord du centre est requis pour accéder à ses données anonymisées Chaque centre est propriétaire des données de sa base 12 mars 2009 Possibilité de faire les requêtes qu’il souhaite sur ses données 1ère Journée du centre de référence des Maladies Respiratoires Rares 10 5 21/04/2009 Un exemple de requête : Nombre moyen de bolus par patient et par diagnostic dans e-Pi Nombre moyen de bolus / patient Anomalies du surfactant 6 3 23 9 Fibrose pulmonaire idiopathique Pathologies interstitielles chroniques et fibroses pulmonaires Sarcoïdose 13 14 Hémosidérose pulmonaire primitive Protéinoses alvéolaires RespiRare 2009 12 mars 2009 11 Merci de votre attention Coordonnées : [email protected] [email protected] 01.44.73.52.63 12 mars 2009 RespiRare 2009 12 6