11/03/2010 Bases de données – Outils de gestion Mise en place d’outils pour gérer, stocker et utiliser les informations d’une recherche biomédicale Document réalisé par L. QUINQUIS Unité d’épidémiologie et de biostatistique (Pr Coste) - Hôpital Cochin Qu’est ce qu’une base de données? Ensemble d’informations avec un objectif commun (descriptif, analytique…) Ensemble structuré et organisé Différents supports (papier, fichier informatique, ecrf) But d’une base de donnée Récolter des données dans un but spécifique: { { Suivie médicale du patient (antécédents, traitements administrés, symptômes observés,…) Etude clinique : analyse d’une population pour améliorer le traitement ou le diagnostique d’une maladie, d’un protocole Stocker des informations pour faciliter l’exploitation (ajout, suppression, recherche,…) Résultat: décrire les données Place de la base de donnée dans la recherche médicale Schéma général d’une étude Élaboration du projet de recherche Recueil des données / datamanagement Analyse descriptive / inférentielle Interprétation / Rapport / Article Notions fondamentales SGBD: Système de gestion des bases de données SGBD = ensemble de programme pour gérer et accéder à une base de donnée Fonctionnement (client/serveur) Analyse Requête Serveur Client Résultat Notions fondamentales Objectifs SGBD Indépendance physique Indépendance logique Accès rapide aux données Non redondance des données Administration centralisée des données Cohérence des données Partage des données Sécurité Notions fondamentales SGBD utilisés Postgresql: Apple, Fujitsu, Skype MySQL: SGBD le plus utilisé dans le monde Oracle Microsoft SQL IBM DB2 Sybase Libre Notions fondamentales SQL: Structured Query Language Langage informatique de type requête { LDD: langage de définition de donnée { Ex: CREATE TABLE table1 (colonne1 INTEGER, colonne2 INTEGER, colonne3 DATE, colonne4 DATE); LMD: langage de manipulation de donnée Ex: SELECT name, service FROM employees WHERE statut='stagiaire' ORDER BY name; { LCD: langage de contrôle Outil pratique (e-CRF): exemple en recherche clinique Toute étude clinique est organisée autour d’un protocole { { { { { Définition du contexte Objectifs médicaux et scientifiques Méthodologie (critères inclusions, données recueillies, calendrier, méthodes statistiques,…) Considérations éthiques et légales Financement Outil pratique (e-CRF): exemple en recherche clinique Phase 1: Conception 1ère étape = retranscription du protocole pour être utilisable par un SGBD Modèle entité/association Entité: objet ou élément caractérisé par son unicité Association: Lien entre plusieurs entités Traitement Patient N° de dossier Nom Prénom Recevoir Date administration Nom traitement N° flacon Dose Outil pratique (e-CRF): exemple en recherche clinique Phase 1: Conception Ce modèle entité/association doit être pensé selon les besoins de l’investigateur et les données nécessaires à l’analyse (description patient, CJP, EIG,…) Adapté au protocole de l’étude Premier pas vers la conception d’un masque de saisie Outil pratique (e-CRF): exemple en recherche clinique Phase 2: Masque de saisie Créer un cahier électronique pour stocker les données et en faciliter la gestion Baser sur la formalisation du protocole Interactif pour faciliter la saisie des informations Indiquant tous les paramètres nécessaires pour répondre aux problématiques posées Outil pratique (e-CRF): exemple en recherche clinique Identifiant patient Outil pratique (e-CRF): exemple en recherche clinique Outil pratique (e-CRF): exemple en recherche clinique Eléments indispensables dans un e-CRF { { { { Description du patient (n° inclusion, bras randomisation, sexe, âge,…) Visites & résultat clinique (CJP) EIG Bordereau sortie d’étude Outil pratique (e-CRF): exemple en recherche clinique Phase 3: Saisie, cohérence Module Formulaire Variable Mise en ligne du e-CRF final (ex: Cleanweb) Structure du e-CRF: Module → Formulaire → Variable Outil pratique (e-CRF): exemple en recherche clinique Phase 4: Extraction et analyse Interaction data-manager et biostatisticien Extraction finale { { { Nomming des variables Format des variables (numérique, qualitative, date,…) Codage des variables Oui/non = coder 1/0 Homme/Femme = 1/2 Résumé Pubmeb: base de données bibliographiques PUBMED = moteur de recherche bibliographique gratuit: { { Biologie Médecine scientifique 19 millions de citations depuis 1950 dans 5000 revues biomédicales Interface donnant accès à la BDD Medline { { { Citations Résumés d’articles scientifiques Textes complets Pubmeb: base de données bibliographiques Lien: http://www.ncbi.nlm.nih.gov/pubmed/ Pubmeb: base de données bibliographiques MeSH (Medical Subject Headings): système de nomenclature pour indexer les articles (ex: classification de Dewey) { Bibliothèque nationale de médecine { Définir une stratégie de recherche 19 catégories (anatomie, maladie, psychiatrie,…) Sous catégorie maladie (animale, cardiovasculaire,…) Exemple: Diagnostique des différents stades de la fibrose du foie par des méthodes non invasives : Maladie Système digestif Maladie du foie Cirrhose du foie Pubmeb: base de données bibliographiques Saisie du sujet principal de la recherche Pubmeb: base de données bibliographiques Arborescence MeSH (ex.: fibrose foie) Pubmeb: base de données bibliographiques Pubmeb: base de données bibliographiques Pubmeb: base de données bibliographiques Pubmeb: base de données bibliographiques Pubmeb: base de données bibliographiques Fin Si vous souhaitez en savoir ++++ : { Base de donnée et langage SQL: { SGBD: { Merci de votre attention Livre: Bases de données de la modélisation au SQL http://laurent-audibert.developpez.com/Cours-BD/html/index.html Postgresql: http://www.postgresql.org/ Mysql: http://www.mysql.fr/ Oracle: http://www.oracle.com Avez vous des questions? Pubmed: http://www.ncbi.nlm.nih.gov/pubmed/