Entrepôt de données de santé autour du PMSI Lama EL SARRAJ (*) LSIS, Université Aix Marseille, LSIS-UMR CNRS 6168 13397 Marseille APHM, 147 boulevard Baille 13005 Marseille (**) [email protected] MOTS-CLÉS : PMSI, KEYWORDS: entrepôt de donnés, qualité des données, évolution de schéma PMSI, data warehouse, data quality, schema evolution 1. Introduction Notre recherche se situe dans le contexte du programme de médicalisation des systèmes d’information (PMSI). Nous proposons de développer ou d’étendre une méthodologie de conception et d’implémentation d’un entrepôt de données (ED) associé au PMSI qui prend en compte la qualité et l’évolutivité des données médicales ainsi que l’évolution des besoins. Nous présentons tout d’abord le PMSI, ensuite notre problématique de recherche, et enfin nous concluons. 2. Le PMSI Le PMSI relève d’une initiative du ministère de la santé en 1982, son modèle est basé sur des travaux du Professeur Robert Fetter (Université de Yale, Etats-Unis), il permet de recueillir des informations à partir du dossier médical des patients à des finalités de santé publique et épidémiologique. En 2005, le PMSI a été étendu à des objectifs économiques, notamment dans la mise en place de la tarification à l’activité (T2A) qui introduit le financement sur la base de l’activité. Ainsi, pour attribuer un tarif de base, les informations concernant le patient (diagnostics, actes, date de naissance, etc.) contenu dans le Résumé d’Unité Médicale (RUM) sont traitées et regroupées en Résumé de Sortie Standardisé (RSS), puis, analysées pour produire un Groupe Homogène de Malades (GHM) à la fois médical et économique. Pour aboutir à la facturation, le GHM est converti en Groupe Homogène de Séjours (GHS) auquel est attribué le tarif de base. Le codage des diagnostics et des actes médicaux est important parce qu’un même séjour peut être codé de plusieurs façons différentes et chaque code conduit alors à un tarif spécifique. Les diagnostics sont codés à l’aide de la Classification Internationale des Maladies (CIM-10), et les actes sont codés avec la Classification Commune des Actes Médicaux (CCAM). 3. Entrepôt de données de santé La complexité des besoins due aux domaines hétérogènes ainsi que les contraintes inhérentes aux outils online transaction processing (OLTP), font que pour disposer d’un véritable outil d’aide à la décision à usage interne, la constitution d’un entrepôt de données de santé (EDS) s’appuyant sur les données du PMSI, est nécessaire. La conception d’un tel EDS va comprendre diverses étapes. En amont de la réflexion, deux points particuliers ont retenu notre attention : la prise en compte de la qualité des données médicales issues du PMSI et celle de l’évolution potentielle des indicateurs nécessaires au pilotage. Pour le premier point, force est de constater que malgré les contrôles permanents effectués pour détecter les anomalies (soit à l’aide des logiciels qui traitent et permettent de revenir au dossier du patient pour corriger, soit par les procédures de contrôles réguliers effectués par la Caisse d’Assurance Maladie sur les éléments du T2A) les données restent entachées d’erreur. Des recherches récentes relatent un manque de qualité des données du PMSI, notamment au niveau du codage [3]. Ensuite, comme évoqué précédemment les données évoluent, de même que les besoins des décideurs utilisant l’EDS. L’évolution des indicateurs, reste un problème délicat car il peut engendrer l’évolution du schéma (conceptuel) de l’ED ce qui complexifie la récupération des données existantes par adaptation au schéma de l’EDS [1] [4]. 4. Conclusion Notre recherche propose de concevoir ou d’étendre une méthodologie de conception et de développement d’un EDS, prenant en compte la qualité et l’évolution des données au cours du temps. Sur les deux points (qualité et évolution) nous nous appuierons sur la connaissance des utilisateurs quant à leur métier et au domaine d’intérêt. Cela nous amènera vers la description de celles-ci et pour cela nous nous appuierons sur les travaux existants, comme, par exemple, le projet DWQ [2], dans lequel est proposé un enrichissement de la sémantique des données intervenant au niveau du méta modèle du schéma de l’ED. 5. Bibliographie [1] Favre C. (2007). Évolution de schémas dans les entrepôts de données : mise à jour de hiérarchies de dimension pour la personnalisation des analyses. Thèse de l’Université Lumière, Lyon. [2] Matthias J. , Yannis V. (1997). Data Warehouse Quality: A Review of the DWQ Project. Invited Paper, Proc. 2nd Conference on Information Quality. MIT, Cambridge. [3] OliveF., Gomez F., Schott A.-M., Remontet L., Bossard N., Mitton N.,Polazzi S., Colonna M. , Trombert-PavioB. (2010). Analyse critique des données du PMSI pour l'épidémiologie des cancers : une approche longitudinale devient possible. Revue d'Épidémiologie et de Santé Publique. [4] Serna-Encinas M.T. (2005). Entrepôts de données pour l’aide à la décision médicale : conception et expérimentation. Thèse de l’Université Joseph Fourrier, Grenoble.