Les enjeux de l`interopérabilité sémantique dans les systèmes d

Téléchargement

Informatique et santé

Collection dirigée par P. Degoulet et M. Fieschi

Paris, Springer-Verlag France

Informatique et Gestion Médicalisée

Rédacteurs :

F. Kohler, M. Brémond et D.Mayeux

Volume 9

Springer-Verlag France, Paris , 1997

Les enjeux de l'interopérabilité sémantique dans les systèmes d'information de santé

Patrice Degoulet (a), Marius Fieschi (b) et Christophe Attali (c)

a Hôpital Broussais, Service d'Informatique Médicale, 96 rue Didot, 75014 Paris

b Hôpital de la Timone, Département d'Information Médicale, rue Saint-Pierre, 13385 Marseille

c Ministère du Travail et Affaires Sociales, 8 avenue de Ségur 75007 Paris

Abstract

Rapid development of community health information networks raises the issue of semantic interoperability

between distributed and heterogeneous components. Indeed, operational health information systems originate

from heterogeneous teams of independent developers and have to cooperate in order to exchange data and

services. A good cooperation is naturally based on a good understanding of the messages exchanged between the

systems. The main issue of semantic interoperability is to ensure that the exchange is not only possible bus also

meaningful.

Informatique et Santé, 1997 (9) : 203-212

1 Introduction

L'efficacité et l'efficience des systèmes d'information de santé doivent être améliorées significativement si l'on

souhaite garantir la qualité des soins tout en respectant les contraintes budgétaires. Il s'agit, tout d'abord, de relier

les différents acteurs du système de santé afin de pallier les limites de l'exercice isolé, d'assurer une prise en

charge globale des patients et de garantir la continuité des soins. Il s'agit, également, de maîtriser les coûts des

systèmes de soin et d'en piloter le fonctionnement global et les adaptations en fonction de l'évolution des

connaissances et des pratiques médicales.

Un système d'information de santé nécessite une infrastructure de communication assurant la liaison entre les

différents acteurs du réseau de soins : professionnels des secteurs hospitalier et extra-hospitalier de production

des soins, organismes de financement et d'évaluation, secteurs de l'enseignement et de la recherche. Cette

infrastructure, qui fait appel à une multitude de moyens de traitement de l'information (ordinateurs) et de

communication (réseaux), est illustrée par le schéma de la figure 1.

L'accès aux données individuelles d'un patient peut se faire, sous réserve du respect des règles de sécurité et de

protection des données nominatives, à partir de postes de travail situés à l'hôpital, dans le cabinet du médecin,

voire au domicile des patients. En même temps qu'aux données individuelles, il convient d'accéder aux systèmes

documentaires et aux banques de connaissances permettant d'optimiser les décisions médicales. Certaines

données, une fois "filtrées", validées et éventuellement anonymisées, sont transmises aux organismes de

financement et de contrôle ou intégrées dans des bases de données épidémiologiques ou de recherche.

Dans un tel réseau de soins, les données sont réparties sur plusieurs serveurs qu'il importe alors de faire coopérer

harmonieusement. 12objectif pour l'ingénieur responsable du développement du réseau est de fournir aux

utilisateurs la vision d'un système "virtuel" unique et homogène, alors que l'information est distribuée sur des

environnements hétérogènes. L'objectif pour les utilisateurs est de pouvoir accéder de façon simple et

transparente aux informations et connaissances utiles, quelles qu'en soient la localisation ou les modalités de

stockage. Cette vision unifiée, au travers d'un poste de travail banalisé jouant le rôle d'assistant intelligent, est

illustrée dans le schéma de la figure 2.

2 L'interopérabilité des systèmes d'information

2.1 Principes généraux et objectifs

L'interopérabilité entre les composants d'un système d'information distribué peut se définir comme la capacité de

ces composants à échanger des services et des données [1]. Elle repose sur des conventions adoptées entre les

parties communicantes et régissant, entre autres, les protocoles d'échange de messages, la désignation des

procédures à activer ou les codes d'erreur retournés. Elle présente une dimension statique (comme, par exemple,

la compatibilité des types de données) et une dimension dynamique (comme la compatibilité des procédures).

L'interopérabilité repose tout d'abord sur l'interconnectivité des composants, qui est elle-même régie par le

respect de normes et de standards informatiques de communication. Les standards de communication consistent

en des spécifications techniques qui se traduisent par des définitions et des règles d'ingénierie, de façon à assurer

que les produits, les traitements et les services remplissent bien leur rôle.

Les messages médicaux ne diffèrent pas fondamentalement des messages d'autres secteurs professionnels. Ils ont

une syntaxe (une forme) et une sémantique (un sens). A un sens, peuvent correspondre plusieurs formes, ce qui

est naturel, mais l'inverse peut aussi être vrai si l'on modélise mal (ou pas du tout) le domaine dans lequel les

échanges sont effectués.

L'interopérabilité syntaxique propose une intégration de premier niveau, que l'on peut appeller intégration

syntaxique, en définissant notamment la nature, le type et le format des messages échangés, Elle conduit à la

notion de système ouvert permettant d'assumer l'hétérogénéité des composants (interfaces, langages de

programmation, etc.) [2-4]. Ce premier niveau est toutefois insuffisant : la cohérence formelle des messages ne

garantit pas, par elle-même, la cohérence des significations perçues par les différents utilisateurs d'un système

(figure 3). Une intégration de second niveau, l'intégration sémantique basée sur l'interopérabilité sémantique, est

donc nécessaire qui prolonge et complète la précédente.

L'objectif de l'interopérabilité sémantique est ainsi d'assurer que les échanges qui s'effectuent entre les

composants interconnectés conservent leur sens, c'est à dire que les parties communicantes ont une

compréhension commune de la signification des données et des services qu'elles échangent [5]. L'interopérabilité

sémantique est une réponse à l'hétérogénéité sémantique des informations traitées par les différentes

applications. Elle implique que les divers utilisateurs partagent des vues cohérentes sur les systèmes de concepts

sous-jacents aux diverses applications (figure 4). Ainsi, par exemple, la signification de la valeur 100 d'un

champs de donnée dépend du concept associé (par exemple la pression artérielle) qui peut être décrit

partiellement dans les dictionnaires de données des logiciels d'application, mais également de l'unité, de la

méthode de mesure utilisée ou du degré de précision.

Figure 4 : Les deux niveaux de l'interopérabilité des systèmes d'information : syntaxique et sémantique

2.2 La multiplicité des syntaxes

La situation actuelle est caractérisée par une multiplicité de standards d'échanges de messages, chacun

caractérisé par une syntaxe et un domaine privilégié d'utilisation. Ainsi, le standard ASTM 1238 est adapté à la

transmission de résultats biologiques et le standard DICOM à la transmission d'images radiologiques [6-8].

L'hétérogénéité des syntaxes n'est cependant pas un obstacle absolu à l'interopérabilité des systèmes

d'information. Il est en effet toujours possible de concevoir des modèles plus génériques et des outils de

traduction d'une syntaxe dans une autre. Ainsi, par l'intermédiaire de l'un de ses groupes de travail (TC 25 1), le

Comité Européen de Normalisation (CEN) a réalisé une étude comparative des caractéristiques syntaxiques des

principaux messages médicaux [8]. Une des conclusions du rapport est que les spécifications sémantiques des

messages sont plus importantes que le choix de la syntaxe utilisée pour supporter le format des messages.

Considérant les particularités du domaine médical, de Moor fait remarquer que le développement de messages,

sans tenir compte de la syntaxe qui n'entre en jeu qu'à la fin du processus, semble être la meilleure alternative

pour satisfaire les besoins complexes et nombreux de communication dans le domaine de la santé [9]. Partant de

ces hypothèses, le CEN/TC 251 ne recommande aucun format de message spécifique pour la totalité du domaine

de la santé, mais il préconise une méthode de développement indépendante de la syntaxe, basée sur des

descriptions générales de messages. Se pose alors le problème de l'harmonisation de différents modèles de

données pour aboutir à un modèle générique commun de message.

Au sein de VIEEE, le JWG-CDM (Joint Working Group for a Common Data Model, ou MEDIX) est en charge

du développement d'un modèle de données commun (Common Data Model ou CDM) aux standards de

l'informatique de Santé [10,11]. Les objectifs mis en avant par ce comité sont les suivants :

• constituer une syntaxe commune pour la modélisation des données à partager,

• établir un modèle objet du domaine de la Santé,

• formaliser un processus de développement distribué des différentes parties du modèle commun à partir de

sous-modèles (Subset Data Model ou SDM),

• créer un répertoire central pour collecter les différents éléments du CDM.

La figure 5 présente la façon dont les différents organismes normalisateurs coopèrent autour du modèle de donné

commun et des sous-modèles.

Figure 5: Le processus d'harmonisation du modèle de données dans l'approche IEEE/MEDIX

2.3 Vers un interopérabilité sémantique des systèmes d'information

Un message peut être considéré comme un ensemble d'unités élémentaires ou atomes d'information, tels que des

couples "attribut - valeur" (par exemple Glycémie 5.5 mmol/1). Les unités peuvent être regroupées en segments

et/ou accepter des éléments de répétition pour former des structures plus complexes (par exemple, le résultat

d'une hyperglycémie provoquée). Comme dans une phrase du langage naturel, la signification sémantique d'un

message est basée sur la signification individuelle de chacun de ses éléments, sur la signification complémentaire

qui résulte de la structure globale utilisée et sur les informations qui peuvent être dérivées des deux précédentes.

Certains éléments peuvent représenter des informations contextuelles qui seront utiles à la transmission et

l'interprétation correcte du message (par exemple, l'émetteur, le destinataire, la syntaxe utilisée ou la référence à

un vocabulaire particulier). Les informations contextuelles, qui seront partagées par l'ensemble des éléments de

message, sont souvent regroupées dans l'entête (header) ou la fin (trailer) du message.

La compatibilité ou l'incompatibilité sémantique lors du processus création/interprétation des messages

dépendent notamment de trois facteurs clés :

• la terminologie ou les nomenclature

Il s'agit de la façon dont les concepts s'expriment dans un vocabulaire contrôlé, ayant le statut de référentiel

d'un domaine de connaissance ou d'activité.

• les relations sémantiques explicites portant sur la terminologie

Les relations peuvent être organisées dans un réseau sémantique. Celui-ci structure les liens entre les

concepts du domaine, en en précisant la nature ; liens de synonymie, d'hétéronymie, de dérivation, etc. (par

exemple PAS et Pression Artérielle Systolique ou angor et angine de poitrine pour des liens de

synononymie).

• la représentation des concepts dans les messages

En général, deux institutions modélisent et représentent les concepts de façons diverses. Des exemples

simples sont l'âge (modélisation de celui-ci ou de la date de naissance, ... ) et l'adresse d'une personne

(séparation du numéro de la rue, du code postal, nombre de lignes, ... ). On pourrait citer de nombreux autres

cas comme la modélisation de l'existence d'un symptôme par un stade (ou une gravité) ou simplement par

oui ou non.

Les deux premiers problèmes ont fait l'objet de nombreux efforts de recherche et développement. Il en résulte un

ensemble de vocabulaires normalisés ou référentiels, dont la portée peut être locale, nationale ou internationale.

La solution au troisième problème passe par une modélisation fine des messages en séparant ce qui est générique

de ce qui peut être spécifique tant au niveau syntaxique que sémantique,

La figure 6 illustre la situation pour deux messages simples M et M'. Le message M est produit par un

composant émetteur A et le Message M' peut être compris par un composant recepteur B. Le message M est codé

selon la syntaxe HL7 et chiffré. Ses concepts font référence au vocabulaire contrôlé ou référentiel RA qui

modélise lui-même le domaine A -, on parle alors de l'ontologie OA du domaine (la production d'un message

HL7 chiffré est considérée comme la sortie du composant A). M' (l'entrée du composant B) n'est pas chiffré,

mais est codé en ASN. 1 et fait référence au référentiel RB qui modélise une ontologie OB.

Nom du patient et nom de naissance sont considérés comme des synonymes exacts dans OA et OB. Les dates

diffèrent par leur modalité de codage (jour/mois/année versus mois/jour/année). Les dosages d'azote et d'urée

dans le sang ne font pas référence au même concept biologique (l'azote est un composant de l'urée) mais il existe

un facteur de conversion connu pour passer des unités en mg/dl aux unités en mmol/l et de l'urée à l'azote ou

vice-versa.

1 / 8 100%

Documents connexes

Au commencement était le verbe Syntaxe, sémantique - Beck-Shop

Ahmed ZELLOU

Syntaxe et sémantique des prédicats : approche contrastive et

La sémantique pour comprendre la valorisation des

Titel: La sémantique lexicale de verbes français Zeit + Raum

GIRY-SCHNEIDER J., 1994, "Sélection et sémantique : problèmes

Recherche de modèles 3D et modélisation à partir d`exemples

Version

champs sémantiques jardinage

Royaume de Belgique Service de Sécurité et d`Interopérabilité des

LLSDL511Corrige (DOC, 25 Ko)

Table des matières

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Les enjeux de l`interopérabilité sémantique dans les systèmes d

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Les enjeux de l`interopérabilité sémantique dans les systèmes d

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib