Figure 5: Le processus d'harmonisation du modèle de données dans l'approche IEEE/MEDIX
2.3 Vers un interopérabilité sémantique des systèmes d'information
Un message peut être considéré comme un ensemble d'unités élémentaires ou atomes d'information, tels que des
couples "attribut - valeur" (par exemple Glycémie 5.5 mmol/1). Les unités peuvent être regroupées en segments
et/ou accepter des éléments de répétition pour former des structures plus complexes (par exemple, le résultat
d'une hyperglycémie provoquée). Comme dans une phrase du langage naturel, la signification sémantique d'un
message est basée sur la signification individuelle de chacun de ses éléments, sur la signification complémentaire
qui résulte de la structure globale utilisée et sur les informations qui peuvent être dérivées des deux précédentes.
Certains éléments peuvent représenter des informations contextuelles qui seront utiles à la transmission et
l'interprétation correcte du message (par exemple, l'émetteur, le destinataire, la syntaxe utilisée ou la référence à
un vocabulaire particulier). Les informations contextuelles, qui seront partagées par l'ensemble des éléments de
message, sont souvent regroupées dans l'entête (header) ou la fin (trailer) du message.
La compatibilité ou l'incompatibilité sémantique lors du processus création/interprétation des messages
dépendent notamment de trois facteurs clés :
• la terminologie ou les nomenclature
Il s'agit de la façon dont les concepts s'expriment dans un vocabulaire contrôlé, ayant le statut de référentiel
d'un domaine de connaissance ou d'activité.
• les relations sémantiques explicites portant sur la terminologie
Les relations peuvent être organisées dans un réseau sémantique. Celui-ci structure les liens entre les
concepts du domaine, en en précisant la nature ; liens de synonymie, d'hétéronymie, de dérivation, etc. (par
exemple PAS et Pression Artérielle Systolique ou angor et angine de poitrine pour des liens de
synononymie).
• la représentation des concepts dans les messages
En général, deux institutions modélisent et représentent les concepts de façons diverses. Des exemples
simples sont l'âge (modélisation de celui-ci ou de la date de naissance, ... ) et l'adresse d'une personne
(séparation du numéro de la rue, du code postal, nombre de lignes, ... ). On pourrait citer de nombreux autres
cas comme la modélisation de l'existence d'un symptôme par un stade (ou une gravité) ou simplement par
oui ou non.
Les deux premiers problèmes ont fait l'objet de nombreux efforts de recherche et développement. Il en résulte un
ensemble de vocabulaires normalisés ou référentiels, dont la portée peut être locale, nationale ou internationale.
La solution au troisième problème passe par une modélisation fine des messages en séparant ce qui est générique
de ce qui peut être spécifique tant au niveau syntaxique que sémantique,
La figure 6 illustre la situation pour deux messages simples M et M'. Le message M est produit par un
composant émetteur A et le Message M' peut être compris par un composant recepteur B. Le message M est codé
selon la syntaxe HL7 et chiffré. Ses concepts font référence au vocabulaire contrôlé ou référentiel RA qui
modélise lui-même le domaine A -, on parle alors de l'ontologie OA du domaine (la production d'un message
HL7 chiffré est considérée comme la sortie du composant A). M' (l'entrée du composant B) n'est pas chiffré,
mais est codé en ASN. 1 et fait référence au référentiel RB qui modélise une ontologie OB.
Nom du patient et nom de naissance sont considérés comme des synonymes exacts dans OA et OB. Les dates
diffèrent par leur modalité de codage (jour/mois/année versus mois/jour/année). Les dosages d'azote et d'urée
dans le sang ne font pas référence au même concept biologique (l'azote est un composant de l'urée) mais il existe
un facteur de conversion connu pour passer des unités en mg/dl aux unités en mmol/l et de l'urée à l'azote ou
vice-versa.