les analyses représentation multiple : certains utilisateurs utilisent des données disponibles uniquement dans des
produits distincts, par exemple : des altitudes combinées avec des adresses en ville. Il incombe alors à l’utilisateur
de mettre en correspondance une BD topographique avec une BD de rues, opération très complexe. Il serait
intéressant de pouvoir accéder à ces différents jeux de données simultanément par un autre moyen ;
•
•
•
•
•
le suivi des phénomènes dans le temps : il peut être essentiel de conserver pour un objet, par exemple : une
parcelle cadastrale ou un lac, ses géométries et ses attributs sémantiques successifs, afin de réaliser des
analyses temporelles. Afin de ne pas conserver de données redondantes, une structure particulière d’objet
pourrait être créée dans une base de données accueillant toute l’information successive.
Problématique : la représentation multiple
La démarche exposée ici repose sur le concept de représentation multiple. Des précisions sont données, ci-
dessous, sur les termes de représentation et de représentation multiple. Puis, les problèmes à résoudre pour accéder à
la représentation multiple sont exposés.
Deux critères sont pris en compte lors de la comparaison de différentes représentations : le point de vue et la
résolution [VANGENOT 01].
Le point de vue matérialise l’intérêt spécifique du concepteur de données qui a présidé à certains choix de
contenu et de représentation, dont principalement le choix des types d’objets et de relations présents dans la base de
données, le choix des propriétés intéressantes pour décrire ces types, le choix du mode de définition de ces propriétés.
La résolution définit le niveau de détail choisi, afin de ne retenir dans la base de données que les objets reconnus
comme significatifs.
Point de vue et résolution caractérisent donc le contenu des bases de données et sa représentation numérique.
Lorsqu’il s’agit de comparer, dans deux bases de données, les instances représentant un même phénomène
géographique, c’est-à-dire lorsque l’on ne considère plus les bases de données mais les données, on peut utiliser, en
plus, les concepts de terrain nominal et de qualité [DAVID, FASQUEL 97].
Le terrain nominal représente le monde réel vu à travers le spectre des spécifications de la base de données.
Ces spécifications incluent, à la fois, le point de vue et la résolution choisis : c’est le contenu « parfait » de la base. La
qualité d’une base se mesure par sa distance au terrain nominal. Deux instances d’un même phénomène géographique
peuvent donc différer pour deux raisons : soit, parce que les spécifications de leurs bases, et donc leurs représentations
dans les terrains nominaux sont différentes, soit, parce qu’ils ont été saisis avec des erreurs de niveaux différents.
La représentation multiple désigne la possibilité d’accéder à plusieurs représentations des phénomènes
géographiques dans une seule base de données, ces différentes représentations étant liées entre elles pour bien
spécifier qu’elles correspondent à une même entité du monde réel.
En tant que possibilité de gestion d’une information polymorphe mais unifiée, la représentation multiple s’impose
donc comme une solution au problème d’incohérence des bases, exposé dans le contexte de cet article. Les principales
spécifications de la représentation multiple se résument à :
rendre cohérent le contenu de la base unifiée, en gérant les représentations, de façon liée ;
garder opérationnelles les applications existantes, en permettant d’exploiter chaque représentation indépendam-
ment des autres.
La création d’une base à représentation multiple, à partir de bases à représentation unique existantes, nécessite
de traiter plusieurs problèmes, détaillés ci-dessous. Ces problèmes touchent aux deux niveaux exposés ci-dessus, pour
le terme de représentation : le niveau des bases de données reposant sur le point de vue et la résolution des bases, et le
niveau des instances, incluant en plus la qualité des données.
On peut citer les thèmes de recherche suivants :
le problème de la modélisation des concepts : il s’agit de définir le schéma conceptuel (voir figure B.5.2, page 78)
de la base à représentation multiple, ce qui nécessite :
(1) de réfléchir aux concepts communs des différentes bases et au meilleur moyen de les modéliser ;
(2) de disposer d’outils de modélisation (un langage de modélisation, un assistant de génie logiciel) supportant
la représentation multiple ;
(3) le problème du SGBD : les SGBD et SIG du marché disposent de modèles logiques (voir figure B.5.2) qui,
par défaut, ne gèrent actuellement pas la représentation multiple. Une part de développement est donc
nécessaire avant d’y intégrer des données à représentation multiple ;
(4) le problème de l’appariement des données : la relation existant entre deux instances homologues de deux
bases différentes doit, le plus souvent possible, pouvoir être reconnue automatiquement afin d’alléger le
travail d’unification des bases existantes. Cela suppose l’utilisation d’algorithmes d’appariement les plus
performants possible ;
Bulletin d'Information de l'IGN n° 73 (2002/3) 62