Spécifications de BD géographiques 243
On notera que tous ces aspects spécifiques des bases de données géographiques
ont un point commun : une liberté importante est a priori laissée pour l’interprétation
du monde. Il existe, en tous cas à l’IGN, un savoir-faire et une expertise communs
qui limitent les variations dans une certaine mesure mais il est néanmoins nécessaire
de rédiger des spécifications précises afin de restreindre cette liberté. Ces spécifica-
tions sont détentrices de l’expertise du domaine et constituent à nos yeux la clef du
processus d’instanciation des bases géographiques et, au-delà, de leur intégration.
2.2. Intégration de bases de données géographiques
La problématique de l’intégration de bases de données (Batini et al., 1984, Batini
et al., 1986, Sheth et al., 1990, Li et al., 1992, Sheth, 1998, Parent et al., 2000) connaît
un regain d’intérêt depuis les approches « médiation » (Wiederhold, 1992, Kirk et al.,
1995, Chawathe et al., 1994, Chawathe et al., 1997, Garcia-Molina et al., 1997). Cette
approche requiert un niveau méta. Traditionnellement, ce niveau décrit les schémas
conceptuels issus de bases hétérogènes (voire un schéma intégrateur) et des liens d’ap-
pariement entre ces schémas établis à partir de la connaissance du domaine (ontolo-
gie). Dans le cas spécifique des bases de données géographiques, (Devogele et al.,
1998) donne plusieurs raisons montrant l’intérêt d’une telle intégration; notamment,
le coût de l’acquisition des données rend souhaitable de faciliter leur réutilisation, et
l’hétérogénéité des données actuelles est un obstacle à cette réutilisation, sans compter
que les diverses sources de données peuvent présenter des incohérences. D’autre part,
cette intégration simplifierait grandement les mises à jour. L’article sus-cité propose
une approche de cette intégration par fédération de bases de données : détermina-
tion et description des correspondances entre les différents schémas des bases puis
réalisation d’un schéma intégré, sans modification des données. Cette approche est
détaillée plus avant dans (Devogele, 1997) où est également présenté un algorithme
d’appariement, pour le cas particulier des données routières, permettant l’instancia-
tion au niveau des données des correspondances inter-schémas, et donc l’instanciation
du schéma intégré. Il existe également des travaux sur la notion de « distance séman-
tique » (Rodriguez et al., 1999).
L’intégration pour les bases de données géographiques peut concerner une autre
spécificité de l’information géographique : la multireprésentation. Dans une base de
données intégrée multireprésentations, un objet donné possède plusieurs représenta-
tions à des résolutions différentes. (Vangenot, 2001) étudie ce type de bases de don-
nées (qui n’existe pas encore de façon importante) et propose un modèle de gestion de
la multireprésentation (non limité à la multirésolution) avec un système d’estampilles.
(Friis-Christensen et al., 2002) propose une approche plus spécifique et technique de
la multireprésentation où la base de données multireprésentation est un cas particulier
de base de données fédérée (« un ensemble de bases de données composantes qui co-
opèrent mais sont autonomes. ») L’article est orienté vers la gestion d’une telle base
de données et en particulier le maintien de la cohérence entre les différentes représen-
tations.