Revue internationale de géomatique. Volume 9 – n° 4/1999, pages 389 à 423
Le Data Mining Spatial
et les bases de données spatiales
Karine Zeitouni — Laurent Yeh
Laboratoire PRISM - Université de Versailles - Saint-Quentin,
45, Avenue des Etats-Unis, F-78035 Versailles cedex
RÉSUMÉ. La combinaison du Data Mining et de bases de données spatiales (BDS) offre de
nouvelles perspectives pour l’analyse spatiale des données géographiques. Cette
combinaison amène au domaine du Data Mining Spatial (DMS). Cet article décrit dans une
première partie les techniques spécifiques de gestion de bases de données spatiales dans un
Système d’Informations Géographiques (SIG). La seconde partie introduit le concept de Data
Mining Spatial en soulignant sa spécificité par rapport au Data Mining sur des bases
relationnelles. Elle souligne l’existence de deux approches au DMS, l’une issue du domaine
d’apprentissage sur des bases de données et l’autre des statistiques orientées analyse
spatiale. Les méthodes développées dans l’une et l’autre de ces deux approches sont décrites
et classées par catégorie selon leur rôle ou la forme de connaissance extraite. L’étude
comparative de ces approches montre leurs similarités, leurs différences et leur
complémentarité. Elle permet de conclure, d’une part, que la combinaison des deux
approches de DMS serait profitable dans le processus d’analyse et, d’autre part, que les
relations spatiales jouent un rôle central dans le processus de Data Mining et par
conséquent que les BDS qui permettent de les déterminer sont d’autant plus importantes.
ABSTRACT. The combination of Data Mining and Spatial Database (SDB) offer new prospects
for spatial analysis in geographical applications. This combination brings to the field of
Spatial Data Mining (SDM). This paper describes, in a first part, the specific techniques for
the management of spatial databases in a Geographical Information System (GIS). The
second part introduces the concept of Spatial Data Mining by underlining its specificity with
regard to Data Mining on relational databases. We point out that there exists two
approaches for the SDM. The first comes from spatial database learning, while the second is
based on spatial statistics field. Methods developed in both approaches are described and
classified by category according to their role or the type of extracted knowledge. The
comparative study of these two approaches shows their similarities, their differences and
their complementary. We conclude first, that the combination of the two SDM approaches
would be valuable in the analysis process; second that spatial relationships play a central
role and accordingly, SDB that allow their computation are all the more interesting.
MOT-CLÉS : Data Mining spatial, analyse spatiale, relations spatiales, statistiques spatiales,
bases de données spatio-temporelles, systèmes d’informations géographiques.
KEYWORDS: Spatial Data Mining, Spatial Analysis, Spatial Relationships, Spatial Statistics,
Spatio-Temporal Databases, Geographic Information Systems.