Une proposition d`extension de GML pour un modèle générique d

publicité
303
Schedae, 2007
Prépublication n° 46
Fascicule n° 2
Une proposition d’extension de GML
pour un modèle générique d’intégration
de données spatio-temporelles hétérogènes
Samya Sagar, Mohamed Ben Ahmed
Laboratoire de Recherche en Informatique Arabisée et Documentique Intégrée (RIADI)
École Nationale des Sciences de l’Informatique
Campus Universitaire de la Manouba, 2010 La Manouba, Tunis, Tunisie
[email protected], [email protected]
Résumé :
Les données géographiques sont un ensemble d’informations renseignant sur les objets observés à la surface terrestre, ces données sont définies par leur position géographique, leur forme,
leur description ainsi que leur évolution dans le temps. Ces données sont très complexes à
modéliser et la multi-représentation qui est intrinsèque à ce type de données, est généralement
négligée dans les modèles de données existants. Nous proposons dans cet article une solution
pour répondre à certains problèmes décisionnels s’appuyant sur des sources hétérogènes de
l’environnement géographique ; une solution basée sur un modèle adapté à la multi-représentation des données géographiques et ce, en proposant une extension à GML. Cette extension permet à notre modèle d’être générique, en ce sens qu’il est destiné à unifier l’hétérogénéité des
représentations des données spatio-temporelles en vue de les intégrer dans une plate-forme
médiatrice entre ces données et des applications dédiées.
Mots-clés : modèle générique, données spatio-temporelles, GML étendu, multireprésentation.
1 Introduction
Vu la complexité des entités spatiales, plusieurs interprétations ou représentations d’une
entité peuvent être définies et maintenues par diverses applications. Il est donc nécessaire
de définir des modèles de données spatiales puissants pour permettre une gestion cohérente de plusieurs représentations des mêmes entités spatiales et la gestion d’objets spatiaux dynamiques. L’objectif de la multi-représentation est de stocker ces différentes
représentations potentielles d’un même phénomène dans une base de données unique.
Les modèles capables d’atteindre un tel objectif et d’assurer le maintien de plusieurs
représentations des mêmes données sont appelés des modèles multi-représentation [1].
Samya Sagar, Mohamed Ben Ahmed
« Une proposition d’extension de GML pour un modèle générique d’intégration de données spatio-temporelles hétérogènes »
Schedae, 2007, prépublication n° 46, (fascicule n° 2, p. 303-307).
304
Nous proposons dans cet article un modèle générique de données spatio-temporelles
qui soit adapté au stockage de représentation multiple des objets géographiques.
2 Travaux liés à la multi-représentation spatiale
Pour la gestion de la multi-représentation dans les bases de données spatiales, certaines
solutions ont été proposées, telles que :
– Solution à base de vue ; Dans les systèmes d’information géographique, la notion de
vue est étendue à la notion de vue spatiale pour permettre la représentation des données géographiques selon différents points de vue. La composante spatiale des éléments des vues spatiales doit être la même que celle des éléments de base dont la
vue est dérivée. Par conséquent, le mécanisme de vue spatiale n’est pas approprié si
la nouvelle représentation spatiale souhaitée n’est pas ‘copiable’d’une représentation
déjà connue [2]. Dans ce cas, la nouvelle représentation ne peut que s’ajouter à l’existante pour constituer une représentation de base ;
– Solution à base d’ontologie ; Les ontologies spatiales sont utilisées pour représenter à
un niveau d’abstraction élevé des concepts spatiaux en termes génériques [3, 4].
Comme pour la solution à base de vue, cette solution ne garantit pas la gestion efficace de la propagation efficace des mises à jour ;
– Solution à base de rôle : Le concept de rôle a été utilisé dans les bases de données
classiques pour modéliser les différents rôles, facettes ou aspects d’une entité [5].
Cette notion est très peu utilisée par la communauté des SIGs.
3 Description de la solution proposée
pour la multi-représentation spatiale
La solution, que nous proposons dans cet article, est une solution à base d’intégration.
L’intégration de plusieurs bases de données géographiques décrivant un même espace
géographique consiste à produire [6], une description unifiée des schémas des bases de
données d’origine (le schéma fédéré), des règles de traduction pour la migration des données et des liens entre différentes représentations d’objets qui modélisent les mêmes entités réelles (exemple : appariement géométrique). L’objectif est de rendre interopérable
des bases de données initialement indépendantes pour permettre une réutilisation des
données mémorisées dans chacune de ces bases de données. La base de données ainsi
construite par intégration peut être considéré comme une base de données multi-représentation. Le schéma fédéré décrit pour chaque entité réelle une représentation unifiée de
toutes ses représentations possibles.
Le modèle ainsi proposé est un modèle de représentation unique et générique pour
divers types de données géographiques et ce, en proposant en plus de la prise en compte
de la dynamique des données géo-référencées une quadruple flexibilité : une flexibilité
géographique, une flexibilité temporelle, une flexibilité sémantique et une flexibilité
graphiques.
4 Modèle générique : GML-étendu
Le modèle que nous proposons se base sur l’extension du standard GML pour prendre en
compte la multi-représentation. Nous allons ajouter à ce format les éléments qui nous semblent nécessaires pour le stockage de données spatio-temporelles avec leurs représentations multiples, à savoir ; la sémantique, la temporalité, la géométrique et le graphique. La
Schedae, 2007, prépublication n° 46, (fascicule n° 2, p. 303-307).
305
version de GML qui sera utilisée est la version 3.0 7]. Comme tout schéma d’application,
notre modèle utilise des classes prédéfinies de GML. Dans notre modèle nous introduisons
deux classes d’entités qui héritent de la classe AbstractFeatureCollection, illustrées dans la
figure 1. La première classe est la collection générique qui inclut toutes les autres entités
qu’on décrit dans notre modèle ; cette classe a été appelée country. La deuxième classe
est la classe geoObject, classe qui correspond dans notre modèle aux représentations des
objets géographiques du monde réel.
Il est une bonne pratique dans la création de schémas d’application en GML de
restreindre le type d’entités dont les instances peuvent être des membres d’une certaine
collection d’entités. Ainsi, un « filtre d’entités » sous forme d’une association est introduit
entre la classe country et la classe geoObject à l’aide de la classe d’association countryMember.
Fig. 1 : Filtre d’entités entre les classes contry et geoObject.
De même un filtre d’entités est ajouté pour relier les quatre classes ; semantic, graphic,
geometry et time, à la classe geoObject par une classe d’association qui est la classe
geoObjectMember. Cette relation est de type 1:1, ce qui veut dire que toute entité de la
classe geoObject est associée à exactement une entité de quatre entités : une à la classe
semantic, une à la classe graphic, une à la classe geometry et une à la classe Time. Les
classes semantic, graphic, geometry et time représentent respectivement les quatre volets
de la multi-représentation à savoir le volet sémantique, le volet graphique, le volet
Pour définir toutes les sémantiques attachées à un objet géographique dans le contexte d’une application donnée, nous avons introduit la classe category qui hérite de la
classe String. La sémantique d’un objet géographique est composée de toutes les catégories auxquelles cet objet peut s’attacher, d’où la relation de composition d’une multiplicité
de type un (1) à plusieurs (1…*).
La partie graphique de la représentation d’un objet géographique est composée de
tous les symboles qui peuvent être utilisés pour représenter graphiquement l’objet sur une
carte. D’où, l’introduction de la relation de composition entre la classe graphic et une
classe symbol, dérivée de la classe String, dont la multiplicité est de type un (1) à plusieurs
(1…*).
Schedae, 2006, prépublication n° 46, (fascicule n° 2, p. 303-307).
306
Pour la partie géométrique de la représentation d’un objet géographique, nous nous
sommes fortement inspiré du modèle MADS [8], qui permet de définir des types abstraits
spatiaux sous forme d’une hiérarchie composée de géométrie simple et de géométrie
complexe. D’où la relation de composition entre la classe geometry et les deux nouvelles
classes simpleGeometry et complexGeometry. La géométrie d’un objet géographique
doit obligatoirement être soit simple soit composée, pour cela nous ajoutons la contrainte
« une seule instance d’une classe parmi les deux doit être présente ». Dans notre modèle
nous avons défini les classes pointGeometry, lineGeometry et polyGeometry pour une
géométrie simple et, multiPointGeometry, multiLineGeometry et multiPolyGeometry pour
une géométrie complexe. Ces classes héritent toutes de la classe AbstractGeometry et
référent chacune à la propriété géométrique correspondante, prédéfinie en GML, c’est-àdire respectivement gml : PointProperty, gml : LineStringProperty, gml : PolygonProperty,
gml : MultiPointProperty, gml : MultiLineStringProperty et gml : MultiPolygonProperty.
Pour pouvoir définir l’aspect temporel dans notre modèle, nous nous sommes
appuyés aussi sur le modèle conceptuel MADS [8], qui offre une hiérarchie de types
abstraits temporels assez représentative. Nous introduisons deux classes qui permettent
de décrire les caractéristiques temporelles de données géographiques. Ces classes sont :
simpleTime et complexTime. La classe simpleTime permet de définir qu’un objet géographique peut être représenté dans un instant, classe instant, ou dans un intervalle, classe
interval. Les classes instant et interval référent chacune à la propriété temporelle correspondante, prédéfinie en GML, c’est-à-dire respectivement gml : TimeInstant et gml :
TimePeriod. La partie de temps complexe indique qu’un objet géographique peut exister
à des instants divers, classe instantset, et/ou à des intervalles divers, classe intervalset. Les
classes insant, interval, instantset, et intervalset héritent de la classe AbstractTime.
Les classes geometry, semantic, graphic, time, simpleGeometry, complexGeometry,
simpleTime et complexTime héritent à leur tour de la classe prédéfinie AbstractFeature.
5 Conclusion
Nous avons proposé, dans cet article, une extension du format GML pour prendre en
compte la multi-représentation des informations géographiques et ce à quatre niveaux ;
géométrique, temporel, sémantique et graphique. Ce modèle permettra ainsi de regrouper dans une même structure les différentes représentations d’un même objet géographique. Cette structure ajoutée au format d’échange GML permettra à notre intergiciel,
proposé dans [9], de jouer pleinement son rôle de médiateur entre les diverses hétérogénéités informationnelles et applicatives, augmentant par là même la capacité des organisations à partager l’information géographique.
6 Références
[1] S. Spaccapietra, C. Parent, C. Vangenot, GIS Databases : Frome Multiscale to MultiRepresentation,
Proceeding of the International Workshop on Emerging technologies for Geo-Based Applications,
May 22-25 2000, Ascona, Switzerland, EPFL-DI-LBD Publisher.
[2] C. Vangenot, Représentation multi-résolution, Concepts pour la description de bases de données
avec multi-représentation, Les nouveaux usages de l’information géographique, Actes des
Journées Cassini 1998, Revue Internationale de Géomatique, Vol. 8, N˚ 1-2/1998, pp. 121-147.
[3] F. T. Fonseca, M.J. Egenhofer, Ontology-Driven Geographic Information Systems, 7th. ACM
Symposium on Advances in Geographic information Systems, Kansas City, MO. C. Banzer
Medeiros (ed.), pp. 14-19, November 1999.
[4] D. Benslimane, E. Leclercq, M. Savonnet, M.N. Terrasse, K. Yétongnon, On the definition of generic
multi-layered ontologies for urban applications, International Journal of Computers, Environment
and Urban Systems, Volume 24, Elsevier Science Ltd, England, pp. 191-214, 2000.
Schedae, 2007, prépublication n° 46, (fascicule n° 2, p. 303-307).
307
[5] L. Qing, H. Frederick, Lochovski, ADOME : An Advanced Object Modeling Environment, IEEE
Transaction on knowledge and data engineering, vol. 10, NO. 2, pp. 255-276, 1998.
[6] T. Devogele, C. Parent, S. Spaccapietra, On Spatial data integration, International Journal of
Geographic Information Systems, V. 12, N˚ 4, pp. 335-352, 1998.
[7] Open GIS Consortium, Inc, Geography Markup Language (GML) Implementation. Specification,
version 3.0, 2003. http://www.opengis.org/docs/02-023r4.pdf
[8] C. Parent, S. Spaccapietra, E. Zimány, P. Domini, C. Plazanet, C. Vangenot, N. Rognon, P. Crausaz,
MADS : un modèle conceptuel spatio-temporelles, Revue Internationale de Geomatique, Vol. 7,
N˚3-4, 1997.
[9] S. Sagar, M. Ben Ahmed, Une plate-forme intergicielle d’aide à la décision basée sur l’analyse de
sources hétérogènes spatio-temporelles, In 7th Conference Internet & Information Systems in the
Digital Age (IBIMA), Brescia, ITALY ; 14 – 16 décembre 2006.
Schedae, 2006, prépublication n° 46, (fascicule n° 2, p. 303-307).
308
Schedae, 2007, prépublication n° 46, (fascicule n° 2, p. 303-307).
Téléchargement