Outils et connaissances pour l’évaluation de la cohérence
Connaissances implicites et explicites : les spécifications
Pour étudier la conformité des représentations, nous avons choisi d’utiliser les spécifications. Ces documents, qui
décrivent quels objets sont saisis dans la base et comment ils sont modélisés, constituent la référence pour juger si les
représentations sont normales ou non, et a fortiori, si les différences de représentations sont incohérentes ou équivalentes.
Bien que l’utilisation des spécifications semble assez naturelle, elle ne va pas sans poser un certain nombre de difficultés.
L’ensemble des contraintes décrites en langage naturel manque souvent d’exhaustivité et nécessite fréquemment une
interprétation. Par exemple, on trouve des descriptions du type : « les cours d’eau temporaires artificiels ou artificialisés sont
saisis en fonction de leur importance et de leur environnement », ou encore, « les petits bâtiments d’aspect précaire sont
exclus ». Ces descriptions suffisent aux opérateurs de saisie qui utilisent leurs connaissances et leur savoir-faire pour déterminer
les objets à sélectionner. Cependant, dans notre contexte d’intégration et d’automatisation, ces descriptions ne sont pas
toujours suffisamment adaptées. Ces règles ne sont pas assez formalisées. D’autre part, les spécifications présentes dans les
documents ne contiennent pas toute l’information nécessaire : il existe généralement des spécifications implicites qu’il est
nécessaire d’extraire des données pour mener à bien l’évaluation des différences.
L’apprentissage artificiel pour extraire les connaissances implicites
Nous avons décidé d’utiliser des techniques d’intelligence artificielle pour acquérir les connaissances implicites :
l’apprentissage automatique supervisé [MITCHELL 97], [SESTER 00] et [MUSTIÈRE 01].
Le problème d’apprentissage supervisé peut être défini de la manière suivante : étant donnée un ensemble
d’exemples (xi, yi), trouver une fonction de classification ou de prédiction telle que f (xi) soit comme yi. Les xi correspondent
aux observables. Les yi correspondent aux étiquettes ou classes des observables. La fonction f correspond au classifieur
à apprendre (figure B.6.2).
-
+
-
-
-
-
+
+
++
?
?
?
?
?
?
?
?
? ?
-
+
-
-
-
-
+
+
+ +
Apprentissage
Classement
par un expert
(xi, yi) = les exemples Y = f (x), le classifieu
i = les observables
figure B.6.2
Mise en œuvre d’un processus d’apprentissage artificiel supervisé :
classification interactive des observables, obtention des règles de classification par les algorithmes d’apprentissage.
Dans notre cas, l’apprentissage est donc envisagé pour extraire des critères de saisie implicites existant dans les
données. Comme nous le verrons par la suite, l’apprentissage peut également servir à produire des règles pour classer
directement les différences de représentation en terme d’incohérence ou d’équivalence [SHEEREN 04a].
Un système-expert pour manipuler automatiquement les connaissances
L’ensemble des connaissances issues des spécifications implicites et explicites est stocké dans un système-
expert [DAVID et al 93]. Ce type de système est particulièrement bien adapté à l’automatisation de notre processus car il
permet de gérer un grand nombre de règles de manière efficace. On peut ajouter, modifier ou éliminer des règles, sans pour
autant transformer les programmes qui les activent. Contrairement à une approche procédurale, les connaissances sont ici
séparées du moteur qui les manipule. Ceci leur confère une grande flexibilité et cette caractéristique est très utile dans
notre cas.
L’analyse spatiale pour extraire les informations implicites
Les connaissances présentes dans les spécifications font référence à des concepts géographiques qui ne sont
pas toujours explicitement représentés dans les BD. En plus de formaliser les spécifications, il est également nécessaire
d’extraire des informations souvent accessibles directement par une simple analyse visuelle des données, mais plus
difficile à obtenir automatiquement. C’est par exemple le cas des ronds-points dans certaines BD de l’IGN. Le concept de
rond-point est bien identifiable en regardant les données, mais dans la base, il correspond seulement à un ensemble d’arcs
et de nœuds connexes. Les propriétés géométriques des objets et les relations spatiales entre ceux-ci sont également
implicites.
72 Bulletin d’information scientifique et technique de l’IGN n° 75 (2006/1)