PRÉFACE
La sélection d’articles publiés dans le présent recueil constitue les actes des sixièmes jour-
nées Extraction et Gestion des Connaissances (EGC’2006) qui se sont tenues à Lille du 17 au
20 janvier 2006.
Les conférences EGC ambitionnent de regrouper chercheurs, industriels et utilisateurs
francophones issus des communautés Bases de Données, Apprentissage, Représentation des
Connaissances, Gestion de Connaissances, Statistique et Fouille de données. Aujourd’hui, de
grandes masses de données structurées ou semi-structurées sont accessibles dans les bases de
données d’entreprises, d’administrations ainsi que sur la toile. Aussi les entreprises et admi-
nistrations ont-elles besoin de méthodes et d’outils capables de les acquérir, de les stocker,
de les représenter, de les indexer, de les intégrer, de les classifier, d’extraire les connaissances
pertinentes pour les décideurs et de les visualiser. Pour répondre à cette attente, de nombreux
projets de recherche se développent autour de l’extraction de connaissances à partir de don-
nées (Knowledge Discovery in Data), ainsi que sur la gestion de connaissances (Knowledge
Management). Les articles réunis dans ce numéro spécial de RNTI rendent compte des déve-
loppements les plus récents dans les multiples disciplines concernées par cette double problé-
matiques, ainsi que du déploiement de méthodes d’extraction et de gestion des connaissances
par des spécialistes d’entreprises.
En particulier on constate dans les travaux rapportés ici une place grandissante accordée
aux formes diverses que peuvent prendre tant les données que les connaissances et à la néces-
sité de structurer les informations pour mieux les appréhender. Ainsi, les données considérées
vont de données numériques classiques aux données symboliques, au multi-média, des images
aux textes, de données statiques aux séquences et flots dynamiques. Les connaissances s’ex-
priment quant à elles en termes de structure, de sémantique, d’ontologies, de règles, etc. On
constate également que, dans le processus de gestion, les connaissances extraites deviennent
à leur tour des données qu’il s’agit de maîtriser et d’exploiter efficacement pour l’action et la
prise de décisions. On relève également l’émergence de nouveaux domaines d’application qui
de la gestion d’entreprise, des télécommunications ou du biomédical s’étendent aux domaine
juridique, au domaine social, à la chimie, aux sciences du vivant, au contrôle de l’environne-
ment et du territoire, ou encore à la gestion industrielle pour n’en citer que quelques uns.
Les articles sont regroupés en chapitres. Les regroupements ont été faits soit selon la pro-
blématique abordée (gestion des connaissances, indexation, ontologies, sémantique, apprentis-
sage, règles d’association, visualisation) ou selon le type de données considérées (complexes
et/ou volumineuses, séquences, textes). Un chapitre est plus spécifiquement consacré aux ap-
plications, et un autre rend compte des logiciels démontrés pendant les journées. En raison
de la forte interrelation entre les thèmes, les regroupements comprennent cependant une part
d’arbitraire, la plupart des articles ayant leur place dans plusieurs chapitres.
Le recueil inclut également les résumés des conférences des invités prestigieux que sont
Heikki Mannila, l’un des pères de l’extraction de motifs fréquents, Gilbert Saporta statisticien
mondialement connu et expert de l’apprentissage statistique et Michael Ley le fondateur du
célèbre site de référence bibliographique DBLP.
v