d’extraire des motifs séquentiels de faible support, approche multi agent pour améliorer
la classification et enfin approche RàPC pour la classification.
– Pré-traitement d’objets complexes : il est à noter cette année de nombreux articles sur
la prise en compte de connaissances hétérogènes, de connaissances voire d’ontologies
dans la constitution d’entrepots de données, dans le pré-traitement en vue de faciliter la
fouille de données ainsi que l’interpétation des résultats.
Une discussion sur cette troisième édition de l’atelier est prévue en fin de journée.
2 Quelques mots sur la fouille de données complexes
Dans tous les domaines, les données à traiter pour y extraire de la connaissance utilisable
sont de plus en plus complexes et volumineuses. Ainsi est-on amené à devoir manipuler des
données : Souvent peu ou non structurées; Issues de plusieurs sources comme des capteurs
ou sources physiques d’informations variées; Représentant la même information à des dates
différentes; Regroupant différents types d’informations (images, textes, video, son,...); ou re-
groupant encore des données de différentes natures (logs, contenu de documents, connais-
sances/ontologies, etc.). Aussi la fouille de données complexes ne doit plus être considérée
comme un processus isolé mais davantage comme une des étapes du processus plus général
d’extraction de connaissances à partir de données (ECD). En effet, les difficultés liées à la com-
plexité des données se répercutent sur toutes les étapes du processus d’ECD : avant d’appliquer
des techniques de fouille dans les données complexes, ces dernières nécessitent un travail pré-
paratoire (principalement de structuration et d’organisation de ces données complexes). Paral-
lèlement, de nouvelles méthodes de fouille (classification, catégorisation, recherche de motifs
fréquents, etc.) doivent également être définies dans ce contexte de la complexité des don-
nées. Enfin la notion d’utilité des paradigmes extraits (anticiper la pertinence des résultats de
la fouille) est également un problème à étudier.
Les thèmes liés à la fouille de données complexes peuvent donc comprendre :
– Pré-traitement, structuration et organisation de données complexes;
– Données inférées, Modélisation guidée par les résultats,
– Enrichissement des données, Sélection, nettoyage des données, codage, transforma-
tion des données, ETL (Extracting, Transforming and Loading);
– Cubes de données pour la fouille des données;
– OLAP et fouille de données;
– Intégration des données complexes;
– Modélisation des données complexes et XML;
– Métadonnées;
– Espaces de représentation des données complexes;
– Fusion de données;
– Processus et méthodes de fouille de données complexes;
– Evaluation des méthodes actuelles;
– Proposition d’approches nouvelles (par exemple hybrides ou multi-stratégies);
– Sélection de sources des données et d’attributs;
– Utilisation de relations spatiales ou temporelles entre les données;
– Utilisation de connaissances du domaine pour optimiser l’extraction;