Atelier CIDN
Clustering incrémental et méthodes de détection de
nouveauté :
application à l'analyse intelligente d’informations évoluant au
cours du temps
Pascal CUXAC ; Jean-Charles LAMIREL
Atelier CIDN’11 :
Clustering incrémental et méthodes de détection de
nouveauté :
application à l'analyse intelligente d’informations évoluant au
cours du temps
Pascal CUXAC 1, Jean-Charles LAMIREL 2
1 INIST-CNRS, 2 allée du Parc de Brabois, CS 10310, 54519 Vandœuvre-lès-Nancy Cedex
2 LORIA-Equipe TALARIS, Campus Scientifique BP 239, 54506 Vandœuvre-lès-Nancy
1 Préface
Le développement de méthodes d'analyse dynamique de l'information, comme le
clustering incrémental et les méthodes de détection de nouveauté, devient une préoccupation
centrale dans un grand nombre d'applications dont le but principal est de traiter de larges
volumes d’information variant au cours du temps. Ces applications se rapportent à des
domaines très variés et hautement stratégiques, tels que l'exploration du Web et la recherche
d'information, l'analyse du comportement des utilisateurs et les systèmes de
recommandation, la veille technologique et scientifique, ou encore, l’analyse de l'information
génomique en bioinformatique. La majorité des méthodes d'apprentissage ont été
initialement définis d'une façon non incrémentale. Cependant, dans chacune des familles de
méthodes, ont été développées des variantes incrémentales permettant de prendre en compte
la composante temporelle d'un flux de données. D'une manière plus nérale les algorithmes
de clustering incrémental et les méthodes de détection de nouveauté sont soumis aux
contraintes suivantes :
Possibilité d'être appliqués sans connaître au préalable toutes les données à analyser ;
Prise en compte d'une nouvelle donnée sans faire un usage intensif des données déjà
prises en considération ;
Résultat disponible après l'insertion de toute nouvelle donnée ;
Les changements potentiels de l'espace de description des données doivent pouvoir être
pris en considération.
L'objectif de cet atelier est de réunir des chercheurs confirmés, ainsi que des jeunes
chercheurs, autour des problématiques et des applications du « clustering incrémental », et de
la « détection de nouveautés ».
Atelier CIDN
2 Principaux thèmes (liste non limitative)
Les algorithmes et techniques de détection de nouveauté ;
Les méthodes de classification incrémentales basées sur la densité ;
Les méthodes adaptatives de type K-means ou centres mobile ;
Les méthodes de classification hiérarchique adaptatives ;
Les méthodes neuronales adaptatives ;
Les approches probabilistes ;
Les méthodes de partitionnement et de classification incrémentale basées sur les
graphes attribués ;
Les approches basées sur l'intelligence en essaim et les algorithmes génétiques ;
Les méthodes de visualisation des résultats d’analyse de données évolutifs
3 Programme
3.1 Conférencier invité
Hatem HAMZA ; société ITESOFT.
Apprentissage incrémental dans l’industrie de l’analyse de documents :
problèmes et perspectives
3.2 Articles acceptés :
Génération de résumés de mise à jour : Utilisation d’un algorithme de
classification non supervisée pour détecter la nouveauté dans les articles de
presse
Aurélien Bossard
LIPN
AD-CLUST: Détection des Anomalies basée sur le Clustering
Imen Brahmi, Sadok Ben Yahia, Pascal Poncelet
Faculté des Sciences de Tunis, LIRMM
Score de Fisher et détection de courbes anormales dans une séquence à des fins
de diagnostic
Etienne Côme, Allou Samé, Patrice Aknin et Marc Antoni
INRETS, SNCF
Comportement comparatif des méthodes de clustering incrémentales et non
incrémentales sur les données textuelles hétérogénes
Raghvendra Mall, Mumtaz Ahmad, Jean-Charles Lamirel
CDE IIIT Hyderabad, CASSIS - Loria - INRIA, TALARIS - Loria - INRIA
Impact de la taille de l’ensemble d’apprentissage : une étude empirique
Christophe Salperwyck, Vincent Lemaire
Orange Labs, LIFL
Cuxac et al.
4 Summary
The development of dynamic information analysis methods, like incremental clustering and
novelty detection techniques, is becoming a central concern in a bunch of applications whose
main goal is to deal with information which is varying over time. These applications relate
themselves to very various and highly strategic domains, including web mining and adaptive
information retrieval, user behaviour analysis and recommendation systems, technological
and scientific survey, anomaly or intrusion detection, and even genomic information
analysis, in bioinformatics.
The goal of this workshop is to bring together researchers whose main topic is to work on
innovative and challenging incremental clustering and novelty detection approaches and on
their application to analysis of time varying information of various natures.
1 / 84 100%