exemple pour les bases Iris et Wine. Les temps de convergence de l’automate sont inférieurs à 1s (en Java
sur PC P4 à 2.6 GHz). Une analyse des résultats en terme de pureté et de nombre de classes est en cours.
En conclusion, nous avons proposé un premier algorithme de classification utilisant les automates
cellulaires. Nous avons montré expérimentalement que cet algorithme est capable de regrouper de manière
pertinente des données de bases classiques. Il est de plus capable de produire une visualisation des
résultats et peut contribuer ainsi à la problématique de la fouille visuelle. Nous avons effectué une
spécialisation du modèle général présenté dans la section 2 : la fonction locale de transition utilise une
information globale (la liste L des données disponibles ainsi que le seuil Seuil(t)). Nous souhaitons
relâcher cette contrainte en autorisant des données à apparaître plusieurs fois sur la grille (classification
recouvrante) et en rendant le seuil de similarité local à chaque donnée (ce qui permettra à l’algorithme
d’être incrémental). Cet algorithme peut être comparé à un algorithme utilisant les fourmis artificielles
[LUM 1994]. Les points communs viennent du fait que les deux méthodes proposent en sortie une
classification des données sur une grille 2D en utilisant des probabilités locales. Cependant, les
heuristiques locales sont différentes. Une comparaison avec ce type d’algorithme est prévue ainsi que
d’étendre notre méthode pour la fouille visuelle des données. En particulier, nous envisageons d’utiliser
des techniques de zoom pour visualiser la grille et considérer que chaque donnée peut être une image.
5 Remerciement
Nous tenons à remercier David Ratsimba pour son aide dans l’implémentation de cet algorithme.
6 Références
[AZZ 2004] AZZAG H., PICAROUGNE F., GUINOT C., VENTURINI G., Un survol des algorithmes
biomimétiques pour la classification. Classification Et Fouille de Donnée, pages 13-24, RNTI-C-1,
Cépaduès. 2004.
[BLA 1998] BLAKE C.L., MERZ C.J., UCI Repository of machine learning databases.
http://www.ics.uci.edu/~mlearn/MLRepository.html]. Irvine, CA: University of California, Department
of Information and Computer Science. 1998.
[GAN 2003] GANGULY N., SIKDAR B. K., DEUTSCH A., CANRIGHT G., CHAUDHURI P. P., A
Survey on Cellular Automata. Technical Report Centre for High Performance Computing, Dresden
University of Technology, December 2003.
[GAR 1970] GARDNER M., Mathematical Games: The fantastic combinations of John Conway's new
solitaire game ‘life’. Scientific American, pages. 120-123, Octobre 1970.
[JAI 1999] JAIN A. K., MURTY M. N., FLYNN P. J., Data clustering: a review, ACM Computing
Surveys, 31(3), pages. 264-323, 1999.
[LUM 94] LUMER E., FAIETA B., Diversity and adaption in populations of clustering ants. In
Proceedings of the Third International Conference on Simulation of Adaptive Behaviour: From
Animals to Animats 3, pages 501-508. MIT Press, Cambridge, MA, 1994.
[NEU 1966] VON NEUMANN J., Theory of Self Reproducing Automata., University of Illinois Press,
Urbana Champaign, Illinois, 1966.