730 RSTI-RIA-ECA – 16/2002. Optimisation pour ECA
1. Introduction
De nombreux algorithmes de classification utilisent des principes inspirés de la
biologie. Par exemple, les algorithmes génétiques ont été appliqués à la classification
en utilisant différents codages [CUC 93, LAS 91, JON 91, FAL 94]. Un individu code
alors le regroupementdes donnéesenclasses, et cetindividu évolue selonles principes
de sélection, de recombinaison et de mutation modélisés à partir de la théorie du Dar-
winisme. De même, les algorithmes à base de population de fourmis artificielles ont
modélisé la manière dont ces insectes sont capables d’organiser des objets en groupes
selon leur similarité [LUM 94, KUN 97, MON 99]. Ils résolvent ainsi un problème de
partitionnement en utilisant des heuristiques particulières qui diffèrent notamment des
opérateurs de croisement et de mutation utilisés dans les approches évolutionnaires.
L’intérêt de ces algorithmes biomimétiques est qu’ils effectuent un regroupement de
manière distribuée et donc sans contrôle central. Ils ne nécessitent généralement pas
de classification initiale des données ni même d’un nombre de classes connu a priori,
comme c’est le cas par exemple pour l’algorithme des centres mobiles (k-means). Ils
peuvent généralement traiter aussi bien des données numériques que symboliques, et
posséder un fonctionnement incrémental. Il existe encore d’autres algorithmes inspi-
rés de systèmes biologiques mais qui n’ont pas encore été appliqués et testés sur des
problèmes de classification. On peut citer par exemple les réseaux immunitaires, les
automates cellulaires ou encore les nuages d’animaux volants ou nageants.
Cette étude se concentre sur ce dernier modèle qui s’inspire du comportement
observé chez certains animaux ayant un comportement social pour le déplacement.
Chaque individu réagit à des règles, souvent identiques à toute la population, qui ne
prennent en compte que le voisinage immédiat de l’individu qui ne peut pas perce-
voir l’ensemble du nuage. À partir du déplacement local de l’individu, des formes
complexes pour le nuage d’animaux vont pouvoir apparaître, formes qui dépassent le
cadre de la règle locale. Cette propriété d’émergence est recherchéedans de nombreux
problèmes d’informatique puisqu’elle va notamment permettre à la fois une paralléli-
sation décentralisée et massive de l’algorithme avec des comportements élémentaires
simples tout en obtenant globalement un résultat complexe. Dans le domaine de la
classification, la manière dont les principes des nuages d’animaux volants vont être
utilisés peut être décrite intuitivement de la façon suivante : chaque individu va re-
présenter une donnée. Les individus vont être placés dans un environnement 2D ou
3D et sont caractérisés par trois éléments : leurs coordonnées dans l’environnement,
leurs vecteurs vitesse et des règles comportementales pour gérer les déplacements.
Ces règles sont communes à tous les individus et utilisent le voisinage local d’un
insecte pour décider de changer le vecteur vitesse. Elles vont prendre en compte la
similarité des données portées par les insectes afin de former des nuages de données
homogènes. Autrement dit, la proximité des insectes, à la fois en termes de position
et de vitesse dans l’espace des déplacements 2D ou 3D, va correspondre à la simila-
rité des données dans leur espace de description multidimensionnel. Non seulement
ce type d’algorithmes va pouvoir classer efficacement, comme mentionné précédem-
ment, des données numériques ou symboliques sans connaissances initiales, mais en