Segmentation hiérarchique des cartes topologiques
Lebbah et al. (2007)).
Pour l’apprentissage des cartes topologiques, les critères de qualité sont plus difficiles à dé-
finir; ils s’articulent autour de l’interprétation des regroupements ou des partitions obtenues.
Par conséquent un premier problème se pose : celui de la segmentation (partitionnement) de la
carte. On retrouve dans la littérature plusieurs méthodes ou propositions de segmentation de la
carte qui utilisent des critères de similarité standard qui ne tiennent pas compte du voisinage
introduit par la carte, (Vesanto et Alhoniemi (2000)). Elles se résument, souvent, à l’utilisation
d’un algorithme de regroupement (classification hiérarchique ou les K-moyennes) combiné à
un indice de qualité pour déterminer la partition idéale. Le second problème qui nous intéresse
dans cet article est celui du choix de l’algorithme de segmentation de la carte. Ainsi, nous
avons introduit une nouvelle classification hiérarchique que l’on va appliquer sur les référents
(représentants) de la carte. Cette nouvelle méthode nommée AntTree introduite par (Azzag
et al.) s’inspire du comportement d’auto-assemblage observé chez une population de fourmis
réelles et leurs capacités à s’accrocher entre elles pour construire des structures vivantes.
La suite de notre article est organisée comme suit : dans la section 2, nous présentons les
principes généraux des cartes SOM avec la nouvelle mesure proposée, ainsi que la nouvelle
méthode de classification hiérarchique utilisée pour la segmentation de la carte topologique.
La section 3, quant à elle, est consacrée aux résultats et à l’étude comparative réalisée sur des
bases de données numériques. La dernière section rassemble les conclusions faites au cours
des expérimentations et présente des perspectives.
2 Segmentation topologique et hiérarchique
Les cartes auto-organisatrices présentées par Kohonen ont été utilisées pour la classification et
la visualisation des bases de données multidimensionnelles. Une grande variété d’algorithmes
des cartes topologiques est dérivée du premier modèle original proposé par Kohonen. Ces mo-
dèles sont différents les uns des autres, mais partagent la même idée de présenter les données
de grande dimension en une simple relation géométrique sur une topologie réduite.
Dans cette section, nous décrivons la version originale des cartes auto-organisatrices. Ce mo-
dèle consiste en la recherche d’une classification non supervisée d’une base d’apprentissage
A={zi∈ Rd, i = 1..N}où l’individu zi= (z1
i, z2
i, ..., zj
i, ...., zd
i)est de dimension d. Ce
modèle classique se présente sous forme d’une carte possédant un ordre topologique de Nc
cellules. Les cellules sont réparties aux nœuds d’un maillage. La prise en compte dans la carte
Cde la notion de proximité impose de définir une relation de voisinage topologique. Ainsi, la
topologie de la carte est définie à l’aide d’un graphe non orienté et la distance δ(c, r)entre
deux cellules cet rétant la longueur du chemin le plus court qui sépare les deux cellules c
et r. Afin de modéliser la notion d’influence d’une cellule rsur une cellule c, qui dépend de
leur proximité, on utilise une fonction noyau K(K ≥ 0et lim
|x|→∞ K(x) = 0). L’influence mu-
tuelle entre deux cellules cet rest donc définie par la fonction K(δ(c, r)). A chaque cellule c
de la grille est associée un vecteur référent wc= (w1
c, w2
c, ..., wj
c, ..., wd
c)de dimension d. Les
phases principales de l’algorithme d’apprentissage sont définies dans la littérature et consistent