Centres de gravit´e
# classes classes Math Sci Fra Lat Gym
2 classes {Jean, Alain, Andr´e, Anne, Pierre}7.30 7.60 8.70 8.30 10.20
W = 28.19 {Evelyne, Brigitte, Didier, Monique}12.63 12.63 12.13 12.25 12.00
3 classes {Jean, Alain, Andr´e}8.33 8.00 6.17 6.83 10.00
W = 16.81 {Anne, Pierre, Evelyne}6.83 7.83 12.50 11.00 13.00
{Brigitte, Didier, Monique}13.83 13.67 12.00 12.33 10.00
4 classes {Jean, Alain}7.00 7.00 6.50 6.75 8.50
W = 10.47 {Anne, Pierre, Evelyne}6.83 7.83 12.50 11.00 13.00
{Andr´e, Brigitte}12.00 11.25 7.00 8.25 12.50
{Didier, Monique}14.25 14.25 13.75 13.75 9.00
Tableau 2: Partitions en 2, 3 et 4 classes – Tableau des notes scolaires
de l’arbre hi´erarchique au niveau o`u on trouve 2, 3 ou 4 classes, selon le cas). On peut voir ces r´esultats
comparatifs dans [11].
Les r´esultats de l’algorithme sur deux autres exemples, les poissons d’Amiard et la sociomatrice de
Thomas (voir [2]), sont montr´es dans le tableau 3.
Poissons d’Amiard Sociomatrice de Thomas
# classes RS RT AG MND CAH RS RT AG MND CAH
3 classes 32213 32213 32213 32213 33149 271.83 271.83 272.98 271.83 279.33
4 classes 18281 18281 22456 28058 19589 235.03 235.03 250.76 241.00 239.37
5 classes 14497 14497 20474 14497 14497 202.58 202.35 223.78 202.23 204.67
Tableau 3: R´esultats de Wpour le recuit simul´e (RS), la recherche tabou (RT), l’algorithme g´en´etique
(AG), la m´ethode des nu´ees dynamiques (MND) et la classification hi´erarchique selon Ward (CAH)
On peut voir que les r´esultats sont les mˆemes pour le recuit simul´e et pour la recherche tabou, et que
ceux–ci sont sup´erieurs `a ceux de l’algorithme g´en´etique. Cependant, sur le tableau des Iris de Fisher,
on obtient des r´esultats sup´erieures pour le recuit simul´e par rapport `a la recherche tabou.
5 Conclusions
Nous avons d´evelopp´e un algorithme de classification automatique par partitions, en utilisant la technique
du recuit simul´e. On a obtenu de tr`es bons r´esultats sur plusieurs tableaux de donn´ees; ces r´esultats sont
comparables ou sup´erieurs en temps et en qualit´e avec ceux obtenus par les m´ethodes classiques.
Notre algorithme cherche des partitions sous–optimales tr`es proches de la partition optimale globale,
dans un temps et un espace de taille polynomiale. Jusqu’`a pr´esent, nous n’avons pas trouv´e un ensemble
de donn´ees tel que les m´ethodes traditionnelles trouvent de meilleurs r´esultats que notre algorithme.
D’autre part, les r´esultats obtenus avec le recuit simul´e sont meilleurs ou ´egaux `a ceux obtenus avec
un algorithme g´en´etique [11] ou la recherche tabou [6].
R´ef´erences
[1] Aarts, E.; Korst, J. (1990) Simulated Annealing and Boltzmann Machines. John Wiley & Sons, Chichester.
[2] Cailliez, F.; Pag`es, J.P. (1976) Introduction `a l’Analyse des Donn´ees. SMASH, Paris.
[3] Celeux, G.; Govaert, G. (1991) “A classification EM algorithm for clustering and two stochastic versions”, Rapport de
Recherche No. 1364, INRIA-Rocquencourt, Le Chesnay.
[4] Diday, E.; Lemaire, J.; Pouget, J.; Testu, F. (1982) El´ements d’Analyse de Donn´ees. Dunod, Paris.
[5] Kirkpatrick, S.; Gelatt, D.; Vecchi, M.P. (1983) “Optimization by simulated annealing”, Science 220, 671-680.
[6] Murillo, A.; Trejos, J. (1996) “Classification tabou bas´ee en transferts”, communication propos´ee aux IV Journ´ees de
la Soci´et´e Francophone de Classification, Vannes.
[7] Piza, E.; Trejos, J.; Murillo, A. (1994–1996) Clasificaci´on Autom´atica: Particiones Utilizando Algoritmos Gen´eticos
y de Sobrecalentamiento Simulado. Informes de Investigaci´on PI-114-94-228, Universidad de Costa Rica, San Pedro.
[8] R´egnier, S. (1965) “Sur quelques aspects math´ematiques des probl`emes de la classification automatique”, I.C.C. Bull.,
Vol. 4, pp. 175–191.
[9] Schektman, Y. (1988) Analyse et Traitement Informatique de Donn´ees. Cours de D.E.A., Universit´e Paul Sabatier.