![](//s1.studylibfr.com/store/data-gzf/680cb056c275e089fea2e64a6a2bf216/1/000332155.htmlex.zip/bg5.jpg)
GA|PM
- 6 -
On tire au hasard 4 nouvelles chaînes parmi les existantes en tenant compte de la valeur de
répartition. On obtient, par exemple : 13, 24, 24 et 19.
On prend les individus 2 par 2. On coupe les chromosomes à une position aléatoire et on
croise les parties coupées :
13 :0110||1 01100=12 24 :11||000 11011=27
24 :1100||0 11001=21 19 :10||011 10111=16
On opère par tirage aléatoire à partir d’une probabilité de mutation définie initialement. On
prend ici 0,05 donc sur les 20 bits des 4 chromosomes, on suppose qu’un seul allèle a été
sélectionné et mute.12 :01100 => 01000 =8
8, 21, 27, 16.
Si on somme les performances, on obtient 1490 au lieu de 1170 à la génération précédente.
Domaines :
Les algorithmes génétiques ont été largement utilisés dans le cadre de l’extraction de
connaissances.
On les retrouve dans toutes les tâches principales. Leur application en sélection d’attributs a surtout été
réalisée en optimisation mono-objectif à l’aide de méthodes enveloppantes notamment avec le
classifier K-Nearest-Neighbor, avec un réseau de neurones ou avec des tables de décisions
euclidiennes. En optimisation multi-objectif, les travaux sont plus rares. Leur application à la sélection
d’attributs pour le clustering est relativement peu fréquente.
Les algorithmes génétiques sont régulièrement utilisés pour réaliser une tâche de clustering. Les
Différents algorithmes proposés diffèrent aussi bien par l’approche de clustering utilisée que par
leur application à des données réelles. Ainsi il existe des travaux ayant comme approche la méthode
des médusoïdes, la méthode des Kmeans , ou une approche hiérarchique. Les applications sont
diversifiées : données spatiales, données d’expression génique et de données de biopuces.
Avantages et inconvénients :
D’abord, les algorithmes génétiques sont coûteux en temps de calcul, puisqu’ils manipulent
plusieurs solutions simultanément. C’est le calcul de la fonction de performance qui est le plus
pénalisant, et on optimise généralement l’algorithme de façon à éviter d’évaluer trop souvent cette
fonction.
Ensuite, l’ajustement d’un algorithme génétique est délicat. L’un des problèmes les plus
caractéristiques est celui de la dérive génétique, qui fait qu’un bon individu se met, en l’espace de
quelques générations, à envahir toute la population. On parle dans ce cas de convergence prématurée,
qui revient à lancer à une recherche locale autour d’un minimum… qui n’est pas forcément l’optimum
attendu. Les méthodes de sélection proportionnelle peuvent en particulier favoriser ce genre de dérive.
Un autre problème surgit lorsque les différents individus se mettent à avoir des performances
similaires : les bons éléments ne sont alors plus sélectionnés, et l’algorithme ne progresse plus.
Le choix d’une représentation « intelligente » pour permettre un remplacement générationnel
efficace est un autre aspect de la question, et l’efficacité d’un algorithme génétique dépend beaucoup
de la façon dont on opère le croisement des individus. Ainsi, dans le cas du problème du voyageur de
commerce, on peut envisager d’apparier selon la méthode des coupures, telles que nous l’avons vu
plus haut. Considérons les deux tournées suivantes, et opérons une coupure entre la troisième et la
quatrième ville, puis inversons les gènes :