PROGRAMMATION D’UN ALGORITHME SERVANT AU LD
MAPPING
Ludovic DRUGBERT et Chang HE
06 mars 2012
Remerciements
Avant tout développement sur notre travail, nous souhaitons commencer ce rapport par des remerciements
et tenons à assurer de toute notre gratitude ceux qui nous ont aidés pour ce projet de deuxième année.
Mr. Christian LAFOREST, responsable ISIMA, pour nous avoir suivi tout au long de ces cinq mois, pour sa
disponibilité et pour l’organisation du rapport. Mr. François BALFOURIER, intervenant extérieur de l’INRA,
qui nous a proposé ce sujet et qui nous a donné les informations nécessaires pour le réaliser. Nous remercions
aussi Mr. Philippe Lacomme et Mr. Michel Gourgand qui nous ont apportés divers éléments pour ce projet.
Table des figures
1.1 Enoncé-Figure1............................................. 2
1.2 Enoncé-Figure2............................................. 3
1.3 Integrated Development Environment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1 Schéma des deux approches de résolutions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Données initiale - Fichier d’exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3 Tableau représentant les r2(DL) .................................... 8
2.4 Tableaureprésentantlesdelta...................................... 8
2.5 Graphedelta ............................................... 9
2.6 Graphedistance ............................................. 9
2.7 Schémarécapitulatif ........................................... 10
3.1 ExempleDijsktra............................................. 11
3.2 Dijsktra[2] ................................................ 12
3.3 InitialisationDijsktra[2]......................................... 12
3.4 Relachement[2].............................................. 12
3.5 Algorithme du Problème du voyageur de commerce [3] . . . . . . . . . . . . . . . . . . . . . . . . 13
3.6 Exemple 1 - Cycle hamiltonien sur une instance de 250 villes . . . . . . . . . . . . . . . . . . . . 13
3.7 Exemple 1 - Cycle hamiltonien sur une instance de 250 villes . . . . . . . . . . . . . . . . . . . . 14
3.8 Classementdedes250villes[1] .................................... 14
3.9 AlgorithmePRIM[2]........................................... 15
3.10Algorithmeparcourspréxe[9] ..................................... 18
3.11Exempleparcourspréxe ........................................ 18
3.12ExemplecycleHamiltonien ....................................... 19
3.13Exempleparcourspréxe ........................................ 19
3.14 Exemple d’une itération améliorante (1er Recherche Locale) . . . . . . . . . . . . . . . . . . . . . 21
3.15Algorithme2OPT[4]........................................... 22
3.16 Exemple d’une itération améliorante (2-OPT) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.17Algorithmedurecuitsimulé[6] ..................................... 23
3.18Algorithmegénétique........................................... 24
3.19 Schéma détaillé des étapes de l’algorithme génétique . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.20AlgorithmeCFCA ............................................ 27
4.1 Résultats des 3 approches sur une instance de 11 sommets . . . . . . . . . . . . . . . . . . . . . . 30
4.2 Résultats de l’algorithme du voyageur de commerce . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.3 Résultats de l’algorithme du voyageur de commerce (zoom) . . . . . . . . . . . . . . . . . . . . . 31
4.4 Résultats de l’algorithme du voyageur de commerce, q = 221 Marqueurs . . . . . . . . . . . . . . 32
4.5 Résultats de l’algorithme du voyageur de commerce, q = 294 Marqueurs . . . . . . . . . . . . . . 32
4.6 Résultats de l’algorithme du voyageur de commerce, q = 13 Marqueurs . . . . . . . . . . . . . . 33
4.7 Miseenévidencede2-OPT ....................................... 35
4.8 Convergencede2-OPT.......................................... 35
4.9 Convergence de l’algorithme génétique - Itération [1, 10] . . . . . . . . . . . . . . . . . . . . . . . 38
4.10 Convergence de l’algorithme génétique - Itération [2, 30000] . . . . . . . . . . . . . . . . . . . . . 38
4.11 Convergence de l’algorithme génétique - Itération [30000, 1000000] . . . . . . . . . . . . . . . . . 38
4.12Exempleborneinférieure ........................................ 39
4.13Exempleborneinférieure ........................................ 40
4.14 Borne inférieure sur les 23 jeux de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.15Exemple1-CFCA............................................ 41
4.16Exemple2-CFCA............................................ 41
Table des matières
1 Présentation 1
1.1 Introduction................................................ 1
1.1.1 Enoncé .............................................. 2
1.2 Vocabulaireetdénitions ........................................ 4
1.2.1 Théoriedesgraphes ....................................... 4
1.2.2 Biologie-Lagénomique..................................... 5
1.3 Integrated Development Environment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 Modélisation du problème 7
2.1 Formalisationduproblème........................................ 8
3 Mise en oeuvre des deux approches de résolution 11
3.1 Premièreméthode ............................................ 11
3.1.1 Pré-traitementdesdonnées ................................... 11
3.1.1.1 Dijsktra......................................... 11
3.1.2 Traitementdesdonnées ..................................... 12
3.1.2.1 Problème du voyageur de commerce . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.1.2.1.aPRIM...................................... 15
3.1.2.1.bParcourspréxe ................................ 18
3.1.2.1.cCycleHamiltonien............................... 19
3.1.2.2 Rechercheslocales................................... 20
3.1.2.2.a 1errecherchelocale ............................... 20
3.1.2.2.b2-OPT ..................................... 21
3.1.2.2.cRecuitSimulé.................................. 23
3.1.2.3 Algorithmegénétique ................................. 24
3.2 Deuxièmeméthode............................................ 27
3.2.1 AlgorithmeCFCA ........................................ 27
4 Résultats et Application 30
4.1 PremièreMéthode ............................................ 30
4.1.1 Probleme du voyageur de commerce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.1.2 Recherchelocales......................................... 34
4.1.2.1 1errecherchelocale................................... 34
4.1.2.2 2-OPT ......................................... 35
4.1.2.3 RecuitSimulé ..................................... 37
4.1.3 Algorithmegénétique ...................................... 38
4.1.3.1 Application LD Mapping . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.1.3.2 Utilisation de la borne inférieure . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.2 Deuxièmeméthode............................................ 41
4.2.1 AlgorithmeCFCA ........................................ 41
5 Défauts et Idées d’améliorations 42
6 Conclusion 43
Résumé et Abstract
Résumé
Durant ce projet de cinq mois, notre travail portait principalement sur la programmation d’une métaheuris-
tique pour ordonner des marqueurs génétiques le long d’un chromosome. Ce projet fait appel aux connaissances
en théorie des graphes, en structure de données, en programmation et en optimisation acquises à l’ISIMA de
Clermont Ferrand. Celui-ci nous a apporté de solides aptitudes à la programmation.
L’objectif de ce projet était d’ordonner des marqueurs génétiques le long d’un chromosome. Pour cela, nous
nous sommes basés sur le problème du voyageur de commerce qui semble être une bonne approche et sur des
métaheuristiques telles que l’algorithme génétique. Nous avons essayé une autre approche avec un autre algo-
rithme que nous avions conçu nous-mêmes, qui s’est avéré ne pas répondre à nos attentes.
Mots-clés : C, Borland C++, Optimisation, Linux, Windows, déséquilibre de liaison, coefficient de correlation,
maximisation, algorithme.
Abstract
During this five months, our work focused on the programming of a metaheuristic order for genetic markers
along a chromosome. This project uses the knowledge in graph theory, in data structure, programming and
optimization of acquired ISIMA Clermont Ferrand. This project has provided strong programming skills.
The objective of this project was to order genetic markers along a chromosome. For this we we are based
on the traveling salesman problem which appears to be a good approach and on metaheuristics such as the
genetic algorithm. We tried another approach with another algorithm that we designed ourselves, which turned
out to not meet our expectations.
Keywords : C, Borland C + +, Optimization, Linux, Windows, linkage disequilibrium, correlation coefficient,
maximization, algorithm.
1 / 49 100%