Table des matières
II.3 Enjeux et objectifs de l’analyse du transcriptome..............................................................................41
II.4 L’importance de l’informatique pour l’analyse des données issues des puces à ADN......................42
II.5 Le principe du clustering des gènes....................................................................................................43
II.5.1 Les prérequis du clustering des gènes ...........................................................................................43
II.5.2 Etat de l’art des méthodes de clustering des gènes..........................................................................46
II .5.2.1 Les méthodes de classification hiérarchiques..........................................................................47
II.5.2.2 Les méthodes de classification par partitionnement.....................................................................49
II.5.2.3 Les méthodes de classification floues ..........................................................................................49
II.5.2.4La classification par les réseaux de Kohonen ...............................................................................50
II.5.2.5 Les méthodes de classification basées sur un modèle..................................................................50
II.5.2.6 Les méthodes de classification basées sur les graphes ................................................................51
II.5.2.7 Les méthodes de biclustering .......................................................................................................51
II.6 Les défis du clustering des gènes .......................................................................................................52
Chapitre III.Contribution1 : Préparation d’une plateforme pour la validation des
algorithmes de clustering.......................................................................................................... 53
III.1 Introduction.......................................................................................................................................54
III.2 Architécture fonctionnelle.................................................................................................................54
III.3 Le module du prétraitement ............................................................................................................55
III.4 Le module du clustering....................................................................................................................57
III.4.1 Le module du clustering hiérarchique............................................................................................57
III.4.2 Le module du clustering par partitionnement ................................................................................59
III.4.2.1 Les algorithmes des K moyenne .................................................................................................59
III.4.2.2 L’algorithme CLARA.................................................................................................................63
III.4.2.3 L’algorithme PAM......................................................................................................................66
III.4.2.4 L’algorithme QT .........................................................................................................................69
III.4.3 Le module du clustering par densité ..............................................................................................70
III.4.4 Le module du clustering flou .........................................................................................................71
III.4.4.1 L’algorithme Fuzzy c means.......................................................................................................71
III.4.4.2 L’algorithmeFuzzy c shell...........................................................................................................73
III.4.4.3 L’algorithme Fanny.....................................................................................................................74
III.5 Le module de validation du clustering..............................................................................................76
III.5.1 La validation interne ......................................................................................................................76
III.5.2 La validation externe......................................................................................................................80
III.5.3 La validation biologique ................................................................................................................81
III.5 Technologies et langages de programmation....................................................................................83