Table des matières
Résumé.......................................................................................................................................3
Publications en lien avec la thèse...............................................................................................4
Chapitre 1 : Introduction..........................................................................................................15
1.1 Données « omiques », puces à ADN.............................................................................16
1.1.1 Données « omiques ».............................................................................................16
1.1.2 Puces à ADN..........................................................................................................18
1.1.2.1 Puces spottées vs puces à oligonucléotides....................................................19
1.1.2.2 Puces à une couleur vs puces à deux couleurs...............................................20
1.1.2.3 Prétraitement des données..............................................................................21
1.1.3 Données biopuces utilisées....................................................................................22
1.2 Apprentissage automatique, méthodes de classification...............................................23
1.2.1 k plus proches voisins (kNN)................................................................................26
1.2.2 Analyse discriminante............................................................................................26
1.2.3 Machines à vecteurs de support (SVM).................................................................27
1.2.4 Réseaux de neurones artificiels.............................................................................29
1.2.5 Boosting.................................................................................................................31
1.2.6 Forêts aléatoires.....................................................................................................32
1.2.7 Estimation des performances du classifieur..........................................................33
1.3 Méthodes de sélection de variables...............................................................................33
1.3.1 Filtres univariés.....................................................................................................35
1.3.1.1 t-score.............................................................................................................35
1.3.1.2 Rapport signal sur bruit..................................................................................36
1.3.1.3 Information mutuelle......................................................................................36
1.3.2 Filtres multivariés..................................................................................................37
1.3.2.1 CAT-score.......................................................................................................37
1.3.2.2 ReliefF............................................................................................................38
1.3.2.3 Couverture de Markov...................................................................................39
1.3.3 SVM-RFE..............................................................................................................40
1.3.4 Évaluation de la méthode de sélection...................................................................41
Chapitre 2 : Analyse de la stabilité de la sélection de variables sur des données haute
dimension et petit échantillon..................................................................................................45
Abstract...............................................................................................................................46
2.1 Introduction...................................................................................................................46
2.2 Stability measures..........................................................................................................48
5