CGR de Calais ´
Ecole Doctorale Sciences pour l’Ing´enieur
Num´ero d’ordre :
TH`
ESE
pr´esent´ee et soutenue publiquement le 08 d´ecembre 2011
pour l’obtention du grade de
Docteur de l’Universit´e du Littoral Cˆote d’Opale
(Discipline : Traitement du Signal et des Images)
par
Guillaume WACQUET
Titre :
Classification spectrale
semi-supervis´ee. Application `a la
surveillance de l´ecosyst`eme marin
Composition du jury
Rapporteurs : St´ephane Canu
Professeur `a l’Institut National des Sciences Appliqu´ees de Rouen
Fadi Dornaika
Ikerbasque Research Professor, Universidad del Pais Vasco, San Sebastian, Espagne
Examinateurs : Sylvie Thiria
Professeur `a l’Universit´e de Versailles Saint-Quentin-en-Yvelines
G´erard Govaert
Professeur `a l’Universit´e de Technologie de Compi`egne
Luis Felipe Artigas
Maˆıtre de Conf´erences `a l’Universit´e du Littoral Cˆote d’Opale
Encadrante : ´
Emilie Caillault Poisson
Maˆıtre de Conf´erences `a l’Universit´e du Littoral Cˆote d’Opale
Directeur de Th`ese : Denis Hamad
Professeur `a l’Universit´e du Littoral Cˆote d’Opale
Laboratoire d’Informatique, Signal et Image de la Cˆote d’Opale – EA 4491
Maison de la Recherche Blaise Pascal – Centre Universitaire de la Mi-Voix
50 rue Ferdinand Buisson – B.P. 719, 62228 Calais Cedex, France
Table des matières
Glossaire 1
Introduction générale 3
1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Organisation de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Contributions de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Chapitre 1 - Représentation des connaissances et contextes de classification 9
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Représentation numérique des données . . . . . . . . . . . . . . . . . . . . . . 9
1.2.1 Représentation des données sous forme de matrices . . . . . . . . . . . 10
1.2.2 Mesures de comparaison entre paires d’objets . . . . . . . . . . . . . . 11
1.2.3 Graphes et caractéristiques . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3 Représentation contextuelle des connaissances . . . . . . . . . . . . . . . . . . 21
1.3.1 Contexte non supervisé . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.3.2 Contexte supervisé . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.3.3 Contexte semi-supervisé . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Chapitre 2 - Graphes et algorithmes de classification spectrale 33
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2 Théorie spectrale des graphes . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.2.1 Matrices Laplaciennes des graphes . . . . . . . . . . . . . . . . . . . . 35
2.2.2 Bi-coupe de graphe (K=2) ....................... 37
2.2.3 K-coupe de graphe (K>2)........................ 41
2.3 Algorithmes de classification spectrale . . . . . . . . . . . . . . . . . . . . . . 42
2.3.1 Algorithmes de bi-partition (K=2) . . . . . . . . . . . . . . . . . . . 43
i
Table des matières
2.3.2 Algorithmes de K-partitions (K>2)................... 47
2.4 Ajustement des paramètres des algorithmes spectraux . . . . . . . . . . . . . . 54
2.4.1 Réglage du paramètre de dispersion σde la matrice de similarités . . . 54
2.4.2 Estimation du nombre de groupes recherchés . . . . . . . . . . . . . . 55
2.4.3 Choix de l’algorithme pour l’étape de partitionnement . . . . . . . . . 60
2.4.4 Métriques d’évaluation du partitionnement . . . . . . . . . . . . . . . 61
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Chapitre 3 - Approches spectrales semi supervisées contraintes 65
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.2 Processus de génération des ensembles de contraintes . . . . . . . . . . . . . . 67
3.2.1 Génération aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.2.2 Caractérisation des contraintes . . . . . . . . . . . . . . . . . . . . . . 68
3.3 Recherche d’espace de projection sous contraintes . . . . . . . . . . . . . . . . 71
3.3.1 Analyse contrainte en composantes principales . . . . . . . . . . . . . 72
3.3.2 Projection contrainte préservant la structure locale . . . . . . . . . . . 75
3.4 Classification spectrale contrainte par modification de la matrice de similarités . 77
3.4.1 Intégration des contraintes par ajout de noeuds . . . . . . . . . . . . . 78
3.4.2 Modification directe des valeurs de similarités . . . . . . . . . . . . . . 82
3.5 Classification spectrale contrainte par optimisation sous conditions . . . . . . . 85
3.5.1 Classification par projection spectrale sous contraintes . . . . . . . . . 85
3.5.2 Classification spectrale contrainte et flexible . . . . . . . . . . . . . . . 88
3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Chapitre 4 - Classification spectrale multi-groupes semi-supervisée 95
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.2 Algorithme de classification spectrale semi-supervisée proposé . . . . . . . . . 96
4.2.1 Pondération de la contribution des contraintes . . . . . . . . . . . . . . 96
4.2.2 Critère de coupes multiples normali contraint . . . . . . . . . . . . . 97
4.2.3 Réglage des contributions de la coupe normalisée et des contraintes . . 98
4.2.4 Solution retenue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.2.5 Pondération des contributions ”Must-Link” et ”Cannot-Link” . . . . . 99
4.2.6 Discussions vis-à-vis des méthodes de la littérature . . . . . . . . . . . 101
4.3 Résultats expérimentaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.3.1 Algorithmes proposés pour la comparaison . . . . . . . . . . . . . . . 102
ii
Table des matières
4.3.2 Exemple illustratif . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.3.3 Application aux bases de données UCI . . . . . . . . . . . . . . . . . 106
4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Chapitre 5 - Caractérisation des cellules phytoplanctoniques d’un échantillon de
culture 117
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.2 La cytométrie et les signaux disponibles . . . . . . . . . . . . . . . . . . . . . 118
5.2.1 La cytométrie en flux . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.2.2 Logiciels de visualisation et d’étiquetage . . . . . . . . . . . . . . . . 121
5.2.3 Variabilité des données cytométriques du phytoplancton . . . . . . . . 122
5.3 Construction de la base de données . . . . . . . . . . . . . . . . . . . . . . . . 127
5.3.1 Composition de la base utilisée . . . . . . . . . . . . . . . . . . . . . 127
5.3.2 Base de données ”attributs” . . . . . . . . . . . . . . . . . . . . . . . 128
5.3.3 Base de données ”similarités” (ou données brutes) . . . . . . . . . . . 128
5.4 Expérimentations sur la base ”attributs” . . . . . . . . . . . . . . . . . . . . . 132
5.4.1 Visualisations planes . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.4.2 Classification supervisée . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.4.3 Classification semi-supervisée avec contraintes . . . . . . . . . . . . . 135
5.5 Expérimentations sur la base ”similarités” . . . . . . . . . . . . . . . . . . . . 137
5.5.1 Visualisation par projection dans l’espace spectral non contraint . . . . 137
5.5.2 Classification supervisée . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.5.3 Classification semi-supervisée avec contraintes . . . . . . . . . . . . . 140
5.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
Chapitre 6 - Recherche de groupes de cellules phytoplanctoniques dans un échantillon
marin 147
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
6.2 Démarche experte d’analyse des données . . . . . . . . . . . . . . . . . . . . 148
6.3 Expérimentations sur la base ”attributs” . . . . . . . . . . . . . . . . . . . . . 149
6.3.1 Visualisations planes par ACP et LPP . . . . . . . . . . . . . . . . . . 150
6.3.2 Estimation automatique du nombre de groupes . . . . . . . . . . . . . 151
6.3.3 Classification non supervisée . . . . . . . . . . . . . . . . . . . . . . . 153
6.3.4 Classification semi-supervisée avec contraintes . . . . . . . . . . . . . 158
6.4 Expérimentations sur la base ”similarités” . . . . . . . . . . . . . . . . . . . . 162
iii
1 / 225 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !