Apprentissage à partir de données et de connaissances incertaines

Par Nicolas SUTTON-CHARANI
Thèse présentée
pour l’obtention du grade
de Docteur de l’UTC
Apprentissage à partir de données et de
connaissances incertaines : application à la prédiction
de la qualité du caoutchouc
Soutenue le 28 mai 2014
Spécialité : Technologies de l’Information et des Systèmes
D1835
Apprentissage à partir de données et de
connaissances incertaines.
Application à la prédiction de la qualité
du caoutchouc
Nicolas SUTTON-CHARANI
Thèse soutenue le 28 Mai 2014 devant le jury composé de :
Président :
Yves GRANDVALET
Directeur de Recherche
Univ. de Technologie de Compiègne
Rapporteurs :
Didier DUBOIS Arnaud MARTIN
Directeur de Recherche CNRS Professeur
Univ. Paul Sabatier Univ. de Rennes 1
Examinateurs :
Jérôme SAINTE BEUVE Mathieu SERRURIER Tristan MARY-HUARD
Chargé de Recherche Maître de Confèrences Chargé de Recherche
INRA SupAgro Univ. Paul Sabatier INRA AgroParis Tech
Eric GOHET Brigitte CHARNOMORDIC
Chargé de Recherche Ingénieur de Recherche
CIRAD INRA
Directeurs de Thèse :
Thierry DENOEUX Sébastien DESTERCKE
Professeur Chargé de Recherche
Univ. de Technologie de Compiègne Univ. de Technologie de Compiègne
Université de Technologie de Compiègne
Laboratoire Heudiasyc UMR CNRS 7253
28 Mai 2014
Table des matières
Préface ix
Remerciements .................................... ix
Résumé français de la thèse .............................xiii
Résumé anglais de la thèse ............................. xiv
Publications durant le doctorat ........................... xiv
Introduction générale 3
I. Incertitude et prédiction 5
1. Incertitudes 7
1.1. Introduction ................................... 7
1.1.1. Types d’incertitude .......................... 8
1.1.2. Identification des différentes incertitudes dans ce travail .... 10
1.2. Théories de l’incertain ............................. 11
1.2.1. Théorie des probabilités ....................... 11
1.2.2. Théorie des possibilités ........................ 16
1.2.3. Théorie des probabilités imprécises ................ 20
2. Théorie des fonctions de croyance 25
2.1. Généralités ................................... 26
2.2. Définitions et propriétés de base ....................... 27
2.3. Interprétations ................................. 34
2.3.1. Fonction multi-valuée ......................... 34
2.3.2. Modèle des Croyances Transférables (MCT )........... 35
2.4. Vraisemblance crédibiliste .......................... 38
2.4.1. Etude du comportement de l’estimateur du maximum de vrai-
semblance crédibiliste (EMV C ) sur des exemples simples . . . 40
2.5. Aspects philosophiques et pratiques ..................... 50
3. Algorithmes E M et E2M53
3.1. Algorithme E M ................................. 54
3.2. Extension crédibiliste : l’algorithme E2M.................. 55
v
Table des matières
II. Incertitude et arbres de décision 59
4. Arbres de décision 61
4.1. Cadre général, définitions ........................... 61
4.2. Historique .................................... 64
4.3. Construction .................................. 65
4.4. Elagage ..................................... 67
4.5. Forêts aléatoires ................................ 68
5. Modélisations de l’incertitude dans différentes méthodologies d’arbres
de décision 69
5.1. Approches probabilistes ............................ 70
5.1.1. Décomposition des exemples d’apprentissage dans l’arbre : Tsang
et al. ................................... 70
5.1.2. Méthodologie Périnel ......................... 71
5.2. Approches probabilités imprécises ...................... 72
5.3. Approches floues ................................ 73
5.3.1. FID de Janikow ............................ 74
5.3.2. Soft Decision Trees de Olaru et Wehenkel ............. 75
5.4. Approches possibilistes ............................ 75
5.5. Approches crédibilistes ............................ 76
5.6. Bilan ....................................... 80
6. Extension de la méthodologie Skarstein-Bjanger et Denoeux (SBD) au cas
multi-classes 83
6.1. Combinaison de classifieurs binaires selon la méthodologie de Quost
et al. ....................................... 84
6.2. Modèle de Dirichlet Imprécis (MDI).................... 84
6.3. Modèle multinomial de Denoeux ...................... 85
6.4. Bilan ....................................... 86
7. Arbres de décision E2M89
7.1. Description du problème des données imparfaites ............ 90
7.2. Méthodologie générale des arbres de décision E2M........... 91
7.2.1. Description formelle de la méthodologie ............. 92
7.2.2. L’algorithme E2Mappliqué à l’estimation du nouveau para-
mètre d’un arbre lors d’une coupure ................ 92
7.2.3. Algorithme d’estimation du nouveau paramètre d’un arbre
obtenu lors d’une coupure ......................100
7.2.4. Algorithme général de construction d’un arbre E2M......101
7.2.5. Arbres E2Mapproximés .......................101
7.3. Prédiction à l’aide d’un arbre de décision E2M..............102
7.4. Elagage : évaluation en classification incertaine .............104
7.4.1. Problématique générale de la classification incertaine .....104
vi
1 / 232 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !