Apprentissage à partir de données et de connaissances incertaines

Téléchargement

Par Nicolas SUTTON-CHARANI

Thèse présentée

pour l’obtention du grade

de Docteur de l’UTC

Apprentissage à partir de données et de

connaissances incertaines : application à la prédiction

de la qualité du caoutchouc

Soutenue le 28 mai 2014

Spécialité : Technologies de l’Information et des Systèmes

D1835

Apprentissage à partir de données et de

connaissances incertaines.

Application à la prédiction de la qualité

du caoutchouc

Nicolas SUTTON-CHARANI

Thèse soutenue le 28 Mai 2014 devant le jury composé de :

Président :

Yves GRANDVALET

Directeur de Recherche

Univ. de Technologie de Compiègne

Rapporteurs :

Didier DUBOIS Arnaud MARTIN

Directeur de Recherche CNRS Professeur

Univ. Paul Sabatier Univ. de Rennes 1

Examinateurs :

Jérôme SAINTE BEUVE Mathieu SERRURIER Tristan MARY-HUARD

Chargé de Recherche Maître de Confèrences Chargé de Recherche

INRA SupAgro Univ. Paul Sabatier INRA AgroParis Tech

Eric GOHET Brigitte CHARNOMORDIC

Chargé de Recherche Ingénieur de Recherche

CIRAD INRA

Directeurs de Thèse :

Thierry DENOEUX Sébastien DESTERCKE

Professeur Chargé de Recherche

Univ. de Technologie de Compiègne Univ. de Technologie de Compiègne

Université de Technologie de Compiègne

Laboratoire Heudiasyc UMR CNRS 7253

28 Mai 2014

Table des matières

Préface ix

Remerciements .................................... ix

Résumé français de la thèse .............................xiii

Résumé anglais de la thèse ............................. xiv

Publications durant le doctorat ........................... xiv

Introduction générale 3

I. Incertitude et prédiction 5

1. Incertitudes 7

1.1. Introduction ................................... 7

1.1.1. Types d’incertitude .......................... 8

1.1.2. Identiﬁcation des différentes incertitudes dans ce travail .... 10

1.2. Théories de l’incertain ............................. 11

1.2.1. Théorie des probabilités ....................... 11

1.2.2. Théorie des possibilités ........................ 16

1.2.3. Théorie des probabilités imprécises ................ 20

2. Théorie des fonctions de croyance 25

2.1. Généralités ................................... 26

2.2. Déﬁnitions et propriétés de base ....................... 27

2.3. Interprétations ................................. 34

2.3.1. Fonction multi-valuée ......................... 34

2.3.2. Modèle des Croyances Transférables (MCT )........... 35

2.4. Vraisemblance crédibiliste .......................... 38

2.4.1. Etude du comportement de l’estimateur du maximum de vrai-

semblance crédibiliste (EMV C ) sur des exemples simples . . . 40

2.5. Aspects philosophiques et pratiques ..................... 50

3. Algorithmes E M et E2M53

3.1. Algorithme E M ................................. 54

3.2. Extension crédibiliste : l’algorithme E2M.................. 55

Table des matières

II. Incertitude et arbres de décision 59

4. Arbres de décision 61

4.1. Cadre général, déﬁnitions ........................... 61

4.2. Historique .................................... 64

4.3. Construction .................................. 65

4.4. Elagage ..................................... 67

4.5. Forêts aléatoires ................................ 68

5. Modélisations de l’incertitude dans différentes méthodologies d’arbres

de décision 69

5.1. Approches probabilistes ............................ 70

5.1.1. Décomposition des exemples d’apprentissage dans l’arbre : Tsang

et al. ................................... 70

5.1.2. Méthodologie Périnel ......................... 71

5.2. Approches probabilités imprécises ...................... 72

5.3. Approches ﬂoues ................................ 73

5.3.1. FID de Janikow ............................ 74

5.3.2. Soft Decision Trees de Olaru et Wehenkel ............. 75

5.4. Approches possibilistes ............................ 75

5.5. Approches crédibilistes ............................ 76

5.6. Bilan ....................................... 80

6. Extension de la méthodologie Skarstein-Bjanger et Denoeux (SBD) au cas

multi-classes 83

6.1. Combinaison de classiﬁeurs binaires selon la méthodologie de Quost

et al. ....................................... 84

6.2. Modèle de Dirichlet Imprécis (MDI).................... 84

6.3. Modèle multinomial de Denoeux ...................... 85

6.4. Bilan ....................................... 86

7. Arbres de décision E2M89

7.1. Description du problème des données imparfaites ............ 90

7.2. Méthodologie générale des arbres de décision E2M........... 91

7.2.1. Description formelle de la méthodologie ............. 92

7.2.2. L’algorithme E2Mappliqué à l’estimation du nouveau para-

mètre d’un arbre lors d’une coupure ................ 92

7.2.3. Algorithme d’estimation du nouveau paramètre d’un arbre

obtenu lors d’une coupure ......................100

7.2.4. Algorithme général de construction d’un arbre E2M......101

7.2.5. Arbres E2Mapproximés .......................101

7.3. Prédiction à l’aide d’un arbre de décision E2M..............102

7.4. Elagage : évaluation en classiﬁcation incertaine .............104

7.4.1. Problématique générale de la classiﬁcation incertaine .....104

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

1 / 232 100%

Documents connexes

3 À la croisée des chemins - Conseil de l`industrie forestière du

Presentazione standard di PowerPoint

Les arbres

L`augmentation de gaz carbonique dans l`air, à cause du

ARBRE 1

Un été magnifique mais… sûrement pas pour les arbres!

Chaque hiver, pendant les périodes de vent fort, des branches ou

Projet d'animation environnementale pour enfants

Conférence-débat - Syndicat mixte forestier

Découvrez la nature au bord des chemins

La Vie d`un Arbre

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Apprentissage à partir de données et de connaissances incertaines

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Apprentissage à partir de données et de connaissances incertaines

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib