Résolution de processus décisionnels de Markov à espace d`état et

Téléchargement

THÈSE

En vue de l’obtention du

DOCTORAT DE L’UNIVERSITÉ DE TOULOUSE

Délivré par :

l’Institut National des Sciences Appliquées de Toulouse (INSA de Toulouse)

Présentée et soutenue le 09/10/2015 par :

Résolution de processus décisionnels de Markov à espace d’état et

d’action factorisés

Application en agroécologie

JURY

Pierre-Olivier

CHEPTOU

Directeur de recherche Président du Jury

Alain DUTECH Chargé de recherche Rapporteur

Sabrina GABA Chargée de Recherche Co-directrice de thèse

Hervé MONOD Directeur de Recherche Rapporteur

Nathalie PEYRARD Chargée de Recherche Directrice de thèse

Régis SABBADIN Directeur de Recherche Co-directeur de thèse

École doctorale et spécialité :

MITT : Domaine STIC : Intelligence Artiﬁcielle

Unité de Recherche :

unité MIAT (UR 875) - INRA Toulouse

Directeur(s) de Thèse :

Sabrina GABA,Nathalie PEYRARD et Régis SABBADIN

Rapporteurs :

Alain DUTECH et Hervé MONOD

Résumé

Cette thèse porte sur la résolution de problèmes de décision séquentielle sous incertitude,

modélisés sous forme de processus décisionnels de Markov (PDM) dont l’espace d’état

et d’action sont tous les deux de grande dimension. La résolution de ces problèmes avec

un bon compromis entre qualité de l’approximation et passage à l’échelle est encore un

challenge. Les algorithmes de résolution dédiés à ce type de problèmes sont rares quand

la dimension des deux espaces excède 30, et imposent certaines limites sur la nature des

problèmes représentables.

Nous avons proposé un nouveau cadre, appelé PDMF3, ainsi que des algorithmes

de résolution approchée associés. Un PDMF3est un processus décisionnel de Markov à

espace d’état et d’action factorisés (PDMF-AF) dont non seulement l’espace d’état et

d’action sont factorisés mais aussi dont les politiques solutions sont contraintes à une

certaine forme factorisée, et peuvent être stochastiques. Les algorithmes que nous avons

proposés appartiennent à la famille des algorithmes de type itération de la politique et

exploitent des techniques d’optimisation continue et des méthodes d’inférence dans les

modèles graphiques.

Ces algorithmes de type itération de la politique ont été validés sur un grand nombre

d’expériences numériques. Pour de petits PDMF3, pour lesquels la politique globale opti-

male est disponible, ils fournissent des politiques solutions proches de la politique globale

optimale. Pour des problèmes plus grands de la sous-classe des processus décisionnels de

Markov sur graphe (PDMG), ils sont compétitifs avec des algorithmes de résolution de

l’état de l’art en termes de qualité. Nous montrons aussi que nos algorithmes permettent

de traiter des PDMF3de très grande taille en dehors de la sous-classe des PDMG, sur des

problèmes jouets inspirés de problèmes réels en agronomie ou écologie. L’espace d’état

et d’action sont alors tous les deux de dimension 100, et de taille 2100. Dans ce cas, nous

comparons la qualité des politiques retournées à celle de politiques expertes.

Dans la seconde partie de la thèse, nous avons appliqué le cadre et les algorithmes

proposés pour déterminer des stratégies de gestion des services écosystémiques dans un

paysage agricole. Les adventices, plantes sauvages des milieux agricoles, présentent des

fonctions antagonistes, étant à la fois en compétition pour les ressources avec la culture

et à la base de réseaux trophiques dans les agroécosystèmes. Nous cherchons à explorer

quelles organisations du paysage (ici composé de colza, blé et prairie) dans l’espace et

dans le temps permettent de fournir en même temps des services de production (rende-

ment en céréales, fourrage et miel), des services de régulation (régulation des populations

d’espèces adventices et de pollinisateurs sauvages) et des services culturels (conservation

d’espèces adventices et de pollinisateurs sauvages). Pour cela, nous avons développé un

modèle de la dynamique des adventices et des pollinisateurs et de la fonction de récom-

pense pour diﬀérents objectifs (production, maintien de la biodiversité ou compromis

entre les services). L’espace d’état de ce PDMF3est de taille 32100, et l’espace d’ac-

tion de taille 3100, ce qui en fait un problème de taille conséquente. La résolution de

ce PDMF3a conduit à identiﬁer diﬀérentes organisations du paysage permettant d’at-

teindre diﬀérents bouquets de services écosystémiques, qui diﬀèrent dans la magnitude

de chacune des trois classes de services écosystémiques.

Mots-clefs : processus décisionnel de Markov, optimisation continue, méthodes de gra-

dient, inférence dans les modèles graphiques, écoinformatique, modélisation mathéma-

tique, paysage, services écosystémiques, pollinisation, adventices

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

1 / 200 100%

Documents connexes

Faire tourner l`algorithme de gauche « à la main » pour A = 15

algorithme algorithme -bases -une

Préambule - Gnuside Formation

Quelques algorithmes

Objectifs 1 Petits exercices 2 Un problème de complexité

Mettre les ordinateurs au travail

Maths(moyens) algorithmes

L`algorithme suivant est décrit en langage pseudo

Premiers algorithmes en géométrie. NIVEAU : secondes EXERCICE

2de - algo - aide algobox

Sujet de stage - ENSTA ParisTech

Fiche élève

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Résolution de processus décisionnels de Markov à espace d`état et

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Résolution de processus décisionnels de Markov à espace d`état et

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib