Master d’Informatique Décisionnelle (2011-2012) Faculté des Sciences et Techniques
Module : Processus de Décision de Markov Université Sultan Moulay Slimane
2
Problème: Soit un PDM avec espace d’états 𝐸 = {1,2} . La matrice de transition P et les
gains au niveau de chaque état sont définis par:
Etat i=1 :
- R(état<1>,a1) = 1 ) --> 0,5 0.5
- R(état<1>,a2) = 2 ) --> 0.4 0.6
Etat i=2 :
- R(état<2>,a1) = 2) --> 1 0
- R(état<2>,a2) = 4 ) --> 0 1
I. On considère le critère d’actualisation avec un facteur α = 0.5.
1. Déterminer l’ensemble des stratégies pures.
2. Déterminer la forme des stratégies stationnaires.
3. Soit la stratégie stationnaire f telle que f(1, 1):= 0.5 ; f(2, 2):= 1 . Calculer la fonction
coût Vα( f ).
4. Déterminer une stratégie optimale en utilisant l’algorithme de la stratégie améliorée
(Donner les résultats de chaque itération).
II. On considère le critère de la moyenne.
Soit la stratégie pure f1 telle que f1(1,2):= 0 ; f1(2, 1):= 1.
1. Calculer la fonction coût (f1) et le vecteur u(f1) en résolvant un système linéaire.
2. Calculer une stratégie à gain moyen optimale en utilisant l’algorithme de la stratégie
améliorée (partant de f1).