SYSTEMES MARKOVIENS A COMMANDE
Le présent travail a pour but d'étudier le comportement asymptotique
de v et de S. Les résultats obtenus ont déjà fait l'objet d'une note aux Comptes
Rendus de l'Académie des Sciences ([9]), mais ont été sensiblement améliorés
depuis.
Pour v, des exemples très simples prouvent qu'il ne peut être question de
limite; par contre, on montre sans difficulté que la suite m I-mest bornée
dans (Rn)', ce qui incite à étudier l'existence d'une direction asymptotique, et
même d'une asymptote. Le théorème 3 (§ VII) donne une réponse comparable
à celle obtenue dans le cas d'un système sans commande, où l'existence d'une
asymptote est étroitement liée à la structure de la matrice de transition (cf. pro-
position 2, § IV). Quant au comportement asymptotique de S, on verra qu'il
dépend de phénomènes de dégénérescence (proposition 20 et corollaire, § VIII);
le seul résultat général obtenu est donc un théorème d'approximation
(théorème 4, § VIII). Notons aussi une amélioration d'un résultat de
R. A. Howard ([7]) au sujet des stratégies constantes dans le temps (théorème 2,
§ IV). Une deuxième partie (à paraître) étudiera quelques problèmes d'ordre
pratique concernant le calcul effectif d'approximations.
Les exemples et les figures ont été rassemblés à la fin, où on trouvera aussi
un index des notations.
L'auteur désire exprimer toute sa reconnaissance à M. R. Pallu de la Barrière.
Son attentive direction a déterminé de très importantes améliorations du fond
et de la forme.
n. — DEFINITIONS ET NOTATIONS
Sur (Rh)f(h = 1, 2,...), la norme utilisée sera la norme suivante
1*11
= «* N
l<i<ft
et on considérera l'ordre suivant :
x < y <==> xt < y% Vi = 1,..., h.
On utilisera aussi les notations :
x < y <£> x < y et x # y
A
xt
< yt Vi =
l,...,
h
Soit
[(Rfc)']r
l'ensemble des r-uples de vecteurs de (Rft)' :
(H-l)
(II-2)
(II-3)
(II-4)
(II-5)