S ÉMINAIRE DE PROBABILITÉS (S TRASBOURG ) ROBERT C. DALANG Sur l’arrêt optimal de processus à temps multidimensionnel continu Séminaire de probabilités (Strasbourg), tome 18 (1984), p. 379-390 <http://www.numdam.org/item?id=SPS_1984__18__379_0> © Springer-Verlag, Berlin Heidelberg New York, 1984, tous droits réservés. L’accès aux archives du séminaire de probabilités (Strasbourg) (http://portail. mathdoc.fr/SemProba/) implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/legal.php). Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright. Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques http://www.numdam.org/ L’ARRET SUR DE PROCESSUS A OPTIMAL MULTIDIMENSIONNEL TEMPS CONTINU par Robert C. DALANG 1. Introduction problème d’arrêt optimal des indexés par R+ a été étudié par de nombreux auteurs (voir [EK] pour une bibliographie exhaustive). Les hypothèses suffisantes "presque nécessaires" sur le processus de gain qui assurent l’existence d’un temps d’arrêt optimal sont l’appartenance à la classe (D) et la semi-continuité supérieure des trajectoires, ou ce qui est équivalent, la semi-continuité supérieure en espérance sur les suites monotones de temps d’arrêt. Dans ces conditions, le temps d’entrée dans l’ensemble où le processus de gain coïncide avec son enveloppe de Snell est un temps d’arrêt optimal. Le pour processus Pour les processus indexés par deux ou plusieurs paramètres diverses notions de temps d’entrée ont été proposées, mais aucune ne semble d’utilité pour le problème d’arrêt optimal. Néanmoins, ce problème a déjà été étudié par plusieurs auteurs, notamment par U. Krengel A. Millet et G. [Mi], A. Millet fMi3 [K-S], et L. Sucheston Mazziotto [Ma]. Dans le Szpirglas fM-5J, G. Mazziotto et J. cas où l’ensemble d’indices est IR2+, i ntrodu i t la noti on de "tacti que aléatoire randomisée" et, par des méthodes de représentation, a montré l’existence d’un temps d’arrêt optimal sous a certaines hypothèses de régularité. Dans un article récent [Ma], réduit le problème de la recherche d’un temps d’arrêt optimal G. sur Mazziotto IR+ problème sur une ligne d’arrêt donnée; les conditions de régularité qu’il portent sur l’enveloppe de Snell du processus de gain. Ce travail1 s’appuie représentation intégrale des résultats optimaux bien connus de sur un v.a. Baxter article de N. Ghoussoub floues et sur Chacon un [B-CJ. L’existence a même propose est établie une généralisant les [G], où espace compact, au de temps d’arrêt pour les processus continus est ramenée à l’étude d’une fonction affine sur ’ l’ensemble des temps d’arrêt flous. L’objectif principal de notre travail1 est de montrer que, pour les processus sur séparables, bornés et à trajectoires IR2 380 semi-continues supérieurement (s.c.s), cette fonction est s.c.s, ce qui suffit pour résoudre le problème d’arrêt optimal. Lorsque l’espace probabi1isé est séparable, le théorème de Choquet permet d’étendre résultat ce classe (D). On remarquera que l’hypothèse n’est pas utilisée. aux processus s.c.s séparables de la d’indépendance conditionnelle (F4) de [C-W] 2. Notations, définitions et rappels L’espace s=(sl,...,sn) écrirons relations ..., par muni sera de si t s la si t=(tl,...,tn) outre en s ~ t relation d’ordre partielle 6 suivante :: Nous seulement si si’ti, et et s ~ et t, s « si t Ces engendrent différents types d’intervalles ouverts, fermés, semi-ouverts, / s , u « t} . exemple ls,tC {u~ IRn+ = . Nous autres IRn+ 5 ad joignons à IR+ IR+ et posons métrique compact notations nous poserons Kn = supérieur à tous les de sa topologie usuelle d’espace correspondante. Pour alléger les strictement est muni U la tribu de et élément noté un boré1ienne Bn . Cfl,F,P) un espace probabilisé complet, muni d’une filtration (Ft)tEKn complète et continue à droite. Une variable aléatoire T définie sur valeurs dans Kn est un temps d’arrêt relativement à la filtration L’ensemble des temps d’arrêt sera noté E h. d ts IR+. (Ft)tKn si T. Le problème d’arrêt optimal pour un processus X est le suivant: trouver un temps d’arrêt To (dit "optimal pour X") tel que sup E(XT) . E(XTo) ’ = Soit {T t} . TET Nous désignerons par C l’ensemble des continus processus X=(Xt)tcKn (les processus indistinguables sont identifiés). C muni de tels que la norme ~X~=E(sup|Xt|) des est fonctions un sur continues de Kn dans lR), intégrables espace de Banach: à valeurs dans au sens c’est C(Kn) en fait l’espace (ensemble des fonctions de Bochner. Considérons C’, le dual topologique de C, muni de la topologie faible ~-(C’,C), c’est-à-dire de la topologie la moins fine par rapport à laquelle les de C’ dans IR sont continues pour tout XeC. Rappelons que C’ muni fonctions de cette topologie est un espace vectoriel topologique Hausdorff de localement convexe. On processus A=(At)teK sera dit croissant si pour tout w03C0, 381 est la fonction de répartition à mesure w positive, qu’un tel processus est continu à droite et admet des limites dans les autres hyperquadrants. finie (r-additive et Bn: V teKn, sur associée At(w) une = ~ W((o,tl). L’ensemble des processus croissants tels que Aoo=I sera noté noter A A. Suivant P.A. Meyer (Me], nous appellerons v.a. floue une mesure positive, est P. L’ensemble des v.a. floues o--additive sur KnxI7, dont la projection sur sera noté U. Pour tout U X,~> - _l X et toute v.a. -intégrable X sur Knxn, poserons d~l. D’après le théorème de désintégration des mesures, il floues et processus croissants (CMe], CG] lemme I.1). alors AeA, pour toute v.a. -intégrable X sur KnxJ1: entre nous v.a. y a Si bi jection affine U correspond à dtAt(.» . . / Kn chaque élément correspond un élément de C’ par la formule X~2014~ X,~u>, réciproque partielle est donnée par le résultat bien connu (cf. [D-M2] p.217, ou (D-U] p.98): pour tout feC’ tel que f ~ 0 (f(X)~0, pour tout processus et f(1)=1, il existe un élément unique positif XeC), ~~U tel que A XeC. Une f(X) = = Knx!’1 X , V XeC. U peut donc être considéré comme un sous-ensemble de C’, que l’on munit de la topologie induite, c’est-à-dire de la topologie la moins fine par rapport à sont continues. laquelle les fonctions Soit Ua le processus croissants Baxter et Chacon, U de ce Cette sous-ensemble de v.a. floues adaptés à la filtration et Ua sont faiblement auxquelles sont associées D’après un les résultat dû à compacts HB-Q, [Mel). La démonstration résultat fait appel à la continuité à droite de la filtration propriété de la filtration n’interviendra plus par la suite. Comme U et sont convexes, ils possèdent des points extrémaux: points extrémaux a été faite par N. Ghoussoub «(G],, en prop.I.2) appliquant un résultat bien connu de M. Yor ([Y], prop.1.6) : ce sont les v.a. floues ~cc portées par le graphe d’une fonction mesurable Kn. Le l’identification processus de croissant Ma ces A associé à un tel et donc ~u est alors de la forme 382 E( Knxt(.) dtAt(.)) = Si de plus ~Ua, biunivoque entre 3. Existence de se il1 est cl ai r que g est un temps d’arrêt, et il1 y temps d’arrêt et points extrémaux de Ua. d’arrêt temps Dans le E(Xg). = cas a correspondance optimaux d’un processus démontre exactement comme continu, l’existence d’un temps d’arrêt optimal l’a fait N. Ghoussoub dans M, prop. 2.3. Ce problème a aussi été résolu par d’autres méthodes dans [Mi] et [Ma]. Afin de rendre notre démarche plus transparente, nous rappelons ici brièvement le résultat et la preuve. 3.1. Théorème :: Soit Alors il existe Démonstration :: son Considérons processus temps d’arrêt la Par définition de la ~Y~C)=Y,~>. donc un un maximum associé ~a en optimal, car est un sur continu optimal non) ou tel que pour Y. affine fonction (adapté définie tV: Ua~IR par topologie faible, ~ est continue. Elle atteint point extrémal /~ de Ua. Le temps d’arrêt To , ) E(YT ° = Y, f~> = sup Y~C> >~ sup E(YT) , Tel d’où le résultat. Il atteint est bien maximum son démonstration qu’une fonction affine un point extrémal (tB3] connu en précédente, la continuité de ~Y s.c.s sur p.II.58, n’est donc pas l’objectif de notre travail conditions qui assurent la semi-continuité supérieure de ~Y. s.c.s suffit! Dans la suite, 3.2. Proposition :: Soit une suite décroissante existe Alors et il a. L’application b. Yt(w)= lim~ (Xk)ksN un compact prop.l). Dans indispensable: sera d’établir Supposons processus mesurable. de processus mesurables tels que: est faiblement s.c.s, convexe la ~y des qu’il pour tout hors d’un ensemble évanescent. l’application Ua~IR définie par existe un temps d’arrêt optimal pour Y. est faiblement s.c.s 383 Démonstration :: faiblement s.c.s Définissons s.c.s et est /~~L k~~ knx donc faiblement /~ par plus y Knx ~pourestY. ~: De affine, donc il existe un temps d’arrêt optimal Si on dispose d’une classe de processus pour lesquels la condition a. de la 3.2 est vérifiée, cette classe peut être étendue par proposition passage à la limite monotone décroissante. Ceci permet d’établir l’existence de temps d’arrêt optimaux pour les processus qui sont limite d’une suite décroissante de processus continus. 3.3. Exemples 1. où f est une fonction s.c.s. de IRk~IR les et Xi sont des processus continus. m 2. 9i (t). i=l où Fi,...,Fm ef et les R sont s.c.s. et bornés. ~3 3. 9i(t) i=l où et les ~ vérifie Si sont des v.a. quelconques ~ les sont valeurs dans s.c.s et bornés, Kn. Rappelons qu’une fonction s.c.s. bornée sur un espace topologique est l’enveloppe inférieure des fonctions continues qui la majorent (si l’espace en question est à base dénombrable, toute fonction s.c.s. est même limite d’une suite décroissante de fonctions continues). Pour les processus s.c.s. on a le résultat analogue suivant: ’ 3.4. Théorème :: s.c.s. Soit Alors Y est majorent. processus l’enveloppe inférieure des mesurable processus borné ~ continus trajectoires qui le bornés Démonstration :t Elle est analogue à celle de la proposition 7 p.IX.10 de [B~J 384 pour les fonctions s.c.s. SupposonsYt(w) I 1, ~tKn, ~w03C0. Il1 toEKn et tout 0 ~ 1, il existe tout est suff i sant de montrer que pour un continu processus borné et tel que 1. d tKn, ~w 2. + . E , d w. , Soit d(.,.) la métrique sur Kn induite par la et h: IR-+R définie par h(x)=min(1, Ixl), xE IR. Soit Z~,t0(w)1 avons définie v.a. par projection stéréographique, Z~,t0(w)=(1-~/2)Yt0(w)+~/2. Z~,t0(w)-Yt0(w)=(1-Yt0(w))~/2. et Nous dernière Cette expression est à la fois >0 et ~. trajectoires de Y sont s.c.s., il nous Si montrons que ~ peut être choisie F-mesurable, ce qui sera fait plus bas, Comme d(t, to) les t continu borné par obtenons un processus 1 et 2, et la conclusion s’ensuit. nous En ce nous posons B=~(t,w) / voir qui elle l’application concerne B alors (t,w)~B} sera posant F-mesurable ~ Soit Bnxf-mesurab1e. est / s=d(t,to), affirme Il est en est B1xF-analytique. l’application rapport à la tribu complétée universelle de F, de l’application en vérifie les conditions 1, qui / A=((s,w) que que h( ~ ~ tel outre Le est que et comme F est si effet, en facile théorème de p.102 mesurable complète, elle par est F-mesurable. Vu d’extraire ce un résultat, on sous-ensemble inférieure est Y. Il est bien par trajectoire. Mais en peut se connu de que cette extraction en w. peut être faite trajectoire procédant de cette manière il C’est pour cette raison que séparabilité dans le théorème suivant. mesurabilité possible dans certains cas processus continus dont l’enveloppe demander s’il est dénombrable nous avons se pose un besoin d’une problème de hypothèse de 385 3.5. Théorème :: Supposons Soit qu’il1 exi ste un borné _ (adapté tel un processus mesurable sous-ensemble dénombrable dense H dans IR+ ou non). que Yt(w)=limsup Ys(w), d te s -3 t seH est faib lement s.c. s. et il1 exi ste Alors l’ appl icati on optimal pour Y. Démonstration :: Nous employons ici quelques notions bien connues de un temps d’arrêt topologie (voir M par exemple). projection stéréographique, Kn est homéomorphe à une partie de la cette sphère est elle-même homéomorphe au n-simplexe sphère standard Sn de IRn. Dans la suite de la démonstration, Kn sera remplacé par Sn, et nous supposerons par homéomorphisme que tous les processus considérés sont Par la unité de indexés par Sn. Soit meN fixé. Par obtenons nous une nombre fini de subdivisions un triangulation de Sn de diamètre inférieur à 1/m. appellerons .intérieur- d’un k-simplexe sous-ensemble de l’espace de dimension k qu’il engendre. Nous Soit de la barycentriques successives ~k l’intérieur d’un k-simplexe qui est triangulation de Sn. Nous définissons son une un intérieur en tant que face d’un des n-simplexes processus par Ys (w) d sup ~w03C0, t s0394kULk où une lk est l’union des intérieurs des des faces, Pour p-simplexes de la triangulation dont 4lk est kp~n. n=2, ~a situation X~(w)= X~(w) Xmt0 (w) sup est ~a suivante: Ys(w), = sup m = max Ys(M). (Yt.(w), sup /t6/l}: Ys(M)), 386 où l’union est Lo triangulation des {t0} dont Intérieurs est L’hypothèse faite une 12 des faces de 1- 2-simplexes de la et des faces. Y dans renonce du théorème garantit la mesurabilité et X"~Y. En outre, Y construction, X~ étant s.c.s. et la triangulation devenant de plus en plus fine, nous voyons que lim ~ Xm=Y. Pour conclure, il suffit donc de vérifier l’hypothèse a. de 1a m 3.2 proposition pour chaque processus X meN. de tout pour t. sur Par est s.c.s. , à Soit fixé. mN nouveau allons Nous exhiber une nouvelle suite de processus s.c.s. qui décroît vers X*", dont chaque élément est limite d’une suite décroissante de processus continus. La conclusion du théorème résultera de la proposition 3.2. Rangeons les faces des n-simplexes de la triangulation de Sn en une suite leurs intérieurs et la valeur de Appelons finie. Nous pouvons alors écrire: M~. sur k(m) X~(w)=~ i=l . Comme Y est borné, les chaque Z~ comme limite le sont uniformément. Z~ d’une Il est donc décroissante suite de possible d’écrire de la étagées v.a. forme Z (P+l)2~ peLj où Lj est fini et dépend ne j. Posons alors que de k(m) ~ S(w)=~ i =1 Nous avons t ~ Xmt(w) trajectoires bien est 1imB constante de j Fixons . . D’autre les sur part, en Mi, il (m étant est se rappelant facile de que l’application vérifier que les sont encore s.c.s. maintenant jdN où et peLj. toujours fixé) et posons Nous avons k(m) X~(w)=~_~_ i=l (p+l)2~ ’~ peLj Ordonnons- les finie 0 formée en des une éléments suite de F finie de la et forme considérons la famille où 6~ est soit 387 G~ soit G~. 6~ ~ -1 Pour FeD posons si FCrG;,p et 0 sinon. Alors k(m) ~1)2~ Z 1=1 FeD peLj k(m) = . i=l FeD La dernière ~ ~~~~ ~F.i.p ’ H Z est parenthèse une peLj fonction de t uniquement: X~(w)=~ FeD trajectoires de j sont s.c.s., fp: Kn~IR est s.c.s. pour tout FeD. D’après la proposition 3.2 (ex. 2 de 3.3) ~ est limite d’une suite décroissante de processus continus, ce qu’il fallait démontrer. Comme les de processus sur Q est borné, continu à droite et s.c.. dans la réunion des autres est borné, continu dans l’un des hyperquadrants hyperquadrants. Voici 3.6. Exemples :: quelques types qui vérifient la condition de l’énoncé du théorème 3.5: - Y hyperquadrants. - Y réunion des autres borné, - Y est - Y est le aux séparable et prolongement s.c.s. à Y s.c.s. borné indexé par 4. Extension s.c.s. au sens JP~ et s.c.s. dans 1 a déf.IV.25. de chap.I.V.31) d’un processus Q~. processus s.c.s. séparâmes de la classe (D) est séparable et la séparable, topologie faible sur Ua est par conséquent métrisable (CD-S3 p.426, Th.!). Dans ce cas le théorème de représentation intégrale de Choquet (fPJ p. 19 et 100) permet de représenter les temps d’arrêt flous par des temps d’arrêt, ce que nous utiliserons dans la proposition suivante. Lorsque la tribu F est 4.1. Proposition :: Supposons que la tribu f de l’espace probabilisé (IY,F,P) soit un processus mesurable de la classe (D). Supposons séparable. Soit 388 qu’il existe 1. de processus mesurables telle que suite une est faiblement s.c.s, pou.r tout mdN; ~u ~ 2.1im TcT Alors il existe temps d’arrêt optimal pour X. un s’inspire de celle Démonstration : Elle définie par une mesure de Par le théorème de Choquet, probabilité (non-unique 03C6m( )03C6m(T)d (T)=E(YmT) Comme E(YT) s.c.s. pour lim du théorème 3.3 de en général) $ d portée m( ) lim = m-oo ~ T T existe telle que . est avons = E(XT) T indépendant de la f(T)=E( XT) ( T= ET pour TeT, il Ua par (T) . Posons, pour que pour tout converge uniformément en T vers E(XT), l’application la topologie sur T induite par la topologie faible et nous Le membre de droite est donc Notons sur [Mi]. Soit mesure ~ est ici choisie pour la seule représenter . possibilité! ). Nous avons d)k(T) , TET sup l pour tout ~Ua et donc fonction faiblement lim 03C6m=03C6 uniformément et affine. Elle s.c.s. temps d’arrêt To, qui est alors optimal pour Il s’ensuit sur donc maximum prend X, d’où la conclusion. son que 03C6 sur est Ua 4.2. Corollaire : Supposons que f est séparable. Soit X un processus séparable de la classe (D). Alors il existe un temps d’arrêt optimal pour X. Démonstration :: Posons mesurable borné s.c.s. vérifie l’hypothèse 1 de Ym = X m : Ym est "" séparable, et par le théorème 3.5, la suite la proposition 4.1. Vérifions l’hypothèse 2: en une un s.c.s. processus 389 dP = Y |XT-YmT|dP {|XT|>m} y |XT| dP + y m dP y 2 |XT| dP . {|XT|>m} {|XT|>m} {|XT|>m} La dernière expression tend vers 0 uniformément en T, d’où le résultat. REFERENCES [B-C] S.R. Baxter - R.V. Chacon : Compactness of 40 p.169-181 (1977). [B1] N. Bourbaki : Elem. de Math. Top. Gen. Chap.1-4. [B2] N. Bourbaki : Elem. de Math. Top. gen. Chap.5-10. Hermann (1974). [B3] N. Bourbaki : Elem. de Math. Esp. Vect. Top. Chap.1-5. [C-W] R. Cairoli - J.B. Walsh : Stochastic Stopping Times. Z.Wahr.verw.Geb. Integrals Hermann (1971). Hermann (1981). in the Plane. Acta Math. 134 p.111-183 (1975). [D-M1] C. Dellacherie - P.A. Meyer : Probabilités et potentiels Hermann (1975). Chap. I à IV. [D-M2] C. Dellacherie - P.A. Meyer : Probabilités et potentiels Hermann (1980). Chap. [D-U] J. Diestel - J.J. Uhl : Vector Measures. American Math.Soc. (1977). [D-S] N. Dunford - J.T. Schwarz : Linear V à VIII. Operators Part I General Theory. Interscience Publishers (1967). [Ek] N. El Karoui : Les aspects probabilistes du contrôle stochastique. Ecole d’été de St. Flour 1979. Lect .N. in Math. 876 p.74-239, Springer Verlag, Berlin (1981). [G] N. Ghoussoub : An its integral representation of randomized probabilities and applications. Lect. N. in Math 920 p.519-543, Springer Verlag (1982). 390 [K-S] [M-S] U. Krengel - by a L. Sucheston : Stopping Rules and Tactics for p.199-229 (1981). Processes indexed Directed Set. J. Mult. Anal. 11 G. Mazziotto - J. Szpirglas : Arrêt optimal sur le plan. Z.Wahr.verw.Geb. 62 p.215-233 (1983). [Ma] G. Mazziotto : Arrêt optimal de processus markoviens à deux indices (prépublication). [Me] P.A. Meyer : Convergence faible et compacité des temps d’arrêt d’après p.411-423, Springer Verlag (1978). Baxter et Chacon. Lect. N. in Math 649 [Mi] A. Millet : On Randomized Tactics and Optimal Stopping in the Plane (prépublication). [N] G. Naber : Press Topological Methods in Euclidean Spaces. Cambridge University (1980). [P] R.R. [Y] M. Yor : Sous-espaces denses dans martingales. Lect. N. in Math 649 Phelps : Lectures on Choquet’s Theorem. Van Nostrand (1966). L1 H1 représentation de p.265-309, Springer Verlag (1978). ou et Robert C. DALANG Département de Mathématiques Ecole Polytechnique Fédérale de 1015 LAUSANNE Suisse Lausanne