arXiv:1411.5265v2 [math.DS] 27 Nov 2014 Généricité au sens probabiliste dans les difféomorphismes du cercle Michele Triestino Résumé What kind of dynamics do we observe in general on the circle ? It depends somehow on the interpretation of “in general”. Everything is quite well understood in the topological (Baire) setting, but what about the probabilistic sense ? The main problem is that on an infinite dimensional group there is no analogue of the Lebesgue measure, in a strict sense. There are however some analogues, quite natural and easy to define : the Malliavin-Shavgulidze measures provide an example and constitute the main character of this text. The first results show that there is no actual disagreement of general features of the dynamics in the topological and probabilistic frames : it is the realm of hyperbolicity ! The most interesting questions remain however unanswered... This work, coming out from the author’s Ph.D. thesis, constitutes an opportunity to review interesting results in mathematical topics that could interact more often : stochastic processes and one-dimensional dynamics. After an introductory overview, the following three chapters are a pedagogical summary of classical results about measure theory on topological groups, Brownian Motion, theory of circle diffeomorphisms. Then we present the construction of the Malliavin-Shavgulidze measures on the space of interval and circle C 1 diffeomorphisms, and discuss their key property of quasi-invariance. The last chapter is devoted to the study of dynamical features of a random Malliavin-Shavgulidze diffeomorphism. Chapitre I Introduction 1 Généricité topologique et généricité probabiliste Dans la théorie moderne des systèmes dynamiques, l’un des points cruciaux est de comprendre leur propriétés génériques, puisqu’une connaissance globale s’avère tout simplement impossible pour l’être humain. Durant les dernières années, d’importants et nombreux résultats ont élucidé le paysage, pqrticulièrement celui de la dynamique décrite par un difféomorphisme C 1 générique d’une variété compacte fermée, sous l’impulsion du programme de Palis [Bon-Día-Via]. La notion de généricité communément utilisée est topologique : dans un espace de Baire (comme par exemple l’espace Diff r (M ) des difféomorphismes C r d’une variété, r ∈ [1, +∞]) un ensemble est générique (ou résiduel) s’il contient une intersection dénombrable d’ouverts denses. Cependant, atteindre cette seule description n’offre pas une vision satisfaisante et il faut lui accoster une étude probabiliste : dans un espace mesuré (X, µ) (par exemple le n-cube unité avec la mesure de Lebesgue) un ensemble est générique – au sens probabiliste – si son complémentaire est de µ-mesure nulle. Problème : dans un espace dynamiquement intéressant, comme Diff r (M ), quelle mesure µ choisir ? Il n’y en a pas d’intrinsèque et on doit souvent avoir recours aux approximations de dimension finie (où l’on dispose de la mesure de Lebesgue, justement). À présent, la notion qui formalise ce genre d’approche est celle de prévalence [Hun-Kal], inspirée par Kolmogorov [Kol]. Dans ce mémoire nous présentons en quelque sorte une « rareté » : lorsque la variété M est de dimension 1 (un intervalle ou un cercle), il existe une classe de candidats jouant le rôle de la mesure de Lebesgue sur Diff 1 (M ) : les mesures de Malliavin-Shavgulidze (MS), apparues dans la littérature physico-mathématique vers la fin des année 1980. Nous entreprenons l’étude des propriétés génériques d’un difféomorphisme tiré au hasard selon l’une de ces mesures. Malheureusement, l’existence de classes de mesures possédant des propriétés semblables n’est pas connue, ni pour des groupes de difféomorphismes de variétés de dimension majeure, ni pour des espaces d’endomorphismes différentiables. 2 Mesures de type Haar Les mesures MS ont la propriété remarquable d’être de type Haar : elles sont 1. compatibles avec la topologie (elles sont des mesures de Radon), 2. quasi-invariantes par l’action de translation (à gauche) d’un sous-groupe suffisamment grand, à l’occasion Diff 2 (M ) – à savoir les translations préservent les ensembles de mesure nulle. De fait, l’existence d’une mesure de Haar sur un groupe topologique (donc, une mesure de Radon quasi-invariante par l’action de translation du groupe entier sur lui-même) force le groupe à être localement compact. Nous ferons des rappels plus détaillés dans ce texte. Expliquons plutôt ici l’avantage théorique et pratique de disposer d’une mesure de Haar sur un groupe, qui est le moteur des travaux autour de Shavgulidze. Il est bien connu que tout groupe fini est isomorphe à un sous-groupe du groupe i symétrique sur un nombre d’objets égal à son ordre. Ainsi, le groupe symétrique sur n éléments contient une copie de tous les groupes de cardinal au plus n. Notons que l’hypothèse de finitude n’est pas nécessaire : tout groupe s’injecte dans le groupe des bijections d’un ensemble de cardinal égal à l’ordre du groupe. En revanche, lorsque le cardinal n’est plus fini, le groupe symétrique est trop grand pour être compris : nous nous en sortons avec l’emploi de l’analyse. Si un groupe G possède une mesure de Haar µ, on peut regarder l’espace de Hilbert des fonctions L2 sur G : 2 L (G, µ) = Z 2 f : G −→ C mesurable f dµ < ∞ . G Or, l’action de G par multiplication à gauche induit une action linéaire sur L2 (G, µ) : étant donné g ∈ G, on associe à f ∈ L2 (G, µ) la fonction Lg f qui fait correspondre à tout x ∈ G la valeur f (g −1 x). Puisque la mesure µ est invariante, cette action est aussi unitaire. La conséquence que l’on en tire est la suivante : tout groupe localement compact est isomorphe à un sous-groupe du groupe des opérateurs unitaires dans un espace de Hilbert. D’après Shavgulidze, on peut développer une telle analyse harmonique aussi pour un groupe de dimension infinie tel que le groupe des difféomorphismes du cercle. Une telle vision est utile lorsque l’on s’intéresse à la théorie des représentations linéaires d’un groupe, mais elle est rarement d’utilité lorsque l’on veut étudier la dynamique non-linéaire. Une (rare ?) exception apparait lorsque l’on se place dans le monde des groupes de Lie (on pense ici aux grands résultats ergodiques obtenus pour les réseaux depuis Margulis). Mais encore, le dynamicien peut-il être satisfait si un problème apparemment simple comme celui de comprendre l’image de la mesure de Haar par l’application d’élévation à puissance g 7→ g k , est difficilement abordable ? Même pour le groupe linéaire GLn (R) cette question n’est pas si simple (heureusement la décomposition spectrale nous sauve !). Les mesures de Haar ne sont pas proprement dynamiques : les objets naturels en dynamique sont ceux qui sont invariants par conjugaison, non par composition d’un coté ! 1 Cependant, en reprenant le discours initial, une mesure « homogène » comme la mesure de Haar est assez appropriée pour décrire le comportement générique au sens probabiliste : très souvent on rencontre les mêmes phénomènes génériques sous les deux différents points de vue (topologique et probabiliste), même si parfois les deux descriptions peuvent être contradictoires. Pour donner un exemple fortement relié à la dynamique sur le cercle, les nombres diophantiens forment une partie de mesure de Lebesgue totale dans R, alors que les nombres de Liouville forment un ensemble résiduel. D’une nature un peu différente était la motivation du travail autour de Malliavin : au lieu d’une analyse harmonique en dimension infinie, le calcul de Malliavin offre (entre autres) le bon cadre pour une théorie des distributions de Schwartz en dimension infinie. En dimension finie, l’intégration par parties est au cœur de la définition des distributions : en commençant par comprendre les transformations qui laissent quasi-invariante une mesure sur un espace de dimension infinie, il est possible d’étendre l’intégration par parties et d’étudier la régularité des transformations de l’espace. 3 Les mesures de Malliavin-Shavgulidze Esquissons brièvement la construction de Malliavin et Shavgulidze : l’idée est brillante, l’explication très simple ! Depuis Wiener, nous savons choisir uniformément une fonction continue sur le cercle de moyenne nulle : nous appelons une telle fonction aléatoire pont brownien. Ensuite on définit le difféomorphisme aléatoire par intégration, en choisissant uniformément par rapport à la mesure de Lebesgue l’image d’un point donné (par exemple 0) : en termes plus précis, si B = (Bt )t∈[0,1] est un pont brownien et λ une variable aléatoire uniforme sur [0, 1] indépendante de B, nous définissons le difféomorphisme aléatoire de Malliavin-Shavgulidze par Rt f (t) = R 01 0 exp(Bs ) ds + λ. exp(Bs ) ds (I.1) 1. On pourrait argumenter qu’une mesure de Haar µ invariante à gauche permet de construire une mesure bi-invariante (et donc invariante par conjugaison) : si ι : G −→ Gop est le morphisme vers le groupe opposé, ι(g) = g −1 , alors µ ∗ ι∗ µ est bi-invariante. Mais il s’agit d’une construction artificielle. ii 1 Par suite, nous disposons d’une mesure µM S sur le groupe Diff + (S1 ) que l’on appelle mesure de Malliavin-Shavgulidze. Un résultat de Cameron et Martin classique montre que la mesure de Wiener sur l’espace des fonctions continues C0 (S1 ) est de type Haar. Il existe un autre théorème, moins connu, de Cameron et Martin [Cam-Mar 2], qui implique entre autres que la mesure de Malliavin-Shavgulidze est de type 1 Haar pour Diff + (S1 ) : le sous-groupe des difféomorphismes C 2 préserve la classe de la mesure MS. Dans le chapitre V, nous avons recueilli les résultats principaux sur les mesures MS, en rajoutant des détails aux preuves qui en nécessitent. En particulier nous présentons le théorème de Shavgulidze qui 3 explicite la dérivée de Radon-Nikodym associée à l’action par multiplication à gauche de Diff + ([0, 1]) 1 sur (Diff + (S1 ), µM S ) : d(Lϕ )∗ µM S (f ) = exp dµM S Z S1 0 2 Sϕ (f (t)) (f (t)) dt , puis nous rappelons le théorème de Kosyak qui montre l’ergodicité de cette action. Bien évidemment, lorsque l’on dispose d’une mesure quasi-invariante à gauche comme µM S , on peut définir la mesure dµ̃M S (f ) = dµM S (f −1 ), qui est naturellement quasi-invariante à droite. Ensuite, par convolution on peut obtenir aussi une mesure quasi-bi-invariante µM S ∗ µ̃M S : elle est peut-être plus intéressante d’un point de vue dynamique, puisqu’elle est également quasi-invariante par l’action de conjugaison. Par rapport à cette mesure, un difféomorphisme aléatoire s’écrit sous la forme f+ ◦ f−−1 , où les f± sont de difféomorphismes aléatoires du type (I.1). Il ne faudra pas cacher que beaucoup d’autres mathématiciens ont construit des mesures sur les groupes de difféomorphismes des variétés. Malgré tous les efforts, il est très difficile d’obtenir de belles mesures lorsque les variétés sont de dimension plus grande que 1 : l’une des difficultés majeures est la nature algébrique de ces groupes de Lie de dimension infinie, qui devient trop compliquée, alors qu’une autre provient de la régularité qui s’affaiblit lorsque l’on monte en dimension (comme par exemple dans le cas des immersions de Sobolev). Il serait très intéressant de disposer d’une construction simple de mesure quasi-invariante sur les difféomorphismes du tore ou du disque, qui préservent l’aire. À ce propos, rappelons que Shavgulidze a défini d’autres mesures quasi-invariantes, par exemple sur l’espace des difféomorphismes C 4 du disque, mais il s’agit de constructions assez indirectes. Nous n’essaierons pas de décrire d’autres exemples de mesures, car chacune porte ses caractéristiques spécifiques et il est presque impossible de les présenter sous une théorie unificatrice. La simplicité, la propriété de quasi-invariance et les propriétés de régularité nous ont convaincus que les mesures MS méritent un certain regard. 4 Étude de la dynamique générique Dans le chapitre VI, nous entreprenons l’étude dynamique. Comme d’habitude, on essaie de décrire le comportement d’un difféomorphisme à conjugaison près. Depuis le travail fondateur de Poincaré [Poi], il est très naturel de comprendre, en premier lieu, quelle pourrait être la distribution du nombre de rotation, qui est l’invariant de conjugaison le plus célèbre. 2 Il s’avère que ce problème semble difficile d’accès. À cause de la présence de difféomorphismes avec orbites périodiques hyperboliques, les difféomorphismes avec orbites périodiques (et donc nombre de rotation rationnel), constituent une partie de mesure strictement positive. Que peut-on dire sur les orbites d’un difféomorphisme choisi uniformément par rapport à la mesure MS ? Existe-t-il presque toujours une orbite périodique ? Nos résultats donnent une bonne description une fois que l’on a conditionné à qu’il y ait des orbites périodiques : Théorème 4.1. Les difféomorphismes du cercle qui possèdent un nombre fini d’orbites périodiques forment une partie de mesure MS totale parmi ceux qui ont des points périodiques. 2. Pour le lecteur qui n’est pas initié à la théorie des difféomorphismes du cercle, nous parcourons les aspects principaux dans le chapitre IV. iii Figure I.1 – Deux exemples de difféomorphismes aléatoires, les ponts browniens qui les définissent et la trace d’une orbite. La preuve s’appuie fortement sur les propriétés du mouvement brownien et s’inspire de la démonstration du fait suivant : le mouvement brownien planaire ne passe presque sûrement par aucun point donné (que nous avons trouvée dans [Mör-Per] ). Plus précisément, nous montrons que presque sûrement les orbites périodiques sont hyperboliques : s’il existe une orbite périodique, alors on en trouve un nombre pair, une moitié est répulsive, l’autre est attractive. Les points sur le cercle qui n’appartiennent pas à l’une de ces orbites sont attirés vers deux d’entre elles, vers l’une dans le futur et vers l’autre dans le passé. Ce genre de difféomorphismes prend le nom de Morse-Smale. Une telle propriété permet d’étudier de manière satisfaisante la dynamique, même en faible régularité : en généralisant un résultat classique de Sternberg, les difféomorphismes Morse-Smale de classe C 1+α peuvent être localement linéarisés, on peut borner leur distorsion et, en suivant Kopell [Kop], on peut facilement décrire leur centralisateur (et ainsi leur classe de conjugaison). Théorème 4.2. Les difféomorphismes du cercle qui ont centralisateur C 1 trivial forment une partie de mesure MS totale parmi ceux qui ont des points périodiques. Cette description confirme l’intuition que l’on a au niveau topologique : dans la topologie C 1 , les difféomorphismes de type Morse-Smale, avec centralisateur C 1 trivial forment une partie ouverte et 1 dense de Diff + (S1 ) [Kop,Yoc 2]. Les théorèmes précédents montrent que le complémentaire est invisible d’un point de vue de la mesure, au moins parmi les difféomorphismes avec points périodiques. La preuve du théorème 4.1 peut être adaptée pour démontrer un résultat qui est intéressant en soi : Théorème 4.3. Soient f1 , . . . , fn des difféomorphismes MS indépendants. Alors le sous-groupe qu’ils engendrent est presque-sûrement libre (de rang n). Ce théorème confirme l’observation topologique : Ghys démontre dans [Ghy] que génériquement dans Homéo+ (S1 ), deux homéomorphismes engendrent un sous-groupe libre. Il est aussi possible de voir le théorème 4.3 comme la généralisation du théorème de Epstein [Eps] dans le contexte des groupes 1 de Lie au groupe de Lie de dimension infinie Diff + (S1 ). Remarque 4.1. L’espace des actions fidèles du groupe libre sur le cercle se sépare qualitativement en deux sous-parties : les actions peuvent être minimales ou laisser un ensemble de Cantor invariant. Par rapport à la topologie naturelle, ces deux sous-parties contiennent des ouverts non-vides. On en déduit que les deux différentes dynamiques sont observables avec probabilité strictement positive. Pour ce qui concerne la présence des difféomorphismes sans orbites périodiques, nous pensons qu’ils forment un ensemble négligeable : une partie du deuxième chapitre est dédiée à nos conjectures à ce propos. Sans rentrer dans le détail, nous terminons cette introduction par une image qui montrent la statistique du nombre de rotation, sur un échantillonnage d’un millier de difféomorphismes « aléatoires ». Remerciements Ce livre doit beaucoup à Étienne Ghys et aux questions qu’il m’a posées tout au long de la thèse. Également l’ambiance conviviale et multidisciplinaire de l’Unité de Mathématiques Pures et Appliquées iv Figure I.2 – Cet escalier représente la fonction de répartition de la variable nombre de rotation, selon la mesure MS. de l’École Normale Supérieure de Lyon a été fondamentale : je tiens à remercier en particulier Alessandro Carderi, Christophe Garban, Emmanuel Jacob, Cristóbal Rivas, Bruno Sévennec, Marielle Simon et Romain Tessera pour leur conseils, parfois fondamentaux. En outre, j’ai bénéficié énormément des discussions avec François Béguin, Victor Kleptsyn, Marco Martens et Andrés Navas. Beaucoup d’arguments sont devenus plus clairs après le cours que j’ai eu le plaisir de donner à la Pontifícia Universidade Católica de Rio de Janeiro pendant l’automne 2014 : je remercie tous les participants, en particulier Sébastien Alvarez, Pablo Barrientos, Dominique Malicet, Carlos Meniño, Maurizio Monge, Isaia Nisoli et Artem Raibekas. v Table des matières I Introduction 1 Généricité topologique et généricité probabiliste 2 Mesures de type Haar . . . . . . . . . . . . . . 3 Les mesures de Malliavin-Shavgulidze . . . . . 4 Étude de la dynamique générique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i i i ii iii II Mesures quasi-invariantes et groupes localement compacts 1 Notions de base de théorie de la mesure . . . . . . . . . . . . 2 Actions sur espaces mesurés . . . . . . . . . . . . . . . . . . . 3 Actions continues sur espaces topologiques mesurés . . . . . . 4 Mesures quasi-invariantes sur les groupes topologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 2 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . III Le mouvement brownien : la fonction continue générique 1 Notions de base de probabilité . . . . . . . . . . . . . . . . 2 Mouvement brownien et régularité . . . . . . . . . . . . . . 3 Propriétés génériques de régularité . . . . . . . . . . . . . . 4 L’intégrale de Paley-Wiener . . . . . . . . . . . . . . . . . . 5 L’espace de Wiener et le théorème de Cameron-Martin . . . 6 Le pont brownien . . . . . . . . . . . . . . . . . . . . . . . . 7 Un deuxième théorème de Cameron-Martin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 6 7 8 8 9 11 12 IV Difféomorphismes du cercle 1 Poincaré et le nombre de rotation . . . . . . . . . 2 Questions de régularité : de Denjoy à nos jours . 2.1 Espaces de difféomorphismes . . . . . . . 2.2 Arithmétique du nombre de rotation . . . 2.3 Le théorème de conjugaison différentiable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 14 16 16 17 18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . V Les mesures de Malliavin-Shavgulidze : difféomorphismes génériques en sion 1 1 Un panorama sur les mesures MS . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Petite histoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Définition des mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Les mesures sur le groupe des difféomorphismes de l’intervalle 1.2.2 Les mesures sur le groupe des difféomorphismes du cercle . . . 1.3 Modules de continuité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Quasi-invariance des mesures MS . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Le théorème de Cameron-Martin-Shavgulidze . . . . . . . . . . . . . . . 2.2 Ergodicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi dimen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 21 21 22 22 24 25 27 27 30 VI Décrire la dynamique aléatoire 1 Points périodiques et nombre de rotation aléatoire . . . . . . . . . . . . . . . . . . 1.1 Difféomorphismes de l’intervalle . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Cadre et notations . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.2 Invariance par inversion du temps . . . . . . . . . . . . . . . . . . 1.1.3 Preuve du théorème 1.1 . . . . . . . . . . . . . . . . . . . . . . . . 1.1.4 Sur le nombre de points fixes . . . . . . . . . . . . . . . . . . . . . 1.2 Difféomorphismes du cercle . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Nombre de rotation rationnel . . . . . . . . . . . . . . . . . . . . . 1.2.2 Nombre de rotation irrationnel . . . . . . . . . . . . . . . . . . . . 1.2.3 Renormalisation et mesures . . . . . . . . . . . . . . . . . . . . . . 2 Centralisateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Quelques rappels sur les centralisateurs des difféomorphismes de l’intervalle 2.2 Centralisateur C 1 d’un difféomorphisme hyperbolique du cercle . . . . . . . 3 Exemples de Denjoy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Appendice : Simulations numériques . . . . . . . . . . . . . . . . . . . . . . . . . . Références . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 32 32 33 33 34 35 36 36 38 39 43 43 46 48 50 58 vii Chapitre II Mesures quasi-invariantes et groupes localement compacts Le fil conducteur sera l’interaction (ou la non-interaction) entre groupes, mesures et topologie. En dimension finie, ceci se concentre principalement dans la notion de mesure de Haar, bijou mathématique que l’on perd lorsque la dimension est infinie. Ce livre part du problème suivant : comprendre quelles sont les mesures qui pourraient remplacer celle de Haar dans certains espaces trop grands. Nous nous proposons ici de décrire les grandes lignes de ce paysage : des textes plus que complets sont disponibles dans la littérature comme références plus techniques. Nous conseillons, à ce propos, le très beau livre de Halmos [Hal] qui porte particulièrement bien ses 60 ans ! 1 Notions de base de théorie de la mesure Soit X un ensemble. Une famille non-vide B ⊂ 2X de parties de X est une tribu (ou σ-algèbre) sur X si B est fermée par les opérations suivantes : – si E ∈ B alors X − E ∈ B, S – si (En )n∈N ⊂ B alors n∈N En ∈ B. Un couple (X, B) est dit espace mesurable. Une fonction f entre deux espaces mesurables (X, B) et (X 0 , B 0 ) est mesurable si f −1 (E 0 ) ∈ B pour tout E 0 ∈ B 0 . Exemple 1.1. La droite réelle R munie de sa tribu borélienne B(R)(i.e. engendrée par les ouverts) est un espace mesurable. Plus généralement, on peut associer un espace mesurable (X, B(X)) à tout espace topologique (X, τ ), en considérant la tribu des boréliens sur X. Un espace mesuré (X, B, µ) est la donnée d’un espace mesurable (X, B) et d’une mesure µ définie sur B (i.e. µ(E) ∈ [0, +∞] est défini pour tout E ∈ B). Lorsque la msure totale µ(X) est égale à 1, on dit que µ est une mesure de probabilité. Lorsque f est une fonction mesurable de (X, B) dans (X 0 , B 0 ), pour toute mesure µ définie sur (X, B) on peut définir la mesure image f∗ µ sur (X 0 , B 0 ) : f∗ µ(E 0 ) := µ(f −1 (E 0 )) pour tout E 0 ∈ B 0 . Ne voulant pas rentrer dans toutes les subtilités de la théorie de la mesure, nous supposerons, dorénavant, que tout espace mesuré X est un espace mesurable standard avec une mesure σ-finie. Cela signifie que l’espace (X, B, µ) est mesurablement isomorphe à l’espace ([0, 1], B ([0, 1]) , Leb). Cette restriction est plutôt fictive pour nous, car dans les exemples que nous traiterons, ces hypothèses seront toujours vérifiées. 2 Actions sur espaces mesurés Définition 2.1. Soit G un groupe qui agit (à gauche) sur un espace mesuré (X, B, µ), avec B invariante par l’action de G et µ mesure σ-finie non-identiquement nulle. On dit que la mesure µ est quasiinvariante pour l’action si pour tout g ∈ G, l’image gA d’un ensemble A ∈ B est de mesure nulle si et seulement si la mesure de A est nulle. Lorsque µ(gA) = µ(A) pour tout A ∈ B et tout g ∈ G, la mesure µ est invariante. 1 Si G agit sur (X, B, µ) et µ est quasi-invariante, il existe une unique fonction ρ : G −→ L1loc (X, µ) telle que pour tout g ∈ G, X f (x) d (g∗ µ) (x) = X f (x) ρg (x) dµ(x) pour tout f ∈ L1 (X, g∗ µ). Ce résultat est le bien connu théorème de Radon-Nikodym et la fonction ρg est plus souvent notée comme la dérivée (de Radon-Nikodym) dgdµ∗ µ ; une telle notation est surtout appropriée si l’on veut souligner sa nature de cocycle (de Radon-Nikodym) : pour tous g, h ∈ G, R R d(gh)∗ µ dg∗ µ dh∗ µ (x) = (hx) · (x) dµ dµ dµ en dehors d’un ensemble µ-négligeable de X (i.e. de mesure nulle). Remarque 2.1. Lorsque la mesure totale µ(X) est finie, alors pour tout élément du groupe g ∈ G, la dérivée de Radon-Nikodym ρg est intégrable, de norme kρg kL1 = µ(X). Définition 2.2. Si µ et ν sont deux mesures sur (X, B) avec la propriété que A est µ-négligeable si et seulement si A est ν-négligeable, on dit que µ et ν définissent la même classe de mesure [µ] = [ν], ou, également, que µ est équivalente à ν, et on écrit µ ∼ ν. Lorsqu’une seule des implications est vérifiée, par exemple si A est ν-négligeable seulement lorsque A est µ-négligeable, on dit que ν est absolument continue par rapport à µ et on écrit ν µ. Une mesure µ est quasi-invariante sous l’action de G si et seulement si les éléments de G préservent la classe de µ. 3 Actions continues sur espaces topologiques mesurés Lorsque l’on suppose que le groupe G agit de façon continue sur un espace topologique X, il est préférable (et plus intéressant) de considérer des mesures sur X qui s’adaptent à la topologie. Dans la suite, on supposera toujours que les espaces topologiques en question sont séparables. Définition 3.1. Soit (X, τ, B) un espace topologique mesurable (ici B est la tribu borélienne 1 ). Une mesure µ sur (X, τ, B) est une mesure de Borel si µ est non-identiquement nulle et finie sur les parties compactes de X. 2 Rappelons qu’une mesure de Borel est régulière à l’extérieur si pour tout E ∈ B, µ(E) = inf{µ(U ) : U ouvert qui contient E}. De manière similaire, µ est dite régulière à l’intérieur si pour tout E ∈ B, µ(E) = sup{µ(K) : K compact contenu dans E}. Une mesure régulière dans le sens précédent est essentiellement déterminée par ses valeurs sur les ouverts ou les compacts de X et une telle mesure est donc appropriée dans un contexte topologique. Ces deux notions sont presque équivalentes, mais il s’avère que demander la régularité intérieure est préférable. Définition 3.2. Soit (X, τ, B) un espace topologique mesurable. Une mesure de Borel µ est une mesure de Radon si elle est finie sur les compacts et régulière à l’intérieur (par rapport aux compacts). Les mesures que nous utiliserons seront de Radon. Exemple 3.1. La mesure de Lebesgue définie sur un ouvert de Rn est évidemment une mesure de Radon et donne une mesure positive à tout ouvert. 1. Normalement on demande que B contienne la tribu borélienne. 2. Dans la littérature, la définition de mesure de Borel peut changer selon les différents auteurs : la propriété qu’elle soit finie sur les compacts n’est pas toujours demandée. 2 Exemple 3.2. La mesure de Wiener sur l’espace des fonctions continues C0 ([0, 1]) (voir la partie III ) est une mesure de Radon et donne une mesure positive à tout ouvert (d’après le théorème de Wiener 2.1 il suffit de le vérifier sur les cylindres). Lorsque G agit de manière continue sur X, on peut se demander s’il existe une mesure de Radon (quasi-)invariante. Sans hypothèses supplémentaires sur X, la réponse à cette question est, en général, négative. En contrepartie, dès que l’on suppose que X est localement compact, on trouve des résultats surprenants ! Théorème 3.1. Soit X un espace topologique séparable localement compact et soit G un groupe qui agit sur X de façon continue. On fait les deux hypothèses suivantes : 1. toute orbite est dense, 2. lorsque K et L sont deux compacts disjoints dans X, il existe un ouvert U non vide dans X tel que, pour tout g ∈ G, le translaté gU n’intersecte pas K et L en même temps. Alors il existe une mesure de Radon µ sur X, invariante par l’action de G. Ce théorème est dû à Steinlage [Ste] et nous l’avons appris sous cette forme dans l’œuvre (monumentale) de Fremlin [Fre, 441C]. En fait, cet énoncé généralise le très célèbre théorème d’existence de la mesure de Haar pour les groupes localement compacts, que nous allons discuter dans la prochaine partie. Pour conclure, terminons par un résultat technique qui s’avérera utile pour étendre par approximation les propriétés de quasi-invariance en dimension finie (voir [Bog 1, Lemma 6.1.8]). Proposition 3.2. Soit X un espace topologique métrisable 3 avec une mesure de probabilité de Radon µ, soit T : X −→ X une application µ-mesurable telle que T∗ µ est de Radon, et soit Tn : X −→ X une suite d’applications mesurables qui convergent µ-presque partout vers T . Supposons que les mesures (Tn )∗ µ sont absolument continues par rapport à µ et que les dérivées de Radon-Nikodym correspondantes forment une suite uniformément intégrable (i.e. relativement compacte dans L1 ). Alors la mesure T∗ µ est absolument continue par rapport à µ et la dérivée de Radon-Nikodym est la limite des dérivées dans la topologie faible de L1 (X, µ). 4 Mesures quasi-invariantes sur les groupes topologiques Les actions qui nous intéresserons le plus seront celles des groupes topologiques sur eux-mêmes. Tout groupe agit naturellement sur lui-même par translations, de deux cotés différents : il peut agir à gauche par l’action L : G × G −→ G (g, x) 7−→ g −1 x et à droite par l’action R : G × G −→ G (g, x) 7−→ xg et ces actions sont dites régulières. Remarque 4.1. Les actions L et R commutent toujours. On remarquera aussi que ces actions sont libres et transitives : si g −1 x = h−1 x alors g = h, et si x, y ∈ G alors, en posant g = xy −1 , on a g −1 x = y. Une autre action dynamiquement intéressante est l’action par conjugaison : γ : G × G −→ G (g, x) 7−→ gxg −1 3. Cette hypothèse peut être affaiblie. 3 Remarque 4.2. Contrairement aux actions régulières, l’action par conjugaison n’est ni libre, ni transitive (si le groupe n’est pas trivial !). Les orbites forment les classes de conjugaison dans G et le stabilisateur d’un élément x ∈ G coïncide avec le centralisateur de x dans G. Lorsque le groupe G est un groupe topologique, ces actions sont continues. Définition 4.1. Une mesure de Haar invariante à gauche (resp. à droite) sur G est une mesure de Radon sur G, invariante par l’action régulière gauche (resp. droite). Exemple 4.1. Lorsque G est le groupe abélien Rn muni de sa topologie euclidienne, il est classique que toute mesure de Haar doit être proportionnelle à la mesure de Lebesgue. Exemple 4.2. Soit Γ un groupe dénombrable discret. La mesure de comptage définit une mesure de Haar sur Γ qui est invariante à gauche et à droite en même temps. Il est facile d’observer que toute autre mesure de Haar sur Γ doit être proportionnelle à la mesure de comptage. En outre, la mesure de Haar est finie si et seulement si le groupe Γ est fini. Ce dernier exemple, même un peu naïf, représente pleinement la situation pour les groupes localement compacts. Nous avons déjà annoncé que le théorème de Steinlage 3.1 est une version « décorée » du théorème de Haar que nous énonçons ici. Théorème 4.1. Sur un groupe localement compact G, il existe toujours une mesure de Haar invariante à gauche, et deux telles mesures sont proportionnelles. De plus, la mesure est finie si et seulement si le groupe G est compact. Remarque 4.3. Toute mesure de Haar µ invariante à gauche définit une mesure de Haar ν invariante à droite : si E ∈ B est un borélien dans G, on pose ν(E) = µ(E −1 ). Alors pour tout g ∈ G, ν(Eg) = µ(g −1 E −1 ) = µ(E −1 ) = ν(E). En général, les mesures de Haar invariantes à gauche ne sont pas invariantes à droite. De manière encore plus étonnante et remarquable, l’existence d’une mesure de Haar caractérise essentiellement les groupes localement compacts. Définition 4.2. Un groupe mesurable (au sens de Weil) est un espace mesuré (G, B, µ) tel que 1. µ est σ-finie et non-identiquement nulle, 2. G est un groupe, 3. la tribu B et la mesure µ sont invariantes par translations à gauche, 4. la multiplication dans G est mesurable. Plus précisément, la fonction qui à (x, y) ∈ G × G associe x−1 y ∈ G est mesurable. Définition 4.3. Un groupe mesuré (G, B, µ) est dit séparé (au sens de Weil) si pour tout élément g ∈ G différent de l’identité, il existe E ∈ B de mesure finie strictement positive tel que la mesure de la différence symétrique est positive : µ(gE 4 E) > 0. Lorsque (G, B, µ) est un groupe mesuré et séparé, il est possible de définir une topologie de groupe topologique sur G, la topologie de Weil τWeil . En effet, sous ces hypothèses, la famille N des ensembles {g ∈ G : µ(gE 4 E) < ε} tels que E ∈ B soit de mesure finie strictement positive, ε ∈]0, 2 µ(E)[, définit un système de voisinages de l’identité dans G. Le groupe topologique mesuré (G, τWeil , B, µ) est un groupe localement borné, où l’on dit que E ∈ B est borné si pour tout voisinage I de l’identité, E est recouvert par un nombre fini de translatés de I. Lorsque l’intérieur d’une partie E ∈ B n’est pas vide, la mesure de E est positive ; lorsque E ∈ B est borné, la mesure de E est finie. Donc G est « presque » un groupe localement compact et µ sa mesure de Haar. Le « presque » est précisé par le théorème de Mackey et Weil [Mac, Wei] que nous allons énoncer. 4 Définition 4.4. Un sous-groupe G dans un groupe mesuré (Ĝ, B̂, µ̂) est dit épais si pour tout Ê ∈ B̂, n o sup µ̂(K̂) : K̂ est un compact dans Ĝ contenu dans Ê − G = 0. Théorème 4.2 (Mackey – Weil). Soit G un groupe mesuré, séparé. Alors il existe un groupe localement compact Ĝ avec une mesure de Haar µ̂ sur la tribu de Borel B̂ de Ĝ, tel que – G soit un sous-groupe épais de Ĝ, – B ⊃ B̂ ∩ G, – µ(E) = µ̂(Ê) lorsque Ê ∈ B̂ et E = Ê ∩ G. Pour une preuve de ce théorème, le lecteur pourra consulter [Wei], aussi bien que le déjà cité [Hal]. Remarque 4.4. Dans [Wei], une version plus fine de ce théorème est montrée. En effet, on peut affaiblir les hypothèses du théorème 4.2 pour montrer que le même résultat est valable lorsque l’on suppose seulement que la mesure sur (G, B) est quasi-invariante. 5 Chapitre III Le mouvement brownien : la fonction continue générique Nos premiers vers dans l’étude de la dynamique générique selon le point de vue probabiliste transite naturellement par le mouvement brownien, qui représente, dans les mathématiques modernes, l’idée de fonction continue choisie au hasard. Le problème de la définition mathématique de cet objet a nécessité beaucoup d’efforts, achevés principalement grâce aux contributions de Wiener [Wie 1]. Nous présentons les outils probabilistes nécessaires à la compréhension de ce travail. Le lecteur pourra consulter le texte [Mör-Per] (voir aussi [Rev-Yor, Kar-Shr] ) comme référence plus que complète sur ce sujet. 1 1 Notions de base de probabilité Un espace de probabilité (Ω, B, P) est un espace mesuré tel que la mesure totale P(Ω) est égale à 1 (voir §1 dans le chapitre précédent). Une variable aléatoire X sur (Ω, B, P) est une fonction mesurable R X : (Ω, B) −→ (R, B(R)). Nous noterons E[X] son espérance, E[X] = Ω X(ω) dP(ω), et Var(X) sa variance, Var(X) = E[X 2 ] − E[X]2 . Une variable aléatoire X définit une mesure de probabilité X∗ P sur (R, B(R)), que l’on appelle distribution de la variable : X∗ P(A) = P(X ∈ A), A ∈ B(R). Exemple 1.1. Une variable X sur (Ω, B, P) est dite gaussienne si sa distribution est une loi gaussienne : autrement dit, il existe σ > 0, m ∈ R tels que P(X ∈ A) = √1 2πσ Z A 2 exp − (t−m) 2σ dt. Les paramètres m est σ sont, respectivement, l’espérance et la variance de la variable X, et sa distribution est notée N (0, σ). L’analyse de Fourier caractérise les variables de distribution gaussienne : une variable X est une variable gaussienne d’espérance m et variance σ si et seulement si h i E eiξX = exp iξm − σ2 ξ 2 pour tout ξ ∈ R. (III.1) Une filtration F (d’une tribu B) est une suite monotone croissante de sous-tribus (Fs )s≥0 : Fs ⊂ Ft si s < t. Une filtration est dite régulière si pour tout s ≥ 0, \ Ft = Fs . t>s On dit qu’une filtration sur (Ω, B, P) définit un espace de probabilité filtré. Un processus X = (Xs )s≥0 sur un espace de probabilité filtré (Ω, B, P, F) est la donnée, pour chaque s ≥ 0, d’une variable aléatoire Xs : (Ω, Fs , P) −→ (R, B(R)). On dit aussi que le processus X est adapté à la filtration F. 1. Le lecteur francophone pourra également se faire du plaisir en consultant aussi [Lév]. 6 Remarque 1.1. Tout processus X est adapté par rapport à sa filtration naturelle (σ(Xs , s ≤ t))t≥0 , où σ(Xs , s ≤ t) est la plus petite tribu pour laquelle les variables (Xs , s ≤ t) sont mesurables, à savoir engendrée par les pré-images Xs−1 (A) des ouverts A ⊂ R. Exemple 1.2. Un processus X = (Xs ) est dit gaussien, si toute combinaison linéaire des Xs est une variable gaussienne par rapport à la loi conjointe. Les processus gaussiens sont déterminés par les espérances et les fonctions de covariance Γ(s, t) = Cov(Xs , Xt ) = E[Xs Xt ] − E[Xs ] E[Xt ]. 2 Mouvement brownien et régularité Définition 2.1. Soit (Ω, B, P) un espace de probabilité. Un mouvement brownien (standard) sur l’intervalle I = [0, 1] est un processus B = (Bt )t∈I défini sur Ω qui satisfait les propriétés suivantes : 1. pour presque tout ω ∈ Ω, l’application t ∈ I 7−→ Bt (ω) est une fonction continue, 2. pour tout choix de t0 = 0 < t1 < . . . < tn−1 < tn = 1, les variables aléatoires Bti − Bti−1 sont deux à deux indépendantes, 3. pour tout choix s < t de temps dans I, la variable Bt − Bs suit une loi gaussienne N (0, t − s), à savoir P(a < Bt − Bs < b) = √ Z b 1 2π(t−s) a 1 exp − 2(t−s) x2 dx, 4. pour presque tout ω ∈ Ω, on a B0 (ω) = 0. Tout mouvement brownien B induit une mesure de probabilité W := B∗ P, sur l’espace C0 (I) des fonctions continues sur l’intervalle I qui valent 0 en 0, muni de la tribu cylindrique C : elle est engendrée par les cylindres C ∈ C, parties de la forme C = {x ∈ C0 (I) | x(ti ) − x(ti−1 ) ∈ Ai , i = 1, . . . n}, (III.2) avec 0 = t0 < t1 < . . . < tn−1 < tn = 1 et Ai ∈ B(R). La mesure W est dite mesure de Wiener. La mesure d’un cylindre est déterminée par les propriétés du mouvement brownien (définition 2.1 ) : pour C comme à la ligne (III.2), W(C) = 1 √ n (2π) (tn −tn−1 )···(t1 −t0 ) Z ··· A1 Z exp An − 12 n X i=1 yi2 ti − ti−1 ! dy1 · · · dyn . (III.3) Théorème 2.1 (Wiener). Les tribus cylindrique C et borélienne B(C0 (I)) sur C0 (I) coïncident. Par conséquent, l’espace de Wiener (classique) (C0 (I), B(C0 (I)), W) représente le choix intrinsèque d’espace de probabilité sur lequel définir concrètement le mouvement brownien : pour x ∈ C0 (I), Bt est la variable aléatoire qui correspond à la valeur de la fonction x au temps t, Bt (x) := x(t). Corollaire 2.2. Le mouvement brownien existe et il est uniquement déterminé par ses propriétés. Nous choisirons comme réalisation des trajectoires browniennes, celle du mouvement brownien donné par la mesure de Wiener. Nous verrons que la mesure de Wiener est un candidat naturel pour remplacer la mesure de Lebesgue sur le groupe abélien de dimension infinie. Remarque 2.1. Rappelons que le mouvement brownien est un processus gaussien centré et par conséquent caractérisé par la famille des covariances Γ(s, t). Dans le cas du mouvement brownien, on a Γ(s, t) = min{s, t}, pour tous s, t. 7 3 Propriétés génériques de régularité Il s’avère que les trajectoires du mouvement brownien ne sont pas différentiables, cependant selle sont un peu plus que continues. Plus précisément nous avons les résultats suivants (voir [Mör-Per, chapitres 1 et 10] ) : Théorème 3.1 (Différentiabilité en aucun point). Presque sûrement, le mouvement brownien n’est différentiable en aucun point t ∈ [0, 1]. Théorème 3.2 (Variation infinie). Presque sûrement, la variation (voir (IV.1)) du mouvement brownien est infinie. Théorème 3.3 (Exposant d’Hölder 1/2). 1. Presque sûrement, le mouvement brownien est une fonction α-höldérienne, pour tout α < 1/2. 2. Presque sûrement, le mouvement brownien est une fonction qui n’est pas α-höldérienne en aucun point, pour tout α > 1/2. Remarque 3.1. Pour compléter l’énoncé du théorème 3.3, il est intéressant de savoir qu’il existe presque sûrement des points lents, auxquels le mouvement brownien est exactement 1/2-höldérien, mais ils sont rares (au sens de la dimension de Hausdorff). p 2t| log t|. Soit B un mouvement |Bt − Bs | = 1 = 1. ε→0 s<t≤1, w(ε) (III.4) Théorème 3.4 (Module de continuité de Lévy). Soit w(t) = brownien standard. On a P lim sup t−s≤ε L’expression (III.4) dit en particulier que le mouvement brownien est une fonction avec module de continuité w. Pour des rappels sur la notion de module de continuité, voir la partie 1.3 du chapitre V. Essayons d’expliquer pourquoi l’exposant critique est exactement 1/2 : cela provient de la nature gaussienne du mouvement brownien. Pour cela nous devons rappeler le critère de Kolmogorov-Čentsov (voir [?, Chapter 1, (1.8)] ) : Théorème 3.5. Soit X = (Xs )s∈[0,1] un processus sur un espace de probabilité filtré (Ω, B, P, F) tel qu’il existe des constantes α, β et C > 0 telles que pour tout 0 ≤ s < t ≤ 1 on ait E|Xt − Xs |α ≤ C |t − s|1+β . (III.5) Alors il existe une modification X̃ = (X̃s )s∈[0,1] de X (à savoir un processus X̃ tel que pour tout s ∈ [0, 1], X̃s = Xs presque sûrement) qui est γ-hölderienne pour tout γ < β/α. 1 En effet, si X est une variable gaussienne centrée de variance t − s > 0, alors Y = √t−s X est une α variable gaussienne de variance 1, donc C = E|Y | ne dépend pas de t − s et on peut écrire E|X|α = C (t − s)α/2 . Donc pour tout α > 2, la condition (III.5) est vérifiée pour B = (Bs )s∈[0,1] , avec β = α2 − 1 et le critère de Kolmogorov-Čentsov implique qu’il existe une modification de B qui est γ-hölderienne pour tout γ < 21 − α1 . En prenant α arbitrairement grand, on retrouve l’exposant critique 1/2. 4 L’intégrale de Paley-Wiener Il est souvent pratique, et il le sera en effet pour nous, de pouvoir définir en quelque sorte l’intégrale d’une fonction par rapport au mouvement brownien. Si f est une fonctionRdans L2 (I) = L2 (I, Leb), ceci se fait sans trop de complications au sens de Stieltjes. Si f = 1[s,t[ , on pose 01 1[s,t[ (u) dBu := B(t)−B(s). 8 On étend ensuite la fonctionnelle forme R1 · dBu par linéarité à toutes les fonctions qui s’écrivent sous la 0 f= k X ai 1[si ,ti [ , ai ∈ R. (III.6) i=1 On voit alors que pour presque tout ω ∈ Ω, 01 · dBu (ω) définit une fonctionnelle linéaire continue (bornée) sur une partie dense dans L2 (I), et qu’elle possède donc une extension à L2 (I) entier. R De plus, pour tout f comme dans (III.6), 01 f dB est une somme de variables aléatoires gaussiennes, donc variable gaussienne elle même. Il est classique qu’une limite de variables gaussiennes est encore gaussienne, donc pour tout f ∈ L2 (I), R Z 1 f dB (III.7) 0 est une variable gaussienne centrée, de variance 01 f 2 (ceci peut se voir grâce à la caractérisation R (III.1) ). La variable 01 f dB est connue sous le nom d’intégrale de Wiener. R 5 L’espace de Wiener et le théorème de Cameron-Martin En suivant la présentation de [Mör-Per, §1.4], nous définissons l’espace de Dirichlet D0 (I) des fonctions absolument continues x ∈ C0 (I) avec dérivée dans L2 (I) : il existe ξ ∈ L2 (I) tel que pour Rt presque tout t, x(t) = 0 ξ(s) ds. Cet espace s’insère naturellement dans le contexte de la mesure de Wiener, puisqu’il représente exactement le sous-espace de C0 (I) des fonctions x qui préservent la classe de la mesure de Wiener sous l’action de translation Tx (y) := y + x. Plus précisément : Théorème 5.1 (Cameron – Martin [Cam-Mar 1]). Soit x une fonction dans C0 (I). Alors la classe de la mesure de Wiener W est préservée par Tx si et seulement si x ∈ D0 (I) et, sous cette hypothèse, le cocycle de Radon-Nikodym 2 est d(Tx )∗ W 1 (y) = exp − dW 2 Z 1 x0 (t)2 dt + Z 1 x0 (s) dy(s) , y ∈ C0 (I). (III.8) 0 0 L’expression 01 x0 (s) dy(s) dans (III.8) dénote l’intégrale de Wiener. Pour montrer ce théorème, nous allons d’abord donner une construction alternative de la mesure de Wiener. Considérons l’espace de Hilbert réel séparable L2 (I) et fixons (gn )n∈N une base orthonormée. R Exemple 5.1. En suivant Wiener [Wie 2], on pourra prendre g0 = 1 et, pour n > 0, √ gn (t) = 2 cos(πnt). (III.9) Ce choix, naturel d’un point de vue de l’analyse de Fourier, est cependant moins adapté quand on veut faire des calculs. Un choix bien meilleur, comme Lévy le fit [Lév], est la base de Haar : pour m ≥ 1 et 1 ≤ k ≤ 2m−1 on définit hm,k := 2 m−1 2 1[ 2k−2 2k−1 − 1 2k−1 2k [ m , m] m , m ] 2 2 2 2 et on pose g0 = 1 et gn = hm,k , pour n = 2m−1 − 1 + k. En fait, nous n’utiliserons pas la forme explicite des gn dans ce qui va suivre. L’espace D0 (I) est un espace de Hilbert réel lorsque l’on définit le produit scalaire hx, yiD0 (I) := hx0 , y 0 iL2 . Une base orthonormée Φn est définie par intégration des gn : Z t gn (s) ds. Φn (t) := 0 2. voir la partie 2 pour la définition. 9 Observons que pour toutes fonctions x et y dans L2 (I), l’inégalité de Cauchy-Schwarz donne Z t (x(s) − y(s)) ds ≤ kx − ykL1 ≤ kx − ykL2 , 0 donc si limn→∞ kxn − xkD0 (I) = 0 alors la suite (xn ) tend uniformément vers x. Par conséquent, pour tout x ∈ D0 (I), la série X x= hx0 , gn iL2 Φn n∈N converge dans D0 (I) et donc uniformément. Soit (Zn ) une suite de variables aléatoires gaussiennes centrées de variance 1, indépendantes, identiquement distribuées. Soit x la somme de la série aléatoire de fonctions X x= Zn Φn . (III.10) n∈N Il est possible de montrer que x est presque sûrement une fonction continue (et il s’agit du point où le choix de la base (gn ) peut simplifier la preuve, voir [Mör-Per] ). En utilisant la remarque 2.1, il est alors clair que x défini par (III.10) est un mouvement brownien : il s’agit d’un processus gaussien centré, de covariance " Γ(s, t) := Cov (x(s), x(t)) = E # X Zn2 Φn (t) Φn (s) n∈N = X h1[0,t] , gn i2L2 n∈N h1[0,s] , gn i2L2 = h1[0,s] , 1[0,t] i2L2 = min {s, t} . Si l’on note γ la mesure gaussienne sur R, dγ(x) = précédents : 1 2 √1 e− 2 x 2π dx, on peut ainsi résumer les arguments Théorème 5.2. Soit (gn )n∈N une base de l’espace L2 (I). Étant donné un mouvement brownien x sur R l’intervalle I et une fonction g ∈ L2 (I), notons hx0 , giL2 l’intégrale de Wiener 01 g dx définie à la ligne (III.7). L’application C0 (I) −→ RN (III.11) x 7−→ (hx0 , gn iL2 )n∈N définit un isomorphisme (linéaire) mesurable entre l’espace de Wiener classique (C0 (I), B(C0 (I)), W) et l’espace vectoriel gaussien de dimension infinie (RN , B(RN ), γ ⊗N ). Preuve du théorème de Cameron-Martin 5.1. Soit x ∈ D0 (I), on va montrer que la mesure W est absolument continue par rapport à la mesure (Tx )∗ W. L’image de l’espace de Dirichlet D0 (I) est l’espace `2 (N) ⊂ RN et comme l’isomorphisme (III.11) est linéaire, l’action induite par Tx sur (RN , B(RN ), γ ⊗N ) est également une action de translation Ta , a = (an ) ∈ `2 (N). Donc il nous faut montrer que la mesure gaussienne γ ⊗N est absolument continue par rapport à (Ta )∗ γ ⊗N . Pour calculer la dérivée de Radon-Nikodym de (Ta )∗ γ ⊗N par rapport à γ ⊗N on procède par approximation, en vertu de la proposition 3.2 du chapitre II. Soit N ∈ N assez grand, on pose aN := (a0 , . . . , aN , 0, . . .) la projection de a sur le sous-espace engendré par les premiers N + 1 vecteurs de la base canonique de `2 (N) (la suite aN est égale à a dans les premières N + 1 cordonnées et identiquement nulle après). La transformation TaN agit uniquement sur les premiers N + 1 facteurs de l’espace produit RN et par conséquent on peut calculer aisément la densité de (TaN )∗ γ ⊗N par rapport à γ ⊗N : N N Y X d(TaN )∗ γ ⊗N exp(−(zn −an )2 /2) ((z )) = = exp an z n − n 2 exp(−zn /2) dγ ⊗N n=0 n=0 10 1 2 N X n=0 ! a2n . Puisque l’on a fait l’hypothèse que la suite (an )n∈N appartient à l’espace `2 (N), la limite sur N de la suite d(TaN )∗ γ ⊗N dγ ⊗N existe presque sûrement et est égale à exp ha, (zn )i`2 − 21 kak2`2 (la convergence presque sûre de n∈N an zn vers ha, (zn )i`2 est, par dualité de Fourier, l’existence presque sûre de l’intégrale de Wiener). D’après la proposition 3.2 du chapitre II, la limite de dérivées de Radon-Nikodym est la dérivée de Radon-Nikodym de la transformation Ta . En utilisant l’inverse de l’isomorphisme (III.11) et l’identité de Parseval, on en conclut (cf. avec (III.8) dans l’énoncé) P d(Tx )∗ W (y) = exp hx0 , y 0 iL2 − 12 kx0 k2L2 = exp hx, yiD0 (I) − 12 kxk2D0 (I) . dW Nous avons aussi la relation symétrique (Tx )∗ W W puisque la mesure (Tx )∗ ((T−x )∗ W) est absolument continue par rapport à la mesure (T−x )∗ W. 6 Le pont brownien Il est aussi possible de définir le mouvement brownien sur le cercle S1 (i.e. comme fonction 1périodique aléatoire). Dans ce cas on parle de pont brownien. Après avoir identifié le cercle au tore R/Z, l’espace C0 (S1 ) des fonctions continues sur le cercle qui prennent la valeur 0 en 0 peut se voir comme l’espace des fonctions continues sur R de période 1 qui valent 0 en 0. Puisque l’intervalle [0, 1] est un domaine fondamental pour l’action de translation de Z, on pourra écrire C0 (S1 ) = {x ∈ C0 (I) : x(0) = x(1) = 0} et on ne fera pas de distinction entre les domaines de définition I ou S1 . On remarquera que l’application π définie par y ∈ C0 (I) 7−→ {x : t 7−→ y(t) − t y(1)} ∈ C0 (S1 ) (III.12) est une projection (elle est linéaire et vérifie π 2 = π) continue et on peut définir la mesure de Wiener sur C0 (S1 ) par W0 := π∗ W. Le processus canonique x = (x(t))t∈S1 sur C0 (S1 ), B C0 (S1 ) , W0 , définit un processus gaussien que l’on appelle pont brownien et porte comme covariances Γ(s, t) = min{s, t} − s t. (III.13) Puisque la projection π modifie y d’une fonction linéaire, les propriétés de régularité presque sûres du pont brownien sont les mêmes que celles du mouvement brownien. Remarque 6.1. Dans la littérature, le pont brownien est aussi présenté en conditionnant le mouvement brownien à revenir en 0 au temps 1. On retrouve un processus gaussien, dont les fonctions de covariance sont données par (III.13). Remarque 6.2. Une représentation gaussienne comme (III.11) est aussi possible pour définir le pont brownien : il suffit de modifier les fonctions Φn ∈ D0 (I) en posant (confronter avec (III.12) ) Φ̃n (t) := Φn (t) − t Φn (1) ∈ D0 (S1 ). On remarquera que Φ̃0 ≡ 0, et on doit donc retirer Φ̃0 de la base. En posant x̃(t) = on a alors X Γ̃(s, t) := Cov (x̃(s), x̃(t)) = E Zn2 Φ̃n (t) Φ̃n (s) = min{s, t} − s t. P n∈N∗ n∈N∗ Le théorème de Cameron-Martin pour la mesure de Wiener sur C0 (S1 ) s’énonce ainsi : 11 Zn Φ̃n (t), Théorème 6.1. Soit x une fonction dans C0 (S1 ). Alors la classe de la mesure de Wiener W0 est préservée par Tx si et seulement si x ∈ D0 (S1 ) et, sous cette hypothèse, le cocycle de Radon-Nikodym est d(Tx )∗ W0 (y) = exp hx, yiD0 (S1 ) − 12 kxk2D0 (S1 ) , y ∈ C0 (S1 ). dW0 Le phénomène que l’on observe avec le théorème de Cameron-Martin 5.1 est par conséquent presque optimal : puisque C0 (I) est un groupe qui n’est pas localement compact, il n’y a aucun espoir de définir une mesure quasi-invariante, non seulement sur C0 (I), mais sur un sous-espace quelconque de C0 (I) de mesure strictement positive. Cependant, la mesure de Wiener est quasi-invariante par l’action d’un sous-groupe dense, qui n’est pas localement compact, et en même temps de mesure nulle ! 7 Un deuxième théorème de Cameron-Martin Terminons cette introduction au mouvement brownien par une partie, plus technique, qui est à la base de la quasi-invariance des mesures sur les groupes de difféomorphismes : il s’agit d’étendre le théorème de Cameron-Martin 5.1 à une classe de transformations non-linéaires de l’espace de Wiener C0 (I). Pour cela, reprenons l’isomorphisme (III.11) entre l’espace de Wiener classique (C0 (I), W) et l’espace vectoriel gaussien de dimension infinie (RN , γ ⊗N ). Supposons qu’au lieu d’une translation Ta : (zn )n∈N 7−→ (zn + an )n∈N , avec a = (an ) ∈ `2 (N), nous considérons maintenant une translation non-linéaire TA = I + A : z = (zn ) ∈ RN 7−→ (zn + an (z)) ∈ RN , qu’on supposera par simplicité inversible presque partout. Rappelons que l’hypothèse que a soit de carré intégrable est fondamentale pour garantir la quasiinvariance de la mesure gaussienne γ ⊗N . On supposera ainsi que la translation non-linéaire TA = I + A est dans la direction de l’espace de Cameron-Martin, ce qui signifie simplement que l’image de A est contenue dans le sous-espace `2 (N). Essayons de deviner comment cette translation opère-t-elle sur la mesure gaussienne γ ⊗N en procédant par approximations finies, comme dans le théorème de Cameron-Martin 5.1. Pour N ∈ N fixé, on définit l’opérateur de projection πN : RN −→ RN dans le sous-espace vectoriel engendré par les N + 1 premiers vecteurs de la base standard de RN . Notons AN = πN AπN et par suite TAN = I + AN , dont la restriction à `2 (N) est une perturbation de rang fini de l’identité. La densité de la mesure (TAN )∗ γ ⊗N par rapport à γ ⊗N est obtenue alors par simple changement de variable : d(TAN )∗ γ ⊗N 1 (TAN (z)) = exp hAN (z), zi`2 + 21 kAN (z)k2`2 , ⊗N dγ |Dz (I + AN )| (III.14) où Dz (I + AN ) = I + Dz AN dénote la dérivée jacobienne de I + AN au point z ∈ RN . Bien évidemment, pour que cela ait du sens, on requiert une hypothèse de différentiabilité pour A, que l’on explicitera un peu plus loin. Observons d’abord que, puisque l’image de l’opérateur A est incluse dans le sous-espace `2 (N), on peut facilement en déduire le candidat pour la limite de l’expression dans l’exponentielle dans (III.14) (en négligeant les problèmes dans la définition d’une « intégrale stochastique » hA(z), zi`2 ). Regardons la suite des déterminants jacobiens |Dz (I + AN )|. Pour avoir que la limite d’une telle suite existe, il faut imposer des conditions sur l’opérateur A. Rappelons qu’un opérateur compact K de `2 (N) dans `2 (N) est diagonalisable, son spectre σ(K) = (λk )k∈N est dénombrable et la multiplicité ν(λ) de toute valeur propre λ non-nulle est finie. Un opérateur compact K est de classe trace, si la suite des valeurs propres, considérée avec multiplicité, est sommable. On peut alors définir, pour tout opérateur de classe trace, le déterminant de Fredholm det(I + K) = Y (1 + λ)ν(λ) , λ∈σ(K) 12 (III.15) qui naturellement généralise le déterminant usuel (le nom est justifié par le fait que I + K est un opérateur de Fredholm). Remarque 7.1. D’après Ramer [Ram], le bon cadre pour définir un déterminant en dimension infinie est constitué des opérateurs de Hilbert-Schmidt, à savoir les opérateurs compacts dont le spectre est de carré intégrable. Dans ce cas il est possible de définir le déterminant régularisé de Fredholm-Carleman det2 (I + K) = Y (1 + λ)ν(λ) e−ν(λ)λ . λ∈σ(K) En revenant à l’opérateur A, on souhaite que la limite des jacobiens |I + Dz AN | soit de la forme (III.15). On fait donc l’hypothèse que pour tout z ∈ RN , la restriction de Dz AN à `2 (N) converge vers un opérateur compact de classe trace dans la topologie de la norme, que l’on note Dz A (rappelons qu’une limite d’opérateurs de rang fini est nécessairement compact). En fait, on peut vérifier que l’opérateur Dz A : `2 (N) −→ `2 (N) est défini comme une différentielle directionnelle usuelle : pour tout v ∈ `2 (N), on a Dz A(v) = lim ε→0 A(z + ε v) − A(z) . ε On espère avoir motivé ainsi la formule de changement de la mesure de Wiener sous des transformations non-linéaires, due originairement á Cameron-Martin [Cam-Mar 2], puis largement améliorée par des travaux successifs, en commençant par Ramer [Ram] (voir aussi les livres [Bog 1, §6.6] ou [Üst-Zak]). Le résultat s’énonce ainsi : Théorème 7.1. Soit K : C0 (I) −→ D0 (I) un opérateur non-linéaire différentiable dans la direction de D0 (I) et tel que en tout point x ∈ C0 (I), la différentielle Dx K définie sur D0 (I) est un opérateur de Hilbert-Schmidt. Supposons que la transformation T = I + K soit presque partout inversible. Alors la mesure T∗ W est absolument continue par rapport à la mesure W et la dérivée de Radon-Nikodym est dT∗ W 1 (T (x)) = exp hK(x), xiD0 (I) + 12 kK(x)k2D0 (I) . W det2 (I + Dx K) Bien évidemment, étendre ce résultat dans le cas de transformations de la mesure de Wiener W0 sur C0 (S1 ) ne présente aucune difficulté. 13 Chapitre IV Difféomorphismes du cercle Il ne sera pas possible de résumer en quelques pages la théorie des difféomorphismes du cercle : leur étude, inaugurée par Poincaré dans son célèbre article [Poi], constitue une partie remarquable dans la théorie des systèmes dynamiques, et des mathématiques en général. Nous renvoyons le lecteur aux textes généraux [Kat-Has, chapitres 11 et 12], [dMe-vSt, chapitre I], et plus spécifiques : [Yoc 2, Her 1] – pour les aspects analytiques – et [Ghy, Nav 1, Nav 2] – pour une approche plus « géométrique ». Nous nous limiterons ici à introduire les notions et résultats fondamentaux qui seront utilisés dans la suite de ce travail. 1 Poincaré et le nombre de rotation Soit f un homéomorphisme du cercle S1 , que l’on voit comme le quotient de R par la translation x 7−→ x + 1. Il existe alors un homéomorphisme F de R dans R qui vérifie F (x + 1) = F (x) + 1 pour tout x ∈ R et F (x) = f (x) (mod 1). On dira que F relève l’homéomorphisme f . 1 De manière réciproque, tout homéomorphisme F : R −→ R qui commute avec la translation par 1, définit par réduction (mod 1) un homéomorphisme du cercle F̄ . En termes plus savants, le morphisme π de revêtement universel 0 /R π / S1 / Homeo ^ + (S1 ) π / Homéo+ (S1 ) /Z /1 induit le morphisme de revêtement universel 0 /Z /1 ^ + (S1 ) s’identifie aux fonctions {F ∈ Homéo+ (R) : F (x + 1) = F (x) + 1}, qui est un groupe et Homeo topologique lorsqu’on le munit de la topologie induite par la norme C 0 : un homéomorphisme F est ε-proche de l’identité id si kF − idk0 := sup |F (x) − x| < ε. x∈[0,1[ Parfois nous ne faisons pas de distinction entre un homéomorphisme du cercle et ses relevés. Pour limiter cette ambiguïté, nous supposerons souvent que l’homéomorphisme F qui relève f ∈ Homéo+ (S1 ) sera déterminé par la condition F (0) ∈ [0, 1[. Remarque 1.1. Si F1 et F2 relèvent f , leur différence F2 − F1 se projette (mod 1) sur la fonction identiquement nulle. Deux relevés diffèrent ainsi d’un nombre entier. Proposition 1.1 (Poincaré). Pour tout f ∈ Homéo+ (S1 ) donné et pour tout choix du relevé F , il existe un unique α ∈ R tel que pour tout x ∈ R |F n (x) − x − nα| < 1. 1. On supposera toujours que f est un homéomorphisme qui préserve l’orientation de S1 . 14 En d’autres termes, il existe une unique translation Rα sur R telle que la fonction F reste à distance bornée de Rα , ainsi que toutes ses itérées F n de Rnα , avec une borne ne dépendant pas de n. Cette remarque justifie la terminologie : le nombre α donné par la proposition 1.1 est appelé le nombre de translation de F . Il suit de la remarque 1.1 que le nombre de translation d’un homéomorphisme f est bien défini ^ + (S1 ) associe son nombre de translation α = ρ(F ) induit (mod 1) : l’application ρ qui à F ∈ Homeo l’application ρ̄ : Homéo+ (S1 ) −→ S1 f 7−→ ρ(F ) (mod 1) C0 qu’on appelle application de nombre de rotation et qu’on notera, avec un abus de notation, plus souvent par ρ. Lorsqu’on munit le groupe Homéo+ (S1 ) de sa topologie naturelle C 0 , l’application ρ est une fonction continue : elle est la limite uniforme de la suite de fonctions continues 1 n (F (x) − x) (mod 1). n L’application nombre de rotation donne beaucoup d’informations sur la dynamique induite par un homéomorphisme f : son nombre de rotation ρ(f ) est rationnel si et seulement si f possède une orbite périodique. Plus précisément, si ρ(f ) = pq , alors toute orbite périodique de f est de période q. Proposition 1.2. Soient f et g deux homéomorphismes du cercle tels qu’il existe h, fonction sur S1 continue et croissante 2 qui semi-conjugue f à g, h ◦ f = g ◦ h. Alors, les nombres de rotations de f et g coïncident : ρ(f ) = ρ(g). Quand l’homéomorphisme f ne possède pas d’orbite périodique, deux cas peuvent se produire. La première possibilité est que f soit un homéomorphisme minimal, à savoir que toute orbite est dense : dans ce cas il existe un homéomorphisme h, unique à rotation près, qui conjugue f à la rotation d’angle α = ρ(f ), h ◦ f = h + α. Sinon, les orbites s’accumulent sur un unique ensemble minimal invariant K = Kf , qui est homéomorphe à un Cantor. Dans ce cas, il existe une fonction continue et croissante h qui semiconjugue f à la rotation d’angle α = ρ(f ), h ◦ f = h + α. Ce cas est dit exceptionnel et l’ensemble minimal K est également dit exceptionnel. Ce terme dérive du fait que, selon Poincaré, de tels exemples devaient être bien rares... Hélas, Poincaré n’a pas vécu assez longtemps pour que Denjoy [Den] lui confirme et contredise à la fois cette affirmation : il construit des exemples, que l’on appelle aujourd’hui de Denjoy, d’homéomorphismes et difféomorphisme C 1 qui sont exceptionnels 3 . D’un autre coté, il montre que la vision de Poincaré n’était pas entièrement erronée : Théorème 1.3 (Denjoy). Tout difféomorphisme du cercle de classe C 1+vb et de nombre de rotation irrationnel est minimal. Rappelons qu’une fonction f est dite de classe C 1+vb si elle est de classe C 1 et si la dérivée f 0 est une fonction à variation bornée : Var(f 0 ) = sup #Π X sup |f 0 (xα ) − f 0 (yα )| < ∞, (IV.1) Π α=1 xα ,yα ∈Iα où Π est une partition de S1 en un nombre fini d’intervalles disjoints Iα , α = 1, . . . , #Π. 2. On dit qu’une fonction h sur le cercle est croissante si les fonctions H qui relèvent h à R sont croissantes. 3. La communauté hésite entre l’emploi du terme exemple ou contre-exemple. Peut-être, parler de Cantor-exemples surmonterait ce problème... 15 2 Questions de régularité : de Denjoy à nos jours Le théorème de Denjoy 1.3 signe le début de l’étude systématique des difféomorphismes du cercle. Quelle est la régularité maximale de l’homéomorphisme h, donné par le théorème de Denjoy, qui conjugue f à Rα ? Cette question a été au cœur de travaux modernes sur les difféomorphismes du cercle parmi les plus fascinants : les résultats à ce propos de Siegel, Arnol’d, Moser, Herman, Yoccoz, Katznelson et Ornstein, Khanin, Sinai et beaucoup d’autres [Sie, Arn, Her 1, Mos, Yoc 1, KatzOrn, Kha-Sin 1, Sta, Kha-Sin 2, Kha-Tep] ont initié des développements majeurs de la théorie. Nous nous occuperons de ce problème un peu plus loin (voir 2.3 ), après quelques rappels pour fixer notations et définitions. 2.1 Espaces de difféomorphismes r Soit r ∈ [0, ∞] un nombre réel, éventuellement infini, on notera Diff + (S1 ) le groupe des difféor 4 morphismes du cercle f qui préservent l’orientation et sont C réguliers . Quand r est un entier, cela signifie que f est dérivable r fois et que sa dérivée r-ième est continue. Quand r n’est pas un nombre entier, cela signifie que f est dérivable brc fois et que sa dérivée brc-ième est une fonction (r − brc)-höldérienne. r r 1 ^ Par analogie au cas continu, on définit le groupe Diff + (S ) = {F ∈ Diff + (R) : F (x+1) = F (x)+1}, r 1 revêtement universel du groupe Diff + (S ) : 0 /Z r 1 ^ / Diff + (S ) π / Diff r (S1 ) + / 1. r Lorsque r ∈ [0, ∞], on munit l’espace Diff + (S1 ) de la topologie induite par la norme C r : si r est un nombre entier ou bien l’infini, kf kr := max sup |D s f (x)| s≤r x∈S1 et plus généralement, en posant τ := r − brc, kf kr := kf kbrc + sup x,y∈S1 |Dbrc f (x) − Dbrc f (y)| . |x − y|τ Remarque 2.1. Soit f un difféomorphisme de classe C r . Alors f est un difféomorphisme de classe C s r pour tout s < r. Notamment, par définition des normes, kf ks ≤ 2 kf kr : l’inclusion de Diff + (S1 ) dans s 1 Diff + (S ) est continue. Malheureusement, cette topologie n’est pas toujours compatible avec la structure de groupe. r Proposition 2.1. Le groupe Diff + (S1 ) des difféomorphismes C r du cercle, muni de la topologie de la r norme C , est un groupe topologique si est seulement si r est un entier ou r = ∞. r Remarque 2.2. Dorénavant, lorsque l’on souhaitera voir Diff + (S1 ) comme un groupe, la topologie sur r 1 brc Diff + (S ) sera toujours la topologie C . Nous donnerons une preuve de la proposition 2.1 en appendice à ce chapitre. Un autre espace, très important, est l’espace des difféomorphismes analytiques. Dans ce contexte, le cercle est identifié à l’ensemble des nombres complexes de module 1. Rappelons qu’une fonction du cercle f est dite analytique s’il existe un nombre ρ > 1 tel que f possède un prolongement analytique sur la couronne circulaire Ar := {z ∈ C : 1/ρ < |z| < ρ}. L’espace des difféomorphismes analytiques ω sur le cercle est noté Diff + (S1 ) et forme un groupe, qui est de plus topologique, lorsque l’on le munit de la topologie qui est la limite inductive des topologies de la convergence uniforme C 0 sur les fonctions analytiques des couronnes Ar . 4. Par abus de langage, un difféomorphisme de classe C 0 est simplement un homéomorphisme. 16 2.2 Arithmétique du nombre de rotation Soit α ∈ R − Q un nombre irrationnel. On notera par rationnelles de α : pour tout n, 1 pn 0 < α − < 2 , qn qn et pour tout p et tout 0 < q < qn α − p > α − pn . q qn pn qn n∈N la suite des approximations (IV.2) (IV.3) Si [a0 , a1 , a2 , . . .] est le développement en fraction continue de α, à savoir 1 α = a0 + a1 + la fraction pn qn 1 a2 + , (IV.4) 1 a3 +··· coïncide avec la troncature au niveau n de (IV.4) : 1 pn = [a0 , a1 , . . . , an ] = a0 + 1 qn a1 + .. .+ . 1 an Les conditions (IV.2) et (IV.3) se traduisent dynamiquement : le point qn α (mod 1) est le point de l’orbite de 0 par Rα qui se rapproche le mieux de 0. Rappelons qu’une mesure µ sur S1 est invariante par un homéomorphisme f si elle est invariante par l’action du groupe cyclique Z ∼ = hf i : f∗ µ = µ. La théorie des espaces de Banach assure toujours l’existence d’une P mesure de probabilité invariante, que l’on peut obtenir comme valeur d’adhérence de la suite n1 n−1 δ , pour un point x ∈ S1 fixé. Toute mesure invariante a pour support k k=0 f (x) n∈N une partie compacte invariante de S1 : une réunion d’orbites périodiques, lorsque f en possède, ou le compact minimal invariant, dans tout autre cas. Les mesures invariantes donnent ainsi beaucoup d’informations sur la dynamique. Par exemple, si l’on pose h(x) = µ ([x0 , x[), pour µ mesure f -invariante et x0 ∈ S1 point arbitraire, on a h ◦ f = h + µ ([x0 , f (x0 )[) . Autrement dit, la fonction h semi-conjugue f à la rotation d’angle µ ([x0 , f (x0 )[) et, en particulier, le nombre de rotation de f est égal à µ ([x0 , f (x0 )[), pour tout choix de µ et x0 . Le lien entre mesures invariantes et dynamique est bien plus profond. Théorème 2.2 (Inégalité de Denjoy-Koksma). Soit f un difféomorphisme du cercle de classe C 1 et de nombre de rotation irrationnel α. Soit q = qn le dénominateur d’une approximation rationnelle de α. Alors, pour toute fonction u ∈ C 1+vb (S1 ) et µ mesure de probabilité f -invariante sur S1 , on a l’inégalité q−1 Z X k u◦f −q u dµ ≤ Var(u). S1 k=0 (IV.5) 0 Remarque 2.3. L’inégalité (IV.5) permet de voir facilement qu’il y a une unique mesure f -invariante, qu’on note µf . Lemme 2.3 (Denjoy). Soit f un difféomorphisme du cercle de classe C 1 , µ une mesure f -invariante sur S1 . On a Z log Df dµ = 0. S1 Corollaire 2.4 (Inégalité de Denjoy). Soit f un difféomorphisme du cercle de classe C 1+vb et de nombre de rotation irrationnel α. Soit q = qn le dénominateur d’une approximation rationnelle de α. Alors, klog Df q k0 ≤ Var(log Df ). (IV.6) 17 Ces inégalités montrent que si l’on connaît la vitesse de divergence de (qn ), ou en d’autres termes la qualité d’approximation de α par des rationnels, on peut envisager de bonnes estimations dans la topologie C 1 . Pour cela, on rappelle des notions arithmétiques. Un nombre irrationnel α vérifie une condition diophantienne d’ordre δ s’il existe une constante C > 0 telle que pour tout p/q ∈ Q, C p 0 < α − ≥ 2+δ . q q Lorsque α vérifie une condition diophantienne d’ordre 0, on dit que α est de type constant. Un nombre α est de type Roth s’il satisfait une condition diophantienne d’ordre ε pour tout ε > 0. Un nombre α qui vérifie une condition diophantienne quelconque est dit diophantien. Les nombres irrationnels qui ne sont pas diophantiens sont de type Liouville et forment une partie résiduelle (au sens de Baire) dans R. En contrepartie, presque tout nombre (au sens de la mesure de Lebesgue) est de type Roth. 2.3 Le théorème de conjugaison différentiable Après 50 années écoulées depuis les premiers résultats, la compréhension de la régularité du difféomorphisme conjugant à la rotation est presque optimale. Le résultat le plus avancé s’énonce ainsi [Katz-Orn] (voir aussi [dMe-vSt] ) : Théorème 2.5 (Conjugaison différentiable). Soit f un difféomorphisme du cercle de classe C r , soit α = ρ(f ) son nombre de rotation. On suppose que α vérifie une condition diophantienne d’ordre δ. Si δ + 2 < r, alors l’homéomorphisme h qui conjugue f à Rα est un difféomorphisme de classe C r−1−δ−ε pour tout ε > 0. Remarque 2.4. Lorsque δ + 2 < r < 4, Khanin et Teplins’kyi [Kha-Tep] et Teplins’kyi [Tep] ont montré que le difféomorphisme h est plus précisément de classe C r−1−δ . Essayons de comprendre, de manière un peu naïve, pourquoi une condition diophantienne sur α influence autant la régularité. Résoudre l’équation h ◦ f = h + α dans l’espace C 1 , revient à s’intéresser à l’équation cohomologique u ◦ f − u = − log Df, (IV.7) dans l’espace C 0 . Le théorème suivant, dû à Gottschalk et Hedlund [Got-Hed] donne une condition nécessaire et suffisante pour que (IV.7) ait des solutions. Théorème 2.6 (Gottschalk – Hedlund). Soit (X, d) un espace métrique compact et f un homéomorphisme minimal de X sur X. Soit ϕ une fonction continue sur X. Les deux affirmations suivantes sont équivalentes : 1. il existe u ∈ C 0 (X) tel que u ◦ f − u = ϕ, P n−1 2. il existe un point x0 dans X tel que supn∈N k k=0 f f (x0 ) < +∞. k Puisque pour tout n ∈ N, log Df n = n−1 k=0 log Df ◦ f , une condition nécessaire et suffisante pour qu’il existe une solution continue pour (IV.7) est P sup k log Df n k0 < +∞. (IV.8) n∈N 1 La fonction qui à f ∈ Diff + (S1 ) associe H1 (f ) = supn∈N k log Df n k0 est appelée invariant de conjugai1 son C par Herman. On confrontera avec (IV.6) que si les dénominateurs qn sont trop écartés l’un de l’autre, l’inégalité de Denjoy n’influence pas trop l’invariant H1 (f ). Au contraire, les inégalités du type (IV.6) sont fondamentales pour la preuve du théorème de conjugaison différentiable. Pour expliquer de manière limpide ce dernier commentaire, nous citons les résultats que l’on peut obtenir grâce à la méthode de conjugaison rapide due à Anosov et Katok [Kat-Has, §12.5]. Théorème 2.7. Pour tout entier r ≥ 1, il existe un difféomorphisme minimal C ∞ du cercle qui est C r−1 -conjugué à la rotation, mais qui n’est pas conjugué de manière C r . 18 Démonstration de la proposition 2.1 Montrons d’abord un lemme intermédiaire. Lemme 2.8. Il existe un plongement du groupe des difféomorphismes C r de l’intervalle ouvert ]0, 1[ dans le groupe des difféomorphismes C r du cercle. Démonstration. Soit ϕ : [0, 1] −→ [0, 1] un difféomorphisme de classe C ∞ , infiniment tangent à l’identité en 0 et 1 et vérifiant la condition suivante : pour tout f , difféomorphisme de classe C r de ]0, 1[, le difféomorphisme conjugué f˜ := ϕ ◦ f ◦ ϕ−1 est un difféomorphisme de l’intervalle fermé [0, 1], C r -tangent à l’identité en 0 et 1. r L’application qui à f associe f˜ définit un homomorphisme continu de Diff + (]0, 1[) dans le groupe r H := g ∈ Diff + ([0, 1]) : D s g(0) = D s g(1) = 1 pour tout 0 < s ≤ r r et ce groupe s’identifie naturellement au sous-groupe H̄ de Diff + (S1 ) composé des difféomorphismes r 1 du cercle C -tangents à l’identité en 0 ∈ S . La démonstration qui suit est une adaptation de la preuve du lemme 3.4 dans [Bri+ ]. Démonstration de la proposition 2.1. D’après le lemme 2.8, il suffit de montrer que le groupe des difféomorphismes de classe C r de l’intervalle ouvert ] − 1, 1[ n’est pas un groupe topologique, lorsque r n’est pas un nombre entier. On écrit r = k + τ , avec k entier et τ ∈]0, 1[ et on définit le difféomorphisme de classe C r g(x) = k τ x + x |x| 2 x + x k−1 |x|1+τ 2 si k impair, si k pair. On fixe q > k un nombre pair et pour tout ε > 0, on définit le difféomorphisme analytique fε (x) = x − ε + εx q . Lorsque ε → 0, la suite fε tend vers id dans la topologie C r . On se propose de montrer que la r norme C r de g ◦ fε − g ne tend pas vers 0, ce qui impliquera que le groupe Diff + (] − 1, 1[) n’est pas un groupe topologique par rapport à la topologie C r . Pour cela, nous allons donner une minoration uniforme en ε de la norme τ -hölderienne de la fonction φε = D k (g ◦ fε ) − D k g en regardant dans l’intervalle [0, ε]. À ce propos, nous aurons besoin de connaître les valeurs de fε en 0 et ε : fε (0) = −ε, fε (ε) = εq+1 . Comme échauffement, considérons d’abord le cas k = 1. Nous avons Dg(x) = 1 + (1 + τ ) |x|τ , 2 Dfε (x) = 1 + ε qxq−1 , d’où φε (ε) − φε (0) = Dg(fε (ε)) Dfε (ε) − Dg(ε) − Dg(fε (0)) Dfε (0) + Dg(0) = Dg(εq+1 ) Dfε (ε) − Dg(ε) − Dg(−ε) Dfε (0) + Dg(0) = Dg(εq+1 ) Dfε (ε) − 2Dg(ε) + = 1+(1+τ2)ε τ (q+1) 1 2 (1 + qεq ) − (1 + (1 + τ )ετ ) + = − (1 + τ ) ετ + o(ετ q ). 19 1 2 On en déduit la minoration kg ◦ fε − gk1+τ ≥ |φε (ε) − φε (0)| = (1 + τ ) + o(ετ (q−1) ), ετ (IV.9) donc la suite (g ◦ fε − g)ε>0 ne tend pas vers 0 dans la topologie C r lorsque ε tend vers 0. Lorsque k > 1, les estimations sont moins directes, ceci étant dû à la complexité de prendre une dérivée d’ordre supérieure d’une composition. En laissant les vérifications au lecteur, en se restreignant aux termes d’ordre inférieur à τ en ε, on trouve φε (ε) − φε (0) = − Dk g(ε) − Dk g(fε (0)) + o(ετ ) = Cr ετ + o(ετ ), avec Cr := −(k + τ ) · · · (1 + τ ). On peut donc en déduire une estimation de la norme C r comme à la ligne (IV.9). Quand r est un nombre entier, la continuité de la composition à gauche et à droite suit de la formule de Faà di Bruno k D (g ◦ f ) = k X Dν g ◦ f ν=1 où k i1 ,...,iν ν! est le coefficient multinomial ! X i1 +...+iν =k k! i1 !···iν ! . 20 k Di1 f · · · Diν f, i1 , . . . , iν Chapitre V Les mesures de Malliavin-Shavgulidze : difféomorphismes génériques en dimension 1 1 1.1 Un panorama sur les mesures MS Petite histoire Dans l’esprit d’une certaine partie des mathématiques des années 1980, un intérêt particulier apparût dans la recherche de mesures quasi-invariantes sur des groupes de Lie de dimension infinie, 1 1 comme Diff + (I) et Diff + (S1 ), notamment avec les finalités illustrées dans l’introduction. Le théorème de Mackey et Weil 4.2 (chapitre II) caractérise les groupes localement compacts comme étant les groupes qui possèdent une mesure quasi-invariante par l’action régulière gauche [Mac, Wei] : nous n’avons donc 1 1 aucun espoir de trouver une telle mesure sur Diff + (I) (et Diff + (S1 )). Pourtant, Shavgulidze donne des exemples de mesures quasi-invariantes pour les actions restreintes à des sous-groupes (notamment par les difféomorphismes de classe C 2 ). Les premiers exemples dans [Sha 1] ne sont guère utilisables, mais on y voit déjà les outils que l’auteur utilisera dans ses futurs travaux. C’est une dizaine d’années plus tard que Shavgulidze reprendra son travail en définissant des mesures analogues pour les difféomorphismes de variétés riemanniennes arbitraires [Sha 2]. Probablement vers la fin des années 1980, les mathématiques de Shavgulidze rencontrent celles de P. Malliavin qui s’intéresse alors aux processus de diffusion sur les variétés riemanniennes. Ils parviennent à la construction des mesures que nous appelons aujourd’hui mesures de MalliavinShavgulidze (mesures MS) sur les difféomorphismes de l’intervalle et du cercle. Même si chacun est capable de construire des mesures boréliennes avec des propriétés d’invariance dans des contextes plus généraux, seules ces mesures possèdent des propriétés vraiment remarquables, en particulier pour leur simplicité [Mal-Mal 1, Mal-Mal 2, Sha 3]. En 1990, P. Malliavin et M. P. Malliavin montrent une quasi-invariance infinitésimale sous l’action des difféomorphismes C 3 (avec des techniques d’analyse stochastique). D’un autre coté, la propriété de quasi-invariance est claire dans l’environnement autour de Shavgulidze (par exemple un esquisse de preuve apparaît dans l’article de Kosyak [Kos] ). Une preuve plus détaillée apparaît en 1997 [Sha 3] (en russe) et [Sha 4] (en anglais) (voir aussi la thèse de l’auteur [Tri]). Une exposition plus moderne se trouve dans le livre de Bogachev [Bog 2, §11.5], que nous allons suivre ici : il s’agit simplement de vérifier que l’on peut appliquer le théorème 7.1 présenté dans le chapitre III. On espère que cette méthode plus conceptuelle puisse aider à comprendre géométriquement les cocycles de Radon-Nikodym associés aux mesures MS. Plus récemment Kuzmin [Kuz] reprend le résultat de Shavgulidze et l’utilise pour affaiblir le plus possible la régularité des fonctions qui quasi-préservent la mesure. 1 D’autres mesures quasi-invariantes sur Diff + (S1 ) ont été introduites par Neretin [Ner] ; celui-ci cite les travaux de Malliavin et Shavgulidze, mais ne parvient pas à décrire le lien avec le sien. 21 Une liste très complète de constructions de mesures sur les groupes de difféomorphismes se trouve dans [Bog 2, §11.5]. Remarque 1.1. Jones a défini une mesure sur les homéomorphismes du cercle et Astala, Jones, Kupiainen, Saksman [Ast-Jon-Kup-Sak] (voir aussi Sheffield [She] ) ont montré que, presque sûrement cette mesure donne un homéomorphisme höldérien. La construction étant assez proche de celle de Malliavin et Shavgulidze, nous croyons fortement que la mesure de Jones est quasi-invariante par l’action des difféomoprhismes C 2 . 1.2 Définition des mesures Construire une mesure quasi-invariante sur un groupe topologique est un problème assez compliqué en général. Rappelons que, d’après ce que nous avons vu dans le chapitre II, lorsque G est un groupe non localement compact, il ne peut pas exister de mesure de Radon sur G, quasi-invariante par rapport à l’action de translation d’un sous-groupe de mesure strictement positive. Une mesure de Radon µ sur G sera dite quasi-invariante si elle est quasi-invariante par rapport à l’action par translation d’un sous-groupe G0 ≤ G, qui est de mesure nulle mais pourtant dense. Une telle définition amène la propriété suivante : Proposition 1.1. Soit µ une mesure de Radon non identiquement nulle sur le groupe topologique G. On suppose qu’il existe un sous-groupe dense G0 ≤ G qui préserve la classe de la mesure µ. Alors la mesure de tout ouvert U ⊂ G est strictement positive : µ(U ) > 0. Démonstration. En effet, le support de la mesure µ (défini comme étant le complémentaire du plus grand ouvert de mesure nulle) est un fermé G0 -invariant et coïncide donc avec G entier. D’après le théorème de Cameron-Martin 5.1, la mesure de Wiener sur C0 (I) ou C0 (S1 ) est quasiinvariante. En dehors de cet exemple, on n’en connait pas beaucoup d’autres (et ils sont certainement moins célèbres). La construction des mesures de Malliavin-Shavgulidze s’appuie si fortement sur la mesure de Wiener, que d’un point de vue mesurable elles sont presque les mêmes. 1.2.1 Les mesures sur le groupe des difféomorphismes de l’intervalle La première étape consiste à identifier topologiquement le groupe de difféomorphismes de l’intervalle de classe C 1 qui préservent l’orientation, à l’espace de Wiener C0 (I). Il y a certainement beaucoup de 1 manières de le faire, puisque si h : Diff + (I) −→ C0 (I) est un homéomorphisme, alors en composant h à la source par φ ∈ Homéo+ (I), on obtient un autre homéomorphisme entre les deux espaces. Pourtant, il existe un choix particulièrement naturel. En effet, pour connaître un difféomorphisme de l’intervalle f , il suffit de connaître sa dérivée f 0 , qui est une fonction continue strictement positive, de moyenne égale à 1. Réciproquement, soit h une fonction continue strictement positive sur l’intervalle I, on peut alors lui associer un difféomorphisme f défini par Rt h(s) ds f (t) = R 01 . 0 h(s) ds On remarquera que dans l’expression précédente un multiple constant de la fonction h définit le même f . On résume ceci. 1 Proposition 1.2. L’espace Diff + (I) des difféomorphismes C 1 de l’intervalle qui préservent l’orientation s’identifie à l’espace C1 (I, R+ ) des fonctions continues positives sur l’intervalle vérifiant h(0) = 1. Cette application induit un homéomorphisme entre les deux espaces, munis respectivement des topologies C 1 et C 0 . Démonstration. Nous avons déjà démontré la première partie de l’énoncé. 22 Soit h une fonction fixée et soit ε > 0. Nous voulons montrer qu’il existe δ > 0 tel que si h et k se trouvent à une distance C 0 inférieure à δ, alors les difféomorphismes associés sont à distance C 1 inférieure à ε. Nous avons R Rt t h(s) ds k(s) ds R0 sup 1 − R 01 k(s) ds t∈I 0 h(s) ds 0 R t [h(s)−k(s)] ds Z t k(s) ds + = sup 0 R 1 h(s) ds 0 t∈I 0 0 − 0 t δ h(s) ds ≤ sup R 1 t∈I R1 1 h(s) ds R1 1 k(s) ds 0 Rt + sup R 1 t∈I 0 0 ! k(s) ds h(s) ds· R1 0 k(s) ds δ ≤ R1 0 2 δ, h(s) ds et pour l’estimation sur la dérivée R h(t) k(t) sup 1 − R1 h(s) ds k(s) ds t∈I 0 0 + k(t) ≤ sup Rh(t)−k(t) 1 t∈I 0 k(s) ds R1 1 h(s) ds − 0 R1 1 k(s) ds 0 ! ! ≤ 1 + sup R 1 k(t) t∈I 0 k(s) ds R1 δ 0 h(s) ds ≤ 1 + δ t∈I h(t)+δ sup R 1 h(s) ds−δ R 1 h(s) ds = 0 0 ! 1 + sup R 1 t∈I 0 h(t) h(s) ds δ R 1 h(s) ds−δ . 0 En posant ε 01 h(s) ds , 1 + supI R 1 h +ε R δ= 0 h(s) ds nous déduisons des estimations précédentes que la norme C 1 de la différence des difféomorphismes associés à h et k est inférieure à 2ε. Réciproquement, soit F un difféomorphisme fixé et ε > 0. Nous cherchons δ > 0 tel que, pour tout G à distance C 1 de F inférieure à δ, les fonctions F 0 /F 0 (0) et G0 /G0 (0) soient à distance C 0 inférieure à ε. Pour tout δ ∈]0, F 0 (0)[ nous avons 0 sup FF0 (0) − I G0 G0 (0) ≤ 1 F 0 (0) δ + sup G0 F 01(0) − I 1 G0 (0) ≤ 1+ ≤ 1+ et par conséquent on peut choisir δ= supI G0 G0 (0) supI F 0 +δ F 0 (0)−δ 1 F 0 (0) δ 1 F 0 (0) δ = 1+ supI F 0 F 0 (0) δ F 0 (0)−δ εF 0 (0) 1+ supI F 0 F 0 (0) +ε afin d’avoir la propriété de continuité cherchée. Cette proposition termine « presque » notre première étape, puisque C1 (I, R+ ) n’est pas très différent de l’espace de Wiener C0 (I) : en effet, par composition à gauche par la fonction logarithme, les deux espaces s’identifient topologiquement. Dans la suite, on notera 1 A : Diff + (I) −→ C0 (I) (V.1) 1 l’application qui à f ∈ Diff + (I) associe la fonction continue log f 0 − log f 0 (0). D’après la proposition 1.2, la fonction A est un homéomorphisme lorsque l’on munit les espaces de leurs topologies naturelles. 23 Observons que l’application inverse A−1 est définie par A −1 R t x(s) e ds x(t) = R 01 , ex(s) ds 0 et grâce à cette application, nous arrivons à la deuxième étape de la construction : la définition des mesures de Malliavin-Shavgulidze. Il est peut-être temps de rappeler que la mesure de Wiener définie dans la partie 2 du chapitre III fait partie d’une famille à un paramètre de mesures : en notant σ > 0 ce paramètre, nous retrouvons avec σ = 1 la mesure de Wiener classique W. Les autres mesures Wσ diffèrent par la variance que l’on considère pour les accroissements du mouvement brownien : si x ∈ C0 (I) est distribué selon la mesure W, la fonction σx ∈ C0 (I) est distribuée selon la mesure Wσ . Plus précisément, la mesure Wσ d’un cylindre C = {x ∈ C0 (I) | x(ti ) − x(ti−1 ) ∈ Ai , i = 1, . . . n}, avec 0 = t0 < t1 < . . . < tn < tn+1 = 1 et Ai ∈ B(R), est donnée par (voir (III.3)) Wσ (C) = 1 √ (2πσ)n (tn −tn−1 )···(t1 −t0 ) Z ··· Z 1 − 2σ exp A1 An n X yi2 ti −ti−1 ! dy1 · · · dyn . i=1 Remarque 1.2. Le paramètre σ mesure entre autres la distance de la fonction aléatoire à la fonction identiquement nulle. Par exemple, lorsque σ est proche de zéro, les fonctions aléatoires se trouvent assez proches de la fonction nulle. Pour rendre cette affirmation plus formelle rappelons le principe de réflexion [Mör-Per, Theorem 2.19] : pour tout r > 0, on a Wσ ({kxk0 ≤ r}) ≤ √4 2π Z ∞ e−s 2 /2 ds ≤ r/σ √8 σ 2π r exp − 12 r2 σ2 . Mais σ mesure aussi la distance locale : en effet, pour σ proche de 0, les oscillations locales d’une fonction typique s’affaiblissent, comme l’explique la loi des logarithmes itérés ( Wσ x(t + ε) − x(t) lim p =σ ε→0 2ε log log(1/ε) )! = 1 pour tout t ∈ I. (V.2) Définition 1.1. Soit σ > 0. On définit la mesure de Malliavin-Shavgulidze de paramètre σ sur les difféomorphismes de l’intervalle, comme l’image de la mesure de Wiener par l’application A−1 : νσ = (A−1 )∗ Wσ . Quand σ = 1, on parlera de la mesure de Malliavin-Shavgulidze, que l’on notera νM S ou bien simplement ν. 1.2.2 Les mesures sur le groupe des difféomorphismes du cercle En modifiant la construction de la partie 1.2.1 on trouve des mesures définies sur le groupe des difféomorphismes du cercle. Dans ce contexte, le cercle S1 est paramétré par le tore euclidien R/Z. 1 Munis de leurs topologies naturelles, l’espace Diff + (S1 ) des difféomorphismes C 1 du cercle s’identifie 1 1 topologiquement à l’espace C0 (S ) × S : à tout difféomorphisme f on associe le couple B(f ) = (B0 (f ), f (0)), avec B0 (f )(t) = log f 0 (t) − log f 0 (0). Remarque 1.3. L’application inverse est donnée par B −1 Z t (x, α)(t) = c(x) 0 où c(x) = −1 1 x(s) ds . 0 e R 24 ex(s) ds + α, (V.3) Le lecteur étant passé par la preuve de la proposition 1.2 n’aura pas de difficulté à montrer que B définit en effet un homéomorphisme. Nous avons introduit à la ligne (III.12) une application π qui projette l’espace C0 (I) sur C0 (S1 ), grâce à laquelle nous avons pu définir la mesure de Wiener W0 sur C0 (S1 ). Par la même méthode, on dispose des mesures W0,σ , définies par W0,σ := π∗ Wσ . Définition 1.2. Soit σ > 0. On définit la mesure de Malliavin-Shavgulidze de paramètre σ sur les difféomorphismes du cercle, comme l’image du produit de la mesure de Wiener par la mesure de Lebesgue sur le cercle, par l’application B −1 : µσ = B∗−1 (W0,σ ⊗ Leb) . (V.4) Quand σ = 1, on parlera de la mesure de Malliavin-Shavgulidze, que l’on notera µM S ou bien simplement µ. 1.3 Modules de continuité Nous l’avons vu dans la partie 2 du chapitre III, la classe de régularité d’un difféomorphisme du cercle influence les phénomènes dynamiques. Il est donc important, si l’on souhaite étudier les mesures MS d’un point de vue dynamique, de connaître la régularité d’un difféomorphisme aléatoire. Les propriétés de la mesure de Wiener que l’on a rencontrées dans la partie 2 nous permettent une description assez exhaustive. Nous avons de nouveau besoin de quelques rappels. Soit w : [0, 1] −→ [0, +∞[ une fonction continue en 0 et vérifiant w(s) = 0 si et seulement si s = 0. On supposera aussi que w est croissante. On définit l’espace C w (I) des fonctions avec module de continuité w : ( w C (I) = ) |x(s) − x(t)| x ∈ C(I) sup <∞ . s,t∈I, s6=t w(|s − t|) Si x est une fonction de module continuité w, on définit sa norme C w : kxkw = |x(s) − x(t)| . s,t∈I, s6=t w(|s − t|) sup Une fonction de module de continuité est automatiquement continue. Réciproquement, toute fonction sur I continue possède un module de continuité : si x est une fonction continue, on pose wx (ε) = sup |x(s) − x(t)|. |s−t|≤ε Exemple 1.1. Quand w(s) = sα , une fonction de module de continuité w est une fonction α-höldérienne. 1+w Dans la suite, on notera Diff + (I) l’espace des difféomorphismes de l’intervalle dont la dérivée est une fonction de module de continuité w. Si f est un difféomorphisme, on définit sa norme C 1+w : kf k1+w = kf k1 + kf 0 kw . La proposition suivante est la clef de ce qui va suivre. Proposition 1.3. Soit w un module de continuité. L’application A définie dans (V.1) induit un homéomorphisme entre les difféomorphismes de l’intervalle de classe C 1+w et les fonctions de classe C w , lorsque l’on munit ces espaces des topologies induites par leurs normes. 25 Démonstration. Remarquons que si h est une fonction strictement positive définie sur l’intervalle, alors on a 1 sup h khkw ≤ k log hkw ≤ khkw , inf Ih I puisque la fonction log est lipschitzienne sur l’intervalle compact h(I) ⊂]0, +∞[. Le lecteur pourra alors facilement terminer la preuve. 1 Corollaire 1.4 (C 2 en aucun point). L’ensemble des difféomorphismes f ∈ Diff + (I) tels que f 0 n’est continue en aucun point est de mesure νσ totale. 1+vb 1 Corollaire 1.5 (Presque jamais C 1+vb ). Soit Diff + (I) l’ensemble f ∈ Diff + (I) des difféomorphismes 1+vb 0 tels que f est une fonction de variation bornée sur I. Alors νσ Diff + (I) = 0. Corollaire 1.6 (Dérivée 1/2-höldérienne). 1+τ 1. Pour tout τ < 1/2, νσ Diff + (I) = 1. 1+τ 2. Pour tout τ > 1/2, νσ Diff + (I) = 0. Et pour être encore plus précis, Corollaire 1.7 (Module de continuité de Lévy). Soit w(t) = 1+w Lévy, alors νσ Diff + (I) = 1. p 2t| log t| le module de continuité de Remarque 1.4. L’expression dans (III.4) exprime une propriété locale. Cependant, comme la fonction x(t)−x(s) w(|t−s|) est uniformément continue sur le carré I × I privé d’un voisinage de la diagonale, on déduit de (III.4) que la norme kxkw est finie. 1 Remarquons que rien ne change dans les énoncés précédents si l’on s’intéresse aux mesures MS sur les difféomorphismes du cercle. Proposition 1.8. Soit w un module de continuité. L’application B définie dans (V.3) induit un homéomorphisme entre les difféomorphismes du cercle de classe C 1+w et les fonctions de classe C w , quand on munit ces espaces des topologies induites par leurs normes. p Corollaire 1.9. Soit w(t) = 2t| log t| le module de continuité de Lévy. Pour tout σ > 0, les difféomorphismes du cercle de classe C 1+w ont mesure µσ totale. Il en résulte qu’un difféomorphisme MS est C 1+α -régulier pour tout α < 1/2. 1. Pour être plus précis, il faudrait modifier la fonction w pour la rendre croissante. 26 2 2.1 Quasi-invariance des mesures MS Le théorème de Cameron-Martin-Shavgulidze Nous en venons à la propriété des mesures MS qui les rend remarquables vis-à-vis des autres mesures sur les groupes de difféomorphismes : leur quasi-invariance. 1 1 Théorème 2.1 (Shavgulidze). Soit G l’un des groupes Diff + (I) ou Diff + (S1 ), soit µ une mesure MS sur G et soit H le sous-groupe de G constitué des difféomorphismes avec deuxième dérivée définie presque partout et dans L2 . La mesure µ est quasi-invariante sous l’action du groupe H par translations à gauche. En outre, le cocycle de Radon-Nikodym est ( 1 d(Lϕ )∗ µ (f ) = exp − dµ σ "Z 1 ϕ00 (f (t)) 0 df (t) + ϕ0 (f (t)) 2 2 #) Z 00 ϕ (f (t)) 0 f (t) dt , 0 (V.5) ϕ (f (t)) où σ correspond au paramètre de la mesure MS et les intégrales sont faites sur l’espace total I, ou bien sur S1 , en accord avec le cas considéré. En effet, lorsque ϕ est de classe C 3 , on peut faire une intégration par parties dans l’expressions 1 donnant le cocycle : dans le cas des mesures sur Diff + (I) on a d(Lϕ )∗ νσ (f ) = exp − σ1 dνσ ϕ00 (f (1)) 0 ϕ0 (f (1)) f (1) − ϕ00 (f (0)) 0 ϕ0 (f (0)) f (0) − Z 1 Sϕ (f (t))f 0 (t)2 dt , 0 1 alors que les termes de bord disparaissent dans le cas des mesures sur Diff + (S1 ) d(Lϕ )∗ µσ (f ) = exp dµσ Z 1 σ S1 0 2 Sϕ (f (t))f (t) dt . Remarque 2.1. Observons la présence de la dérivée de Schwarz dans les cocycles de Radon-Nikodym. Nous rappelons que la dérivée schwarzienne d’un difféomorphisme ϕ se définit ainsi : ϕ000 (t) 3 Sϕ (t) = 0 − ϕ (t) 2 00 2 ϕ (t) ϕ0 (t) ou bien encore 1 Sϕ (t) = D2 log Dϕ − (D log Dϕ)2 , 2 2 0 et vérifie la relation de cocycle Sϕψ = Sϕ ◦ ψ · (ψ ) + Sψ . D’après cette relation, elle est naturellement définie sur l’espace des différentielles quadratiques sur le cercle. De plus, la dérivée Sϕ est identiquement nulle si et seulement si ϕ est une transformation de Möbius. Elle pourrait suggérer une certaine invariance projective. Pour compléter l’énoncé du théorème 2.1, nous observons que lorsque le sous-groupe H agit à droite, la classe de la mesure de µ n’est pas préservée, sauf dans un cas très particulier : 1 1 Théorème 2.2 ( [Kos] ). Soit G l’un des groupes Diff + (I) ou Diff + (S1 ), soit µ une mesure MS sur G et soient ϕ, ψ ∈ G. Alors les mesures (Rϕ )∗ µ et (Rψ )∗ µ sont équivalentes si et seulement si ϕ et ψ diffèrent d’une rotation. 1 Remarque 2.2. En particulier, sur le groupe Diff + (I), aucune mesure MS n’est quasi-invariante par la composition à droite par aucun difféomorphisme. On en déduit qu’il existe un très grand nombre de 1 1 classes de mesures différentes sur Diff + (I) et Diff + (S1 ) qui sont invariantes par l’action à gauche de H. La preuve de ce dernier théorème utilise la propriété des logarithmes itérés (V.2) du mouvement brownien : si l’on considère la composition à droite par un difféomorphisme ϕ, en chaque point t on trouvera que l’événement q | log f 0 (t + ε) − log f 0 (t)| p lim = σ ϕ0 (t) (V.6) ε→0 2ε log log(1/ε) 27 est de mesure totale pour la nouvelle mesure de probabilité (Rϕ )∗ µ. L’une des différences majeures entre les actions à droite et à gauche est que la première induit un changement de temps pour le brownien correspondant à f , alors que l’action à gauche est simplement une « translation non-linéaire » : soit ϕ un difféomorphisme assez régulier et f un difféomorphisme aléatoire défini par un mouvement brownien B. En formules, l’action à droite donne pour la mesure de Wiener log(f ◦ ϕ)0 − log(f ◦ ϕ)0 (0) = B ◦ ϕ + log ϕ0 − log ϕ0 , alors que celle à gauche donne log(ϕ ◦ f )0 − log(ϕ ◦ f )0 (0) = B + log ϕ0 ◦ f − log ϕ0 (f (0)). Essayons de comprendre, grâce à ce qu’on a déjà essayé d’illustrer dans la partie 7 du chapitre III. Nous allons suivre l’exposition de Bogachev [Bog 2]. Notre but consiste maintenant à traiter la transformation non-linéaire que Lϕ induit sur l’espace de Wiener. Pour des raisons de simplicité, nous considérerons seulement les mesures νM S et µM S (la variance σ ne représente pas vraiment un obstacle, mais elle alourdit les calculs). 2 Soit ϕ ∈ Diff + (I) et posons h := A(ϕ−1 ), on écrira alors Th (x) = (I + Sh )(x) = A ◦ Lϕ ◦ A−1 (x), avec Z t Sh (x)(t) = h c(x) 1 c(x) = R 1 . x 0 e x(s) e (V.7) ds , 0 Le groupe des difféomorphismes C 2 agit sur C0 (I) par T défini en (V.7). 1 Remarque 2.3. De manière similaire, lorsque ϕ ∈ Diff + (S1 ), on pose h = B0 (ϕ−1 ) et B ◦ Lϕ ◦ B −1 (x, α) = (Th (x, α), ϕ−1 (α)), avec Z t x(s) e Th (x, α)(t) = x(t) + h α + c(x) 1 c(x) = R 1 , x 0 e ds − h(α), 0 qui définit une action sur C0 (S1 ) × S1 . 2 1 En fait, pour la preuve on se restreindra à l’action de Diff + (I) sur Diff + (I). R L’image de l’opérateur non-linéaire Sh est incluse dans D0 (I) puisque h ∈ D0 (I) et c(x) 0t ex ∈ C 1 . Sa dérivée jacobienne au point x ∈ C0 (I), dans la direction de v ∈ D0 (I) est d Dx Sh (v)(t) = h c(x + ε · v) dε = h0 c(x) Z t ex Z t x+ε·v e 0 Z t c(x) 0 ε=0 (ex v) − c(x)2 0 Z t ex Z 1 0 (ex v) . 0 Cette expression peut sembler un peu trop complexe, donc pour aider le lecteur, rappelons qu’il faut R substituer mentalement f (t) = c(x) 0t ex pour écrire plus simplement 0 Z t 0 (f v) − f (t) Dx Sh (v)(t) = h (f (t)) 0 Z 1 0 (f v) . (V.8) 0 On remarque que l’opérateur Dx Sh est de type intégral avec son noyau défini par l’expression entre crochets : Kh,x (t, s) := h0 (f (t)) 1[0,t] (s) − f (t) f 0 (s), appartenant à l’espace L2 ([0, 1]2 ). En particulier Dx Sh est un opérateur compact. 28 Lemme 2.3. Soit h ∈ D0 (I) et Sh défini par (V.7). Alors pour tout x ∈ C0 (I), le spectre de la restriction de Dx Sh à D0 (I) est réduit à la seule valeur propre 0. Démonstration. Soit λ ∈ C − {0} et soit v ∈ D0 (I) une solution de l’équation Dx Sh (v) = λ v. Rt x 0 e , comme dans (V.8), Z 1 On écrit, en utilisant un peu improprement f (t) = c(x) h0 (f (t)) Z t (f 0 v) − f (t) 0 (f 0 v) = λ v(t), (V.9) 0 Substituons la fonction inconnue v par une nouvelle inconnue u, liée par la relation v(t) = h0 (f (t)) u(t). Alors l’équation (V.9) devient Z t f 0 (s)h0 (f (s)) u(s) ds + E f (t) = λ u(t), (V.10) 0 avec E=− Z 1 (f 0 v) 0 ne dépendant pas de t et que par homogeneité de l’équation, on suppose égal à 0 ou 1. Remarquons qu’en posant t = 1 dans l’équation (V.10), on trouve u(1) = 0 (il s’agit en quelque manière de la clef de la preuve !). Avec une intégration par parties, on trouve h (f (t)) u(t) − Z t h (f (s)) u0 (s) ds + E f (t) = λ u(t). (V.11) 0 En dérivant l’expression (V.11) on trouve l’égalité presque partout : h0 (f (t)) f 0 (t) u(t) + E f 0 (t) = λ u0 (t). Les solutions de cette équation linéaire du premier ordre sont de la forme u(t) = exp 1 λ h (f (t)) 1 λE Z t 0 f (s) exp 0 − λ1 h(f (s)) ds + b , b ∈ R. En fait b doit forcement être égal à 0, puisque d’après l’équation (V.10) on a u(0) = 0. Donc u(t) = E λ1 exp Z t 1 λ h (f (t)) 0 f 0 (s) exp − λ1 h(f (s)) ds et en particulier, si E 6= 0, la fonction u est non nulle pour tout t > 0. Comme u(1) = 0 alors E = 0. Donc λ n’appartient pas au spectre de Dx Sh . En donnant référence à la partie 7 du chapitre III, on en déduit que le déterminant de FredholmCarleman de Th = I + Sh est égal à 1. Donc, par le théorème 7.1 sur les transformations linéaires de la mesure de Wiener, on a d(Th )∗ W (Th (x)) = exp hSh (x), xiD0 (I) + 21 kSh (x)k2D0 (I) dW R 2 R R R = exp 01 h0 c(x) 0t ex c(x)ex(t) dx(t) + 12 01 h0 c(x) 0t ex c(x)ex(t) dt . En revenant à l’espace des difféomorphismes, on peut écrire R R d(Lϕ )∗ νM S (Lϕ (f )) = exp 01 (log(ϕ−1 )0 )0 ◦ f df 0 + 21 01 (log(ϕ−1 )0 )0 ◦ f · f 0 2 . dνM S (V.12) Nous aiderons le lecteur à transformer l’expression précédente en celle (V.5) de l’énoncé du théorème 2.1. Nous notons g la variable Lϕ (f ) = ϕ−1 ◦ f . Grâce à ce changement de variable, on a 29 1. (log(ϕ−1 )0 )0 ◦ f = −(log ϕ0 )0 ◦ g · (ϕ−1 )0 ◦ f = −(log ϕ0 )0 ◦ g · 1 ϕ0 ◦g ; 2. f 0 = (ϕ ◦ g)0 = ϕ0 ◦ g · g 0 ; 3. df 0 = d(ϕ ◦ g)0 = ϕ00 ◦ g · (g 0 )2 + ϕ0 ◦ g dg 0 . Les égalités 1. et 3. donnent pour le premier terme dans (V.12) Z 1 (log(ϕ−1 )0 )0 ◦ f df 0 = − Z 1 0 (log ϕ0 )0 ◦ g dg 0 − =− (log ϕ0 )0 ◦ g · 0 0 Z 1 Z 1 (log ϕ0 )0 ◦ g dg 0 − ϕ00 ◦ g 0 2 (g ) ϕ0 ◦ g Z 1 (log ϕ0 )0 ◦ g · g 0 2 , 0 0 alors que pour le deuxième, en utilisant 1. et 3. on trouve : 1 2 Donc on a 2.2 Z 1 (log(ϕ −1 0 0 )) ◦f ·f 0 2 = 0 1 2 Z 1 (log ϕ0 )0 ◦ g · g 0 2 . 0 R R d(Lϕ )∗ νM S (g) = exp − 01 (log ϕ0 )0 ◦ g dg 0 − 21 01 ((log ϕ0 )0 ◦ g · g 0 )2 . dνM S Ergodicité 1 1 Soit G l’un des groupes Diff + (I) ou Diff + (S1 ), soit µ une mesure MS sur G, le couple (G, µ) définit un espace mesuré, sur lequel le groupe H agit, non en préservant la mesure, mais en préservant les ensembles négligeables (l’action de H quasi-préserve la mesure µ). Définition 2.1. Soit (X, µ) un espace mesuré standard sur lequel un groupe H agit en quasi-préservant la mesure µ. On dit que l’action de H est ergodique si tout ensemble mesurable invariant est négligeable ou bien conégligeable 2 . Dans ce contexte, pour des raisons liées à la théorie des représentations, Kosyak a étudié l’ergodicité de l’action de H sur (G, µ) [Kos]. 1 1 Théorème 2.4 (Kosyak). Soit G l’un des groupes Diff + (I) ou Diff + (S1 ), soit µ une mesure MS sur G et soit H un sous-groupe de G qui contient tous les difféomorphismes de classe C 2+α (α < 1/2). L’action de H sur (G, µ) est ergodique. Démonstration. La preuve du théorème 2.4 consiste à étudier l’action non-linéaire donnée par les transformations Sh (voir (V.7) ) sur l’espace de Wiener, mais vu de manière « hilbertienne », comme nous l’avons fait dans la partie 5 du chapitre III. Pour commencer, on s’intéressera à l’action de H sur (C0 (I), W). Avec le choix de la base orthonormée de Fourier (gn )n∈N de L2 (I) (voir (III.9) ), nous avons vu que la variable X x(t) = Zn Φn (t) n∈N définit un mouvement brownien, lorsque les Zn forment une suite de variables aléatoires gaussiennes centrées de variance 1 i.i.d., et les Φn sont définies par intégration des gn (voir encore la partie 5 du chapitre III). Nous allons nous restreindre aux fonctions x appartenant à un ensemble de mesure pleine Ω ⊂ C0 (I) de sorte que tout x ∈ Ω est de classe C 1/2−ε pour tout ε > 0. L’expression définissant Sh dit que la fonction x est transformée en Z t Sh (x)(t) = x(t) + h c(x) x(s) e ds 0 = X n∈N Z t Zn + h c(x) 0 2. Un ensemble mesurable A ⊂ X est conégligeable si le complémentaire dans X est négligeable. 30 ex(s) ds , Φn Φn . L2 Fixons x ∈ Ω et soit (an )n∈N une suite à support dans {0, . . . , N }, soit h tel que h c(x) R t x(s) ds = 0e an Φn (t), alors h est une fonction de classe C 3/2−ε (les éléments de la base de Fourier sont de classe C ∞ ), et si l’on définit ϕ−1 := A−1 (h), alors ϕ ∈ H. Pourquoi ce choix ? En fait, nous venons de montrer que la suite (Zn )n∈N peut être envoyée par un élément de H sur la suite (Zn + an )n∈N , qui peut être arbitrairement choisie sur toute fenêtre {0, . . . , N }. En regardant les coefficients de Fourier, nous identifions (C0 (I), W) avec l’espace gaussien (RN , γ ⊗N ), où γ est la mesure gaussienne standard sur R. Nous avons que toute orbite de l’action sur (RN , γ ⊗N ) du groupe Rf in des translations à support fini, est incluse dans une orbite de l’action non-linéaire induite par H. Or, il est classique que l’action de Rf in est ergodique (pour les probabilistes, il s’agit fondamentalement de la loi du 0–1 de Hewitt-Savage [Mör-Per, Lemma 1.25] ) et on peut finalement 1 conclure que l’action de H sur (Diff + (I), νM S ) est ergodique. P n≤N 1 La preuve pour l’action sur (Diff + (S1 ), µM S ) suit les mêmes lignes : en notant Φ̃n la base de 1 D0 (S ), pour toute suite (an )n∈N à support dans {0, . . . , N } et θ ∈ S1 , on peut définir ϕ ∈ H tel que si h = B0 (ϕ−1 ), alors 1. h α + c(x) R t x(s) P ds = n≤N an Φ̃n (t), 0e 2. ϕ−1 (α) = θ, où (x, α) ∈ C0 (S1 ) × S1 est fixé. 31 Chapitre VI Décrire la dynamique aléatoire 1 Points périodiques et nombre de rotation aléatoire Pour comprendre la dynamique décrite par un difféomorphisme, le premier pas consiste à obtenir le plus d’informations possibles sur les orbites. Dans le cas d’une dynamique en dimension 1, nous avons pu voir au début du chapitre IV que la connaissance des orbites périodiques permet une bonne description des phénomènes globaux. Il s’avère que si l’on considère des difféomorphismes aléatoires par rapport aux mesures MS, les orbites périodiques sont de nature assez contrôlée. 1.1 Difféomorphismes de l’intervalle Puisque nos difféomorphismes préservent l’orientation, tout point périodique sur l’intervalle est nécessairement un point fixe. Nous voudrions donc décrire l’ensemble des points fixes d’un difféomorphisme aléatoire de [0, 1] : est-il fini ou bien infini ? Pour nous donner une réponse exhaustive, nous étudions le caractère des points fixes : un point t tel que f (t) = t est parabolique si f 0 (t) = 1, et hyperbolique dans le cas contraire. Pour t point fixe hyperbolique, on dira que t est attractif si f 0 (t) < 1 et répulsif autrement. Les difféomorphismes qui possèdent uniquement des points fixes hyperboliques ne sont pas trop compliqués. Le théorème suivant affirme que l’on peut négliger les phénomènes paraboliques pour les difféomorphismes MS (nous entendons par ceci qu’une certaine 1 propriété est vérifiée par un ensemble de difféomorphismes dans (Diff + (I), νM S ) de mesure 1). Théorème 1.1. Pour tout λ > 0, la probabilité que le difféomorphisme f possède un point fixe avec multiplicateur λ est nulle : νM S (∃ t : f (t) = t, f 0 (t) = λ) = 0. En particulier un difféomorphisme MS ne possède pas de points fixes paraboliques. Nous pouvons en déduire un premier corollaire : Corollaire 1.2. Un difféomorphisme MS possède un nombre fini de points fixes, tous hyperboliques. Démonstration. Il suffit de montrer que tout point fixe est isolé. Si {tk } est une suite de points fixes qui s’accumule sur un point fixe t, par continuité de la dérivée et d’après le théorème des valeurs intermédiaires, on doit avoir f 0 (t) = 1. Donc t est parabolique. La preuve du théorème 1.1 utilise fortement les propriétés du mouvement brownien et la définition des difféomorphismes MS. Nous avons recherché une démonstration qui pourtant n’utilise pas les expressions explicites des densités des variables considérées : il est assez probable que les résultats présentés dans [Mat-Hir-Yor, Man-Yor, Yor] puissent permettre de déduire l’énoncé du théorème, mais une telle preuve serait extrêmement technique. 32 1.1.1 Cadre et notations Pour cette partie, on peut ne pas préciser l’espace de probabilité (Ω, B, P) qui sera donc arbitraire. Pour tout mouvement brownien standard (B(t))t∈[0,1] sur (Ω, B, P) on définit le difféomorphisme de [0, 1] dans lui-même R t B(s) e ds f : t 7−→ R 01 (VI.1) B(s) e ds 0 qui a la même loi qu’un difféomorphisme MS. La définition de f nous oblige à considérer une filtration plus grande que Ft = σ ((B(s))s≤t ), la filtration naturelle associée à B : pour définir f au temps t, il faut connaître l’évolution de B entre 0 R et t et la moyenne totale 01 eB(s) ds. Il s’ensuit que si l’on définit, par exemple, la filtration régulière Gt = \ Z 1 Ft0 ∨ σ eB(s) ds , (VI.2) 0 t0 >t alors f définit un processus sur (Ω, B, P, G). 1.1.2 Invariance par inversion du temps Il est bien connu que si B est un mouvement brownien sur (Ω, B, P), alors le processus « inversé » B(s) := B(1 − s) − B(1) défini encore un mouvement brownien sur [0, 1], mais qui est un processus par rapport à la tribu inversée F t = σ ((B(s))1−t≤s≤1 ). On étend cette remarque aux difféomorphismes de Malliavin-Shavgulidze : Lemme 1.3. Si f est un difféomorphisme MS défini par l’expression (VI.1), le difféomorphisme aléatoire R 1−t B(s) e ds f (t) = 1 − 0R 1 , B(s) ds 0 e a la même loi que f . Démonstration. En effet soit t ∈ [0, 1], on a 0 log f (t) = B(1 − t) − log Z 1 eB(s) ds 0 −B(1) = B(1 − t) − B(1) − log e Z 1 eB(s) ds 0 = B(t) − log Z 1 eB(s)−B(1) ds 0 = B(t) − log − Z 0 e B(1−u)−B(1) du 1 = B(t) − log Z 1 eB(u) du. 0 Comme B est encore un mouvement brownien, la preuve du lemme est terminée. Si l’on définit la nouvelle filtration régulière Gt = \ Z 1 F t0 ∨ σ t0 >t alors f définit un processus sur (Ω, B, P, G). 33 B(u) e 0 du , 1.1.3 Preuve du théorème 1.1 La preuve suivante s’inspire de [Mör-Per, corollaire 2.26], où l’on montre qu’un mouvement brownien planaire ne passe presque sûrement pas par un point donné (dans un intervalle de temps fini). Notons E l’événement E = {∃ ∈ [0, 1] : f (t) = t, f 0 (t) = λ}. Il s’avère plus simple montrer que la probabilité de l’événement Ẽ := ∃ t ∈ [0, 1] : f 0 (t) = λ, f 0 (f (t)) = λ est nulle. Le résultat en suivra puisque Ẽ ⊃ E. D’après (VI.1), log f 0 (t) = B(t) − log Z 1 eB(s) ds, 0 et nous voulons démontrer que le processus planaire Z(t) := B(t) − log Z 1 e B(s) ds, B(f (t)) − log Z 1 B(s) e 0 ds 0 ne passe pas par le point de la diagonale (log λ, log λ) : l’événement Ẽ est égal à l’événement {∃ t ∈ [0, 1] : Z(t) = (log λ, log λ)} . Le processus planaire (Z(t))t∈[0,1] part du point aléatoire − log Z 1 e B(s) ds, − log Z 1 e B(s) ds 0 0 et on veut connaître la probabilité qu’il atteigne le point déterministe (log λ, log λ). Bien évidemment la loi du point de départ possède une densité par rapport à la mesure de Lebesgue sur la diagonale ∆ ⊂ R2 . Il nous suffira donc de montrer le résultat suivant : Lemme 1.4. Soit x ∈ R un point donné et f un difféomorphisme de Malliavin-Shavgulidze défini par un mouvement brownien B comme à la ligne (VI.1). Alors pour Lebesgue-presque tout y ∈ R, on a P (∃ t ∈ [0, 1] : (B(t) − y, B(f (t)) − y) = (x, x)) = 0. Démonstration. D’après l’invariance par translations du mouvement brownien, on peut rendre le point de départ déterministe en rendant aléatoire le point ciblé : P (∃ t ∈ [0, 1] : (B(t) − y, B(f (t)) − y) = (x, x)) = P (∃ t ∈ [0, 1] : (B(t), B(f (t))) = (x + y, x + y)) . Ce petit changement nous permet de simplifier le problème en faisant un aller-retour par le théorème de Fubini. En effet, en intégrant par rapport à z = x + y, la question équivaut à se demander si l’intégrale Z P (∃ t ∈ [0, 1] : (B(t), B(f (t))) = (z, z)) dz R est nulle, et on peut alors échanger l’ordre d’intégration : Z P (∃ t ∈ [0, 1] : (B(t), B(f (t))) = (z, z)) dz R Z =E h R 1{∃ t∈[0,1] : (B(t),B(f (t)))=(z,z)} dz = E Leb∆ Im (B(t), B(f (t)))t∈[0,1] ∩ ∆ 34 i , (VI.3) où Leb∆ dénote la mesure de Lebesgue sur la diagonale ∆ ⊂ R2 et Im l’image du processus. L’espérance (VI.3) est inférieure ou égale à h E Leb Zéros (B(f (t)) − B(t))t∈[0,1] i , en notant Zéros (B(f (t)) − B(t))t∈[0,1] l’ensemble des t ∈ [0, 1] tels que B(f (t)) = B(t). En ayant obtenu cette majoration, on peut revenir en arrière par le théorème de Fubini : h E Leb Zéros (B(f (t)) − B(t))t∈[0,1] i Z 1 P (B(f (t)) = B(t)) dt. = 0 On va montrer que pour tout t ∈ (0, 1) P (B(f (t)) = B(t)) = 0. (VI.4) Or, la probabilité que l’on ait f (t) = t étant nulle, on va montrer que pour t ∈ (0, 1) fixé P ({B(f (t)) = B(t)} ∩ {f (t) > t}) = 0, (VI.5) puis le fait que la probabilité P ({B(f (t)) = B(t)} ∩ {f (t) < t}) est nulle suivra par méthode de couplage (en utilisant le lemme 1.3 ) : si f (t) < t, en « renversant le temps », on obtient f (1 − t) > 1 − t, ce qui nous permet de déduire le deuxième cas à partir du premier. Les événements {f (t) > t} et {f (t) < t} appartiennent à Gt pour tout t ∈ [0, 1]. Donc on peut effectivement se restreindre au cas f (t) > t, avec le grand avantage que sur cet événement, la loi de B(f (t)) − B(t) n’a pas d’atome : on peut le constater facilement, puisque pour calculer la valeur f (t) on doit avoir connaissance de B uniquement jusqu’à l’instant t qui est inférieure à f (t) (outre que R 1 B(s) ds). En utilisant par exemple la propriété de Markov du mouvement brownien, on en déduit 0 e l’assertion (VI.5), qui permet de conclure la preuve du lemme. 1.1.4 Sur le nombre de points fixes On peut améliorer notre description en étudiant la probabilité qu’un difféomorphisme possède exactement m points fixes. Si l’on définit la variable aléatoire M = #Fix(f ), on voudrait décrire la distribution de M . On peut facilement montrer que la probabilité que M soit égal à 2 est positive (0 et 1 sont toujours des points fixes) : en effet, supposons que l’intégrale totale du mouvement brownien B sur [0, 1] soit presque 1 et que B croisse beaucoup près de 0, puis reste presque constant ; on trouvera ainsi un difféomorphisme qui n’a pas d’autres points fixes. Plus généralement : Proposition 1.5. Pour chaque entier positif m ≥ 2, la probabilité que M soit égal à m est strictement positive. Démonstration. En effet, l’ensemble des difféomorphismes avec m points fixes hyperboliques est d’intérieur non vide dans la topologie C 1 . L’affirmation suit du fait que la mesure MS est strictement positive sur tout ouvert. Remarque 1.1. Des simulations numériques laissent penser que la loi de M est proche d’une loi géométrique de paramètre 1/2. Cependant les statistiques changent remarquablement lorsque le paramètre σ de la variance du brownien change : par exemple, pour σ = 2 la distribution de M est encore proche d’une loi géométrique de paramètre 1/2, mais elle ne l’est plus pour des valeurs de σ plus grandes que 4. Une façon possible d’obtenir une estimation sur la décroissance de la loi de la variable M pourrait être un simple lemme de dynamique hyperbolique C 1+α en dimension 1, qui dit que le nombre de points fixes d’un difféomorphisme f est contrôlé par la distance de log f 0 à 0 sur l’ensemble des points fixes de f . 35 1+α Lemme 1.6. Soit f ∈ Diff + (I) et t0 un point fixe de f . On note t1 = inf{t > t0 t.q. f (t) = t}. Alors la distance entre t0 et t1 est minorée : t+ − t− ≥ | log f 0 (t0 )|1/α + | log f 0 (t1 )|1/α 1/α k log f 0 kα . (VI.6) Démonstration. Si t0 et t1 coïncident, le terme de droite dans (VI.6) est nulle puisqu’alors t0 est un point fixe parabolique (cf. le corollaire 1.2). Nous pouvons donc supposer t0 < t1 . Par continuité de la dérivée, il existe un point t∗ entre t0 et t1 auquel la dérivée de f vaut 1. Puisque la fonction log f 0 est C 1+α , on a pour tout t (en particulier pour t = t0 , t1 ) : | log f 0 (t)| = | log f 0 (t∗ ) − log f 0 (t)| ≤ k log f 0 kα |t − t∗ |α et donc |t − t∗ | ≥ | log f 0 (t)| k log f 0 kα 1/α . En écrivant t1 − t0 = (t1 − t∗ ) + (t∗ − t0 ), l’inégalité précédente nous donne (VI.6). Des conséquences plus intéressantes du théorème 1.1 interviendront dans la suite. 1.2 Difféomorphismes du cercle Soit (Ω, B, P) un espace de probabilité, soit B = (Bt )t∈S1 un pont brownien sur Ω et α ∈ S1 une variable de loi uniforme et indépendante de B. Nous définissons le difféomorphisme du cercle aléatoire de Malliavin-Shavgulidze : R t B(s) e ds f : t 7−→ R 01 + α. B(s) ds 0 e Il est facile de remarquer que la loi de f est invariante lorsque l’on fait une conjugaison par une rotation. 1.2.1 Nombre de rotation rationnel Rappelons (voir partie 1 dans l’introduction) qu’un difféomorphisme du cercle possède une orbite périodique si et seulement si son nombre de rotation est rationnel. Nous avons Proposition 1.7. Soit q un entier strictement positif. La probabilité qu’un difféomorphisme de Malliavin-Shavgulidze possède une orbite de période q est positive. Plus précisément, la probabilité que le nombre de rotation soit égal à p/q est positive pour tout p/q ∈ Q. Démonstration. On fixe p/q rationnel. L’ensemble des difféomorphismes avec nombre de rotation p/q est d’intérieur non vide, puisqu’il contient les difféomorphismes avec une orbite périodique hyperbolique, dont la combinatoire est de type p/q. On conclut encore grâce aux propriétés de la mesure. Comme analogue à la proposition 1.2, on peut dire que les orbites périodiques sont presque toujours hyperboliques. Proposition 1.8. La probabilité qu’un difféomorphisme MS possède une orbite périodique parabolique est nulle. Il en résulte que les orbites périodiques sont en nombre fini, pair, et la probabilité d’en avoir exactement m est positive pour tout m pair. 36 Esquisse de la preuve. Rappelons qu’une orbite {t, f (t), . . . , f q−1 (t)} est parabolique si et seulement si f q (t) = t et log Df q (t) = q−1 X B(f k (t)) − q log Z 1 eB = 0. 0 k=0 On appelle multiplicateur de l’orbite la quantité Df q (t) (qui ne dépend pas du point t dans l’orbite). On montrera que pour tout λ > 0, la probabilité qu’il existe une orbite périodique de multiplicateur égal à λ est nulle. Pour cela, on peut procéder comme dans la preuve du théorème 1.1, en regardant les événements E = {∃ t : f q (t) = t et Df q (t) = λ} Ẽ = {∃ t ∈ [0, 1] : Df q (t) = λ et Df q (f (t)) = λ} . La preuve procède de manière semblable jusqu’à la ligne (VI.4) : on veut montrer que pour tout t ∈ [0, 1] P (B(f q (t)) − B(t)) = 0. Au lieu de considérer seulement deux cas différents ({f (t) > t} et {f (t) < t}), nous devons faire face à une combinatoire plus complexe. En effet, si l’on souhaite appliquer la propriété de Markov pour B, il faut que la condition suivante soit vérifiée : max f k (t) < f q (t) < 1. k<q Il est encore possible, par méthode de couplage, de se ramener toujours à ce cas : il suffit en fait d’opérer une conjugaison par une rotation appropriée (voir la figure VI.1 ). 0 0 Figure VI.1 – Preuve du lemme 1.8 : combinatoire d’une orbite et choix convenable de la rotation Par les mêmes arguments, on peut démontrer le résultat suivant qui est intéressant en soi : Théorème 1.9. Soient f1 , . . . , fn des difféomorphismes de Malliavin-Shavgulidze indépendants. Alors le sous-groupe qu’ils engendrent est presque sûrement libre. Démonstration. Soit w = w(f, g) un mot non-trivial en f et g. On veut montrer que la probabilité que w(f, g) = id est nulle, lorsque f et g sont deux difféomorphismes MS indépendants. Soit ` la longueur du mot w et notons wj le suffixe de w de longueur j (avec j ≤ `). Il nous suffit de démontrer que la probabilité P(log Dw ≡ 0) est égale à 0. Or, on peut écrire log Dw sous la forme log Dw = `−1 X j Bij ◦ ψj ◦ wj − log j=0 Z S1 exp(Bij ) , avec ij ∈ {1, 2}, j ∈ {±1}, ψj ∈ {id, f −1 , g −1 } et B1 , B2 sont deux ponts browniens indépendants qui définissent f et g. Pour tous C1 , C2 ∈ R, on définit l’événement Z AC1 ,C2 = S1 exp(Bi ) = exp(Ci ), i = 1, 2 . 37 En moyennant sur les possibles valeurs des variables P ∀ t ∈ S1 , `−1 X R S1 exp(Bi ), on peut écrire j Bij (ψj (wj (t))) − log j=0 S1 Z exp(Bij ) = 0 = E P ∀t ∈ S1 , j Bij (ψj (wj (t))) = K(w; C1 , C2 ) AC1 ,C2 j=0 `−1 X avec K(w; C1 , C2 ) = #f −1 w − #f w · C1 + #g−1 w − #g w · C2 et où #γ w dénote le nombre de γ ∈ {f ±1 , g ±1 } dans le mot w. Or, pour t fixé et presque tous les C1 , C2 , P j Bij (ψj wj (t))) = K(w; C1 , C2 ) AC1 ,C2 = 0. j=0 `−1 X Ceci est facile à observer : supposons que ψ`−1 (w`−1 (t)) soit le dernier point sur le cercle à la gauche de 0, parmi les {ψj (wj (t))} (sinon, on fait un couplage avec le processus que l’on obtient par la conjugaison avec une rotation appropriée). Alors la loi de Bi`−1 (ψ`−1 (w`−1 (t))) n’as pas d’atome. 1.2.2 Nombre de rotation irrationnel Une question plus délicate, qui certainement mériterait une réponse, est la suivante : Question 1. Les difféomorphismes avec nombre de rotation irrationnel, forment-ils un ensemble de mesure strictement positive ? La topologie dans ce cas ne peut pas nous venir en aide, car l’ensemble des difféomorphismes avec 1 nombre de rotation α irrationnel fixé forment un fermé (contractile), d’intérieur vide dans Diff + (S1 ) (voir [Her 1] ). En utilisant le théorème de conjugaison différentiable (théorème 2.5 dans le chapitre introductif), Herman [Her 2] démontre le résultat suivant : Théorème 1.10. Soit f un difféomorphisme du cercle de classe C 3 , on définit Kf ⊂ S1 comme étant la réunion des paramètres λ ∈ S1 pour lesquels le nombre de rotation de Rλ ◦ f est irrationnel. Alors, la mesure de Lebesgue de Kf est strictement positive. 1 Figure VI.2 – Image prise de [Her 2]. Elle représente un chemin générique dans Diff + (S1 ) qui traverse des zones où le nombre de rotation est constant. Pour montrer ce théorème, Herman explique que la fonction nombre de rotation ρ est différentiable (au sens de Gateaux) aux points constitués par le difféomorphismes f avec nombre de rotation irrationnel α et C 1 -conjugués à la rotation, et sa différentielle, définie sur l’algèbre de Lie des champs de vecteurs, est donnée par Z (Dh ◦ f ◦ h−1 ) v ◦ h−1 , v ∈ Vect1 (S1 ) 7−→ S1 où h est le difféomorphisme conjuguant f à Rα : f = h−1 ◦ Rα ◦ h. 38 (VI.7) Exemple 1.1. Ce phénomène s’observe par exemple dans la célèbre famille d’Arnol’d. Pour tout a ∈ ] − 1/2π, 1/2π[ et λ ∈ S1 , on définit la fonction fa,λ (x) = x + λ + a sin(2π x). Les ensembles Ap/q des paramètres a et λ tels que ρ(fa,λ ) = p/q ont la forme de petites langues. Pour des petites valeurs de a, les t pour lesquels ρ(fa,t ) est irrationnel est presque 1. Cette dernière affirmation suit du fait que le bord des régions sur lesquelles le nombre de rotation est constant et rationnel, est Lipschitz au voisinage des pointes (a ∼ 0, ρ(fa,t ) rationnel). Nous avons fait des simulations numériques (voir appendice 4 ), qui montrent des langues quand −1 on regarde les mesures MS : pour tout couple (α, σ), on peut calculer µσ ρ (α) . Nous pensons que, contrairement à ce que l’on constate dans l’exemple d’Arnol’d, la mesure des difféomorphismes avec nombre de rotation irrationnel est nulle pour tout σ > 0. L’argument géométrique donné par Herman [Her 2] ne pourra pas être exploité, car l’on s’attend à ce que la fonction ρ ne soit pas Lipschitz aux difféomorphismes avec nombre de rotation diophantien, mais (1/2 − ε)-Hölder. En revanche, il est facile de voir que les difféomorphismes avec nombre de rotation irrationnel fixé, forment une partie de mesure nulle (il est en soi évident que les nombres irrationnels pour lesquels la mesure est positive, doivent être en nombre au plus dénombrable). Pour cela, nous rappellerons un résultat dû à Arnol’d (voir [Her 1] ) : Proposition 1.11. Soit f un homéomorphisme du cercle qui fixe 0 et soit α un nombre irrationnel. Il existe un seul λ = λ(α) ∈ S1 tel que le nombre de rotation de Rλ ◦ f soit égal à α. En outre, la fonction λ(α) est continue en la variable f . Remarque 1.2. On peut aussi montrer que pour tout nombre rationnel p/q, il existe deux fonctions λ+ et λ− , telles que ρ(Rλ+ ◦ f ) = ρ(Rλ− ◦ f ) = p/q et pour tout λ > λ+ (resp. < λ− ) le nombre de rotation de Rλ ◦ f est strictement supérieur (resp. inférieur). Les difféomorphismes en ces paramètres sont dits semi-stables. La proposition 1.8 montre en particulier que la probabilité qu’un difféomorphisme de MalliavinShavgulidze avec nombre de rotation p/q soit semi-stable est nulle. Nous en déduisons, par dénombrabilité des nombres rationnels, que les difféomorphismes semi-stables forment une partie négligeable 1 dans Diff + (S1 ). 1 D’après la proposition 1.11, on peut penser à ρ−1 (α) comme à une hypersurface dans Diff + (S1 ), non lisse en général, mais avec une régularité qui dépend de la régularité du difféomorphisme et, surtout, de la condition diophantienne que α vérifie : ces deux paramètres donnent un contrôle sur la différentielle du nombre de rotation (voir (VI.7) ). Pour ce qui nous concerne, il suffit de remarquer que l’on peut voir ρ−1 (α) comme l’image d’une 1 1 1 section continue sα du fibré en cercles Diff + (S1 ) sur S1 \Diff + (S1 ), où S1 \Diff + (S1 ) s’identifie, via −1 1 l’application B donnée par (V.3), à B C0 (S ) × {0} . Par définition de la mesure MS (voir (V.4) ), on peut appliquer le théorème de Fubini à l’intégrale Z Z C0 (S1 ) S1 1{sα (x)} (t) dt dW0,σ (x) = µσ sα C0 (S1 ) , qui est pourtant nulle. Proposition 1.12. Pour tout nombre irrationnel α, la mesure des difféomorphismes avec nombre de −1 rotation α est nulle : µσ ρ (α) = 0. 1.2.3 Renormalisation et mesures L’une des clefs pour comprendre la nature des difféomorphismes du cercle est la renormalisation. Cachée dans les travaux de Herman et Yoccoz [Her 1, Yoc 1], elle permet de mieux expliquer pourquoi le résultat de conjugaison différentiable est vrai. Il s’agit de regarder de plus en plus localement la dynamique décrite par f . Il est possible de définir la renormalisation Rf de tout difféomorphisme f sans point fixe : en prenant l’intervalle I1 contenant 0 et dont les extrémités sont f (0) et f q1 (0) (rappelons de la partie 2.2 que l’entier q1 est choisi comme le plus petit k tel que f k (0) appartient 39 à l’intervalle de gauche délimité par 0 et f (0) et tel que f k+1 (0) appartient à celui de droite), on considère le difféomorphisme du cercle I1 /f q1 (0)∼f (0) qui est défini par f sur l’intervalle d’extrémités f q1 (0) et 0 et par f q1 sur l’autre (voir figure VI.3 ). On opère par la suite une conjugaison affine pour envoyer I1 /f q1 (0)∼f (0) sur le cercle R/Z standard : nous avons défini le renormalisé Rf . Figure VI.3 – Construction de la renormalisation de f Notons T l’homothétie T (t) = (f (0) + 1 − f q (0)) t qui envoie [0, 1] sur [−f q (0), f (0)] en fixant 0. Avec une terminologie plus récente, Rf est défini par la paire d’applications qui commutent (T −1 f T, T −1 f q T ), qui est l’échange d’intervalles généralisé sur [0, 1] en figure VI.3. La théorie de Herman-Yoccoz peut s’expliquer en disant que les renormalisations successives Rn f se rapprochent d’une rotation lorsque le nombre de rotation est diophantien (les difféomorphismes infiniment renormalisables sont exactement ceux avec nombre de rotation irrationnel). Question 2. Quelle est l’image de la mesure µM S sous l’opérateur R ? Nous ne savons pas répondre à cette question. Nous pouvons cependant faire une remarque facile. Nous avons vu, dans le chapitre précédent, que lorsque l’on compose à droite par un difféomorphisme ϕ, l’événement (V.6) est de mesure 1 pour la probabilité image. Lorsque l’on renormalise f , on fait apparaitre une itération f q dans la définition de Rf , qui modifie cette loi des logarithmes itérés : pour tout t ∈ [0, 1] on a log D(Rf )(t + ε) − log D(Rf )(t) p ε→0 2ε log log(1/ε) lim q T 0 (t) f q (0) si t ∈ − , 0 , f (0) + 1 − f q (0) = q−1 X log Df (f k (T (t + ε))) − log Df (f (T (t))) p lim ε→0 2ε log log(1/ε) k=0 f (0) . si t ∈ 0, f (0) + 1 − f q (0) q f (0) + 1 − f q (0) f q (0) si t ∈ − , 0 , f (0) + 1 − f q (0) = q q−1 Xq f (0) + 1 − f q (0) Df k ((f (0) + 1 − f q (0)) t) k=0 f (0) . si t ∈ 0, f (0) + 1 − f q (0) Nous en déduisons Proposition 1.13. Les mesures R∗ µM S et µM S ne sont pas équivalentes. La proposition précédente donne seulement une réponse partielle au problème : si l’on s’attend à ce que la renormalisation « lisse » les difféomorphismes, il faut croire que ce module de continuité local donné par la loi de logarithmes itérés doit tendre vers 0 lorsque l’on applique R une infinité de fois. En 40 d’autres mots, on doit penser que l’opérateur R concentre le support de la mesure µM S de plus en plus dans un voisinage C 1+1/2−ε des rotations : soit n, disons, un nombre impair, et regardons encore la loi des logarithmes itérés après n renormalisations d’un difféomorphisme renormalisable n fois. On a log D(Rn f )(t + ε) − log D(Rn f )(t) p ε→0 2ε log log(1/ε) lim qn−1 −1 q q X qn−1 (0) + 1 − f qn (0) f Df k ((f qn−1 (0) + 1 − f qn (0)) t) k=0 f qn (0) , 0 , si t ∈ − q f n−1 (0) + 1 − f qn (0) = qX n −1 q q f qn−1 (0) + 1 − f qn (0) Df k ((f qn−1 (0) + 1 − f qn (0)) t) k=0 f qn−1 (0) si t ∈ 0, q . q f n−1 (0) + 1 − f n (0) Si le nombre de rotation de f est irrationnel, on peut regarder le comportement lorsque n tend vers l’infini. Si f n’est pas minimal, alors le facteur q f qn−1 (0) + 1 − f qn (0) converge vers un nombre strictement positif, et on devrait penser que les sommes convergent (d’après le résultat de Norton expliqué dans la partie 3 de ce chapitre). Enprevanche, si f est minimal, il faut regarder finement la compétition entre ces deux limites : le facteur f qn−1 (0) + 1 − f qn (0) tend vers 0, mais la somme diverge. Pourquoi sommes-nous convaincus que le nombre de rotation doit être rationnel presque sûrement ? Le fait est que pour construire Rf on se retrouve toujours avec beaucoup de choix. Nous allons être plus précis. Considérons le processus (f, Gt ), où Gt est la filtration introduite à la ligne (VI.2) (avec les modifications appropriées en considérant que l’on travaille avec un pont brownien). Pour définir Rf , nous n’avons pas besoin de connaitre entièrement le pont brownien entre 0 et 1. 1. Le premier point de l’orbite est f (0) = α : il est choisi uniformément par rapport à Lebesgue et il est indépendant de Gt pour tout t. 2. Ensuite la définition de f (α) nécessite la connaissance de α et de B entre 0 et α. Supposons α < f (α) < 1 (∗) (dans le cas contraire on pourra faire un couplage avec 1 − f (1 − t)). Au lieu de considérer (Bt )t∈[0,α] , on peut se restreindre à la variable Rα B e +α : R01 0 eB nous avons que f 2 (0) est mesurable par rapport à la tribu Z 1 σ B1 , eB , α, 0 Z α eB . 0 3. Sous la condition précédente, q1 définit un temps d’arrêt qui est mesurable par rapport à la tribu Z 1 σ B1 , eB , α, Z α 0 0 eB , (Bt )t∈[α,1[ . Le temps q1 est fini si et seulement si f n’a pas de point fixe. On en déduit que la variable f q1 +1 (0) est mesurable par rapport à la tribu T1 = σ B1 , Z 1 eB , α, 0 Z α 0 41 eB , (Bt )t∈[α,f q1 (0)] . 4. Par conséquent, l’intervalle I1 sur lequel on définit la renormalisation Rf , ainsi que le couple d’applications (f, f q1 ), sont mesurables par rapport à la tribu T1 . Ce qui est important est qu’ils sont presque indépendants de l’évolution de B dans l’intervalle délimité par f q1 (0) et f (0) qui contient 0 : il faut seulement connaitre Z 1 f q1 (0) B e Z f (0) et eB . 0 Le point f q1 +1 (0) joue le rôle de α dans le premier point. 5. En répétant les étapes précédentes, on en déduit que l’intervalle In d’extrémités f qn−1 (0) et f qn (0) qui contient 0 et le couple (f qn−1 , f qn ) sont presque indépendants de l’évolution de B dans l’intervalle In , modulo deux conditions de bords comme dans le point précédent. En conclusion, le fait que le difféomorphisme aléatoire f soit renormalisable une infinité de fois est indéterminé si l’on connait l’évolution de B partout, sauf en un petit intervalle autour de 0. On aimerait alors disposer d’une espèce de propriété de Markov pour pouvoir appliquer une loi du 0–1. Les images de la figure VI.12 sont assez suggestives sous ce point de vue. 42 2 2.1 Centralisateurs Quelques rappels sur les centralisateurs des difféomorphismes de l’intervalle Rappelons d’abord un résultat classique, dû originairement a Sternberg et dans cette version C 1+α par Chaperon [Cha], mais présenté sous cette forme par Yoccoz (voir [Nav 1, Nav 2, Yoc 2] ). Définition 2.1. On dit que deux difféomorphismes f et g de classe C 1+α définissent le même germe s’ils coïncident dans un voisinage suffisamment petit de l’origine. On définit G+1+α (R, 0) comme étant l’espace des germes des difféomorphismes C 1+α de la droite qui fixent 0 et préservent l’orientation. On dit qu’un germe [g] est hyperbolique si la dérivée en 0 de g définissant [g] est différente de 1 (observer que cette notion est toujours bien définie). Théorème 2.1 (Théorème de linéarisation de Sternberg). Soit [g] ∈ G+1+α (R, 0) un germe hyperbolique et a := g 0 (0). Il existe alors un germe [h] ∈ G+1+α (R, 0) tel que h0 (0) = 1 et h(g(x)) = ah(x) dans un voisinage de l’origine. (∗) En outre, si [h1 ] est un germe C 1 qui vérifie (∗), alors [h1 ] est de classe C 1+α et définit le même germe que h. Démonstration. On va transformer le problème de la recherche d’un tel h en un problème de point fixe. Pour cela, linéarisons l’équation (∗) : soit δ > 0 suffisamment petit tel que g soit défini sur l’intervalle [−δ, δ], alors on peut écrire g(x) = ax + φ(x) et h(x) = x + ψ0 (x), avec les fonctions φ et ψ0 de classe C 1+α et nulles en 0 jusqu’au premier ordre. L’équation (∗) s’écrit sur [−δ, δ] : ax + φ(x) + ψ0 (g(x)) = ax + a ψ0 (x) ou bien ψ0 = a1 ψ0 ◦ g + a1 φ. (VI.8) On définit l’espace vectoriel Eδ des fonctions ψ de classe C 1+α sur [−δ, δ], telles que ψ(0) = ψ 0 (0) = 0. On munit Eδ de la norme kψk = kψ 0 kα . L’espace Eδ est alors un espace de Banach et la fonction φ appartient à Eδ . L’équation (VI.8) nous suggère de définir l’endomorphisme Sδ de Eδ : Sδ [ψ] = a1 ψ ◦ g, de sorte que ψ0 doit être solution de l’équation ψ = Sδ [ψ] + a1 φ. (VI.9) Quitte à passer à g −1 , on peut supposer a < 1, puis on pose C(δ) := sup[−δ,δ] g 0 . Placés maintenant dans le bon cadre analytique pour résoudre (VI.9), on montre que pour δ suffisamment petit, Sδ est 43 une contraction. Soient t et s dans [−δ, δ], on a Sδ [ψ]0 (t) − Sδ [ψ]0 (s) = 1 (ψ ◦ g)0 (t) − (ψ ◦ g)0 (s) a 1 0 ψ (g(t)) g 0 (t) − ψ 0 (g(s)) g 0 (s) a 1 1 0 0 ≤ ψ (g(t)) g (t) − ψ 0 (g(t)) g 0 (s) + ψ 0 (g(t)) g 0 (s) − ψ 0 (g(s)) g 0 (s) a a |ψ 0 (g(t))| 0 g 0 (s) ≤ kg kα |t − s|α + kψk |g(t) − g(s)|α a a |ψ 0 (g(t)) − ψ 0 (0)| 0 g 0 (s) = kg kα |t − s|α + kψk |g(t) − g(s)|α a a kψk |g(t)|α 0 C(δ) ≤ kg kα |t − s|α + kψk C(δ)α |t − s|α a a i kψk h ≤ C(δ)α |t|α kg 0 kα + C(δ)1+α |t − s|α a i kψk h ≤ C(δ)α δ α kg 0 kα + C(δ)1+α |t − s|α . a = Il suffira donc de prendre δ tel que C(δ)α δ α kg 0 kα + C(δ)1+α < a, choix bien possible car le premier terme tend vers 0 et C(δ) tend vers a < 1 lorsque δ tend vers 0. Il reste à montrer l’unicité. Soit h1 un germe C 1 qui vérifie les bonnes propriétés, alors g ◦ h−1 1 = ◦ Ma (où Ma est la multiplication par a), d’où h−1 1 −1 −1 h ◦ h−1 1 ◦ Ma = h ◦ g ◦ h1 = Ma ◦ h ◦ h1 , qui veut dire que h ◦ h−1 1 commute avec Ma . Soit t un point suffisamment près de 0, alors n h h−1 1 (a t) h h−1 1 (t) = lim n→∞ = t lim n a n h h−1 1 (a t) an t n→∞ = t h ◦ h−1 1 0 (0) = t. Corollaire 2.2. Soit f un difféomorphisme C 1+α de l’intervalle avec 0 et 1 seuls points fixes. On suppose a := f 0 (0) 6= 1, alors il existe un difféomorphisme h de [0, 1[ qui est de classe C 1+α sur [0, 1[ et vérifie h0 (0) = 1 et h(f (x)) = ah(x) pour tout x ∈ [0, 1[. (∗∗) En outre, si h1 est un difféomorphisme C 1 qui vérifie (∗∗), alors h1 est de classe C 1+α et coïncide avec h. Démonstration. Par le théorème de linéarisation de Sternberg, il existe un voisinage de 0 et un difféomorphisme h̃ défini sur ce voisinage tel que (∗) soit satisfait. Ceci entraîne que la définition du difféomorphisme h souhaité est entièrement déterminée : en effet, tout voisinage de 0 contient un domaine fondamental pour l’action de f , de la forme J0 = [x0 , f (x0 )[ (si l’on suppose, sans perte de généralité, a > 1). Soit maintenant x ∈ [0, 1[ un point quelconque. Il existe un unique entier n = n(x) tel que f n(x) (x) ∈ J0 . On définit h(x) := a−n(x) h̃(f n(x) (x)). La fonction n = n(x) vérifie n(f (x)) = n(x) − 1. Il en découle l’égalité h(f (x)) = a−n(f (x)) h̃ f n(f (x)) (f (x)) = a−n(x)+1 h̃ f n(x) (x) = ah(x). 44 Puisque tout difféomorphisme f vérifiant les hypothèses du corollaire précédent est conjugué à Ma , la multiplication linéaire par a = f 0 (0), il s’ensuit, en particulier, que le centralisateur C 1 de f sur [0, 1[ est conjugué par le difféomorphisme h au centralisateur C 1 de la multiplication par f 0 (0) sur [0, +∞[. La description de ce dernier est assez élémentaire. Soit ϕ un difféomorphisme sur [0, +∞[ qui commute avec Ma . Supposons, sans perte de généralité, que a soit inférieur à 1. Pour tout x ∈ [0, +∞[ et n > 0 entier, ϕ(x) = ϕ (an x) et ϕ0 (x) = ϕ0 (an x) . an (VI.10) Puisque, pour tout x fixé, la suite (an x)n∈N tend vers 0, (VI.10) force la dérivée de ϕ à être constante. On vient de démontrer que le centralisateur C 1 de Ma est égal à R+ , qu’on peut voir comme étant ∂ le flot à un paramètre du champ de vecteurs a ∂x . 1 On en déduit que le centralisateur C de f sur [0, 1[ est égal au groupe à un paramètre {ft } engendré par le champ de vecteurs de Szekeres Xf associé à f , défini par Xf (x) = h(x) Dh−1 (x) log a. On remarquera que le flot de Xf au temps t est défini par ft (x) = h−1 at h(x) . Nous nous rapprochons de l’étude de l’invariant de Mather. Même si Kopell dans [Kop] avait entièrement expliqué ce dont nous avons principalement besoin, nous allons encore suivre l’exposition de Yoccoz [Yoc 2]. Soit f un difféomorphisme de l’intervalle avec 0 et 1 comme uniques points fixes, supposés hyperboliques. On note a = f 0 (0) et b = f 0 (1). Prenons en exemple le cas a > 1 > b. Soient Xf et Yf les champs 1 de vecteurs de Szekeres associés à f sur les intervalles [0, 1[ et ]0, 1] respectivement. Si g ∈ Diff + (I) 0 0 τ commute avec f , d’après ce qui précède, il doit exister deux temps τ et τ tels que g = fτ = f , où {ft }t∈R est le flot engendré par Xf et {f t }t∈R celui par Yf . Soient x, y ∈]0, 1[, on définit W x,y comme étant la fonction de « raccord » entre {f t } et {ft } : f t (y) = fW x,y (t) (x). (VI.11) Si h et k sont les difféomorphismes qui linéarisent f sur [0, 1[ et ]0, 1] respectivement, l’équation (VI.11) devient x,y k −1 bt k(y) = h−1 aW (t) h(x) , d’où W x,y h k −1 bt k(y) (t) = loga . h(x) La fonction W x,y (t) est un difféomorphisme C 1+α de R dans R qui vérifie de plus W x,y h k −1 b bt k(y) (t + 1) = loga h(x) h f k −1 bt k(y) = loga h(x) −1 ah k bt k(y) = loga = 1 + W x,y (t) h(x) En d’autres termes, W x,y commute avec les translations entières et, par passage au quotient de cette action, il définit un difféomorphisme du cercle de classe C 1+α , que l’on note encore W x,y . On remarquera aussi, avec des vérifications analogues, que pour tous s, t, t0 , W ft (x),f t0 (y) (s) = W x,y (s + t0 ) − t. 0 Puisque g = fτ = f τ , pour tous x, y ∈]0, 1[, W x,y doit vérifier W x,y (s + τ 0 ) − τ = W g(x),g(y) (s). 45 (VI.12) 0 Proposition 2.3 ( [Yoc 2] ). Le difféomorphisme g = fτ = f τ commute avec f sur [0, 1] si et seulement 1 si, pour tous x, y ∈]0, 1[, (VI.12) est vérifiée. C’est-à-dire, le centralisateur C 1 de f dans Diff + (I) est x,y 2 isomorphe au stabilisateur de W sous l’action de R : (t, t0 ) · W x,y (s) = W x,y (s + t0 ) − t. On peut voir que le stabilisateur de W x,y est toujours soit cyclique, engendré par correspond à la sous-période de W x,y − id, ou bien isomorphe à R entier. (VI.13) 1 1 n, n , où 1 n Remarque 2.1. Les difféomorphismes de classe C 1+α qui ont un centralisateur C 1 trivial forment une partie ouverte et dense. Étendons maintenant l’étude précédente aux difféomorphismes hyperboliques avec un nombre arbitraire de points fixes, 0 = p0 < q0 < p1 < q1 < . . . < pm < qm = 1. Le raisonnement est valable pour tout intervalle de la forme [pi , qi ] ou [qi , pi+1 ]. Remarquons que pour tout point pi (ou qi ), le théorème de linéarisation de Sternberg 2.1 permet de trouver un difféomorphisme hi de classe C 1+α défini sur ]qi−1 , qi [ (ou ]pi , pi+1 [) à valeurs dans R, tel que h0i (pi ) = 1 et hi (f (x)) = f 0 (pi ) hi (x) pour tout x ∈]qi−1 , qi [. (VI.14) Cela permet d’associer à f un champ de vecteurs de Szekeres sur l’intervalle ]qi−1 , qi [, de sorte que les flots f t sur ]qi−1 , pi ] et ft sur [pi , qi [ se raccordent en pi . Si g est un difféomorphisme de classe C 1 qui centralise f , il correspond à un certain f t sur ]qi−1 , pi ] et donc, par (VI.14), à ft sur [pi , qi [. Nous en déduisons que la définition d’un tel g sur un quelconque des intervalles [pi , qi ] ou [qi , pi+1 ] force la définition de g sur l’intervalle entier. Ainsi, la proposition 2.3 implique que le centralisateur C 1 de f sur [0, 1] est isomorphe au stabilisateur de x0 ,y x ,y 0 x0 ,y0 (W0,0 , W0,10 1 , W1,11 1 , . . .) par l’action diagonale de R2 définie sur chaque composante par (VI.13) x,y x,y (nous avons noté Wi,i , Wi,i+1 les W x,y correspondant aux intervalles [pi , qi ] et [qi , pi+1 ] ). 2.2 Centralisateur C 1 d’un difféomorphisme hyperbolique du cercle Soit f un difféomorphisme de classe C 1+α qui possède uniquement des orbites périodiques hyperboliques. On suppose que le nombre de rotation de f est égal à p/q. Par souci de simplicité on suppose que les multiplicateurs de chaque orbite sont différents l’un de l’autre. Alors le difféomorphisme F := f q est un difféomorphisme du cercle avec uniquement des points fixes hyperboliques. Un résultat de Kopell [Kop] (voir aussi [Yoc 2] ) montre que les centralisateurs C 1 de f et F coïncident. La preuve de ce fait n’est pas trop difficile, mais elle ne rajoute aucun élément nouveau vraiment instructif pour nous à présent. Ainsi, nous pouvons nous restreindre au cas où le nombre de rotation de f vaut 0. Il est clair que pour tout point fixe x∗ ∈ S1 , le difféomorphisme f définit un difféomorphisme f∗ de l’intervalle I∗ := [x∗ , x∗ + 1], et tout élément du centralisateur de f sur S1 , centralise aussi f∗ sur I∗ , si l’on suppose qu’un tel élément fixe x∗ . La grande différence dans l’étude des centralisateurs sur le cercle et sur l’intervalle se manifeste par une partie de torsion : il peut exister un difféomorphisme g qui permute cycliquement les points attractifs et les points répulsifs de f , tout en commutant avec f . Remarquons que sous notre hypothèse sur les multiplicateurs des orbites (donc sur les valeurs de la dérivée de f aux points fixes), ceci ne peut cependant pas se produire. Proposition 2.4 ( [Yoc 2] ). Avec les notations précédentes, le centralisateur C 1 de f est isomorphe à un sous-groupe fermé de R. De plus, il existe un ouvert dense de f pour lequel le centralisateur C 1 est trivial. Théorème 2.5. Pour µM S -presque tout difféomorphisme f du cercle avec nombre de rotation rationnel, le centralisateur C 1 de f est trivial. Nous utiliserons le lemme suivant dont la preuve est très simple. Lemme 2.6. Soit f q : [x0 , x1 ] −→ [x1 , x2 ] un difféomorphisme aléatoire obtenu en itérant q fois un difféomorphisme MS f avec dérivées aux extrémités fixées. Soient (an )n∈N ⊂]x0 , x1 [ et (bn )n∈N ⊂]x1 , x2 [ deux suites (décroissantes). Alors la probabilité qu’il existe n tel que f q (an ) = bn est nulle. 46 Pour montrer le théorème 2.5, nous suivons la preuve de Kopell dans [Kop], du fait que les contractions avec centralisateur C 1 trivial constituent une partie dense parmi les contractions. Démonstration. Sans perte de généralité, on peut supposer que le nombre de rotation de f soit 0. Considérons l’ensemble des f tels que 1. f préserve un intervalle I = [x, y] et sa restriction à [x, y[ est une contraction. Fixons x0 ∈]x, y[ et posons, pour tout n ∈ Z, xn = f n (x0 ). 2. On connait f (et donc Df ) sur J = [x, x1 ] et J 0 = [x0 , y] et on sait que f (x0 ) = x1 . Nous allons conditionner la mesure de Malliavin-Shavgulidze par rapport à cet événement. La deuxième condition implique que l’on connait les champs de vecteurs X et Y associés à f autour de x et de y, sur les intervalles J et J 0 . En particulier on connait les flots à un paramètre ft et f t sur les intervalles J et J 0 respectivement. Soit h un difféomorphisme de I tel que h|J∪J 0 = f|J∪J 0 et tel que h appartient à un flot à un paramètre {ht } de difféomorphismes C 1 . Tout difféomorphisme aléatoire f détermine un homéomorphisme ψ = ψf de ]x, y] tel que 1. ψ|[x1 ,y] = id, 2. ψh = hψ , 3. f = ψ −1 hψ. En effet, il suffit de définir le difféomorphisme β = h ◦ f −1 de [x2 , x1 ] dans lui-même, tangent à l’identité en x1 et x2 : si l’on pose ψ|[x2 ,x1 ] = β, on détermine ψ entièrement, en utilisant la propriété 2. Le lemme 2.6 implique que presque sûrement, il n’existe pas de n > 0 tel que f (h1/n (x0 )) = h1/n (x1 ). Donc presque sûrement, il n’existe pas de n > 0 tel que ψ(h1/n (x1 )) = h1/n (ψ(x1 )) , (VI.15) puisque ψ = h ◦ f −1 sur [x2 , x1 ]. Supposons que le centralisateur C 1 de f ne soit pas trivial : il existe n > 0 tel que f 1/n est différentiable en x et par unicité du flot à un paramètre on doit avoir f 1/n = ψ −1 h1/n ψ. Alors f 1/n commute avec f = ψ −1 hψ, qui est égal à h sur [x, x1 ]. Cela implique que sur l’intervalle [x, x1 ], on a f 1/n = h1/n . Donc ψh1/n = h1/n ψ sur [x, x1 ], qui est possible uniquement avec probabilité nulle d’après (VI.15). Remarque 2.2. La preuve du théorème précédent est assez « molle » : elle ne requiert pas d’expliciter la mesure MS, en utilisant seulement ses propriétés qualitatives. Notamment, Les propriétés données par la proposition 1.8 et le lemme 2.6, avec la propriété de régularité Hölder presque sûre, suffisent. 47 3 Exemples de Denjoy Nous abordons ici l’étude des difféomorphismes avec nombre de rotation irrationnel. On doit rappeler qu’à présent, on ne sait pas si ces difféomorphismes forment une partie de mesure positive, par rapport à la mesure MS (question 1 ). Cependant, pour traiter, au sens de la mesure, l’ensemble des difféomorphismes avec nombre de rotation irrationnel α fixé, nous introduisons des mesures MS « locales ». 1 La proposition 1.11 nous a permis de voir ρ−1 (α) comme étant une hypersurface dans Diff + (S1 ). r 1 r Nous noterons aussi Diff +,α (S ) l’ensemble des difféomorphismes de classe C et nombre de rotation irrationnel α fixé. 1 Définition 3.1. La mesure MS locale sur Diff +,α (S1 ) est définie comme étant la mesure image de W0,σ R t x(s) e ds R par rapport à la section sα qui à f0 (t) = 01 x(s) associe sα (f0 ) = Rλ(α) ◦ f0 , l’unique translatée de f0 0 e ds avec nombre de rotation α. On notera µσ,α la mesure (sα )∗ W0,σ . Par rapport aux mesures µσ , les mesures locales µσ,α ont l’avantage de nous faire travailler avec des ponts browniens. Si l’on conditionnait un difféomorphisme de Malliavin-Shavgulidze à avoir nombre r de rotation irrationnel, la mesure que l’on obtiendrait sur Diff +,α (S1 ) ne serait pas pour autant « homogène » : la densité en un point x = log Df − log Df (0) dépendrait de la mesure de Lebesgue du Cantor Kf défini dans l’énoncé du théorème de Herman 1.10. Remarque 3.1. Pour tout α ∈ R − Q, la fonction sα est un homéomorphisme qui préserve les classes r de régularité. Il s’ensuit que presque sûrement, un difféomorphisme f ∈ Diff +,α (S1 ) est de classe C 1+w (w module de Lévy (III.4) ), que sa variation n’est pas bornée, etc. D’après la remarque précédente, presque sûrement le théorème de Denjoy (théorème 1.3 dans l’introduction) ne peut pas s’appliquer. La question à laquelle nous souhaiterions répondre est la suivante : Question 3. Pour chaque α irrationnel fixé, quelle est la mesure µσ,α des difféomorphismes qui sont conjugués topologiquement à la rotation ? De quelle manière cette mesure dépend de la condition diophantienne satisfaite par α ? Est-il vrai, par exemple, que si α satisfait une condition diophantienne 1 d’ordre δ, alors, presque sûrement, tout difféomorphisme est C 2 −ε−δ -conjugué à la rotation ? Pour tout α irrationnel et τ < 1/2, il est possible de construire des exemples de Denjoy avec nombre de rotation α et de classe C 1+τ . Ces exemples ont été traités systématiquement pour la première fois par Herman [Her 1, Chapitre X]. Nous les représentons ici, en nous inspirant plutôt de Norton [Nor]. On pose σ = 1/τ et on choisit M = M (σ), entier suffisamment grand tel que M +1 M σ < 54 . Pour A tout n ∈ Z, on définit `n := (|n|+M n∈Z `n = 1 (cette condition assurera )σ , où A a été choisi pour que que le Cantor minimal invariant est un ensemble de mesure de Lebesgue nulle). Pour tout n fixé, soit In un intervalle fermé dans S1 et de longueur `n . On force les intervalles In à être ordonnés combinatoirement sur le cercle comme une orbite de la rotation d’angle α (on peut par exemple faire correspondre nα à In ). Ce choix, et la densité de l’orbite (nα)n∈Z , implique que S K := S1 − n∈Z In est un ensemble de Cantor (de mesure de Lebesgue nulle). On passe ensuite à la construction du difféomorphisme. Pour tout n, on définit un difféomorphisme S fn de classe C 1+τ de In sur In+1 et on pose f In = fn ; la densité de n∈Z In implique que f s’étend à un homéomorphisme de S1 dans S1 . Afin que f soit globalement de classe C 1+τ sur S1 , il faut prendre quelques précautions pour définir les fn . h i Soit ϕ : [0, 1] −→ [0, 4] une fonction C ∞ de support 13 , 23 et de moyenne globale 1. Si x ∈ In = [an , bn ], on définit `n+1 − `n x − an gn (x) = 1 + ϕ . `n `n Alors gn est une fonction strictement positive de classe C ∞ et gn (an ) = gn (bn ) = 1. En outre, le choix du M implique que gn est toujours inférieur, disons, à 2. Il s’ensuit que tout difféomorphisme P Z x gn (y) dy fn (x) := an+1 + an 48 a une dérivée uniformément bornée par 2 et elle tend vers 1 lorsque |n| tend vers l’infini. Ces considérations permettent de définir globalement f , comme expliqué plus haut, et alors f sera un difféomorphisme de classe C 1 en tout point x ∈ S1 . Remarquons que la dérivée de f vaut 1 sur le Cantor K. Il reste à vérifier que f est de classe C 1+τ . Pour cela, il suffit de montrer que les normes C τ des gn sont uniformément bornées. Des estimations désagréables, mais élémentaires, montrent que pour 2σ n assez grand en module, la constante de Hölder C τ de gn est bornée par A τ kϕkLip (kϕkLip est la constante de Lipschitz de ϕ sur [0, 1]). Ces exemples ont de plus la propriété, pour nous remarquable, que la dimension de boîte supérieure du Cantor K est exactement τ . À ce propos, nous rappelons que si (X, d) est un espace métrique compact et Y ⊂ X une partie bornée, on définit la dimension de boîte supérieure de Y de la manière suivante : soit, pour tout ε > 0, N (ε) le nombre minimal de boules de rayon ε nécessaires pour recouvrir Y ; alors la dimension de boîte supérieure dimB (Y ) de Y est définie comme étant la limite supérieure log N (ε) . ε→0 log(1/ε) dimB (Y ) = lim La limite à droite dans l’expression n’existe pas forcément. Si cette limite existe, on l’appelle plus simplement dimension de boîte de Y . Il est connu (voir [Nor] ) que pour une partie compacte Y sur le cercle S1 , de mesure de Lebesgue P nulle, la dimension de boîte supérieure de Y est égale à l’infimum des s > 0 tel que Leb(I)s < ∞, où la somme est faite sur les composantes connexes I du complémentaire de Y dans S1 . P P Dans notre exemple, la somme Leb(I)s = `sn est finie si et seulement si s > τ , d’où la validité de notre affirmation. Plus généralement, Norton montre qu’il y a des contraintes pour qu’un Cantor dans S1 soit l’ensemble minimal invariant d’un difféomorphisme de classe C 1+τ : Théorème 3.1 (Norton). Soit f un difféomorphisme du cercle avec un ensemble minimal qui est un Cantor K, tel que la dimension de boîte supérieure de K soit égale à σ ∈]0, 1[. Alors f n’est pas de classe C 1+τ pour tout τ > σ. Observons que dans notre contexte aléatoire, si f est un difféomorphisme tiré au hasard par rapport à la mesure MS locale, et si l’on suppose les deux propriétés supplémentaires suivantes : 1. f possède un Cantor invariant K, 2. Df = 1 sur K, alors, la dimension de boîte supérieure de K doit être exactement 1/2. En effet, la dimension de boîte des zéros d’un pont brownien est presque sûrement égale à 1/2 (voir [Mör-Per] ), et donc il en est de même pour tout ensemble de niveau non-vide. Il n’est pas alors possible d’exclure l’existence d’un ensemble de probabilité non-nulle de difféomorphisme qui vérifient les propriétés 1. et 2. ci-dessus. Un raffinement célèbre de la dimension de boîte est la dimension de Hausdorff. Dans [Kra-Sch] le résultat de Norton est amélioré, sous la condition que Df soit égal à 1 partout sur le Cantor invariant. Théorème 3.2 (Kra – Schmeling). Pour tout τ > 0, si K est un Cantor minimal invariant pour un difféomorphisme du cercle C 1+τ et de nombre de rotation α qui satisfait une condition diophantienne d’ordre δ, alors la dimension de Hausdorff de K est supérieure ou égale à τ /(1 + δ). Par suite, des exemples aléatoires de difféomorphismes de Denjoy avec Df = 1 sur le Cantor sont possibles seulement si le nombre de rotation α est de type Roth. Ces nombres α forment une partie de mesure pleine par rapport à la mesure de Lebesgue, et donc nous ne rencontrons encore aucune contrainte. 49 4 Appendice : Simulations numériques En commençant l’étude des difféomorphismes aléatoires, nous avons eu une sensation de dépaysement : quel type de difféomorphisme devons-nous imaginer ? Nous avons alors eu recours à une aide « numérique » : l’un des avantages à travailler avec les mouvements browniens est en effet leur simplicité quand on souhaite faire des simulations ! Dans la suite, nous présentons quelques images, en rajoutant après les lignes de code qui nous ont permis de les obtenir : elles présentent principalement deux parties, une pour générer pseudoaléatoirement un difféomorphisme qui suit la loi de Malliavin-Shavgulidze et une autre pour calculer le nombre de rotation. Le langage est Python. Les simulations ont été effectuées sur les serveurs du PSMN de l’École Normale Supérieure de Lyon. 50 Figure VI.4 – Paramètre σ = 0.6 Nombre de rotation [0, 2, 1, 2, 2, 1, 1, 1, . . .] ∼ 27 73 Figure VI.6 – Paramètre σ = 1.6 Nombre de rotation [0, 2, 1, 6, 2, 4, 1, 2, . . .] ∼ 231 662 Figure VI.5 – Paramètre σ = 0.8 Nombre de rotation [0, 15, 3, 4, 1, 3, 1, 15, . . .] ∼ Figure VI.7 – Paramètre σ = 2.3 Nombre de rotation 37 Figure VI.8 – Paramètre σ = 3.4 Nombre de rotation 37 Figure VI.9 – Paramètre σ = 9.1 Nombre de rotation 0 51 1216 18619 Dans les images nous avons tracé le graphe du difféomorphisme pseudo-aléatoire f , avec le pont brownien utilisé dans sa définition. Le graphe du pont brownien est colorié par une couleur entre 0 et 1 qui correspond à l’image du point 0 par f . Sur le graphe de f nous avons aussi marqué les points sur l’orbite de 0 : f k (0), pour k ∈ {200, . . . , 499}. Cet algorithme nous a permis de générer 1050 difféomorphismes aléatoires pour chaque loi µσ , avec σ ∈ {0.25, 0.5, . . . , 7.75}, dont nous avons calculé le nombre de rotation. La figure VI.10 se lit ainsi : chaque ligne correspond à un paramètre σ, pour lequel nous avons ordonné de manière croissante les nombres de rotation obtenus pour cette valeur. Pour distinguer les rationnels des irrationnels, nous avons reporté chaque nombre de rotation ρ par une couleur entre 0 et 1, qui correspond à la partie fractionnaire de ρ multiplié par un très grand nombre rationnel (2 · 3 · 4 · 5 · 6 · 7 · 8 · 9 · 10 · 11 · 13 · 14 · 15 · 17 · 19 · 23). Figure VI.10 – Rouge rationnel Même si l’on observe beaucoup de points qui ne sont pas rouges (surtout pour des petites valeurs de σ), nous ne croyons pas que les nombres de rotation irrationnels aient µσ -mesure positive : il est numériquement impossible de distinguer un nombre de rotation irrationnel d’un nombre de rotation rationnel avec très grand dénominateur. Pour faire une comparaison avec ce qui se passe dans le même type de figure provenant de la famille d’Arnol’d (exemple 1.1 ), nous croyons que les graphes qui décrivent les bords des langues sont donnés par des fonctions non-Lipschitz mais plutôt 1/2-Hölder. Dans la figure VI.11 nous montrons les « escaliers du diable » que l’on trouve en lisant la figure VI.10 ligne par ligne. On peut observer que pour σ = 0.5 la distribution du nombre de rotation est très proche de l’identité, ce qui suggérerait comme conjecture que pour des petites valeurs de σ, le fait d’avoir nombre de rotation irrationnel est un événement de mesure strictement positive. Remarquons en outre que notre algorithme permet aussi de déterminer numériquement les distributions des {an }n≤L , lorsque σ = 1. Dans la figure VI.12 on représente les fonctions de répartition des an pour n = 1, . . . , 6, comparées avec la distribution classique de Gauss-Kuzmin. Il semblerait que les distributions soient presque les mêmes : un tel fait devrait impliquer que le nombre de rotation est rationnel presque sûrement. Cependant cette ressemblance est moins évidente pour des différentes valeurs de σ (dans la figure VI.13 on peut voir les statistiques pour σ = 2). 52 Figure VI.11 – Distribution du nombre de rotation selon les mesures µσ , avec σ ∈ {0.5, 1, . . . , 7.5} (lecture ligne par ligne) 53 Figure VI.12 – Fonctions des répartitions des an (n = 1, . . . , 6) lorsque σ = 1, comparées avec la distribution classique de Gauss-Kuzmin Figure VI.13 – Fonctions des répartitions des an (n = 1, . . . , 6) lorsque σ = 2, comparées avec la distribution classique de Gauss-Kuzmin 54 1 from __future__ import d i v i s i o n , p r i n t _ f u n c t i o n import numpy a s np from s c i p y . i n t e r p o l a t e import i n t e r p 1 d import m a t p l o t l i b . p y p l o t a s p l t import m a t p l o t l i b . mlab a s mlab 6 from math import exp , s q r t , f l o o r n K L 11 A = = = = 10000 # points 10 # tests 8 # length of continued fraction expansion 1500 # maximum size of single element in continued fraction expansion def p a r t f r a c ( x ) : return x−f l o o r ( x ) 16 # it computes the rational number defined by a continued fraction expansion b # of length l +1 def r a t i o n a l _ a p p r o x i m a t i o n ( b , l ) : p = [0 ,1] 21 q = [1 ,b [ 1 ] ] f o r i in r a n g e ( 1 , l +1) : p . append ( b [ i +1]∗p [ i ]+p [ i −1]) q . append ( b [ i +1]∗ q [ i ]+q [ i −1]) return p [ l +1]/ q [ l +1] 26 # this is for computing the rotation number of a given homeomorphism f: # we use the classical algorithm #( explained for example in " de Melo , van Strien : One - dimensional dynamics ") # it computes the continued fraction expansion of the rotation number 31 # and uses rational_approximation to return the L - th rational approximation # of it ( or it stops before if it finds a periodic orbit ) def r o t a t i o n ( f ) : a = [0] orbit = [ ] 36 o r b i t . append ( p a r t f r a c ( f ( 0 ) ) ) i f o r b i t [0]==0 : return 0 41 46 51 def s h i f t ( x ) : i f p a r t f r a c ( x )>o r b i t [ 0 ] : return p a r t f r a c ( x )−1 return p a r t f r a c ( x ) def f i r s t _ r e t u r n ( p , pre_p , y ) : x = shift ( f (y) ) while x<pre_p o r x>p : x = shift ( f (x) ) return x a . append ( 1 ) x = orbit [0] i f s h i f t ( f ( o r b i t [ 0 ] ) ) ==0: return 1/2 56 61 i f s h i f t ( f ( o r b i t [ 0 ] ) ) <0: while s h i f t ( f ( x ) ) <0: a [ 1 ] = a [1]+1 x = shift ( f (x) ) i f a [1] >A: return 0 i f s h i f t ( f ( x ) ) ==0: a [ 1 ] = a [1]+1 return 1/ a [ 1 ] 55 66 71 76 81 86 91 96 101 106 111 116 o r b i t . append ( s h i f t ( x ) ) z = shift ( f (x) ) a . append ( 0 ) while z >0: y = z z = first_return ( shift ( orbit [0]) , shift ( orbit [1]) ,z) a [ 2 ] = a [2]+1 i f a [2] >A: return 1/ a [ 1 ] i f z==0: a [ 2 ] = a [2]+1 return r a t i o n a l _ a p p r o x i m a t i o n ( a , 1 ) o r b i t . append ( y ) i f s h i f t ( f ( o r b i t [ 0 ] ) ) >0: def s h i f t ( y ) : i f p a r t f r a c ( y )>=o r b i t [ 0 ] : return p a r t f r a c ( y )−1 return p a r t f r a c ( y ) o r b i t . append ( o r b i t [ 0 ] − 1 ) a . append ( 0 ) while s h i f t ( f ( x ) ) >0: a [ 2 ] = a [2]+1 x = shift ( f (x) ) i f a [2] >A: return 1/ a [ 1 ] i f s h i f t ( f ( x ) ) ==0: a [ 2 ] = a [2]+1 return r a t i o n a l _ a p p r o x i m a t i o n ( a , 1 ) o r b i t . append ( s h i f t ( x ) ) z = shift ( f (x) ) f o r i in r a n g e ( 1 , L) : a . append ( 0 ) i f s h i f t ( o r b i t [ i +1])< s h i f t ( o r b i t [ i ] ) : while z >0: y = z z = f i r s t _ r e t u r n ( s h i f t ( o r b i t [ i ] ) , s h i f t ( o r b i t [ i +1]) , z ) a [ i +2] = a [ i +2]+1 i f a [ i +2]>A: return r a t i o n a l _ a p p r o x i m a t i o n ( a , i ) i f z==0: a [ i +2]=a [ i +2]+1 return r a t i o n a l _ a p p r o x i m a t i o n ( a , i +1) i f s h i f t ( o r b i t [ i +1])> s h i f t ( o r b i t [ i ] ) : while z <0: y = z z = f i r s t _ r e t u r n ( s h i f t ( o r b i t [ i +1]) , s h i f t ( o r b i t [ i ] ) , z ) a [ i +2] = a [ i +2]+1 i f a [ i +2]>A: return r a t i o n a l _ a p p r o x i m a t i o n ( a , i ) i f z==0: a [ i +2] = a [ i +2]+1 return r a t i o n a l _ a p p r o x i m a t i o n ( a , i +1) o r b i t . append ( y ) 121 return r a t i o n a l _ a p p r o x i m a t i o n ( a , L) # this generates pseudo - random MS diffeomorphisms 126 def r o t a t i o n a l e a ( var ) : s = np . random . normal ( 0 , var , n+2) s s = np . cumsum ( s ) T = np . random . rand ( 1 , 1 ) w = [] 131 f o r i in r a n g e ( 0 , n+1) : 56 136 141 146 w . append ( exp ( 1 / s q r t ( n ) ∗ ( s s [ i +1]− i ∗ s s [ n+1]/n ) ) ) # exponential of browian motion a = [ 0 ,w [ 1 ] ] f o r j in r a n g e ( 2 , n+1) : a . append ( a [ j −1]+w [ j ]+w [ j −1]) # we integrate w p = [] q = [] f o r i in r a n g e ( 0 , n+1) : p . append ( i /n ) q . append ( a [ i ] / a [ n ] ) g = interp1d (p , q) # linear intepolation on n +1 points def G( x ) : return g ( x−f l o o r ( x ) ) + f l o o r ( x ) + T # we compose by a uniform rotation T and the compute the rotation number return r o t a t i o n (G) # here is the " main " part : we simulate K diffeomorphisms of variance parameter h /4 , 151 # where h ranges from 1 to 31 then it prints out a sorted vector f o r h in r a n g e ( 1 , 2 ∗ ∗ 5 ) : v = [] f o r k in r a n g e ( 0 ,K) : v . append ( r o t a t i o n a l e a ( h / 2 ∗ ∗ 3 ) ) 156 p r i n t (h/4) print ( sorted (v) ) print () 57 Bibliographie [Arn] V. I. Arnol’d. Small denominators. I. Mapping the circle onto itself. Izv. Akad. Nauk SSSR Ser. Mat. 25 (1961), 21–86. [Ast-Jon-Kup-Sak] K. Astala, P. Jones, A. Kupiainen & E. Saksman. Random conformal weldings. Acta Math. 207, no. 2 (2011), 203–254. [Bog 1] V. I. Bogachev. Gaussian measures. Mathematical Surveys and Monographs 62, AMS (1998). [Bog 2] . Differentiable measures and the Malliavin calculus. Mathematical Surveys and Monographs 164, AMS (2010). [Bon-Día-Via] C. Bonatti, L. J. Díaz & M. Viana. Dynamics beyond uniform hyperbolicity. Encyclopædia of Mathematical Sciences 102, Springer-Verlag (2005). [Bri+ ] M. G. Brin et al. On Shavgulidze’s Proof of the Amenability of some Discrete Groups of Homeomorphisms of the Unit Interval. Preprint arXiv:0908.1353 [Cam-Mar 1] R. H. Cameron & W. T. Martin. Transformations of Wiener integrals under translations. Ann. of Math. (2) 45 (1944), 386–396. [Cam-Mar 2] & . The transformation of Wiener integrals by nonlinear transformations. Trans. Amer. Math. Soc. 66 (1949), 253–283. [Cha] M. Chaperon. Invariant manifolds revisited. Proc. Steklov Inst. Math. 236, no. 1 (2002), 415–433. [Den] A. Denjoy. Sur les courbes définies par les équations différentielles à la surface du tore. J. Math. Pures Appl. (9) 11 (1932), 333–375. [Eps] D. B. A. Epstein. Almost all subgroups of a Lie group are free. J. Algebra 19 (1971), 261–262. [Fre] D. H. Fremlin. Topological measure spaces. Part I. Deuxième édition. Torres Fremlin (2006). [Ghy] É. Ghys. Groups acting on the circle. Enseign. Math. (2) 47, no. 3-4 (2001), 329–407. [Got-Hed] W. H. Gottschalk & G. A. Hedlund. Topological dynamics. AMS Colloquium Publications, Vol. 36 (1955). [Hal] P. R. Halmos. Measure theory. D. Van Nostrand Company (1950). [Her 1] M. R. Herman. Sur la conjugaison différentiable des difféomorphismes du cercle à des rotations. Publ. Math. de l’IHÉS 49 (1979), 5–233. [Her 2] . Mesure de Lebesgue et nombre de rotation. Dans Geometry and topology (Proc. III Latin Amer. School of Math., Inst. Mat. Pura Aplicada CNPq, Rio de Janeiro, 1976). Lecture Notes in Math. 597, Springer (1977), 271–293. [Hun-Kal] B. R. Hunt & V. Yu. Kaloshin. Prevalence. Dans Handbook of Dynamical Systems, vol. 3, éditeurs H. Broer, F. Takens & B. Hasselblatt. Elsevier Science (2010), 43–87. [Kar-Shr] I. Karatzas & S. E. Shreve. Brownian motion and stochastic calculus, deuxième édition. Graduate Texts in Mathematics 113, Springer-Verlag (1994). [Kat-Has] A. B. Katok & B. Hasselblatt. Introduction to the modern theory of dynamical systems. Enc. Math. and Appl., Cambridge University Press (1995). [Katz-Orn] Y. Katznelson & D. Ornstein. The differentiability of the conjugacy of certain diffeomorphisms of the circle. Ergodic Theory Dynam. Systems 9, no. 4 (1989), 643–680. 58 [Kha-Sin 1] K. M. Khanin & Ya. G. Sinai. A new proof of M. Herman’s theorem. Comm. Math. Phys. 112, no. 1 (1987), 89–101. [Kha-Sin 2] & . Smoothness of conjugacies of diffeomorphisms of the circle with rotations. Russian Math. Surveys 44, no. 1 (1989), 69–99. [Kha-Tep] 333–344. & A. Teplins’kyi. Herman’s theory revisited. Invent. Math. 178, no. 2 (2009), [Kol] A. N. Kolmogorov. Obščaja teorija dinamičeskih sistem i klassičeskaja mehanika (Théorie générale des systèmes dynamiques et mécanique classique). Proc. Intern. Congr. Math. (1954), 315–333. [Kop] N. Kopell. Commuting diffeomorphisms. Dans Global Analysis, Proc. Sympos. Pure Math. vol. XIV (1968), 165–184. [Kos] A. V. Kosyak. Irreducible regular Gaussian representations of the groups of the interval and circle diffeomorphisms. J. Funct. Anal. 125, no. 2 (1994), 493–547. [Kra-Sch] B. Kra & J. Schmeling. Diophantine classes, dimension and Denjoy maps. Acta Arith. 105, no. 4 (2002), 323–340. [Kuz] P. A. Kuzmin. On circle diffeomorphisms with discontinuous derivatives and quasi-invariance subgroups of Malliavin-Shavgulidze measures. J. Math. Anal. Appl. 330, no. 1 (2007), 744–750. [Lév] P. Lévy. Processus stochastiques et mouvement brownien. Les Grands Classiques GauthierVillars, Éditions Jacques Gabay (1992). Réimpression de la deuxième (1965) édition. [Mac] G. W. Mackey. Borel structure in groups and their duals. Trans. Amer. Math. Soc. 85 (1957), 134–165. [Mal-Mal 1] M. P. Malliavin & P. Malliavin. Mesures quasi invariantes sur certains groupes de dimension infinie. C. R. Acad. Sci. Paris Sér. I Math. 311, no. 12 (1990), 765–768. [Mal-Mal 2] & . An infinitesimally quasi-invariant measure on the group of diffeomorphisms of the circle. Special functions (Okayama, 1990), ICM-90 Satell. Conf. Proc., Springer (1991), 234–244. [Man-Yor] R. Mansuy & M. Yor. Aspects of Brownian motion. Universitext, Springer-Verlag (2008). [Mat-Hir-Yor] H. Matsumoto & M. Yor. Exponential functionals of Brownian motion. I. Probability laws at fixed time. Probab. Surv. 2 (2005), 312–347. [dMe-vSt] W. de Melo & S. van Strien. One-dimensional dynamics. Erg. Math. Grenz. (3), 25. Springer-Verlag (1993). [Mör-Per] P. Mörters & Y. Peres. Brownian motion. Cambridge Series in Statistical and Probabilistic Mathematics, Cambridge University Press (2010). [Mos] J. Moser. A rapidly convergent iteration method and non-linear differential equations. II. Ann. Scuola Norm. Sup. Pisa (3) 20 (1966), 499–535. [Nav 1] A. Navas. Grupos de difeomorfismos del círculo. Ensaios Matemáticos 13, Soc. Brasil. Mat. (2007). [Nav 2] . Groups of circle diffeomorphisms. Chicago Lectures in Mathematics (2011). [Ner] Yu. A. Neretin. Representations of Virasoro and affine Lie algebras. Representation theory and noncommutative harmonic analysis, I, Enc. Math. Sci. 22, Springer (1994), 157–234. [Nor] A. Norton. Denjoy’s theorem with exponents. Proc. Amer. Math. Soc. 127, no. 10 (1999), 3111–3118. [Poi] H. Poincaré. Mémoire sur les courbes définies par les équations différentielles, IV. J. Math. Pures Appl. (3) 2 (1886), 151–217. [Ram] R. Ramer. On nonlinear transformations of Gaussian measures. J. Functional Analysis 15 (1974), 166–187. [Rev-Yor] D. Revuz & M. Yor. Continuous martingales and Brownian motion. Troisième édition, Springer-Verlag (1999). 59 [Sha 1] E. T. Shavgulidze. An example of a measure which is quasi-invariant relative to the action of a group of diffeomorphisms of the circle. Funktsional. Anal. i Prilozhen. 12, no. 3 (1978), 55–60, 96. [Sha 2] . A measure that is quasi-invariant with respect to the action of a group of diffeomorphisms of a finite-dimensional manifold. Dokl. Akad. Nauk SSSR 303, no. 4 (1988), 811–814. [Sha 3] . Quasi-invariant measures on groups of diffeomorphisms. Tr. Mat. Inst. Steklova 217 (1997), 189–208. [Sha 4] . Some properties of quasi-invariant measures on groups of diffeomorphisms of the circle. Russ. J. Math. Phys. 7, no. 4 (2000), 464–472. [She] S. Sheffield. Conformal weldings of random surfaces : SLE and the quantum gravity zipper. Preprint arXiv:1012.4797 [Sie] C. L. Siegel. Iteration of analytic functions. Ann. of Math. (2) 43 (1942), 607–612. [Sta] J. Stark. Smooth conjugacy and renormalisation for diffeomorphisms of the circle. Nonlinearity 1, no. 4 (1988), 541–575. [Ste] R. C. Steinlage. On Haar measure in locally compact T2 spaces. Amer. J. Math. 97 (1975), 291—307. [Tep] O. Yu. Teplins’kyi. On the smoothness of the conjugacy of the circle diffeomorphisms to rigid rotations. Ukrainian Math. J. 60, no. 2 (2008), 310–326. [Tri] M. Triestino. La dynamique des difféomorphismes du cercle selon le point de vue de la mesure. Thèse de l’Université de Lyon (2014). [Üst-Zak] A. Üstünel & M. Zakai. Transformation of measure on Wiener space. Springer Monographs in Mathematics, Springer-Verlag (2000). [Wei] A. Weil. L’intégration dans les groupes topologiques et ses applications. Actual. Sci. Ind., no. 869, Hermann et Cie., Paris (1940). [Wie 1] N. Wiener. Differential space. Journal Math. Phys. 2 (1923), 131–174. [Wie 2] . Generalized harmonic analysis. Acta Math. 55, no. 1 (1930), 117–258. [Yoc 1] J.-C. Yoccoz. Conjugaison différentiable des difféomorphismes du cercle dont le nombre de rotation vérifie une condition diophantienne. Ann. Sci. École Norm. Sup. (4) 17, no. 3 (1984), 333–359. [Yoc 2] . Petits diviseurs en dimension 1. Astérisque no. 231, SMF (1995). [Yor] M. Yor. Exponential functionals of Brownian motion and related processes. Springer Finance, Springer-Verlag (2001). Michele Triestino Departamento de Matemática PUC-Rio Rua Marquês de São Vicente, 225 Gávea, Rio de Janeiro CEP 22451-900, Brasil E-mail : [email protected] 60