Habilitation à diriger les recherches Spécialité : Mathématiques Holonomie aléatoire, grandes matrices unitaires Thierry LÉVY Rapporteurs : M. Bruce DRIVER M. David ELWORTHY M. Wendelin WERNER Soutenue le 20 novembre 2009 devant le jury composé de : M. Philippe BIANE M. Philippe BOUGEROL M. David ELWORTHY Mme Alice GUIONNET M. Yves LE JAN M. Wendelin WERNER Introduction Ce texte est une présentation synthétique des travaux de recherche mathématiques que j’ai effectués depuis le début de ma thèse. La nature de ces travaux a dicté la forme de ce texte et je commencerai par expliquer brièvement de quelle manière. Un problème a été au coeur de ma réflexion depuis le début de mon activité de recherche : il s’agit de la construction et de l’étude d’une mesure de probabilités, la mesure de Yang-Mills en deux dimensions, qui est une simplification accessible aux mathématiciens d’un des ingrédients essentiels de la formulation par les intégrales de Feynman des théories de jauge, ces théories qui depuis presque quarante ans sont le meilleur outil dont disposent les physiciens pour décrire les constituants de la matière et leurs interactions à l’échelle de l’infiniment petit. Mon travail de thèse a consisté à donner une seconde construction rigoureuse de cette mesure, dont Ambar Sengupta avait donné la première. Depuis lors, en même temps que j’ai utilisé cette construction pour étudier différents aspects de la mesure de Yang-Mills, j’ai cherché à l’améliorer et à la généraliser. Cela m’a conduit à définir une classe de processus stochastiques, que j’appelle champs d’holonomie markoviens, et qui contient la mesure de Yang-Mills de la même façon que les processus de Lévy usuels contiennent le mouvement brownien. Par ailleurs, au cours des dernières années, l’étude d’une certaine limite de la mesure de Yang-Mills, que les anglo-saxons appellent large N limit, m’a conduit à me pencher sur certaines propriétés des grandes matrices unitaires aléatoires qui, dans une large mesure, ont un intérêt indépendant de la motivation initiale qui était la mienne. Le fil directeur de ma réflexion jusqu’à aujourd’hui est donc celui qui mène de l’étude de la mesure de Yang-Mills à la définition des champs d’holonomie markoviens. Toutefois, ni la mesure de Yang-Mills ni à plus forte raison ces champs d’holonomie markoviens ne sont des objets classiques ou simplement bien connus. Il m’a donc semblé qu’il serait peu judicieux de faire de ces notes de synthèse une liste de résultats brièvement remis dans leur contexte. Au contraire, il m’a semblé qu’il était souhaitable, et qu’il serait peut-être utile, de les concevoir, pour une grande partie, comme une introduction à la théorie des champs d’holonomie aléatoire. C’est ce que sont donc leurs deux premiers chapitres, que l’on peut prendre comme un survol de la monographie [L7] 1 et, le cas échéant, comme une aide à sa lecture. Le premier chapitre est de nature probabiliste et le deuxième de nature plus géométrique. En 1. Cette monographie paraîtra début 2010. 3 4 effet, une particularité des recherches qui sont exposées ici est qu’elles utilisent à la fois le langage du calcul des probabilités et celui de la géométrie différentielle. Parmi d’autres combinaisons possibles, j’ai choisi d’écrire ce texte en pensant à un lecteur familier avec les probabilités et non hostile à la géométrie différentielle. Les objets géométriques importants sont donc décrits en détail, bien plus sans doute qu’un expert en géométrie différentielle ne pourrait le souhaiter. De plus, tout au long du texte, des précis sur divers sujets sont présentés sous forme d’encarts, afin que le lecteur puisse aisément se référer à ceux dont il a l’usage, et tout aussi aisément ne pas lire ceux dont il sait connaître le contenu. Le troisième et dernier chapitre présente mes travaux, seul et en collaboration avec Florent Benaych-Georges et Mylène Maïda, sur les grandes matrices unitaires aléatoires. Dans ce domaine beaucoup plus familier à beaucoup de lecteurs potentiels, une présentation plus succinte du contexte m’a paru suffisante. Néanmoins, là encore, les objets sont introduits en détail et des encarts balisent la progression du texte. Enfin, en annexe à ces notes de synthèse, j’ai ajouté un texte que j’aurais beaucoup aimé avoir à ma disposition au début de mes travaux. J’y trace un chemin (nécessairement superficiel) qui relie les équations de Maxwell aux théories de jauge en mettant l’accent sur la raison pour laquelle il est naturel d’introduire des fibrés principaux dans la formulation quantique de l’électromagnétisme. La seule originalité de ce texte, qui est une synthèse de fragments glanés ici ou là, est d’être écrit par un mathématicien et pour des mathématiciens. Présentation des résultats Je vais maintenant décrire plus précisément le thème de mes recherches en indiquant tout d’abord de quelle façon il est issu de la physique théorique. Les difficultés mathématiques des théories de jauge La mesure de Yang-Mills porte les noms des physiciens Chen Ning Yang et Robert L. Mills qui, en 1954, ont les premiers considéré des champs de jauge prenant leurs valeurs dans des algèbres de Lie non abéliennes pour rendre compte de certains effets de l’interaction forte [YM54]. Les théories de jauge non abéliennes auxquelles ils ont ainsi ouvert la voie ont ensuite servi de cadre à des modèles de plus en plus vastes et précis des interactions entre les constituants élémentaires de la matière, pour aboutir au modèle standard qui est, depuis le début des années 1970, la meilleure théorie disponible dans ce domaine et qui rend compte, de façon conceptuellement homogène, des interactions électromagnétique, faible et forte [CG07]. Dans le modèle standard, les interactions sont véhiculées par des bosons de jauge, dont les photons sont un exemple, qui véhiculent l’interaction électromagnétique 2 . Ces bosons sont représentés par des fluctuations d’un champ de jauge, dont la nature mathématique est celle d’une connexion sur un fibré principal. La théorie de ces connexions a précisément 2. Pour imaginer comment deux électrons peuvent se repousser en échangeant des photons, on peut penser à deux patineurs lancés parallèlement l’un à l’autre et qui s’envoient à tour de rôle une lourde balle, faisant ainsi à chaque fois, par réaction, diverger un peu leurs trajectoires. 5 été formalisée par Charles Ehresmann dans les années 1950 [Ehr51], pour des raisons internes aux mathématiques, et une anecdote raconte que Chen Ning Yang et ShiingShen Chern, discutant vers 1970, se seraient chacun étonnés de ce que l’autre trouve aussi naturel que lui de considérer de tels objets. Du point de vue physique, une théorie de jauge est caractérisée par son lagrangien, qui exprime comment les différents champs en présence interagissent. Le lagrangien de Yang-Mills, dans un espace vide de matière et où ne se trouvent que des bosons de jauge, est donné par l’expression L(A) = Tr(F ∧ ∗F ), où F est le champ de force du champ de jauge A, c’est-à-dire la courbure de la connexion A. Ce lagrangien étant donné, on définit l’action de Yang-Mills comme l’intégrale Z L(A), S(A) = R4 si bien que S est une fonctionnelle à valeurs réelles sur l’espace, traditionnellement noté A, de toutes les connexions. Conformément à la formulation de Feynman de la mécanique quantique, on peut alors calculer la probabilité qu’un certain évènement physique survienne en calculant le carré du module d’une intégrale de la forme Z i Φ(A)e ~ S(A) dA, (1) B où B ⊂ A est un certain ensemble de connexions, Φ : A → C est une fonctionnelle, et dA une mesure de référence sur A. Des expressions comme (1) n’ont pas de sens mathématique. Le problème le plus visible est que l’espace A des connexions n’est pas localement compact 3 et ne porte pas de mesure de Radon invariante par translation, ce que devrait être, d’après l’usage qu’en font les physiciens, la mesure dA. Néanmoins, la qualité inouïe des prédictions que les physiciens parviennent à faire en manipulant de telles intégrales, et plus généralement les théories quantiques de champs, suggère qu’il est possible et important de dégager la nature mathématique des objets qui sont en jeu dans ces théories. D’une façon générale, donner un cadre mathématique rigoureux pour la formulation du modèle standard est un problème encore largement ouvert 4 , mais dans le cas d’un espace-temps à deux dimensions, et en se plaçant dans un cadre euclidien (c’est-à-dire en remplaçant dans (1) le i de l’exponentielle par −1), il est possible de donner un sens rigoureux et cohérent avec leur sens physique à des intégrales de la forme (1). On parvient ainsi à donner un sens à l’expression µ(dA) = 1 − 1 S(A) e 2 dA, Z (2) 3. On pourrait penser que la symétrie de la théorie sous l’action du groupe de jauge vient résoudre ce problème, puisqu’il suffit de travailler sur le quotient de A par l’action de ce groupe. Ce n’est toutefois pas le cas car, contrairement à une idée fausse que j’ai entendue plusieurs fois énoncer, le quotient de l’espace des connexions par l’action du groupe de jauge n’est pas localement compact, ni de dimension finie en aucun sens. En revanche, l’espace des modules de connexions plates, quotienté par les transformations de jauge, sur un fibré principal au-dessus d’un espace raisonnable (dont le groupe fondamental est de type fini) est un objet de dimension finie. 4. Il fait partie des six problèmes restants pour la résolution desquels l’institut Clay offre un million de dollars. Pour tenter sa chance, on pourra consulter la page www.claymath.org/millenium/Yang-Mills_Theory. 6 qui est l’écriture heuristique la plus habituelle de la mesure de Yang-Mills, comme mesure de probabilités sur l’espace A de toutes les connexions 5 . Dans le contexte où nous allons nous placer, avec un espace-temps bidimensionnel, on peut penser en première approximation à une connexion comme à une 1-forme différentielle sur une surface. Une fonctionnelle typique d’une connexion est donc son intégrale le long d’un chemin, ou d’un lacet. Pour être un peu moins approximatif, il vaut mieux penser à une connexion comme à une version multiplicative d’une forme différentielle. Un groupe G est donné, qui s’appelle le groupe de structure, qui peut par exemple être le groupe SU(2), et la connexion détermine, par intégration le long de chaque chemin, un élément de ce groupe. Cet élément s’appelle l’holonomie de la connexion le long de ce chemin. Naturellement, l’holonomie le long de la concaténation de deux chemins est le produit des holonomies le long de chacun des chemins. Il se trouve que seules les holonomies le long de lacets jouent un rôle important dans les théories de jauge, à cause d’une symétrie de ces théories appelée précisément symétrie de jauge. Le groupe de structure G étant fixé, on peut donc penser à une connexion sur une surface comme à un objet qui à chaque lacet tracé sur cette surface associe un élément de G. Ceci peut s’écrire de façon concise (mais légèrement fausse) comme suit : si M est une surface et si L(M ) désigne l’ensemble des lacets sur M , et si G est un groupe de Lie compact, alors on a l’inclusion 6 A ⊂ {fonctions de L(M ) dans G}. De ce point de vue, définir une mesure de probabilités sur l’espace des connexions revient à définir une mesure de probabilités sur l’ensemble des fonctions qui vont de l’ensemble des lacets sur notre surface dans le groupe de structure G. Cette idée est absolument fondamentale pour tout ce qui suit, car ce sont bien des objets de ce type que nous allons décrire : non pas des formes différentielles aléatoires, mais des processus stochastiques indexés par des lacets tracés sur des surfaces et à valeurs dans un groupe de Lie compact. Pour guider un peu l’imagination, disons que les processus que nous allons considérer sont des processus de Lévy 7 indexés par des lacets et à valeurs dans un groupe. Si la surface que nous considérons est par exemple un plan, et si pour chaque t ≥ 0 nous considérons la variable aléatoire associée à un cercle qui entoure un disque d’aire t (de telle sorte que les intérieurs de ces cercles grossissent avec t, voir la proposition 1.1.3 et ce qui précède) alors nous obtenons un processus stochastique indexé par R+ et à valeurs dans le groupe G, dont les accroissements multiplicatifs sont indépendants et stationnaires. Si en revanche la surface sur laquelle nous traçons les lacets est une sphère, notre famille de lacets va, au bout d’un temps égal à l’aire totale de la sphère, venir se refermer en un lacet constant après avoir “fait le tour de la sphère”. Dans ce cas, nous obtiendrons plutôt un pont d’un processus de Lévy à valeurs dans G. Des surfaces à la topologie différente conduiront à des variantes de ce pont à valeurs dans G. Une partie des problèmes que nous allons considérer concernent donc ces processus, leur définition, par le biais d’une discrétisation, leur caractérisation, leur classification, 5. Pour plus de détails sur ce qui précède, on peut consulter la section 2.3 et en particulier la définition 2.3.1. 6. Pour une définition de la symétrie de jauge et un énoncé correct de cette inclusion, on pourra se reporter à la proposition 2.2.4 et à ce qui précède. Pour une discussion du lien entre symétrie de jauge et choix de jauge en électromagnétisme, on peut lire, dans l’annexe, les sections A.3 et A.4. 7. Il s’agit ici de Paul Lévy, 1886-1971. 7 leur signification géométrique, et l’étude de leurs comportements dans certaines limites. Nous allons en particulier considérer la limite qui consiste à multiplier l’aire totale de la surface sur laquelle on trace les lacets par une constante qui tend vers zéro (c’est la limite semi-classique de la théorie de Yang-Mills), pour laquelle nous présenterons un principe de grandes déviations, démontré en collaboration avec James R. Norris. L’étude d’une autre limite, lorsque le groupe de structure est le groupe unitaire U(N ) et que l’on fait tendre N vers l’infini, ne sera pas abordée ici directement, mais motive mon intérêt pour certaines questions liées aux grandes matrices unitaires aléatoires qui sont présentées plus bas et qui seront exposées en détail dans le dernier chapitre. Une partie de ces questions a été résolue en collaboration avec Florent Benaych-Georges et Mylène Maïda. La construction de la mesure de Yang-Mills Après le travail fondateur de Yang et Mills en 1954 [YM54], on cite traditionnellement un article de Alexander A. Migdal écrit en 1975 [Mig75] comme étant la première avancée significative vers une description mathématiquement rigoureuse de la mesure de YangMills discrète en deux dimensions. Dans cet article, Migdal identifie en effet, peut-être pour la première fois, le rôle fondamental joué par le noyau de la chaleur sur le groupe de structure. Ce noyau n’y est pas nommé, mais il est écrit sous la forme non équivoque de son développement en série de Fourier. Dans les années 1980, Sergio Albeverio, Raphael Høegh-Krohn et Helge Holden ont examiné, dans un cadre essentiellement discret, l’idée d’une mesure aléatoire sur une surface qui prendrait ses valeurs dans un groupe de Lie [AHKH86, AHKH88]. Ils ont en particulier compris l’importance pour ce problème de la propriété de semi-groupe de convolution. Les champs d’holonomie markoviens qui sont présentés ici sont, comme nous le verrons, en correspondance avec des semi-groupes de convolution de mesures sur le groupe de structure et ceci peut être considéré comme un prolongement des idées de ces auteurs. Le problème de la construction de la mesure de Yang-Mills continue en deux dimensions a été abordé dans les années 1980 par Leonard Gross [Gro85, Gro88], puis il a été étudié par Bruce Driver [Dri89, Dri91] dans le cas où la surface est un plan, et il a finalement été résolu par Ambar Sengupta sur une surface compacte arbitraire, alentour 1994 [Sen92, Sen97a]. L’approche de Gross, Driver et Sengupta est basée sur l’observation du fait qu’en se plaçant dans une jauge adéquate, une connexion prise sous la mesure de Yang-Mills peut, d’après l’expression (2), être comprise comme une connexion dont la courbure a la loi d’un bruit blanc 8 , éventuellement conditionné d’une façon qui dépend de la topologie de la surface sur laquelle on travaille. C’est donc en partant d’un bruit blanc et en donnant un sens à un conditionnement singulier de ce bruit qu’Ambar Sengupta est parvenu à définir une sorte de mouvement brownien indexé par les lacets tracés sur une surface compacte et à valeurs dans un groupe de Lie compact connexe 9 . 8. Il s’agit d’un bruit blanc à valeurs dans l’algèbre de Lie du groupe de structure. 9. Pour faire un parallèle avec une situation familière, sa construction est analogue à celle qui consiste à construire le mouvement brownien sur [0, 1] en se donnant un bruit blanc W sur [0, 1], c’est-à-dire une isométrie de L2 ([0, 1], dt) dans un espace de variables aléatoires gaussiennes centrées, et à poser, pour tout t ∈ [0, 1], Bt = W (1[0,t] ). En conditionnant le bruit par l’égalité W (1[0,1] ) = 0, on obtient un pont brownien. 8 Au début des années 1990, Edward Witten a publié deux articles sur la théorie de Yang-Mills en deux dimensions [Wit91, Wit92], qui naturellement ont suscité un grand intérêt. Dans l’un de ces articles [Wit91], il décrit dans les grandes lignes la théorie de Yang-Mills discrète et s’en sert pour étudier la géométrie de l’espace des modules de connexions plates sur une surface de Riemann, en particulier pour calculer son volume symplectique. La mesure symplectique sur l’espace des connexions plates peut en effet être comprise comme la limite semi-classique de la mesure de Yang-Mills, c’est-à-dire sa limite lorsque le volume de l’espace-temps tend vers zéro. Je n’ai pas étudié cet aspect de la mesure, et il n’est pas évoqué dans ce texte 10 . Néanmoins, le principe de grandes déviations que j’ai établi avec James Norris, et sur lequel je reviendrai dans un moment, étudie une limite, mais d’une autre nature, lorsque le volume de l’espace-temps tend vers zéro. À la même période, d’autres approches plus ou moins partielles du problème de la construction de la mesure de Yang-Mills ont été proposées qui, bien que n’étant pas toutes pleinement satisfaisantes mathématiquement, ont donné des éclairages variés sur divers aspects de cette mesure. Il s’agit en particulier des travaux de Dana Fine [Fin90, Fin91], Claas Becker [Bec95], Doug Pickrell [Pic96], John Baez et Stephen Sawin [BS97, BS98], Abhay Ashtekar et al. [AI92, AL94, AL95, AMMa94]. Mon premier travail [L1, L2] a consisté à donner une autre construction de la mesure de Yang-Mills et cela a constitué ma thèse, que j’ai écrite sous la direction d’Yves Le Jan. Mon approche a consisté à établir rigoureusement la théorie discrète telle qu’elle est décrite par Witten, puis à montrer qu’il est possible de la passer à la limite continue 11 . Plus précisément, pour construire un processus d’holonomie aléatoire indexé par des lacets tracés sur une surface, on décrit ses lois marginales de dimension finie, puis on applique un théorème de Kolmogorov. Toutefois, le fait que ce processus soit indexé par un ensemble de chemins pose des problèmes spécifiques, comme le fait qu’il n’est pas possible de décrire simplement toutes ses marginales. Il faut donc procéder à des approximations, dont la qualité détermine la classe des lacets le long desquels on saura définir une holonomie aléatoire. Dans [L2], je suis parvenu à définir un processus indexé par des chemins lisses par morceaux et associé, dans le sens évoqué quelques pages plus haut, au mouvement brownien sur un groupe de Lie compact connexe. Dans un travail postérieur à ma thèse [L4], j’ai généralisé la partie discrète de cette construction pour pouvoir y inclure certains raffinements topologiques 12 , ce qui m’a permis, en collaboration avec James Norris à Cambridge [LN5], de démontrer un principe 10. Pour plus de détails, on pourra consulter les travaux de Michael Atiyah et Raoul Bott [AB83], William Goldman [Gol84], Robin Forman [For93], Kefeng Liu [Liu96, Liu97], Ambar Sengupta et Christopher King [Sen97b, KS94]. 11. Pour poursuivre l’analogie de la note précédente, cette approche correspond à celle qui consiste à construire le mouvement brownien comme limite de marches aléatoire. 12. Le problème était de parvenir à construire une mesure pour chaque classe d’isomorphisme de fibré principal sur la surface qu’on considère, dans le cas où il en existe de non-triviales. La théorie discrète classique, qui voit un fibré à travers ses restrictions au-dessus de graphes, c’est-à-dire d’objets de dimension 1, ne peut détecter, pourvu que le groupe de structure soit connexe, la différence entre deux fibrés non-isomorphes. Pour pallier ce problème, j’ai remplacé l’espace des configurations discrètes usuel par un espace plus gros, qui en est à peu de choses près un revêtement. En passant à la limite continue, j’ai ainsi pu obtenir une construction des mesures associées à des fibrés particuliers, et désintégrer la mesure construite dans [L2]. J’ai également démontré que les processus d’holonomie associés à des fibrés non-équivalents ont des lois mutuellement singulières. 9 de grandes déviations pour la mesure de Yang-Mills. Il s’agit du premier, et à ce jour du seul résultat rigoureux qui lie cette mesure à la fonctionnelle d’énergie qui lui donne son nom. Dans ce travail, nous avons dû considérer de véritables fibrés principaux et de véritables connexions sur ces fibrés, et les confronter aux fonctions de lacets à valeurs dans un groupe qui étaient censées en être les holonomies 13 . Par ailleurs, j’ai étudié, à la suite de Bergfinnur Durhuus [Dur80] et d’Ambar Sengupta [Sen94], un aspect algébrique de la théorie de Yang-Mills discrète et amélioré un résultat de densité qui est d’une certaine importance théorique pour justifier l’usage exclusif que font les physiciens des boucles de Wilson comme observables dans les théories de jauge [L3]. Plus précisément, il n’est pas évident que la classe d’observables habituellement considérée par les physiciens, à savoir l’algèbre engendrée par les boucles de Wilson, qui sont les traces des holonomies le long de lacets, soit complète, c’est-à-dire qu’elle sépare les points de l’espace de configuration. Les cas où le groupe de structure est unitaire ou orthogonal impair, ou un produit de tels groupes, avaient été résolus positivement par Durhuus puis Sengupta. En utilisant un peu de théorie classique des invariants et une autre famille naturelle d’observables, les réseaux de spin (en anglais spin networks), inventés dans les années 70 par Roger Penrose et introduits à la fin des années 90 dans les théories de jauge par John Baez (voir [Bae96]), j’ai démontré la complétude de l’algèbre engendrée par les boucles de Wilson pour tous les produits de groupes unitaires, orthogonaux et symplectiques. Le cas des groupes de spineurs reste cependant ouvert. Malgré l’existence de deux approches rigoureuses, celle d’Ambar Sengupta et la mienne, pour la construction de la mesure de Yang-Mills, et malgré les généralisations que j’avais apportées à la mienne, il me semblait que plusieurs points restaient à clarifier et que la construction n’avait pas du tout atteint sa forme définitive. Les grandes matrices unitaires Vers 2005, j’ai commencé à m’intéresser à un aspect de la mesure de Yang-Mills que j’avais ignoré jusqu’alors, et qui est son comportement asymptotique lorsque le groupe de jauge est le groupe unitaire U(N ) avec N tendant vers l’infini. Les anglo-saxons désignent ce champ d’investigations simplement par “large N limit”. Isadore Singer a publié un court article [Sin95] sur ce sujet dans lequel il ouvre des perspectives mathématiques où pour l’essentiel tout reste à faire. Michael Anshelevich a développé et explicité dans la mesure du possible cet article dans [Ans97]. Toutefois, la littérature dans ce domaine est encore principalement le fait de physiciens [GG95, GM95, GT93b, GT93a, Kaz81, KK80]. Les premières questions qui se posent dans cette direction de recherche peuvent en fait être formulées de façon largement indépendante de la théorie de Yang-Mills et concernent les grandes matrices unitaires prises sous la mesure du noyau de la chaleur. Ces matrices aléatoires ont été étudiées principalement par Philippe Biane [Bia97], Feng Xu [Xu97], Steve Zelditch [Zel04]. Plus récemment, Ambar Sengupta [Sen08] a clarifié le travail de F. Xu. 13. En particulier, nous avons dû résoudre des problèmes de minimisation sous contrainte et construire explicitement des connexions lipschitziennes dont l’holonomie était prescrite le long des arêtes d’un graphe et dont l’action était minimale étant donné cette contrainte. 10 Dans [L6], j’ai établi un lien entre le mouvement brownien sur le groupe unitaire et une marche aléatoire très simple sur le groupe symétrique, qui peut se comprendre comme une conséquence de la dualité de Schur-Weyl ou de la formule d’Itô. Ce lien m’a permis de donner une expression combinatoire des moments de la distribution des valeurs propres d’une matrice unitaire de taille N prise sous la mesure du noyau de la chaleur. Cette expression se présente comme une série, convergente, qui fait intervenir des puissances paires négatives de N et qui peut être interprétée rigoureusement comme un développement suivant le genre d’un certain revêtement ramifié aléatoire d’un disque. Ceci fournit en fait une preuve rigoureuse de la plus simple des formules merveilleuses que donnent David Gross et Washington Taylor dans [GT93b, GT93a]. L’expression que j’ai établie permet également de retrouver les moments de la distribution limite des valeurs propres et des résultats de liberté asymptotique (au sens des probabilités libres) obtenus par P. Biane. La familiarité avec le mouvement brownien unitaire acquise lors de ce travail m’a permis, en collaboration avec Florent Benaych-Georges, de construire dans [LBG8] une famille de structures de dépendance (ou d’indépendance) dans un espace de probabilités non-commutatif qui interpolent entre l’indépendance classique et la liberté. Il était connu que si A et B sont deux grandes matrices diagonales réelles dont les valeurs propres se répartissent approximativement selon deux mesures de probabilités µ et ν, et si U est une matrice de permutation choisie uniformément (resp. une matrice unitaire choisie sous la mesure de Haar), alors les valeurs propres de A+U BU −1 se répartissent selon la mesure µ∗ ν, convolution classique de µ et ν (resp. selon la mesure µν, convolution libre de µ et ν). En donnant à U la loi au temps t d’un mouvement brownien convenablement normalisé sur le groupe unitaire dont la loi au temps 0 est la loi uniforme sur les matrices de permutation, nous avons défini une opération convolution ∗t pour tout t réel positif, qui pour t = 0 est la convolution classique et pour t tendant vers l’infini tend vers la convolution libre. Nous avons en fait défini la structure de dépendance entre deux sous-algèbres d’un espace de probabilités non-commutatif qui sous-tend cette convolution. Notre espoir initial était d’identifier des cumulants associés à cette convolution t-libre, c’est-à-dire des formes multilinéaires universelles dont l’annulation caractériserait la t-liberté de certains de leurs arguments. Nous pensions qu’ils pourraient réaliser une interpolation entre les cumulants classiques, intimement liés à la combinatoire des partitions d’un ensemble, et les cumulants libres, liés aux partitions non-croisées d’un ensemble muni d’un ordre cyclique. Cet espoir a été déçu et nous avons démontré qu’il n’existait pas de cumulants t-libres. Dans un travail en collaboration avec Mylène Maïda [LM9], nous avons établi un théorème de la limite centrale pour des fonctions sur le groupe unitaire du type U 7→ trf (U ), où f est une fonction suffisamment régulière sur le cercle unité du plan complexe et où tr est la trace normalisée. La fonction f étant donnée, l’expression trf (U ) a un sens pour U élément de U (N ) quel que soit N . Les résultats de P. Biane [Bia97] décrivent sa limite lorsque N tend vers l’infini, qui est une limite presque-sûre. Nous avons étudié ses fluctuations, démontré qu’elles sont gaussiennes, et déterminé la forme quadratique sur un espace de fonctions suffisamment régulières qui donne la covariance limite de ces fluctuations. Elle s’exprime naturellement dans le cadre des probabilités libres, en termes du mouvement brownien unitaire libre. Nous avons pu rapprocher notre résultat de celui 11 obtenu par Persi Diaconis et Steven Evans [DE01] dans le cas de matrices unitaires prises sous la mesure de Haar, en montrant que la covariance qu’ils avaient identifiée, à savoir le 1 produit scalaire dans l’espace de Sobolev H 2 , était la limite de notre covariance lorsque le temps tend vers l’infini. Les champs d’holonomie markoviens Parallèlement à ces travaux sur les grandes matrices unitaires, je me suis rendu compte durant l’été 2006 qu’il était possible de démontrer une propriété de continuité pour la mesure de Yang-Mills qui permettait, en ce qui concerne le point technique a priori un peu secondaire de la régularité des lacets avec lesquels on travaille, d’en placer la définition dans un cadre plus naturel que ceux dans lesquels elle était restée cantonnée jusqu’alors. Il s’agissait en l’occurrence d’étendre la définition de l’holonomie aléatoire à la classe de tous les chemins continus de longueur finie, qui est probablement à peu de choses près la plus grande qu’on puisse considérer avec les techniques que j’ai mises en oeuvre. Cette extension m’a amené à reconsidérer la construction de fond en comble et, progressivement, j’ai abouti à la définition des champs d’holonomie aléatoires [L7] qui généralise complètement la construction que j’avais donnée dans ma thèse. La propriété de Markov des champs d’holonomie aléatoire est devenue centrale dans leur définition même, qui s’inspire de la définition usuelle des processus de Markov et de la définition des théories topologiques des champs quantiques. La classe d’objets que j’ai ainsi définie contient la mesure de Yang-Mills, qui en est le prototype, comme la classe des processus de Lévy contient le mouvement brownien. Un des aspects importants de la généralisation apportée par les champs d’holonomie markoviens est la possibilité de considérer des groupes de structures qui ne sont pas connexes et en particulier des groupes finis. Dans le cas du groupe symétrique, un travail d’Alessandro d’Adda et Paolo Provero [DP04] montrait un lien entre une théorie analogue à la théorie de Yang-Mills et un modèle de revêtements ramifiés aléatoires. J’ai obtenu un résultat similaire dans le cas général, qui permet de réaliser explicitement une grande classe de champs d’holonomie markoviens à valeurs dans un groupe fini comme monodromies de revêtements ramifiés aléatoires 14 , et dont le lieu de ramification est à peu de choses près un processus ponctuel de Poisson. Localisation des énoncés principaux L’énoncé complet des résultats principaux présentés dans ces notes nécessiterait de longues introductions qui constituent en fait une grande partie du corps du texte. Je vais donc me contenter, sans les énoncer, d’indiquer les endroits dans le texte où ils se trouvent. Les principaux énoncés présentés dans le premier chapitre sont : • la définition des champs d’holonomie markoviens (définition 1.3.3, p.38), • un théorème d’existence de ces champs (théorème 1.3.7, p.40), 14. Plutôt qu’un revêtement ramifié, il faut en fait considérer un fibré principal ramifié, c’est-à-dire un revêtement ramifié sur les fibres régulières duquel le groupe de structure agit librement et transitivement. 12 un théorème d’extension qui est la clé du passage à la limite continue d’une théorie discrète (théorème 1.2.17, p.36), • un résultat de classification partielle de ces champs (théorème 1.3.6, p.40), • la construction du champ de Yang-Mills à partir d’un bruit blanc (théorème 1.3.9, p.43), • un résultat de densité des boucles de Wilson dans l’algèbre des observables d’une théorie de jauge discrète, pour une certaine classe de groupes de structures (théorème 1.2.11, p.31). Les principaux énoncés du deuxième chapitre sont : • la réalisation des champs d’holonomie markoviens à valeurs dans des groupes finis par des revêtements ramifiés aléatoires (théorème 2.1.5, p.51), • la désintégration du champ de Yang-Mills selon les classes d’isomorphismes possibles de G-fibrés principaux au-dessus d’une surface (théorème 2.4.6, p.64), • deux théorèmes de grandes déviations pour la mesure de Yang-Mills lorsque l’aire de la surface tend vers zéro démontrés en collaboration avec James R. Norris (théorèmes 2.4.8 et 2.4.9, p.65). Les principaux énoncés du troisième chapitre sont : • un théorème qui exprime en termes combinatoires les moments d’une matrice unitaire prise sous la mesure du noyau de la chaleur (théorème 3.1.4, p.73), • une formule due à Gross et Taylor que j’ai pu prouver grâce au résultat précédent (théorème 3.1.13, p.79). Puis, en collaboration avec Mylène Maïda : • un théorème de la limite centrale pour la répartition des valeurs propres d’une matrice unitaire sous la mesure du noyau de la chaleur (théorème 3.2.13, p.84), • la convergence, lorsque le temps tend vers l’infini, de la covariance qui apparaît dans le théorème précédent vers celle identifiée par Persi Diaconis et Steven Evans dans le cas des matrices unitaires uniformes [DE01] (théorème 3.2.14, p.84). Enfin, en collaboration avec Florent Benaych-Georges : • la définition de la convolution t-libre de deux mesures de probabilités sur R (théorème 3.3.1, p.86), • la définition de la t-liberté de deux sous-algèbres d’un espace de probabilités noncommutatif, qui interpole entre les notions de liberté et d’indépendance (définition 3.3.5, p.89), • un énoncé qui code le système différentiel permettant de calculer la convolution t-libre de certaines lois (proposition 3.3.7, p.90), • un résultat de non-existence de cumulants pour la notion de t-liberté (théorème 3.3.14, p.93). • Chapitre 1 Champs d’holonomie markoviens [L2, L3, L7] 1.1 Introduction Le but de cette introduction est de nous donner, avant que nous ne prenions les choses au début et dans un ordre proche de l’ordre logique, un aperçu de ce que sont les champs d’holonomie markoviens. Nous allons pour cela commencer par en examiner un exemple simple et fondamental, qui nous donnera une idée de la nature de la propriété de Markov qui est en jeu dans ces processus. Nous donnerons ensuite une définition provisoire de ces champs d’holonomie, puis nous examinerons leurs “noyaux de transition”, dont les propriétés intimement liées à la chirurgie des surfaces peuvent être suggestivement dessinées. Nous terminerons en énonçant un résultat d’existence et de classification partielle qui est l’un des résultats principaux de notre travail sur ces processus. Presque tout ce qui est dit dans cette introduction sera repris en plus ample détail dans la suite du chapitre. 1.1.1 Le processus de Poisson modulo n indexé par des lacets Plaçons-nous dans le plan euclidien R2 . Appelons temporairement lacet une application continue l : [0, 1] → R2 telle que l(0) = l(1) et dont l’image soit de mesure de Lebesgue nulle. Soit l un lacet et soit z un point de R2 , que nous identifions à C, non situé sur l’image de l. L’indice de l par rapport à z est l’entier relatif nl (z) défini par Z 1 dw , (1.1) nl (z) = 2iπ l̃ w − z où ˜l est un lacet de classe C 1 par morceaux arbitraire dont la distance uniforme à l est inférieure à la distance de z à l’image de l, si bien que l et ˜l sont homotopes dans R2 \ {z}. Comme nous supposons que l’image de l est de mesure de Lebesgue nulle, la fonction nl est définie et finie presque partout sur R2 , et à support compact. Soit n ≥ 2 un entier. Nous allons associer à chaque lacet l une variable aléatoire à valeurs dans Z/nZ. Pour cela, nous allons ajouter modulo n les indices de l par rapport aux points d’un ou plusieurs processus ponctuels de Poisson. 13 14 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] Définition 1.1.1 Soient λ1 , . . . , λn−1 des réels positifs ou nuls. Soient Π1 , . . . , Πn−1 des processus ponctuels de Poisson sur R2 indépendants tels que pour chaque k ∈ {1, . . . , n − 1}, Πk soit d’intensité λk fois la mesure de Lebesgue. À chaque lacet l on associe la variable aléatoire n−1 Z X Nl = k nl (z) dΠk (z) (mod n). (1.2) k=1 R2 Figure 1.1 – Prenons n = 4. Les processus Π1 , Π2 et Π3 sont représentés respectivement par des carrés noirs, des croix bleues et des ronds rouges. Ainsi Π1 contribue pour 2, Π2 pour 6 et Π3 pour 6. Ainsi, dans cet exemple, Nl = 2 (mod 4). Notons temporairement L(R2 ) l’ensemble des lacets sur R2 . Nous venons de définir un processus stochastique indexé par L(R2 ) et à valeurs dans Z/nZ. Énonçons quelques propriétés de ce processus. Lorsque l est un lacet, nous notons l−1 le même lacet parcouru en sens inverse. D’autre part, lorsque l1 et l2 sont deux lacets basés au même point, nous notons l1 l2 leur concaténation. Proposition 1.1.2 Le processus (Nl )l∈L(R2 ) est mutliplicatif. Ceci signifie que pour tous l, l1 , l2 ∈ L(R2 ) tels que l1 et l2 soient basés au même point, nous avons Nl−1 = −Nl , Nl1 l2 = Nl1 + Nl2 . Considérons maintenant une famille à un paramètre très simple de lacets. Pour chaque t ≥ 0, appelons lt le bord d’un disque d’aire t, parcouru une fois dans le sens positif, ces disques étant choisis de sorte que pour tous s ≤ t, le disque d’aire s soit contenu dans le disque d’aire t. Alors (Nlt )t≥0 est un processus stochastique ordinaire, indexé par R+ , à valeurs dans Z/nZ. Proposition 1.1.3 Le processus (Nlt )t≥0 est une chaîne de Markov sur Z/nZ. Son générateur (Qa,b )a,b∈Z/nZ est donné, pour tous a 6= b, par Qa,b = λc , où c est l’unique entier de {1, . . . , n − 1} tel que b = a + c (mod n). Les accroissements de ce processus sont indépendants et stationnaires : c’est un processus de Lévy, dont la mesure de saut, qui est une mesure sur (Z/nZ) \ {0}, attribue la masse λk à la classe de k pour tout k ∈ {1, . . . , n − 1}. 1.1. INTRODUCTION 15 Figure 1.2 – Avec les mêmes conventions de couleur que dans la figure précédente, les valeurs successives de Nlt pour les quatre valeurs de lt représentées ici sont 0, 3, 1 et 0 modulo 4. Nous dirons que le processus de Lévy décrit dans la proposition ci-dessus est associé au processus (Nl )l∈L(R2 ) . Sa loi ne dépend pas de la façon dont on choisi les lacets (lt )t≥0 . La propriété de Markov de ce processus de Lévy entraîne une propriété de Markov pour le processus N , qu’on peut exprimer comme suit. Si J est un lacet qui est une courbe de Jordan, nous noterons respectivement int(J) et ext(J) les adhérences des composantes connexes bornée et non bornée du complémentaire dans R2 de l’image de J. Proposition 1.1.4 Soit J un lacet qui est une courbe de Jordan. Alors les deux σ-algèbres σ (Nl : l ⊂ int(J)) et σ (Nl : l ⊂ ext(J)) sont indépendantes conditionnellement à NJ . Plus généralement, soient J, J1 , . . . , Jn des courbes de Jordan deux à deux disjointes telles que les intérieurs de J1 , . . . , Jn soient deux à deux disjoints et contenus dans l’intérieur de J. On définit alors M1 = int(J) ∩ ext(J1 ) ∩ . . . ∩ ext(Jn ) et M2 = ext(J) ∪ int(J1 ) ∪ . . . ∪ int(Jn ). Alors les deux σ-algèbres σ (Nl : l ⊂ M1 ) et σ (Nl : l ⊂ M2 ) sont indépendantes conditionnellement à la σ-algèbre σ(NJ , NJ1 , . . . , NJn ). J1 J4 J J J3 J2 Figure 1.3 – Partie gauche : les lacets situés à l’extérieur de J peuvent entourer l’intérieur de J. Partie droite : le domaine M2 est grisé. 16 1.1.2 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] Une première définition des champs d’holonomie markoviens La proposition 1.1.4 exprime une propriété de Markov où les notions de passé et de futur sont remplacées par les notions d’intérieur et d’extérieur, par rapport à une ou plusieurs courbes qui séparent le plan en plusieurs composantes connexes. Même si nous partons d’un domaine topologiquement simple comme le plan R2 , nous voyons apparaître, en appliquant cette propriété de Markov, des domaines plus compliqués comme le domaine M1 représenté (en blanc) dans la partie droite de la figure 1.3, homéomorphe en l’occurence à une sphère à cinq trous. Outre l’opération de découpage qui conduit par exemple du plan à cette sphère à cinq trous, des opérations de recollement sont également naturelles. Si par exemple on part des processus de Poisson indexés par les lacets tracés sur deux disques disjoints, tous deux conditionnés par le fait qu’ils attribuent un certain élément x de Z/nZ au bord de leur disque respectif, il est naturel de chercher à recoller ces disques le long de leurs bords pour définir le processus de Poisson indexé par les lacets tracés sur une sphère, ou tout du moins le conditionnement de ce processus par l’évènement qu’il attribue la valeur x à un certain équateur, qui est la cicatrice du recollement qu’on a effectué. Pour prendre en compte la propriété de Markov dans toute sa généralité, il faut donc ne pas se restreindre au plan R2 ou à un disque, mais considérer une classe de domaines qui soit stable par les opérations de chirurgie simple que sont le découpage le long de courbes de Jordan et le recollement le long de composantes connexes du bord. Une telle classe est facile à identifier : dès que l’on dispose de disques et de sphères à trois trous (ou à n trous avec n ≥ 3), on peut, par recollements, obtenir n’importe quelle surface compacte. Ce sont donc les surfaces compactes qui constituent la classe naturelle de domaines sur lesquels vont être tracés les lacets qui indexent nos processus. ENCART 1 – Topologie des surfaces [Mas77, Moi77] Une surface compacte, ou simplement surface, est une variété différentiable réelle de dimension 2, compacte, orientable ou non, éventuellement avec un bord. En tant qu’espace topologique, c’est un espace séparé compact dont chaque point admet un voisinage homéomorphe à R2 ou à R × R+ . La structure différentiable n’apporte pas d’information nouvelle par rapport à la structure topologique : deux surfaces sont difféomorphes si et seulement si elles sont homéomorphes. Le bord d’une surface, s’il est non vide, est une réunion disjointe finie de cercles. On dit qu’une surface est fermée si elle n’a pas de bord. À toute surface on peut associer une surface fermée en collant un disque le long de chacune des composantes connexes de son bord. Deux surfaces connexes qui ont le même nombre de composantes connexes du bord sont difféomorphes si et seulement si les surfaces fermées qui leur sont associées sont difféomorphes. Enfin, les surfaces fermées connexes sont classées à difféomorphisme près par leur orientabilité et leur genre, qui peut être n’importe quel entier positif pour une surface orientable et n’importe quel entier strictement positif pour une surface non-orientable. Lorsqu’on travaille simultanément avec des surfaces orientables et non-orientables, il est plus commode de considérer leur genre réduit, qui est égal au genre pour les surfaces non-orientables et au double du genre pour les surfaces orientables. L’avantage principal du genre réduit est qu’il est additif par rapport à l’opération de somme connexe. La surface de genre 0 est la sphère, la surface orientable de genre g et de genre réduit 2g la somme connexe de g tores et la surface non-orientable de genre g, la somme connexe de g plans projectifs. Ce plan projectif peut être obtenu comme quotient de la sphère unité de R3 par la relation qui identifie un point avec son symétrique par rapport à l’origine. À la différence du cas unidimensionnel, une orientation d’une surface orientable ne permet pas de dis- 1.1. INTRODUCTION 17 tinguer parmi les composantes connexes de son bord entre des composantes entrantes et des composantes sortantes : pour toute permutation des composantes connexes du bord d’une surface, même orientée, il existe un difféomorphisme, préservant l’orientation le cas échéant, qui induit cette permutation. Tout comme le processus de Poisson que nous avons examiné à la section précédente prenait ses valeurs dans Z/nZ, les champs d’holonomie markoviens prennent général leurs valeurs dans un groupe, mais ce groupe en général ne sera pas commutatif. Ce sera un groupe de Lie compact, c’est-à-dire un groupe de matrices compact. Nous allons imposer que les champs d’holonomie satisfassent une propriété de multiplicativité analogue à celle exprimée par la proposition 1.1.2, et qui dans le cas d’un groupe non-commutatif s’exprime naturellement comme suit (voir aussi la définition 1.2.1 plus bas) : si G est un groupe, si M est une surface et m un point de M , une famile (Hl )l∈Lm (M ) de variables aléatoires indexée par l’ensemble des lacets sur M basés en m est multiplicative si ∀l1 , l2 ∈ Lm (M ) , Hl1−1 = Hl−1 et Hl1 l2 = Hl2 Hl1 presque sûrement. 1 La raison pour laquelle l’ordre de l1 et l2 est inversé dans la dernière égalité sera expliquée à la section 2.2.2. Un autre aspect important du processus de Poisson indexé par les lacets est le rôle qu’a joué la mesure de Lebesgue sur R2 dans sa définition, par le biais de l’intensité de Π1 , . . . , Πn−1 . Dans le cas général, il est nécessaire de munir les surfaces sur lesquelles on travaille d’une mesure d’aire, qui joue comme nous le verrons un rôle analogue à celui joué par la mesure des longueurs dans le cas des processus de Markov usuels indexés par des intervalles de temps. Nous pouvons maintenant donner une définition provisoire et très vague des champs d’holonomie markoviens. Définition 1.1.5 (Champs d’holonomie markoviens : définition provisoire) Soit G un groupe de Lie compact. Un champ d’holonomie markovien bidimensionnel à valeurs dans G est une collection de processus stochastiques à valeurs dans G, un pour chaque surface compacte munie d’une mesure d’aire et d’un choix de conditions au bord le long de certaines composantes connexes de son bord. Pour chaque telle surface, le processus est indexé par l’ensemble des lacets sur la surface et il est multiplicatif. Enfin, la collection de tous ces processus stochastiques se comporte vis-à-vis de la chirurgie des surfaces (découpage le long de courbes de Jordan et recollements de composantes connexes de bords) d’une façon qui est gouvernée par la propriété de Markov. 1.1.3 Noyaux de transition et chirurgie des surfaces Pour comprendre le rôle des conditions au bord qui sont mentionnées dans la définition ci-dessus, nous allons faire un bref parallèle avec le cas des processus de Markov usuels, indexés par des intervalles de temps. La donnée d’un tel processus, prenant ses valeurs dans un espace d’états X , permet entre autres d’associer à chaque intervalle de longueur t et à chaque condition initiale x ∈ X une mesure Pt (x, dy) sur X . Les transitions de 18 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] ce processus ont donc lieu le long d’intervalles, auxquels on peut penser, de façon un peu inutilement sophistiquée, comme à des transitions topologiques (ou cobordismes) entre des paires de points. On peut dire, de façon analogue, que les transitions d’un champ d’holonomie markovien ont lieu le long de surfaces, elles-mêmes vues comme des cobordismes entre des familles de cercles (voir par exemple la figure 1.4 ci-dessous). Toutefois, comme nous l’avons dit à la fin de l’encart 1, et contrairement à ce qui se passe pour un intervalle, le bord d’une surface, même orientée, ne se sépare pas canoniquement en des composantes connexes entrantes et des composantes connexes sortantes. Elle peut en outre, même si elle est connexe, avoir un nombre arbitraire et éventuellement nul de composantes connexes de bord. La décision de regarder une surface orientée donnée comme une transition entre certaines de ces composantes connexes de bord (entrantes) et les autres (sortantes) est donc arbitraire. La contrepartie analytique de cette plus grande symétrie entre ces composantes connexes qu’entre le point initial et le point final d’un intervalle, est qu’il faut renoncer à la distinction qui fait du noyau de transition Pt (x, dy) d’un processus de Markov usuel une fonction en x et une mesure en y. Dans le cas usuel, cette distinction disparaît partiellement lorsque le processus est suffisamment régulier pour que, pour tout t > 0 et tout x ∈ X , la mesure Pt (x, dy) ait une densité, habituellement notée pt (x, y), par rapport à une mesure de référence sur X . La théorie des champs d’holonomie markoviens telle que nous la développons se restreint à des champs suffisamment réguliers pour qu’on se trouve dans une situation analogue, où tous les noyaux de transition ont une densité. Il est temps de décrire ces noyaux de transition. De même que la transition d’un processus usuel le long d’un intervalle ne dépend que de la longueur de l’intervalle et pas de sa position dans la droite réelle, la transition d’un champ d’holonomie markovien le long d’une surface ne dépend de cette surface qu’à isomorphisme près, pour une bonne notion d’isomorphisme. La structure pertinente est la suivante. Nous avons besoin de considérer une surface, caractérisée par son orientabilité, que nous notons par un signe, + ou −, par le nombre des composantes connexes de son bord, que nous notons p, et par son genre réduit que nous notons g (voir la définition du genre réduit à l’encart 1). Cette structure topologique est complétée par ce qui joue le rôle de la longueur d’un intervalle, à savoir l’aire totale, notée t, d’une mesure d’aire dont nous munissons la surface. Un théorème de Moser assure que le seul invariant par difféomorphismes d’une telle mesure d’aire est précisément son aire totale. Le quadruplet (±, p, g, t) caractérise donc complètement la surface à difféomorphismes près et les noyaux de transition d’un champ d’holonomie markovien sont une famille de fonctions ± Zp,g,t : Gp → R+ , (1.3) analogues des densités pt (x, y) dont nous avons parlé plus haut. Considérons maintenant une surface avec un bord ayant p composantes connexes, de genre réduit g et d’aire totale t. Choisissons q composantes connexes de son bord, que nous déclarons entrantes, et regardons les p − q autres comme des composantes sortantes. Si nous fixons des conditions “initiales”, qui sont des éléments x1 , . . . , xq ∈ G, le long des q composantes entrantes, orientées arbitrairement, le champ conditionné à respecter ces conditions initiales détermine un processus indexé par les lacets tracés sur notre surface, 1.1. INTRODUCTION 19 et nous pouvons en particulier considérer la distribution des variables aléatoires associées au p − q composantes sortantes, vues comme des lacets particuliers sur notre surface, et qui est donnée par −1 ± (x−1 Zp,g,t 1 , . . . , xq , y1 , . . . , yp−q ) dy1 . . . dyq . La mesure dy sur le groupe G est sa mesure de Haar normalisée, son unique mesure borélienne de probabilités invariante par les translations. Les exposants qui apparaissent servent à prendre en compte notre décision de regarder certaines composantes comme ± entrantes et d’autres comme sortantes, et permettent d’assurer que la fonction Zp,g,t soit symétrique en tous ses arguments. x1 y1 x2 y2 x3 y3 x4 Figure 1.4 – Ici, p = 7, q = 4 et g = 6 (il s’agit du genre réduit). La propriété de Markov usuelle, pour des processus indexés par le temps, se reflète dans le fait que les densités des noyaux de transition forment un semi-groupe de convolution. Du point de vue des intervalles comme cobordismes entre paires de points, cette propriété donne un renseignement sur le comportement du processus sur un intervalle de temps qui est le recollement de deux intervalles ayant un instant en commun. Dans le contexte bidimensionnel, en recollant des surfaces le long de certaines composantes de leurs bords, ou en recollant deux composantes du bord d’une même surface, voire en recollant avec ellemême une composante du bord d’une surface, on obtient de nouvelles surfaces et chacune de ces opérations de chirurgie donne lieu à une relation entre les noyaux de transition d’un champ d’holonomie markovien, analogue à la relation de Chapman-Kolmogorov. Si ε et ε0 sont deux signes, nous notons ε ∧ ε0 le signe qui vaut + si et seulement si ε et ε0 sont eux-mêmes le signe +. ± Proposition 1.1.6 Soient (Zp,g,t ) les fonctions de partitions d’un champ d’holonomie markovien. Pour tout choix admissible des paramètres, on a les relations suivantes. Z 0 ε Zp,g,t (x1 , . . . , xp−1 , z)Zpε0 ,g0 ,t0 (y1 , . . . , yp0 −1 , z −1 ) dz = (1.4) G 0 ε∧ε Zp+p 0 −2,g+g 0 ,t+t0 (x1 , . . . , xp−1 , y1 , . . . , yp0 −1 ). Cette relation correspond au recollement de deux surfaces distinctes le long d’une composante du bord de chacune. Z ε ε Zp,g,t (x1 , . . . , xp−2 , z, z −1 ) dz = Zp−2,g+2,t (x1 , . . . , xp−2 ). (1.5) G 20 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] x1 z x1 z y1 x2 y1 x2 Figure 1.5 – Ici, ε = ε0 = +, p = 3, g = 0, p0 = 2 et g 0 = 2. L’orientation la plus intuitive des surfaces étant sous-entendue, seule la composante de bord marquée z du tore à deux trous est orientée négativement, ce qui explique pourquoi elle apparaît avec un exposant −1 dans l’intégrale. Cette relation correspond au recollement de deux composantes du bord d’une même surface. Observons que notre convention sur le genre réduit permet de ne pas avoir à distinguer le cas orientable (où le genre usuel augmente de 1) du cas non-orientable (où le genre augemente de 2). z x1 x1 z Figure 1.6 – Ici, ε = +, p = 3, g = 0. Z ε − Zp,g,t (x1 , . . . , xp−1 , z 2 ) dz = Zp−1,g+1,t (x1 , . . . , xp−1 ). (1.6) G Cette dernière relation correspond au recollement d’une composante du bord d’une surface avec elle-même selon un difféomorphisme involutif sans point fixe qui préserve l’orientation. La surface qu’on obtient est toujours non-orientable, homéomorphe à celle qu’on aurait obtenue en recollant un ruban de Möbius le long de la composante du bord considérée. Figure 1.7 – Il est difficile de dessiner le résultat final d’un tel recollement. Nous représentons plutôt la façon dont une composante connexe du bord de la surface se colle le long bord d’un ruban de Möbius. L’infinité de noyaux de transition d’un champ d’holonomie markovien satisfait donc une infinité de relations, une pour chaque opération de chirurgie des surfaces. Le fait, 1.1. INTRODUCTION 21 évoqué plus haut, que toute surface compacte peut être obtenue par recollement de disques et de sphères percées de trois trous (voir figure 1.8), entraîne donc que l’ensemble des noyaux de transion est en fait déterminé par un très petit nombre d’entre eux. Figure 1.8 – La surface orientable de genre réduit 6 avec 5 composantes de bord réalisée par recollements de sphères à trois trous et d’un disque. Une telle décomposition n’est pas unique et celle représentée n’utilise pas un nombre minimal de blocs élémentaires. Proposition 1.1.7 Tous les noyaux de transition d’un champ d’holonomie markovien + + sont déterminés par les noyaux (Z1,0,t )t>0 et (Z3,0,t )t>0 , associés respectivement aux disques et aux sphères à trois trous de toutes les aires. De plus, sous une hypothèse de régularité que nous détaillerons plus tard, les seuls + noyaux (Z1,0,t )t>0 suffisent à déterminer tous les autres. + Dans le cas du processus de Poisson indexé par les lacets, les noyaux (Z1,0,t )t>0 , associés à des disques, sont les marges unidimensionnelles du processus indexé par R+ que nous avons décrit à la proposition 1.1.3. Dans le cas général, on a le résultat suivant, valable sous certaines hypothèses de régularité pour le champ d’holonomie markovien. Proposition 1.1.8 Considérons un champ d’holonomie markovien à valeurs dans un + groupe G. Les mesures (Z1,0,t (x) dx)t>0 sur G forment un semi-groupe de convolution. Ce sont les lois marginales unidimensionnelles d’un processus de Lévy à valeurs dans G, qui est dit associé au champ considéré. À ceci près qu’il n’est pas démontré dans tous les cas qu’un champ d’holonomie aléatoire markovien est complètement déterminé par ses noyaux de transition, il y a donc une correspondance entre processus de Lévy sur un groupe de Lie compact et champs d’holonomie à valeurs dans ce groupe. Le résultat qui suit est l’un de nos résultats fondamentaux sur les champs d’holonomie markoviens. Nous l’énoncerons à nouveau, plus précisément, à la fin de ce chapitre, après avoir introduit les définitions nécessaires. Théorème 1.1.9 ([L7, Théorème 4.3.1]) Soit G un groupe de Lie compact. Pour tout processus de Lévy à valeurs dans G satisfaisant certaines hypothèses techniques, il existe un champ d’holonomie aléatoire markovien à valeurs dans G auquel ce processus est associé. La preuve de ce théorème d’existence est constructive et nous allons consacrer l’essentiel de ce chapitre à indiquer comment on parvient à construire un champ d’holonomie markovien. 22 1.2 1.2.1 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] Processus multiplicatifs indexés par des chemins L’espace mesurable Commençons par préciser les objets qui sont en jeu. Nous nous donnons une surface M . Elle est munie de sa structure différentiable, d’une orientation si elle est orientable et d’une mesure borélienne qui nous servira à mesurer les aires. Nous supposerons que cette mesure a, dans chaque système local de coordonnées, une densité lisse et strictement positive par rapport à la mesure de Lebesgue. Nous la noterons vol. Si M est orientée, on peut identifier la mesure vol à une 2-forme volume, c’est-à-dire une 2-forme différentielle qui ne s’annule pas. La classe des chemins que nous considérons est la classe des chemins rectifiables, c’està-dire continus et de longueur finie. Le fait qu’un chemin soit de longueur finie n’est pas une notion métrique, mais bien une notion différentiable : c’est invariant par difféomorphismes. Nous noterons P(M ) l’ensemble des chemins de longueur finie, considérés à reparamétrisation près. Lorsque c est un chemin, nous noterons c−1 le même chemin parcouru dans l’autre sens, et c et c l’origine et l’extrémité de c. Si c1 et c2 sont deux chemins tels que c1 = c2 , nous noterons c1 c2 leur concaténation. Le groupe que nous allons considérer et dans lequel le champ prendra ses valeurs est un groupe de Lie compact, que nous noterons G. ENCART 2 – Groupes de Lie compacts [BtD85, DK00] Un groupe de Lie compact est un groupe topologique compact qui est également une variété différentiable de telle sorte que le produit et l’inversion soient des applications lisses. Un tel groupe est isomorphe, par un isomorphisme de groupe qui est aussi un difféomorphisme, à un sous-groupe fermé du groupe unitaire U (N ) pour un certain N . On perd donc un certain caractère intrinsèque de la description, mais aucune généralité, à penser à un groupe de Lie compact comme à un groupe compact de matrices à coefficients complexes. C’est ce que nous ferons désormais sans le signaler dès lors que cela nous semblera utile pour simplifier la présentation. Notons que tout groupe fini muni de la topologie discrète est un groupe de Lie compact. Soit G un groupe de Lie compact. Il a deux propriétés fondamentales de notre point de vue. Premièrement, il porte une unique mesure borélienne de probabilités invariante par R les translations, la mesure de Haar, que nous ne noterons pas, c’est-à-dire que nous écrirons simplement G f (g) dg pour l’intégrale d’une fonction continue f : G → R par rapport à cette mesure. Deuxièmement, son algèbre de Lie porte un produit scalaire invariant par adjonction. L’algèbre de Lie de G peut être définie comme le sous-espace vectoriel réel de MN (C) donné par g = {A ∈ MN (C) : ∀t ∈ R, etA ∈ G}. L’espace vectoriel g porte un produit scalaire (non unique en général, même à une constante multiplicative près) invariant par l’action de G par adjonction, c’est-à-dire par conjugaison : ad(g)A = gAg −1 . La donnée d’un tel produit scalaire sur g est équivalent à la donnée d’une métrique riemannienne sur G pour laquelle toutes les translations, à droite et à gauche, sont des isométries. Le volume riemannien d’une telle métrique est une mesure invariante par les translations, donc un multiple de la mesure de Haar. Dans le cas du groupe unitaire U (N ), l’algèbre de Lie u(N ) est l’espace des matrices anti-hermitiennes. Le produit scalaire Tr(A∗ B) = −Tr(AB) est alors un produit scalaire invariant. La forme bilinéaire Tr(A∗ B) + αTr(A∗ )Tr(B) est également invariante pour tout α réel, c’est donc un produit scalaire invariant dès que c’est un produit scalaire, c’est-à-dire dès que α > − N1 . Nous aurons besoin plus loin de quelques considérations topologiques sur G. Si G n’est pas connexe, la composante connexe de l’élément neutre, est un sous-groupe distingué de G noté G0 et tel que le quotient G/G0 soit fini. 1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS 23 Supposons G connexe. Le groupe fondamental de G, comme celui de tout groupe topologique, est commutatif. En fait, étant donné deux lacets continus γ1 , γ2 : [0, 1] → G, la concaténation γ1 γ2 de ces deux lacets est homotope à leur produit point par point t 7→ γ1 (t)γ2 (t), ainsi qu’à leur produit point par point dans l’autre sens t 7→ γ2 (t)γ1 (t). La multiplication point par point munit les classes d’homotopie sans condition d’extrémités fixées d’une structure de groupe abélien canoniquement isomorphe à π1 (G, 1), où 1 désigne l’élément neutre de G. Ce groupe est fini si et seulement si le centre de G est fini, auquel cas on dit que G est semi-simple. Dans ce cas, G adment un revêtement universel par un autre groupe de Lie compact. Par exemple, le groupe fondamental de SO(3) est isomorphe à Z/2Z et SO(3) admet un revêtement universel, de degré 2, par SU (2). Dans le cas où le centre de G n’est pas fini, par exemple si G = U (N ), un revêtement universel de G est isomorphe au produit d’un groupe compact et de Rn pour un certain n ≥ 1. Décrivons l’espace canonique d’un processus multiplicatif indexé par une partie de P(M ) et à valeurs dans G. Définition 1.2.1 Soit P une partie de P(M ). On dit qu’une fonction h : P → G est multiplicative si 1. ∀c ∈ P, c−1 ∈ P ⇒ h(c−1 ) = h(c)−1 . 2. ∀c1 , c2 ∈ P, c1 c2 ∈ P ⇒ h(c1 c2 ) = h(c2 )h(c1 ). On note M(P, G) l’ensemble des fonctions multiplicatives de P dans G. Nous allons munir M(P, G) de la σ-algèbre C engendrée par les applications d’évaluation h 7→ h(c), pour c décrivant P . Un champ d’holonomie aléatoire sur M est une mesure finie ou de probabilités sur (M(P(M ), G), C). 1.2.2 Graphes Pour construire une mesure sur (M(P(M ), G), C), on voudrait procéder comme d’habitude lorsqu’on construit un processus stochastique, en décrivant d’abord ses marges fini-dimensionnelles, puis en appliquant un théorème de Kolmogorov. Ceci n’est malheureusement pas possible directement, car on ne sait pas décrire simplement toutes les lois marginales fini-dimensionnelles des mesures qu’on veut construire. Avant d’expliquer d’où vient ce problème, commençons par décrire celles de ces lois pour lesquelles c’est possible. Nous dirons qu’un lacet l : [0, 1] → M est simple s’il est injectif sur [0, 1). Définition 1.2.2 Un graphe sur M est un triplet G = (V, E, F) tel que 1. E est un ensemble d’arêtes, c’est-à-dire de chemins injectifs ou de lacets simples, qui soit ne rencontrent pas le bord de M , soit sont contenus dedans ; on suppose que dès que E contient une arête e il contient l’arête e−1 , et que deux arêtes qui ne sont pas inverse l’une de l’autre ne se recontrent, le cas échéant, qu’en certaines de leurs extrémités, 2. V est l’ensemble des extrémités des arêtes de E, 3. F est l’ensemble des composantes connexes du complémentaire dans M de la réunion des images des arêtes de E, 4. chaque élément de F est homéomorphe à un disque ouvert de R2 . Les éléments de V s’appellent les sommets du graphe, et les éléments de F ses faces. 24 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] Figure 1.9 – Un graphe sur une sphère percée de trois trous. L’hypothèse que les faces sont homéomorphes à des disques ouverts impose que le bord de la surface soit couvert par des arêtes du graphe, ici deux arêtes injectives et deux lacets simples. Soit G un graphe sur M . Notons P(G) l’ensemble des chemins que l’on peut former en concaténant des arêtes de G. Nous allons décrire une mesure de probabilités sur M(P(G), G). Il ne s’agit pas strictement parlant d’une loi marginale fini-dimensionnelle du champ d’holonomie, car P(G) est infini, mais on vérifie aisément que l’application de restriction M(P(G), G) → M(E, G) est une bijection. En d’autres termes, une fonction multiplicative sur les chemins tracés dans un graphe est complètement déterminée par ses valeurs sur les arêtes. De plus, si on choisit une orientation de G, c’est-à-dire une partie E+ de E telle que E soit la réunion disjointe de E+ et (E+ )−1 , alors il suffit même de connaître une fonction multiplicative sur E+ : on a à nouveau une application de restriction bijective M(E, G) → M(E+ , G). Enfin, toute fonction de E+ dans G est multiplicative, car E+ ne contient l’inverse d’aucun de ses éléments, ni aucune de leurs concaténations. Ainsi, + M(E+ , G) = GE . + + La mesure dg ⊗E , qui est la mesure de Haar sur le groupe de Lie compact GE , détermine par les bijections que nous avons décrites des mesures sur M(E, G) et M(P(G), G), que nous appellerons uniformes et que nous noterons simplement dh. La mesure que nous allons définir sur M(P(G), G) a une densité par rapport à cette mesure uniforme, qui dépend du choix d’un processus de Lévy sur G. 1.2.3 Processus de Lévy et marges associées à des graphes Commençons par décrire brièvement les processus de Lévy sur G. ENCART 3 – Processus de Lévy sur un groupe de Lie compact [Lia04] On dit qu’un processus X = (Xt )t≥0 à valeurs dans G est un processus de Lévy s’il est càdlàg et si ses accroissements sont indépendants et stationnaires. Comme la multiplication dans G n’est pas commutative, il faut choisir un côté pour définir les accroissements, et nous décidons que l’accroissement de X entre s et t est Xs−1 Xt (on parle de processus de Lévy à gauche). Soit X un processus de Lévy. Alors la formule Pt f (x) = E[f (xX0−1 Xt )] définit un semi-groupe de Feller invariant à gauche, au sens où pour tous x, y ∈ G et tout borélien Γ de G, on a Pt (yx, yΓ) = Pt (x, Γ). Réciproquement, tout processus de Feller dans G dont le noyau de transition est invariant à gauche est un processus de Lévy à gauche. Enfin, la donnée d’un processus 1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS 25 de Lévy à gauche équivaut à la donnée d’un semi-groupe de convolution faiblement continu de mesures de probabilités sur G, le semi-groupe des lois marginales unidimensionnelles de X. Le générateur d’un processus de Lévy est la somme d’un terme diffusif, d’un terme de dérive et d’un terme de saut, ce dernier étant caractérisé par une mesure notée Π qui ne charge pas l’élément neutre et qui satisfait R la condition d’intégrabilité G dG (1, x)2 Π(dx) < +∞, où dG est une distance riemannienne bi-invariante sur G. Nous allons considérer des processus issus de l’identité et invariants par conjugaison, c’est-à-dire tels que pour tout g ∈ G, les processus X et gXg −1 aient la même loi. Pour de tels processus, les trois parties du générateur sont invariantes par conjugaison. Cette contrainte est particulièrement restrictive pour les parties diffusive et de dérive : si le groupe G est simple, par exemple si G = SU (N ), alors la dérive est nulle et la partie diffusive du générateur est imposée à une constante multiplicative positive près. Nous avons besoin de considérer des processus de Lévy dont la loi à tout instant strictement positif a une densité continue par rapport à la mesure de Haar. Le résultat suivant montre que ceci a lieu sous une hypothèse bien plus faible. Rappelons que G0 est la composante connexe de l’élément neutre dans G et que le quotient G/G0 est fini. Proposition 1.2.3 ([L7, Proposition 4.2.3]) Soit X un processus de Lévy invariant par conjugaison sur G, issu de l’élément neutre. S’il existe p > 1 tel que pour tout t > 0 la loi de Xt admette une densité Lp par rapport à la mesure de Haar sur G, alors cette densité, qu’on notera (t, x) 7→ Qt (x) est continue sur (0, +∞) × G et strictement positive sur (0, +∞) × G0 . Si de plus le support de la mesure image de Π par la projection G → G/G0 engendre G/G0 , alors Q est strictement positive sur (0, +∞) × G. Définition 1.2.4 Nous dirons qu’un processus de Lévy X sur G est admissible s’il est issu de l’élément neutre, invariant par conjugaison et si pour tout t > 0 la loi de Xt admet une densité Qt par rapport à la mesure de Haar telle que (t, x) 7→ Qt (x) soit continue et strictement positive sur (0, +∞) × G. Le groupe G, qui est compact, admet une métrique riemannienne telle que les translations soient des isométries (voir l’encart 2). Une telle métrique n’est pas unique, mais nous en choisissons une sur G et nous notons dG la distance riemannienne associée. Pour la plupart des usages que nous en ferons, nous écrirons des distances entre un élément de G et l’élément neutre. Cette distance peut être remplacée sans dommage dans toutes les formules par une distance euclidienne dans MN (C) entre l’élément considéré et la matrice identité. Donnons des exemples de processus admissibles. • Si G est un groupe fini, les processus admissibles sont exactement les chaînes de Markov dont le générateur est invariant, et dont la mesure de saut est invariante par conjugaison et a un support qui engendre G. • Si G est connexe et si on le munit d’une métrique riemannienne bi-invariante, alors le mouvement brownien sur G est un processus de Lévy admissible. • Si X est un processus admissible, on peut ajouter ou soustraire à sa mesure de saut n’importe quelle mesure finie portée par G0 sans changer le fait qu’il soit admissible. • Il existe des processus de saut pur admissibles, par exemple le processus sur SU (2) dont la mesure de saut est Π(dx) = dG (1, x)α dx pour α ∈ (−5, −3). 26 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] Soit X un processus de Lévy admissible sur G dont nous notons Q la densité. Soit M une surface munie d’un graphe G. Nous allons maintenant définir une mesure sur M(P(G), G) associée à X. Observons que chaque face de G est bordée par un lacet dans G. Cette affirmation ne va pas tout-à-fait de soi : d’une part ce lacet n’est pas unique, car il n’est défini qu’à changement d’orientation et d’origine près, d’autre part il n’est pas forcément un lacet simple, c’est-à-dire qu’il peut emprunter deux fois une même arête, éventuellement deux fois dans le même sens si la surface n’est pas orientable (voir figure 1.10). Pour simplifier l’exposition, nous ne nous préoccuperons pas du cas non-orientable dans la plupart des énoncés qui suivent. Dans une surface orientable et orientée, le bord d’une face F est donc un lacet ∂F défini au choix de son origine près. Ainsi, si h : P(G) → G est une fonction multiplicative, la valeur de h(∂F ) est définie à conjugaison près. Ceci suffit à ce que la définition suivante ait un sens. Définition 1.2.5 Soit M une surface munie d’une mesure d’aire notée vol. Soit G un graphe sur M . On définit la mesure de probabilités DFX,G M,vol sur (M(P(G), G), C) par DFX,G M,vol (dh) = 1 Y X,G ZM,vol F ∈F Qvol(F ) (h(∂F )) dh. Il est possible d’incorporer des conditions au bord dans la définition de DFX,G M,vol mais nous préférons ne pas le faire en détail pour ne pas allonger inutilement l’exposition. Indiquons simplement que la densité n’est pas affectée par les conditions au bord, mais qu’on ne conditionne en fait que la mesure uniforme dh à satisfaire les contraintes qu’on X,G a choisies. La constante de normalisation ZM,vol est alors modifiée et devient une fonction des conditions au bord. Mentionnons également que dans le cas non-orientable, il est nécessaire de supposer que le processus X est invariant par inversion, c’est-à-dire qu’il a même loi que X −1 . Figure 1.10 – Ce graphe sur un ruban de Möbius a deux sommets, trois arêtes et une seule face, dont le bord emprunte deux fois l’équateur (ici en gras) dans le même sens. Nous allons maintenant justifier dans la mesure du possible la définition 1.2.5, c’està-dire de trouver un sens en lequel elle est naturelle. Pour cela, il est opportun de parler de symétrie de jauge. 1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS 1.2.4 27 Symétrie de jauge Définition 1.2.6 On appelle groupe de jauge le groupe J = F(M, G) de toutes les fonctions de M dans G. Si P est une partie de P(M ), alors J agit sur M(P, G) de la façon suivante : l’élément j de J transforme l’élément h de M(P, G) en l’élément j · h défini par ∀c ∈ P , (j · h)(c) = j(c)−1 h(c)j(c). Pour des raisons géométriques ou physiques que nous expliquerons plus tard, on ne doit considérer sur M(P(M ), G) que des objets, mesures ou fonctions, invariants sous l’action du groupe de jauge. Ceci restreint énormément l’espace des observables, c’est-à-dire des fonctions autorisées. Par exemple, si c est un chemin dont les extrémités sont distinctes, alors les seules fonctions f : G → R telles que h 7→ f (h(c)) soit invariante sous l’action de J sont les fonctions constantes. En effet, la valeur de h(c) peut être transformée en n’importe quel élément de G par une transformation de jauge appropriée. Si c est un lacet en revanche, toute fonction f : G → R invariante par conjugaison, c’est-à-dire telle que f (yxy −1 ) = f (x) pour tous x, y, donne lieu à une fonction h 7→ f (h(c)) invariante par transformation de jauge. En y regardant de plus près, on s’aperçoit qu’une transformation de jauge non seulement conjugue les valeurs de la fonction h sur les lacets, mais conjugue par le même élément la valeur de h sur tous les lacets basés au même point. Définissons l’action par conjugaison diagonale de G sur Gn pour tout entier n ≥ 1 par y · (x1 , . . . , xn ) = (yx1 y −1 , . . . , yxn y −1 ). Alors, pour toute fonction f : Gn → R invariante par cette action diagonale et toute famille l1 , . . . , ln de lacets basés au même point, la fonction h 7→ f (h(l1 ), . . . , h(ln )) est une fonction invariante par transformation de jauge, et c’est essentiellement la plus générale possible. Avant d’énoncer un résultat, donnons un exemple de classes de conjugaison diagonales. Dans le groupe SO(3), chaque rotation qui n’est ni l’identité ni une symétrie axiale (appelons de telles rotations des rotations propres) a un axe, qui est une droite orientée, et un angle, qui appartient à (0, π). Cet angle caractérise la classe de conjugaison de la rotation. Considérons maintenant deux collections (r1 , . . . , rn ) et (r10 , . . . , rn0 ) de rotations propres. Alors ri est conjuguée à ri0 pour tout i = 1, . . . , n si et seulement si ri et ri0 ont même angle pour tout i = 1, . . . , n. Cependant, il existe une rotation r telle que ri0 = rri r−1 pour tout i = 1, . . . , n si et seulement si, en plus de la condition précédente, il existe une rotation (qui n’est autre que r) qui, pour tout i = 1, . . . , n, envoie l’axe orienté de ri sur l’axe orienté de ri0 . Ainsi, la classe de conjugaison diagonale d’une famille de rotations est donnée par les angles de ces rotations et la position relative de leurs axes. Proposition 1.2.7 Soit P une partie de P(M ) stable par inversion et par concaténation. On suppose que toute extrémité d’un chemin de P est reliée à toute autre par un chemin de P . Soit m une extrémité d’un chemin de P . Soit Lm l’ensemble des lacets basés en m qui appartiennent à P . Alors on a les deux propositions suivantes. 1. L’application composée M(P, G) −→ M(Lm , G) −→ M(Lm , G)/G, où la première application est la restriction et la deuxième le quotient par l’action de G par conjugaison diagonale sur tous les facteurs, passe au quotient en une injection M(P, G)/J −→ M(Lm , G)/G. 28 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] 2. Soient c1 , . . . , cn des éléments de P . Soit f : Gn → R une fonction continue telle que la fonction h 7→ f (h(c1 ), . . . , h(cn )) soit invariante par transformations de jauge. Alors il existe n lacets l1 , . . . , ln basés en m et une fonction continue f˜ : Gn → R invariante sous l’action diagonale de G par conjugaison telle que pour tout h ∈ M(P, G) on ait f (h(c1 ), . . . , h(cn )) = f˜(h(l1 ), . . . , h(ln )). Lorsqu’on se restreint à des observables invariantes par transformations de jauge, on ne perd donc rien à se restreindre à des lacets, ni même aux lacets basés en un point arbitraire. La proposition ci-dessus rend intelligible la définition, que nous donnons maintenant, d’une σ-algèbre sur M(P, G) plus petite que la tribu des cyclindres que nous avons considérée jusqu’à présent. Définition 1.2.8 Soit P une partie de P(M ) stable par inversion et par concaténation. On suppose que toute extrémité d’un chemin de P est reliée à toute autre par un chemin de P . On appelle σ-algèbre invariante et on note I la plus petite σ-algèbre qui rende mesurable toutes les fonctions h 7→ f (h(l1 ), . . . , h(ln )) où l1 , . . . , ln sont des lacets de P basés au même point et où f : Gn → R est invariante par l’action diagonale de G par conjugaison. Revenons à la mesure de probabilités que nous avons définie sur M(P(G), G). La proposition suivante ne devrait pas constituer une surprise. Lemme 1.2.9 La mesure DFX,G M,vol est invariante sous l’action du groupe de jauge. Terminons ce paragraphe par une observation sur la nature des conditions au bord qu’on peut imposer au champ d’holonomie. Lorsqu’on met des conditions au bord sur la mesure DFX,G M,vol , on impose la valeur des fonctions multiplicatives des lacets le long des composantes connexes du bord de M . Ces composantes connexes n’ont d’une part pas d’origine privilégiée et d’autre part, en eussent-elles chacune une que celles-ci seraient nécessairement deux à deux distinctes. Il n’a donc pas de sens, à transformation de jauge près, d’imposer plus que la classe de conjugaison de la valeur des fonctions le long de chaque composante du bord. Les conditions au bord consistent donc en la donnée d’une classe de conjugaison pour chaque composante connexe orientée du bord de M (voir la définition 1.3.2). 1.2.5 Une représentation aléatoire du groupe des lacets L’invariance de jauge de la mesure DFX,G M,vol nous autorise à la considérer comme un bon objet du point de vue géométrique et physique, mais ne suffit pas à la rendre naturelle. Pour mieux la comprendre, étudions la structure de l’ensemble des lacets basés en un point dans un graphe. 1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS 29 ENCART 4 – Groupe des lacets dans un graphe Soit G un graphe. Soit m un sommet de G et soit Lm (G) l’ensemble des lacets dans G basés en m. La concaténation munit Lm (G) d’une structure de monoïde. Déclarons deux lacets équivalents si l’on peut passer de l’un à l’autre par une suite d’insertions ou d’effacements de chemins de la forme ee−1 où e est une arête de G. Cette relation est compatible avec la concaténation et le quotient de Lm (G) par cette relation est un groupe. Appelons lacet réduit un lacet qui ne contient aucun sous-chemin de la forme ee−1 . Alors on démontre que chaque classe d’équivalence contient un unique lacet réduit, qui en est aussi l’unique élément de longueur minimale. On peut donc choisir de représenter chaque classe par son unique représentant réduit, et considérer comme opération de groupe l’opération de concaténation-réduction. On obtient le groupe des lacets réduits, noté RLm (G), qui est est canoniquement isomorphe au groupe fondamental π1 (M \ Y, m) où Y est une partie finie de M qui contient exactement un point dans chaque face de G. Le groupe RLm (G) est libre et la façon la plus simple d’en exhiber une base est de choisir un arbre couvrant de G et d’associer à chaque arête non couverte par cet arbre un lacet de RLm (G). Pour cela, à chaque arête e non couverte par l’arbre, on associe le lacet qui part de m, va à l’origine de e par l’unique chemin injectif entre m et e dans l’arbre, parcourt e, puis retourne à m par l’unique chemin injectif de e à m dans l’arbre. Notons v = #V, e = #E/2 et f = #F les nombres de sommets, d’arêtes non orientées et de faces de G. Notons également g le genre réduit de M (c’est-à-dire le genre réduit de la surface obtenue en recollant un disque le long de chaque composante du bord de M ) et p le nombre de composantes connexes du bord de M . Alors il y a e − v + 1 arêtes non couvertes par un arbre couvrant de G. La caractéristique d’Euler de M vaut d’une part 2 − g − p et d’autre part v − e + f. Ainsi, le nombre d’arêtes non couvertes par un arbre couvrant de G vaut g + p + f − 1. Le groupe RLm (G) est donc libre de rang g + p + f − 1. Sur un disque par exemple, ce nombre vaut f, le nombre de faces de G. On peut alors donner une, et même de nombreuses bases de ce groupe qui soient en bijection explicite avec l’ensemble des faces. Appelons lasso un lacet qui est de la forme sbs−1 , où s est un chemin issu de m et b est un lacet simple (c’est-à-dire injectif au fait près que ses deux extrémités sont confondues) basé en l’extrémité de s. La lacet b s’appelle la boucle du lasso. On dit qu’un lasso est facial si sa boucle est le bord d’une face de G. Pour un graphe sur un disque, il est possible de donner une base de RLm (G) formée de lassos faciaux, un pour chaque face de G, de telle façon que le produit de ces lassos dans un certain ordre soit un lasso dont la boucle est le bord du disque. Dans le cas général, on a le résultat suivant. On observera que, bien que RLm (G) soit libre, on préfère en donner une présentation qui contient une relation, de même par exemple que l’espace des suites réelles finies (a0 , . . . , an ) de somme nulle, bien que de dimension n, est plus aisément décrit comme le noyau d’une forme linéaire sur Rn+1 que comme l’image d’une application linéaire Rn → Rn+1 . Proposition 1.2.10 Soit M une surface connexe de genre réduit g avec un bord à p composantes connexes. Soit G un graphe sur M avec f faces. Soit m un sommet de G. Il existe g lassos a1 , . . . , ag , un mot w en g lettres et leurs inverses, p lassos c1 , . . . , cp , dont les boucles sont les p composantes du bord de M , et f lassos faciaux l1 , . . . , lf bordant les f faces de G tels que le groupe RLm (G) admette la présentation hai , cj , lk | w(a1 , . . . , ag )c1 . . . cp l1 . . . lf = 1i, et, pour toute fonction continue f : Gg+p+f → R, on ait Z f (h(a1 ), . . . , h(ag ), h(c1 ), . . . , h(cp ), h(l1 ), . . . , h(lf )) dh M(P (G),G) Z = f (x1 , . . . , xg , y1 , . . . , yp , z1 , . . . , zf−1 , zf )dxi dyj dzk , Gg+p+f où on a posé zf = (w(x1 , . . . , xg )c1 . . . cp z1 . . . zf−1 )−1 . Les lassos a1 , . . . , ag engendrent en particulier, avec la relation w(a1 , . . . , ag ) = 1, le groupe fondamental de la surface obtenue à partir de M en recollant un disque le long de chaque composante connexe du bord. 30 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] En présence de conditions au bord, les variables h(ci ) seraient uniformes sur les classes de conjugaison qui leur seraient assignées. Dans le cas présent, nous voyons que les variables h(l1 ), . . . , h(lf ) sont aussi indépendantes que le leur permet la topologie de M . Considérons une fonction multiplicative h : P(G) → G. Nous savons par la proposition 1.2.7 qu’à transformation de jauge près, h est caractérisée par sa restriction à Lm (G), où m est un sommet de G choisi arbitrairement. Il découle immédiatement de la multiplicativité de h que deux lacets équivalents au sens défini ci-dessus ont la même image par h. Ainsi, h détermine une application multiplicative de RLm (G) dans G, ce qui n’est rien d’autre qu’un homomorphisme de groupes de RLm (G) dans G. Nous pouvons écrire, un peu abstraitement, M(P(G), G)/J ' Hom(RLm (G), G)/Int(G), où Int(G) est le groupe des automorphismes intérieurs de G, c’est-à-dire ceux qui sont donnés par la conjugaison par un élément fixe de G, qui agit par composition à droite sur Hom(RLm (G), G). La mesure DFX,G M,vol détermine donc un homomorphisme aléatoire de RLm (G) dans G dont la loi est invariante par composition par un automorphisme intérieur. Un tel homomorphisme aléatoire est caractérisé par la loi de l’image d’une partie génératrice de RLm (G) et puisque le groupe RLm (G) est libre, on a tout intérêt à prendre pour partie génératrice une base, afin que ne pèse aucune contrainte de nature algébrique sur la loi de son image, à part le fait qu’elle soit invariante par conjugaison diagonale. Vu la description que nous avons donnée de RLm (G) et le processus de Lévy X sur G étant donné, l’homomorphisme aléatoire déterminé par la mesure DFX,G M,vol est le plus naturel possible. Sur un disque par exemple, il envoie les lassos l1 , . . . , lf de la base décrite par la proposition 1.2.10 sur des variables aléatoires indépendantes de loi respectivement égales à celles de Xvol(F1 ) , . . . , Xvol(Ff ) , où les faces ont été numérotées de telle sorte que la boucle du lasso li borde Fi . Sur des surfaces de genre supérieur, ou en présence de conditions au bord, les lois des images des lassos faciaux sont modifiées de la façon la plus naturelle possible. Par exemple, sur un disque avec condition au bord donnée par un élément x1 de G, on conditionne le processus X à atteindre la classe de conjugaison de x1 au temps égal à l’aire totale du disque, et les images de l1 , . . . , lf ont les lois des incréments de ce pont du processus X. Un autre exemple simple est celui de la sphère, où le processus X est conditionné à revenir à l’élément neutre au temps égal à l’aire totale de la sphère. On voit au passage que l’on trouve donc quelque chose qui ressemble beaucoup à ce qui se passe sur un disque avec condition au bord donnée par l’élément neutre. Enfin, on peut décrire par exemple ce qui se passe sur une surface fermée de genre réduit 4 : si le graphe G est assez fin, on peut choisir la base de telle sorte que le mot w en 4 lettres soit le mot aba−1 b−1 cdc−1 d−1 . Alors les lassos faciaux sont envoyés sur des variables ayant les lois des incréments du processus X conditionné à avoir, au temps égal à l’aire totale du tore, la loi de U V U −1 V −1 W ZW −1 Z −1 , où U, V, Z, W sont uniformes indépendantes sur G. Pour certains graphes, le mot w peut être différent, par exemple abcda−1 b−1 c−1 d−1 , mais on 1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS 31 vérifie que la loi de w(U1 , U2 , U3 , U4 ) où U1 , U2 , U3 , U4 sont uniformes et indépendantes sur G ne dépend pas du graphe G, mais seulement de la topologie de M . 1.2.6 Boucles de Wilson [L3] En marge de la progression vers la définition des champs d’holonomie markoviens, cette section présente un résultat qui concerne la théorie discrète que nous venons de décrire. Elle peut être ignorée sans dommage pour la compréhension de la construction principale. Soit G un graphe sur une surface M , bien qu’à vrai dire la surface ne joue ici aucun rôle. Sur l’espace M(P(G), G), les considérations de symétrie de jauge nous ont amené à introduire des fonctions de la forme h 7→ f (h(l1 ), . . . , h(ln )) où l1 , . . . , ln sont des lacets basés au même sommet et où f est invariante par conjugaison diagonale. Les propositions 1.2.7 et 1.2.10 permettent de vérifier que ces fonctions séparent les points de l’espace quotient M(P(G), G)/J . Elles engendrent donc, d’un point de vue physique, une bonne algèbre d’observables. Toutefois, dans l’étude des théories de jauge discrètes, les physiciens considèrent le plus souvent une algèbre plus petite d’observables, engendrée par des fonctions plus simples, les boucles de Wilson. Il s’agit de fonctions de la forme h 7→ f (h(l)) où l est un lacet et où f est invariante par conjugaison. La question naturelle qui se pose est de savoir si ces observables suffisent à engendrer toutes les fonctions continues sur l’espace quotient M(P(G), G)/J , c’est-à-dire, d’après le théorème de Stone-Weierstrass, si elles séparent les points. Soit h une fonction multiplicative. La question est la suivante : connaissant la classe de conjugaison de h(l) pour tout lacet l, connaît-on h à transformation de jauge près, c’est-à-dire, connaît-on la classe de conjugaison diagonale de (h(l1 ), . . . , h(ln )) pour tout n-uplets de lacets basés au même point ? Etant donné l1 , . . . , ln , nous avons accès à la classe de conjugaison de h(l1 ), . . . , h(ln ), mais aussi à celles de h(l1 l2 ) = h(l2 )h(l1 ), h(l1 l2 l3 ) = h(l3 )h(l2 )h(l1 ) ou de l’image par h de tout autre lacet qu’on peut former en concaténant des copies de l1 , . . . , ln . Nous avons donc accès à la classe de conjugaison de tout produit des éléments h(l1 ), . . . , h(ln ) de G. Il s’agit d’une question purement algébrique sur le groupe dans lequel la fonction h prend ses valeurs. Si ce groupe est SO(3), on peut poser la question de la manière suivante : étant donné n rotations r1 , . . . , rn de R3 , la connaissance de l’angle de toute rotation qu’on peut former en multipliant des éléments pris, avec répétition possible, dans l’ensemble {r1 , . . . , rn , r1−1 , . . . , rn−1 }, suffit-elle pour déterminer la position relative des axes de r1 , . . . , rn ? Dans ce cas précis, la réponse est positive. Théorème 1.2.11 ([L3, Proposition 3.4]) Soit G un produit fini de groupes pris dans la liste suivante : unitaire, spécial unitaire, orthogonal, spécial orthogonal, symplectique. Soit r ≥ 1 un entier. Soient g = (g1 , . . . , gr ) et g 0 = (g10 , . . . , gr0 ) deux éléments de Gr . Supposons que pour tout mot w en r lettres et leurs inverses, les éléments w(g) et w(g 0 ) de G soient conjugués. Alors il existe k ∈ G tel que pour tout i compris entre 1 et r on ait gi0 = kgi k −1 . 32 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] Ce théorème avait été démontré par B. Durhuus pour le groupe unitaire et spécial unitaire [Dur80] et par A. Sengupta pour les groupes unitaires et orthogonaux impairs [Sen94]. La preuve du théorème ci-dessus repose sur l’utilisation des spin networks, qui sont un ensemble de fonctions invariantes sur M(P(G), G) d’une nature différente et pour lesquelles il est immédiat de vérifier qu’elles engendrent une algèbre dense de fonctions [Bae96]. On démontre ensuite, en utilisant les théorèmes fondamentaux de la théorie des invariants, que ces spin networks peuvent s’exprimer en termes de boucles de Wilson. 1.2.7 Invariance par subdivision Reprenons le cours principal de la construction des champs d’holonomie markoviens. X,G La constante de normalisation ZM,vol qui apparaît dans la définition 1.2.5 et qui est, en présence de conditions au bord, une fonction de ces conditions, sera bien, comme la notation le suggère, un des noyaux de transition du champ d’holonomie associé à X que nous essayons de construire. Elle semble pourtant dépendre du graphe qu’on considère. Un premier résultat important affirme que ce n’est pas le cas. X,G Proposition 1.2.12 ([L7, Prop. 3.2.5, Prop. 4.1.10]) Le nombre ZM,vol , qui, en préX,G sence de conditions au bord, est une fonction de ces conditions ZM,vol (x1 , . . . , xp ), ne déX pend pas du graphe G et on la note ZM,vol (x1 , . . . , xp ). Si M est orientable de genre réduit g, alors on a l’expression explicite suivante : Z X −1 ZM,vol (x1 , . . . , xp ) = Qvol(M ) ([a1 , a2 ] . . . [ag−1 , ag ]c1 x1 c−1 1 . . . cp xp cp ) dai dck , G où l’on a noté [a, b] = aba−1 b−1 . Si M est non-orientable de genre g, alors Z X −1 ZM,vol (x1 , . . . , xp ) = Qvol(M ) (a21 . . . a2g c1 x1 c−1 1 . . . cp xp cp ) dai dck . G On voit ici apparaître des expressions qui rappellent les présentations classiques des groupes fondamentaux des surfaces. Ceci n’est pas surprenant si l’on pense que ces présentations peuvent être calculées à partir de modèles polygonaux des surfaces, dont on identifie les arêtes par paires, et que ces mêmes modèles polygonaux fournissent par ailleurs des graphes à une seule face sur les surfaces, dans lesquels on peut calculer la fonction de partition et obtenir presque directement les expressions ci-dessus. Nous voudrions maintenant regrouper toutes les mesures DFX,G M,vol en une unique mesure sur M(P(M ), G). Comme nous l’avons annoncé au début de la section 1.2.2, ceci ne fonctionne pas directement. D’une part, les mesures DFX,G M,vol ne suffisent pas à décrire toutes les lois marginales de dimension finie d’une mesure sur M(P(M ), G) : en général, un nombre fini de chemins, ou même un seul chemin, ne sont pas des chemins qu’on peut réaliser en concaténant des arêtes d’un graphe. Par exemple, un chemin même très régulier peut tout à fait avoir un complémentaire dans M constitué d’une infinité de composantes connexes. D’autre part, et c’est un autre aspect du même problème, l’ordre partiel naturel sur l’ensemble des graphes n’a pas la propriété requise pour appliquer un théorème analogue au théorème de Kolmogorov. L’ordre partiel est le suivant. 1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS 33 Définition 1.2.13 On dit qu’un graphe G2 est plus fin qu’un graphe G1 si E1 ⊂ P(G2 ) ou, ce qui revient au même, si P(G1 ) ⊂ P(G2 ). L’ensemble de tous les graphes ainsi partiellement ordonné n’est pas filtrant à droite, ce qui signifie qu’étant donné deux graphes, il n’en existe pas toujours un troisième qui soit simultanément plus fin que les deux premiers. On résout ces deux problèmes en restreignant temporairement la classe de chemins qu’on considère sur M . On souhaite considérer des chemins qui, comme les chemins affines par morceaux ou analytiques réels sur R2 par exemple, aient une propriété de rigidité qui empêche deux d’entre eux de s’intersecter de façon pathologique. La seule structure différentiable sur M ne permet pas de définir une telle classe. Il faut donc enrichir la structure de M en gardant à l’esprit que l’objet final doit être indépendant de cet enrichisement. Nous choisissons de munir M d’une structure riemannienne, que nous choisissons de telle sorte que le volume riemannien coïncide avec la mesure d’aire. On appelle alors A(M ) l’ensemble des chemins géodésiques par morceaux sur M , ou Aγ (M ) si l’on veut faire explicitement référence à une métrique riemannienne donnée γ. Etant donné deux graphes G1 et G2 tels que G2 soit plus fin que G1 , on dispose d’une application de restriction M(P(G2 ), G) → M(P(G1 ), G) induite par l’inclusion P(G1 ) ⊂ P(G2 ). Le résultat fondamental de la théorie est le résultat d’invariance par subdivision suivant. Il est démontré dans [L7], principalement à la proposition 4.3.4. Proposition 1.2.14 1. Soient G1 et G2 deux graphes tels que G2 soit plus fin que G1 . 2 Alors l’application de restriction M(P(G2 ), G) → M(P(G1 ), G) envoie la mesure DFX,G M,vol 1 sur la mesure DFX,G M,vol . 2. Soit γ une métrique riemannienne sur M . La famille des espaces de probabilités n o M(P(G), G), I, DFX,G : G graphe géodésique par morceaux M,vol est une famille cohérente. On peut en prendre la limite projective et obtenir un espace de probabilités (M(Aγ (M ), G), I, DFX M,vol ), de telle sorte que la loi marginale du processus canonique sur cet espace associée à un graphe à arêtes géodésiques par morceaux G soit la mesure DFX,G M,vol . C’est dans la preuve de cette propriété que la propriété de semi-groupe des lois unidimensionnelles de X joue son rôle. Illustrons cela sur un exemple. Considérons les deux graphes représentés à la figure 1.11. Le graphe G1 est obtenu à partir de G2 en retirant l’arête e. Dans G2 , cette arête est commune au bords de deux faces F1 et F2 , l’une bordée par le lacet e1 e2 e, l’autre par e−1 e3 e4 . Ces deux faces sont réunies dans G1 pour former une seule face F , bordée par le lacet e1 e2 e3 e4 . Soit f : M(P(G1 ), G) → R une fonction. Elle induit une fonction f˜ : M(P(G2 ), G) → R, telle que la valeur f˜(h) de f˜ sur une fonction multiplicative h ne dépende pas de la R 1 valeur de h(e). L’invariance par subdivision signifie que M(P(G1 ),G) f (h) DFX,G M,vol (dh) = R f˜(h) DFX,G2 (dh). Si nous choisissons une orientation de G2 (ce que nous avons M(P(G2 ),G) M,vol partiellement fait sur la figure), nous pouvons voir l’intégrale de gauche comme une inté+ + grale sur GE1 et celle de droite comme une intégrale sur GE2 . Il y a donc une variable en 34 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] e1 e4 F2 e F1 e4 e3 e3 e1 e2 F e2 G2 G1 Figure 1.11 – Enlever une arête à un graphe est l’opération élémentaire la plus importante qui permet de passer d’un graphe plus fin à un graphe moins fin. plus dans l’intégrale de droite, qui correspond à l’arête e. Or précisément la fonction f˜ ne 2 dépend pas de cette variable. Seule la densité de DFX,G M,vol en dépend, par le biais des deux termes associés R aux deux faces bordées par e : il y a dans l’intégrale de droite un terme de la forme . . . Qvol(F1 ) (h(e)h(e2 )h(e1 ))Qvol(F2 ) (h(e4 )h(e3 )h(e)−1 ) . . . d(h(e1 )) ce qui, en renommant x1 , x2 , x3 , x4 , x les variables h(e1 ), h(e2 ), h(e3 ), h(e4 ), h(e) et en tenant compte de l’invariance par conjugaison de Q, se réécrit plus suggestivement Z . . . Qvol(F1 ) (x2 x1 x)Qvol(F2 ) (x−1 x4 x3 ) . . . dx. La propriété de semi-groupe de convolution de Q permet d’intégrer par rapport à x pour faire apparaître le terme Qvol(F1 )+vol(F2 ) (x2 x1 x4 x3 ) = Qvol(F ) (x4 x3 x2 x1 ), qui est exactement 2 le terme correspondant à F dans la densité de DFX,G M,vol . Une fois l’invariance par subdivision établie, on peut appliquer un théorème de Kolmogorov, dans une version qui n’est pas tout à fait classique du fait de la taille de l’espace des indices, mais pour laquelle la compacité de G fait plus que compenser cette petite difficulté et permet même une preuve légèrement plus simple que celle de la version la plus fréquente adaptée à des processus réels indexés par le temps. 1.2.8 Extension aux lacets rectifiables Nous disposons maintenant, au prix d’un supplément artificiel de struture sur M , d’un processus à valeurs dans G indexé par les lacets géodésiques par morceaux. Pour passer des lacets géodésiques par morceaux aux lacets rectifiables, nous allons procéder par approximation, ce pour quoi il faut commencer par munir P(M ) d’une topologie convenable. ENCART 5 – Topologie sur l’espace des chemins La donnée d’une métrique riemannienne sur M en fait un espace métrique (M, d) et permet de mesurer les longueurs des chemins rectifiables. Nous noterons `(c) la longueur du chemin c. Nous définissons une distance sur P(M ) en posant, pour tous chemins c, c0 paramétrés à vitesse constante par [0, 1], d` (c, c0 ) = max{d(c(t), c0 (t)) : t ∈ [0, 1]} + |`(c) − `(c0 )|. 1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS 35 La topologie de l’espace métrique (P(M ), d` ) ne dépend pas de la métrique riemannienne qu’on a choisie sur M . Cette distance est assez facile à manier, mais elle a l’inconvénient que l’espace (P(M ), d` ) n’est jamais complet. En effet, il est facile de construire une suite de chemins de longueur 2 qui converge uniformément (mais en faisant des zigzag) vers un segment géodésique de longueur 1. En fait, il existe une autre distance sur P(M ), complète et qui métrise la même topologie que d` . Il s’agit d’une variante de la distance en 1-variation qui sur R2 par exemple s’écrit Z 1 |ċ(t) − ċ0 (t)| dt. d1 (c, c0 ) = max{d(c(t), c0 (t)) : t ∈ [0, 1]} + 0 Cette distance est toutefois beaucoup moins pratique à manier que la distance d` et elle nous intéresse surtout dans la mesure où elle métrise la topologie que nous considérons de façon complète. La plupart du temps, à cause de l’invariance par transformations de jauge, nous considérerons des convergences à extrémités fixées : nous dirons qu’une suite (cn )n≥0 de chemins converge vers un chemin c à extrémités fixées si d` (cn , c) tend vers 0 et si pour tout n ≥ 0, le chemin cn a les mêmes extrémités que c. L’ensemble A(M ) des chemins géodésiques par morceaux est bien entendu dense dans P(M ) pour la convergence à extrémités fixées. Pour définir une mesure sur M(P(M ), G), il nous faut donc deux choses : une propriété de régularité de la mesure DFX M,vol sur M(A(M ), G) et un théorème d’extension. Commençons par la première. Rappelons que dG est la distance riemannienne sur G pour une métrique bi-invariante. Proposition 1.2.15 Considérons la mesure DFX M,vol sur M(A(M ), G). Il existe K > 0 tel que pour tout lacet simple l ∈ A(M ) bordant un disque D et tel que `(l) < K −1 , on ait Z p dG (1, h(l)) DFX (dh) ≤ K vol(D). M,vol M(A(M ),G) Cette propriété, qui exprime que l’holonomie le long du bord d’un petit disque est proche de l’élément neutre, ne peut venir que d’une propriété analogue du processus de Lévy X. Proposition 1.2.16 ([Lia04, Lemma 3.5]) Soit X = (Xt )t≥0 un processus de Lévy issu de l’élément neutre sur G. Il existe une constante K telle que √ ∀t ≥ 0, E[dG (1, Xt )] ≤ K t. Pour utiliser cette propriété de régularité de DFX M,vol , nous allons considérer le groupe Γ de toutes les variables aléatoires à valeurs dans G définies sur l’espace de probabilités (M(A(M ), G), DFX M,vol ). Ce groupe est muni d’une distance δ définie par la formule ∀S, T ∈ Γ, δ(S, T ) = E[dG (S, T )]. La paire (Γ, δ) est un groupe topologique métrique complet sur lequel les propriétés d’invariance de dG entraînent que les translations et l’inversion sont des isométries. Nous allons considérer le processus canonique sur (M(A(M ), G), DFX M,vol ) comme une fonction multiplicative de A(M ) dans Γ : à chaque chemin c est associée la variable 36 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] aléatoire Hc définie par Hc (h) = h(c). La propriété de régularité énoncée à la proposition 1.2.15 peut se réécrire p δ(1, Hl ) ≤ K vol(D). Nous appliquons alors le théorème suivant. Théorème 1.2.17 ([L7, Theorem 3.3.1]) Soit M une surface munie d’une métrique riemannienne dont on note vol le volume riemannien. Soit (Γ, δ) un groupe métrique complet sur lequel les translations et l’inversion sont des isométries. Soit H ∈ M(A(M ), Γ) une fonction multiplicative. Supposons qu’il existe K > 0 telle que pour tout lacet simple −1 l ∈ p A(M ) bordant un disque D et tel que `(l) < K , on ait l’inégalité δ(1, H(l)) ≤ K vol(D). Alors H admet une unique extension, toujours notée H, appartenant à M(P(M ), Γ) telle que pour toute suite (cn )n≥0 de chemins convergeant à extrémités fixées vers un chemin c, on ait convergence de H(cn ) vers H(c). La fonction multiplicative H : P(M ) → Γ détermine, à rebours de ce que nous avons fait quelques lignes plus haut, une mesure de probabilités sur M(P(M ), G), que nous notons HFX M,vol . Le théorème suivant, dont la preuve est malheureusement assez peu agréable, garantit que nous avons atteint notre but. Théorème 1.2.18 ([L7, Proposition 3.4.1]) La mesure HFX M,vol ne dépend pas du choix de la métrique riemannienne sur M . De plus, pour tout graphe G sur M , dont les arêtes ne sont pas nécessairement géodésiques par morceaux pour quelque métrique que ce soit, X la loi marginale de HFX M,vol associée à P(G) est la mesure DFM,vol . ENCART 6 – L’inégalité de Banchoff-Pohl [BP72, Vog81] Nous allons donner une autre application du théorème 1.2.17, dans un cadre plus habituel. Plaçons-nous dans R2 et rappelons que nous avons défini, pour tout lacet continu l : [0, 1] → R2 , la fonction nl hors de l’image de l (voir l’équation (1.1)). Considérons la métrique euclidienne usuelle sur R2 et notons A(R2 ) l’ensemble des chemins affines par morceaux. Si le lacet l est affine par morceaux, son complémentaire n’a qu’un nombre fini de composantes connexes et la fonction nl , localement constante, ne prend qu’un nombre fini de valeurs. Elle est donc bornée et à support compact, et donc en particulier de carré intégrable. À tout chemin c affine par morceaux, associons le lacet obtenu en concaténant à c des segments qui relient l’origine de R2 à chacune de ses extrémités et notons par abus nc la fonction associée à ce lacet. Avec cette notation et au vu de la remarque précédente, on vérifie immédiatement que l’application c 7→ nc est une fonction multiplicative (ou plutôt, en l’occurence, additive) n : A(R2 ) → L2 (R2 ). p Si l est un lacet simple qui borde un disque D, on a l’égalité knl kL2 = aire(D). Pour être tout à fait dans le cadre d’application du théorème, il nous faudrait nous restreindre à un disque compact du plan, mais nous prendrons ce disque suffisamment grand pour ne pas avoir à nous en préoccuper. Nous pouvons donc affirmer que la fonction c 7→ nc se prolonge en une fonction continue de P(R2 ) dans L2 (R2 ). En particulier, nous en déduisons que pour tout lacet rectifiable l, la fonction nl est de carré intégrable. De plus, elle dépend continûment (au sens de L2 ) du lacet l (au sens de la convergence pour la distance d` ou la distance en 1-variation). 1.3. CHAMPS D’HOLONOMIE MARKOVIENS 37 Le fait que nl soit de carré intégrable pour tout lacet rectifiable est connu, et quantifié par l’inégalité de Banchoff-Pohl, qui généralise l’inégalité isopérimétrique usuelle en affiramant que knl k2L2 ≤ 1.3 1.3.1 1 `(l)2 . 4π (1.7) Champs d’holonomie markoviens Définition La construction qui aboutit à la définition de la mesure HFX M,vol se place exclusivement sur une surface, avec éventuellement un jeu de conditions au bord fixées dès le départ. Pour passer à la définition des champs d’holonomie markoviens, il ne nous manque plus qu’une petite étape où nous allons considérer simultanément toutes les surfaces possibles et les opérations de découpage et de recollement. Pour donner une définition précise, il nous faut donc donner un cadre un peu plus formel aux conditions au bord et au recollement de deux surfaces. Lorsqu’on recolle deux surfaces le long de deux composantes de leur bord, le long desquelles on avait imposé des conditions compatibles, on obtient une surface plus grande mais sur laquelle reste, comme une cicatrice de cette opération, une courbe le long de laquelle le champ est contraint. Ceci nous amène à définir une surface marquée. Définition 1.3.1 Une surface marquée est une paire (M, C ), où M est une surface et où C est un ensemble fini de sous-variétés lisses de dimension 1 deux à deux disjointes de l’intérieur de M . Les éléments de C sont orientés et on suppose que chaque élément de C apparaît dans C avec les deux orientations possibles. Figure 1.12 – Une surface marquée par trois courbes. On note B(M ) l’ensemble des composantes connexes du bord de M , chacune prise avec les deux orientations possibles. On note Conj(G) l’ensemble des classes de conjugaison de G. Notons que l’inverse d’une classe de conjugaison est encore une classe de conjugaison. Définition 1.3.2 On appelle ensemble de G-contraintes sur (M, C ) une application C : C ∪ B(M ) → Conj(G) telle que pour tout N ∈ C ∪ B(M ), et avec la notation N −1 pour la même courbe orientée dans l’autre sens, on ait C(N −1 ) = C(N )−1 . 38 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] Soit (M, C ) une surface marquée et soit l ∈ C une marque. On note Spll (M ) la surface, non nécessairement connexe, obtenue en coupant M le long de l. Cette surface est naturellement munie d’une application de recollement ψ : Spll (M ) → M . Les marques de M autres que l (resp. une mesure d’aire sur M , resp. un ensemble de Gcontraintes sur (M, C )) déterminent des marques sur Spll (M ), notées Spll (C ) (resp. une mesure d’aire notée Spll (vol) sur Spll (M ), un ensemble de G-contraintes noté Spll (C) sur (Spll (M ), Spll (C ))). Soit (M, C , C) une surface marquée munie d’un ensemble de G-contraintes, soit l ∈ C une marque et soit x un élément de G. On note Cl→x l’ensemble de G-contraintes qui coïncide avec C sur toutes les marques sauf l et l−1 et tel que C(l) soit la classe de conjugaison de x. Nous pouvons enfin donner la définition principale. Définition 1.3.3 (Champ d’holonomie markovien. [L7, Definition 3.1.2]) Soit G un groupe de Lie compact. Un champ bidimensionnel markovien d’holonomie à valeurs dans G est la donnée, pour chaque quadruplet (M, vol, C , C) formé d’une surface marquée munie d’une mesure d’aire et d’un ensemble de G-contraintes, d’une mesure finie HFM,vol,C ,C sur (M(P(M ), G), I), de telle sorte que les sept propriétés suivantes soient vérifiées. A1 . Pour tout (M, vol, C , C), on a HFM,vol,C ,C (∃l ∈ C ∪ B(M ) : h(l) ∈ / C(l)) = 0. A2 . Pour tout (M, vol, C ) et pour tout évènement Γ ∈ I, la mesure HFM,vol,C ,C (Γ) est une fonction mesurable de C. A3 . Pour tout (M, vol, C , C) et pour tout l ∈ C , on a Z HFM,vol,C ,Cl→x dx. HFM,vol,C \{l,l−1 },C|B(M )∪C \{l,l−1 } = G A4 . Si ψ : (M, vol, C , C) → (M 0 , vol0 , C 0 , C 0 ) est un difféomorphisme qui préserve toutes les structures que nous considérons, alors l’application induite ψ : M(P(M 0 ), G) → M(P(M ), G) vérifie HFM,vol,C ,C = HFM 0 ,vol0 ,C 0 ,C 0 ◦ ψ −1 . A5 . Pour tous (M1 , vol1 , C1 , C1 ) et (M2 , vol2 , C2 , C2 ), on a HFM1 ∪M2 ,vol1 ∪vol2 ,C1 ∪C2 ,C1 ∪C2 = HFM1 ,vol1 ,C1 ,C1 ⊗ HFM2 ,vol2 ,C2 ,C2 . A6 . Pour tout (M, vol, C , C) et tout l ∈ C , notant ψ : Spll (M ) → M l’application de recollement, on a HFSpll (M ),Spll (vol),Spll (C ),Spll (C) = HFM,vol,C ,C ◦ ψ −1 . A7 . Pour tout (M, vol, ∅, C) et tout l ∈ B(M ), on a Z HFM,vol,∅,Cl→x (1) dx = 1. G 1.3. CHAMPS D’HOLONOMIE MARKOVIENS 39 Les axiomes A1 , A2 et A3 concernent les conditions au bord : ils garantissent que les mesures HFM,vol,C ,C , lorsque les marques et les contraintes varient, sont bien des désintégrations les unes des autres au sens où on s’attend qu’elles le soient. L’axiome A4 assure que la mesure HFM,vol,C ,C ne dépend pas de plus de structure que ce que nous avons considéré. Rappelons qu’un théorème classique de Moser assure que si deux surfaces difféomorphes munies de mesures d’aire ont même aire totale, alors il existe un difféomorphisme de l’une sur l’autre qui préserve les aires. On peut raffiner ce résultat en présence de marques (voir la proposition 1.4.3 dans [L7]). L’axiome A5 concerne les réunions disjointes de surfaces et permet de se restreindre au cas de surfaces connexes. L’axiome A6 est la propriété de Markov proprement dite. Il englobe toutes les situations possibles eu égard à la connexité et à l’orientabilité de la surface qu’on obtient en coupant M le long de l. Nous mentionnons l’orientabilité car il peut arriver qu’une surface nonorientable devienne orientable lorsqu’on la coupe le long d’une courbe, par exemple un ruban de Möbius le long d’un équateur. Enfin l’axiome A7 est un axiome de normalisation. Sans lui, étant donné un champ HF, nous pourrions pour tout α réel non nul définir un autre champ eαvol(M ) HFM,vol,C ,C . 1.3.2 Existence et classification partielle Nous allons maintenant énoncer nos deux résultats principaux qui sont un résultat d’existence et un résultat de classification. L’ordre naturel pour énoncer et prouver ces résultats est de commencer par le résultat de classification. Il est très important de se souvenir que les mesures HFM,vol,C ,C sont des mesures finies et non pas des mesures de probabilité. Les noyaux de transition, dont nous avons déjà longuement parlé, ne sont autres que les masses de ces mesures. Définition 1.3.4 Soit HF un champ d’holonomie markovien. Soient p, g des entiers naturels et t un réel strictement positif. Soient x1 , . . . , xp des éléments de G. Soit M une surface orientée de genre réduit g dont le bord a p composantes connexes. Soit vol une mesure d’aire sur M d’aire totale t. Soit enfin C l’ensemble de conditions au bord qui aux composantes de M orientées positivement et arbitrairement ordonnées associe les classes de conjugaison de x1 , . . . , xp . On définit alors + Zp,g,t (x1 , . . . , xp ) = HFM,vol,∅,C (1). Supposons maintenant g ≥ 1. Soit M 0 une surface non-orientable de genre réduit g dont le bord a p composantes connexes. Soit vol une mesure d’aire sur M d’aire totale t. Soit enfin C l’ensemble de conditions au bord qui aux composantes de M arbitrairement orientées et ordonnées associe les classes de conjugaison de x1 , . . . , xp . On définit alors − Zp,g,t (x1 , . . . , xp ) = HFM 0 ,vol,∅,C (1). Les fonctions ainsi définies s’appellent les fonctions de partition du champ d’holonomie. On démontre que ces fonctions satisfont la première partie de la proposition 1.1.7 : elles sont toutes déterminées par les fonctions associées au disque et à la sphère à trois trous. 40 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] L’axiome A7 garantit que chaque fonction de partition est, par rapport à chacune de ses variables et pour toute valeur des autres, la densité d’une mesure de probabilités sur + G. En particulier, la famille de mesures (Z1,0,t (x) dx)t>0 est une famille à un paramètre de mesures de probabilités sur G. Pour l’étudier, et plus généralement pour étudier les champs d’holonomie que nous venons de définir, il est nécessaire de faire quelques hypothèses de régularité. Définition 1.3.5 Soit HF un champ d’holonomie markovien. On dit que HF est régulier si les deux conditions suivantes sont vérifiées. 1. Pour tout (M, vol, C , C), et pour toute suite (cn )n≥0 de chemins sur M qui converge à extrémités fixées vers c, on a Z dG (h(cn ), h(c)) HFM,vol,C ,C (dh) −→ 0. M(P(M ),G) n→∞ 2. Pour tout (M, vol, C ), la fonction (t, C) 7→ HFM,tvol,C ,C (1) est continue. Pour un champ d’holonomie régulier, la deuxième partie de la proposition 1.1.7 est + vraie : toutes les fonctions de partition sont déterminées par les Z1,0,t . Le théorème suivant éclaire leur structure et classifie en partie les champs d’holonomie aléatoires. Théorème 1.3.6 ([L7, Proposition 4.2.1]) Soit HF un champ d’holonomie markovien + régulier. Alors les mesures de probabilités (Z1,0,t (x) dx)t>0 sur G sont les lois marginales unidimensionnelles d’un processus de Lévy invariant par conjugaison issu de l’élément neutre. Ce processus de Lévy, qui est dit associé à HF, en détermine toutes les fonctions de partition. Il est admissible au sens de la définition 1.2.4. Il est tentant de penser que ce processus de Lévy détermine tout le champ d’holonomie, mais, sauf quand le groupe G est abélien, cela ne semble pas facile à démontrer. En revanche, la construction que nous avons détaillée dans les sections précédentes permet d’établir le théorème d’existence suivant. Théorème 1.3.7 ([L7, Theorem 4.3.1]) Tout processus de Lévy admissible sur un groupe de Lie compact est associé à un champ d’holonomie markovien régulier. Ce théorème, sans doute le plus important de tout ce chapitre, est l’aboutissement de mes travaux visant à améliorer et à généraliser la construction de la mesure de Yang-Mills. Sa preuve occupe l’essentiel de la monographie [L7]. 1.3.3 Le champ de Yang-Mills Parmi tous les processus de Lévy admissibles sur un groupe de Lie connexe, le mouvement brownien joue un rôle particulier. Le champ d’holonomie qu’on construit en partant du mouvement brownien a un nom : c’est le champ de Yang-Mills. C’est le premier à avoir été construit et c’est celui qui est utilisé par les physiciens dans la théorie quantique des champs. Nous reviendrons sur ce champ particulier dans le chapitre suivant, où nous 1.3. CHAMPS D’HOLONOMIE MARKOVIENS 41 examinerons, sous la forme d’un principe de grandes déviations, les liens entre l’objet que nous avons construit et les expressions que les physiciens manipulent avec tant de succès. Dans cette section, nous donnons une description simple de ce champ, analogue à celle du processus de Poisson indexé par les lacets (voir section 1.1.1), lorsque le groupe G est abélien, c’est-à-dire, puisque nous supposons G compact et connexe, lorsque G = U (1)n pour un certain n ≥ 0. Ce cas a été le premier compris et les premiers travaux pour des groupes plus généraux ont procédé en se ramenant à une situation analogue au cas abélien. Par souci de simplicité, nous nous restreignons dans ce qui suit au cas n = 1. Plaçons-nous pour commencer dans le plan R2 . Soit W un bruit blanc sur R2 , c’està-dire une isométrie de L2 (R2 ) dans un espace de variables aléatoires réelles gaussiennes centrées. De façon équivalente, W est le processus gaussien indexé par L2 (R2 ) dont la fonction de covariance est donnée par le produit scalaire L2 . Nous notons W (f ) la variable gaussienne associée à une fonction f de carré intégrable sur R2 . Par analogie avec la définition 1.1.1, nous associons à chaque lacet l la variable aléatoire Bl = eiW (nl ) . (1.8) Cette définition n’a de sens que si la fonction nl est de carré intégrable. Nous avons discuté ce point plus haut et indiqué que l’inégalité de Banchoff-Pohl nous le garantissait lorsque le lacet l est de longueur finie (voir l’équation (1.7) et la discussion qui précède). 2 Si nous nous restreignons à un disque D contenu dans R R , la famille de variables (Bl )l∈L(D) ainsi définie a la loi de (Hl )l∈L(D) sous la mesure U (1) HFD,vol,∅,∂D7→x dx, où HF est le champ d’holonomie associé au mouvement brownien que l’on intègre ici par rapport à la condition au bord. Notons que, d’après l’axiome A7 , cette mesure est bien une mesure de probabilités. Pour pouvoir mettre une condition au bord spécifique sur le disque D, introduisons une variante de la fonction nl en posant Z 1 0 nl = nl − nl dvol, vol(D) D c’est-à-dire en retirant sa moyenne à nl . Si nous définissons, pour tout lacet rectifiable l 0 dans D, Bl0 = eiW (nl ) , nous obtenons un processus indexé par L(D) qui ressemble au pro0 cessus B et qui vérifie B∂D = 1 presque sûrement. Toutefois, la loi de (Bl0 )l∈L(D) n’est pas + égale à celle du processus canonique sous la mesure normalisée Z1,0,vol(D) (1)−1 HFD,vol,∅,∂D7→1 . Pour nous en rendre compte, recommençons dans le contexte présent la construction du processus (Nlt )t≥0 que nous avions faite pour le processus de Poisson (voir la proposition 1.1.3). Supposons pour fixer les idées que D soit le disque de rayon √1π centré en l’ori√ gine et appelons, pour tout t ∈ [0, 1], lt le cercle centré en l’origine de rayon √πt . Alors la fonction n0lt vaut 1 − t dans le disque bordé par lt et −t à l’extérieur. On en déduit immédiatement que pour tous s, t ∈ [0, 1], hn0ls , n0lt iL2 (D,vol) = min(s, t) − st. Ainsi, le processus réel (W (n0lt ))t∈[0,1] est un pont brownien de 0 à 0 de longueur 1, et le processus (Bl0t )t∈[0,1] est l’exponentielle de (i fois) ce pont. Or ce processus n’est pas 42 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] markovien. En effet, ses trajectoires sont toutes homotopiquement triviales dans le cercle U (1) : c’est le pont de 1 à 1 de longueur 1 du mouvement brownien sur U (1) conditionné par le fait que ses trajectoires sont homotopes au lacet constant. Ce conditionnement n’est pas singulier, mais détruit la propriété de Markov. Le pont de longueur 1 du mouvement brownien sur U (1) est l’exponentielle du mouvement brownien sur R conditionné non pas à revenir en 0, mais à aboutir en un point de 2πZ. Sa valeur finale est alors une certaine variable aléatoire T dont la loi est donnée par ∀k ∈ Z, P(T = 2kπ) ∝ e−2k 2 π2 . (1.9) Une meilleure définition consiste alors à prendre une variable aléatoire TR dont la loi est 1 n dvol, puis celle décrite ci-desus, indépendante du bruit blanc W , à poser n̄l = vol(D) D l (1) Bl = ei(W (nl )+n̄l T ) . 0 Le processus B (1) ainsi défini a bien la loi du processus canonique sous la mesure normalisée + Z1,0,vol(D) (1)−1 HFD,vol,∅,∂D7→1 . Pour définir le champ sur des surfaces plus générales que le disque, il faut parvenir à y étendre la définition de la fonction n0l et du nombre n̄l . Une telle extension est possible au prix de certains choix. Soit M une surface orientée de genre réduit g. Notons N1 , . . . , Np les composantes connexes de son bord, orientées positivement. Soit C1 , . . . , Cg une famille de courbes lisses orientées sur M (il suffit qu’elles soient rectifiables) qui déterminent une base du premier groupe d’homologie de la surface obtenue en fermant M , c’est-à-dire en recollant un disque le long de chaque composante du bord de M . Alors les classes de N1 , . . . , Np , C1 , . . . , Cg engendrent H 1 (M, Z) avec la relation [N1 ] + . . . + [Np ] = 0. Soit mainenant l un lacet sur M . Sa classe d’homologie se décompose de façon unique sous la forme g p−1 X X [l] = ζi [Ci ] + νj [Nj ], i=1 j=1 où les ζi et les νj sont des entiers. Le cycle ⊥ l =l− g X i=1 ζi Ci − p−1 X νj Nj j=1 est donc homologue à 0. Il existe alors une unique fonction de moyenne nulle sur M localement constante sur le complémentaire de l’image de l⊥ qui varie de 1 ou −1 à chaque traversée de l⊥ , suivant l’orientation de l et de la surface. Cette description n’est bien entendu valide que si l est suffisamment régulier mais nous n’entrerons pas dans le détail technique de la définition. Nous noterons n0l⊥ cette fonction. Les valeurs qu’elle prend sont toutes égales modulo 1 et nous notons −n̄l la classe de R/Z correspondante. On vérifie aisément que cette notation est cohérente avec le cas du disque étudié plus haut. Nous pouvons maintenant définir un processus indexé par les lacets sur une surface quelconque. Nous utilisons les notations du paragraphe ci-dessus. 1.3. CHAMPS D’HOLONOMIE MARKOVIENS 43 Définition 1.3.8 Soit (M, vol, ∅, C) une surface mesurée avec des conditions au bord. Notons x1 , . . . , xp les conditions au bord le long de N1 , . . . , Np . Posons x = x1 . . . xp . Soit W un bruit blanc sur (M, vol), c’est-à-dire une isométrie de L2 (M, vol) dans un espace gaussien réel. Soit T une variable aléatoire à valeurs dans {t ∈ R : eit = x}, indépendante de W et dont la loi est donnée par t2 ∀t ∈ R, eit = x, P(T = t) ∝ e− 2vol(M ) . Soient U1 , . . . , Ug des variables i.i.d. de loi uniforme sur U (1), indépendantes de W et T . Pour tout lacet l ∈ L(M ), nous posons (x1 ,...,xp ) Bl 0 = eiW (nl⊥ ) ein̄l T U1ζ1 . . . Ugζg xν11 . . . xνpp . (1.10) Théorème 1.3.9 ([L2, Theorem 3.2]) Le processus B (x1 ,...,xp ) ainsi défini a la loi du + −1 processus canonique sous la mesure normalisée Zp,g,vol(M ) (x1 , . . . , xp ) HFM,vol,∅,C . Dans le cas abélien, la structure du champ d’holonomie associé au mouvement brownien est donc celle d’un bruit blanc auquel s’ajoute un aléa fini-dimensionnel. Il est par exemple possible de reconstruire un bruit blanc à partir du champ d’holonomie aléatoire. Ceci indique, incidemment, que la mesure d’aire est entièrement codée dans le champ d’holonomie. Nous discuterons dans le chapitre suivant l’intérêt et la signification de la définition (1.10) lorsqu’on y substitue à la variable T une valeur déterministe t telle que eit = x. 1.3.4 Lien avec les théories topologiques des champs quantiques Nous avons présenté la définition des champs d’holonomie aléatoire (définition 1.3.3) comme une généralisation de la définition des processus de Markov usuels, indexés par des intervalles de temps. Dans cette section, nous allons détailler une autre analogie, entre cette définition et celle d’une théorie topologique des champs quantiques (abrégée en TQFT, pour topological quantum field theory), due à M. Atiyah. ENCART 7 – Théories topologiques des champs quantiques [Ati88] Soit n ≥ 0 un entier. Il existe une catégorie, notée Cobn , dont les objets sont les variétés différentiables compactes orientées sans bord de dimension n et dont les morphismes sont donnés par les cobordismes : si N1 et N2 sont deux variétés orientées de dimension n, Hom(N1 , N2 ) est l’ensemble des variétés orientées de dimension n + 1 dont le bord est muni d’un difféomorphisme avec la réunion disjointe de N1∗ et N2 , où on a noté N1∗ la variété obtenue à partir de N1 en renversant l’orientation. Par ailleurs, il existe une catégorie, beaucoup plus familière, notée Vect, dont les objets sont les espaces vectoriels complexes de dimension finie et dont les morphismes sont les applications linéaires. Une TQFT de dimension n + 1 est un foncteur covariant de Cobn dans Vect, qu’on note en général Z pour rappeler que cette définition a été initialement donnée comme un cadre général pour les fonctions de partition de certaines théories quantiques ou statistiques des champs. Ainsi, par définition, Z associe à toute variété N de dimension n un espace vectoriel Z(N ) et à toute variété M de dimension n + 1 munie d’un difféomorphisme entre son bord et la réunion disjointe N1∗ t N2 de deux variétés de dimension n, une application linéaire Z(M ) : Z(N1 ) → Z(N2 ). Ce foncteur doit de plus satisfaire un certain nombre de propriétés naturelles. 1. Il doit être multiplicatif : si N1 et N2 sont deux variétés de dimension n, on demande que Z(N1 tN2 ) = 44 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] n=0 n=1 Figure 1.13 – Deux exemples de cobordismes, en dimensions n + 1 = 1 et n + 1 = 2. Z(N1 ) ⊗ Z(N2 ) (le produit tensoriel des espaces vectoriels) et, pour tous M1 et M2 de dimension n + 1, que Z(M1 t M2 ) = Z(M1 ) ⊗ Z(M2 ) (le produit tensoriel des applications linéaires). 2. Il doit également être involutif : pour toute variété N de dimension n, on demande que Z(N ∗ ) = Z(N )∗ (l’espace vectoriel dual), et pour toute variété M de dimension n, que Z(M ∗ ) = Z(M )∗ (l’application linéaire adjointe). 3. Il doit également se comporter de façon naturelle vis-à-vis des compositions de cobordismes : si M1 réalise un cobordisme entre N1 et N2 , et M2 un cobordisme entre N2 et N3 , et si M est obtenue en recollant M1 et M2 le long de N2 , alors on demande que Z(M ) = Z(M2 ) ◦ Z(M1 ). M1 M2 Z(M1 ) Z(M2 ) Z(S 1 )⊗4 −→ Z(S 1 )⊗5 −→ Z(S 1 )⊗2 Figure 1.14 – Composition de deux cobordismes en dimension 2. On peut reformuler cet axiome de façon plus générale en changeant très légèrement de point de vue. En identifiant l’espace des applications linéaires de Z(N1 ) dans Z(N2 ) avec Z(N1 )∗ ⊗ Z(N2 ) = Z(N1∗ t N2 ), on peut dire que l’application linéaire Z(M ) est un élément de l’espace vectoriel Z(∂M ). Alors on demande que la propriété suivante soit vérifiée. 3’. Si le bord de M s’écrit N1 t N1∗ t N2 et si M 0 est obtenue à partir de M en recollant les deux copies de N1 , on ait Z(M 0 ) = κ(Z(M )), où κ : Z(N1 )∗ ⊗ Z(N1 ) ⊗ Z(N2 ) → Z(N2 ) est la contraction naturelle des deux premiers facteurs. 4. Enfin, on demande que Z se comporte bien vis-à-vis des difféomorphismes préservant l’orientation des variétés de dimension n et n + 1, c’est-à-dire qu’à des variétés de dimension n difféomorphes soient associés des espaces vectoriels isomorphes et à des cobordismes difféomorphes soient associées des applications linéaires conjuguées par les isomorphismes linéaires associés aux difféomorphismes induits sur les bords. 1.3. CHAMPS D’HOLONOMIE MARKOVIENS 45 N1 N2 N1∗ M N2 M0 Figure 1.15 – Recollement de deux composantes du bord d’une surface. La condition de multiplicativité impose par exemple que si ∅ désigne la variété vide de dimension n, on ait Z(∅) = Z(∅) ⊗ Z(∅). Ainsi, Z(∅) est soit l’espace vectoriel nul soit l’espace vectoriel C. On supposera, pour éviter des situations triviales que Z(∅) = C. Alors, pour toute variété M de dimension n + 1 sans bord, Z(M ) est une application linéaire de C dans lui-même, c’est-à-dire un nombre complexe. Si N est une variété de dimension n, Z(N × [0, 1]) est un endomorphisme de Z(N ). Puisque le cylindre N × [0, 1] est difféomorphe à deux copies du même cylindre mises bout à bout et recollées, on a Z(N × [0, 1]) = Z(N × [0, 2]) = Z(N × [0, 1]) ◦ Z(N × [0, 1]). Ainsi, Z(N × [0, 1]) est un projecteur de Z(N ) et on ne restreint pas la généralité en supposant que ce projecteur est l’identité. Alors, en recollant les deux bouts et en utilisant la propriété 30 , on trouve que Z(N × S 1 ), où S 1 est le cercle, est la contraction naturelle de Z(N × [0, 1]), l’identité de Z(N ) vue comme élément de Z(N )∗ ⊗ Z(N ), c’est-à-dire la trace de cette application linéaire, c’est-à-dire encore la dimension de Z(N ). Dans le cadre qui nous intéresse, il faut modifier légèrement la définition d’une TQFT pour y incorporer la notion de volume, ou d’aire puisque nous nous intéresserons au cas n + 1 = 2. On remplacera donc partout les variétés orientées de dimension n + 1 par des variétés munies d’une mesure de n + 1-volume, dont le seul invariant à difféomorphisme près est, d’après un théorème de Moser, le volume total. Nous ne modifions donc que les objets de la catégorie Cobn . Les axiomes 1 à 4 sont inchangés. L’objet qu’on obtient s’appelle une théorie topologique des champs quantiques dépendant du volume (disons : une v-TQFT). Pour M de dimension n + 1, nous noterons Zt (M ) l’élément de Z(∂M ) associé à M lorsqu’elle est munie d’une mesure de n + 1-volume de volume total égal à t. Examinons ce que peut être une v-TQFT de dimension 1. Choisissons-en donc une, notée Z. Il n’y a qu’une variété connexe de dimension 0, c’est le point que nous notons pt et qui peut avoir deux orientations, notées + et −. Il n’y a donc qu’un espace vectoriel en jeu, qui est Z(pt+ ) et que nous notons V . Il n’y a ensuite que deux variétés connexes orientées de dimension 1, l’intervalle et le cercle. Il est pratique de représenter les intervalles comme des intervalles de R munis de leur longueur naturelle. Alors, pour tous s < t réels, Z([s, t]) est un endomorphisme de V , qui ne dépend que de t − s et que nous notons Pt−s . De plus, l’axiome 3 permet d’affirmer que pour tous s < t < u, on a Z([s, u]) = Z([t, u]) ◦ Z([s, t]), si bien que (Pt )t>0 est un semi-groupe d’endomorphismes de V . Enfin, le raisonnement fait à la fin de la description générale des TQFT s’applique à pt × [0, t] et permet d’affirmer que, pour tout t > 0, Zt (S 1 ) = Tr(Pt ). Finalement, une v-TQFT de dimension 1 est la donnée d’un semi-groupe d’endomorphismes d’un espace vectoriel. Notons que contrairement au cas purement topologique, 46 CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7] rien ici n’impose que V soit de dimension finie. Si nous nous plaçons par exemple dans un cadre hilbertien, il suffit que Pt soit un opérateur à trace pour tout t > 0. Un processus de Markov usuel, indexé par des intervalles de temps, donne lieu, pourvu qu’il soit assez régulier, par le biais de ses noyaux de transition, à une v-TQFT de dimension 1. Prenons par exemple un processus de Lévy X admissible sur un groupe de Lie compact G, et dont nous notons Qt (x) la densité. Définissons Z(pt) comme l’espace L2 (G)G des fonctions sur G de carré intégrable et invariantes par conjugaison. Alors pour tous s < t, nous pouvons définir Z([s, t]) comme la fonction (x, y) 7→ Qt−s (x−1 y) qu’on peut voir soit comme le noyau intégral d’une application linéaire de L2 (G)G dans lui2 même, soit comme un élément de L2 (G2 )G ' L2 (G)G ⊗ L2 (G)G . Notre définition des champs d’holonomie markoviens contient la définition d’une vTQFT de dimension 2, qui est donnée par les masses des mesures finies HFM,vol,∅,C , de la façon suivante. Ici encore, il n’y a qu’une variété orientée de dimension 1 sans bord, à savoir le cercle S 1 , si bien qu’il n’y a qu’un espace vectoriel en jeu, Z(S 1 ), que nous prenons égal à L2 (G)G . Notons que cet espace est de dimension finie si et seulement si G est fini. Alors la masse de la mesure associée à une surface M , vue comme fonction des conditions au bord, est un élément de la puissance tensorielle de L2 (G)G correspondant au nombre de composantes connexes du bord de M . Autrement dit, pour tous p, g ≥ 0 et + 2 p Gp 2 G ⊗p tout t > 0, nous pouvons voir Zp,g,t comme un élément de L (G ) ' L (G) . Nous pouvons donc énoncer le résultat suivant. Proposition 1.3.10 Soit G un groupe de Lie compact. Soit HF un champ d’holonomie + markovien à valeurs dans G. Soient (Zp,g,t )p,g≥0,t>0 les fonctions de partition de HF associées à des surfaces orientées. Posons Z(S 1 ) = L2 (G)G , l’espace des fonctions de carré intégrable invariantes par conjugaison sur G. Pour toute surface mesurée M d’aire totale + t, de genre réduit g et telle que ∂M ait p composantes connexes, posons Z(M ) = Zp,g,t . Alors le foncteur Z est une v-TQFT de dimension 2. Chapitre 2 Champs d’holonomie, revêtements et connexions Dans ce deuxième chapitre, nous allons décrire plusieurs structures géométriques qui donnent lieu à des fonctions multiplicatives de l’ensemble des lacets sur une surface à valeurs dans un groupe. Dans deux situations bien distinctes, nous allons montrer qu’on peut relier certains des processus construits au chapitre précédent à des versions aléatoires de ces structures géométriques. 2.1 Groupes finis et revêtements ramifiés [L7, Chapitre 5] Dans cette section, nous allons montrer que lorsque le groupe G est fini, le champ d’holonomie markovien associé par le théorème 1.3.7 à une marche aléatoire sur G peut être réalisé explicitement à l’aide de revêtements ramifiés aléatoires de la surface sur laquelle on travaille. La présentation de ce résultat sera aussi pour nous l’occasion de comprendre dans une situation simple comment les champs d’holonomie aléatoire sont liés à des notions de relèvement horizontal et de transport parallèle. 2.1.1 Groupe fondamenal et revêtements Nous allons commencer par chercher les structures géométriques les plus simples possibles qui donnent lieu à des fonctions multiplicatives de l’ensemble des lacets sur une surface, à valeurs dans un groupe quelconque. Soit donc M une surface, sur laquelle nous fixons un point m. Chaque lacet l ∈ Lm (M ) a une classe d’homotopie, qui est un élément du groupe fondamental π1 (M, m). L’application l 7→ [l] qui à un lacet associe sa classe d’homotopie est une fonction multiplicative Lm (M ) → π1 (M, m), qui nous est donnée par la seule structure topologique de M . Nous allons commencer par réinterpréter cette fonction d’une façon apparemment bien compliquée mais qui va nous permettre de comprendre de nombreuses fonctions multiplicatives. f → M un revêtement universel de M . Choisissons m̃ ∈ π −1 (m). Le choix Soit π : M f, de la façon suivante. Soit [l] une de m̃ détermine une action du groupe π1 (M, m) sur M classe d’homotopie de lacets basés en m, représentée par un lacet l. Soit ˜l le relèvement 47 48 CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS de l issu de m̃ et soit ñ l’extrémité finale de ˜l, qui ne dépend pas du choix de l dans [l]. Il f → M (c’est-à-dire un unique existe alors un unique automorphisme du revêtement π : M f tel que π ◦ h = π) qui envoie m̃ sur ñ. Cet automorphisme de homéomorphisme h de M revêtement est celui qu’on associe à l’élément [l] de π1 (M, m). f → M ) et un groupe (ici π1 (M, m)) Nous avons donc un revêtement de M (ici π : M qui agit simplement et transitivement sur les fibres de ce revêtement, ce qui signifie que pour toute paire de points d’une même fibre, il existe un élément et un seul du groupe qui envoie le premier sur le second. Nous avons de plus un point base sur M (ici m) et un élément du revêtement au-dessus de ce point base (ici m̃). Pour chaque lacet l sur M basé en m, nous pouvons relever l en partant de m̃, déterminer le point final ñ de ce relèvement et associer au lacet l l’unique élément du groupe qui envoie m̃ sur ñ. Ici, tautologiquement, cet élément est la classe d’homotopie de l. Pour comprendre ce que nous avons gagné avec cette formulation obscure, donnonsnous un groupe G, par exemple un groupe fini, et un homomorphisme de groupes ρ : π1 (M, m) → G. Alors nous pouvons former la fonction multiplicative l 7→ ρ([l]) de Lm (M ) dans G. Cette fonction multiplicative s’interprète de la même façon que la précédente, comme nous allons le voir maintenant. Quitte à restreindre G, nous supposerons que ρ est surjectif. La théorie des revêtements garantit qu’au noyau de l’homomorphisme ρ, qui est un sous-groupe distingué de π1 (M, m), est associé un revêtement E → M dont le groupe des automorphismes s’identifie au quotient de π1 (M, m) par le noyau de ρ, qui à son tour s’identifie à G. Une façon de construire le revêtement E est de le réaliser comme f ×π (M,m) G, qui est le quotient du produit cartésien M f × G par la le produit fibré M 1 f, tout g ∈ G et tout γ ∈ π1 (M, m), identifie relation d’équivalence qui pour tout x̃ ∈ M −1 (x̃, g) et (x̃ · γ, ρ(γ )g). Cette façon de construire E montre que G agit à droite sur E, simplement et transitivement sur les fibres : il suffit de poser (x̃, g) · g 0 = (x̃, gg 0 ). Le revêtement E est donc un G-fibré principal. Définition 2.1.1 Soit G un groupe fini. On appelle G-fibré principal au-dessus de M un revêtement π : E → M muni d’une action à droite de G sur E, qui est libre et transitive sur les fibres. La construction que nous avons déjà fait deux fois est la suivante. Proposition 2.1.2 Soit G un groupe fini. Soit π : E → M un G-fibré principal. Soit m un point de M . Soit e un point de E tel que π(e) = m. Soit l un lacet sur M basé en m. Soit ˜l le relèvement de l issu de e. L’unique élément de G qui envoie e sur l’extrémité finale de ˜l s’appelle indifféremment la monodromie ou l’holonomie de l. La fonction de Lm (M ) dans G qui à un lacet associe sa monodromie est multiplicative. Cette proposition est l’exemple fondamental, et le plus simple, de la façon dont nous allons interpréter des fonctions multiplicatives en termes géométriques. Elle n’est toutefois pas une source très riche de fonctions multiplicatives. D’une part, les seuls groupes G pour lesquels on peut faire une construction non-triviale sont ceux qui sont isomorphes à des quotients du groupe fondamendal de M . D’autre part, l’image d’un lacet ne dépend que 2.1. GROUPES FINIS ET REVÊTEMENTS RAMIFIÉS [L7, CHAPITRE 5] 49 de sa classe d’homotopie dans M . Si M est simplement connexe, par exemple un disque ou une sphère, nous ne pouvons construire que la fonction multiplicative identiquement égale à l’élément neutre. Si le groupe fondamental de M est abélien, par exemple si M est un tore ou un plan projectif, G doit être abélien. Dans le cas du plan projectif, ce ne peut même qu’être Z/2Z. 2.1.2 Revêtements ramifiés aléatoires Pour enrichir cette construction, nous allons nous autoriser à percer M , c’est-à-dire à lui enlever un nombre fini de points. Cela va permettre de résoudre les deux difficultés d’un coup. En effet, le groupe fondamental d’une surface privée d’un nombre fini non nul de points est toujours un groupe libre, et le fait d’enlever des points permet de distinguer homotopiquement des lacets qui sont homotopes dans M . Le seul inconvénient est que nous ne pouvons plus considérer les lacets qui passent par les points que nous avons enlevés. Cependant, l’ensemble de points qu’on enlève est voué à devenir aléatoire, et un lacet donné ne le rencontrera qu’avec probabilité nulle. Définition 2.1.3 Un G-fibré principal ramifié sur M avec lieu de ramification Y , où Y est une partie finie de l’intérieur de M , est un revêtement π : R → M \ Y muni d’une action à droite de G sur R, qui est libre et transitive sur les fibres. La structure d’un revêtement ramifié au voisinage d’un point de ramification est simple. Si y est un point de Y , il existe un voisinage V de y tel que la restriction de π à chaque composante connexe de π −1 (V \ {y}) soit conjuguée topologiquement à l’application z 7→ z n de C∗ dans lui-même, pour un certain entier n ≥ 1 (voir figure 2.1). En particulier, il est possible d’ajouter un nombre fini de points à R pour en faire une surface lisse, de telle sorte que tous les points ajoutés soient envoyés sur Y par π. L’application π : R → M ainsi obtenue s’appelle un revêtement ramifié. 1 i −i 0 −1 1 z 7→ z 2 −1 0 1 Figure 2.1 – L’application z 7→ z 2 est le revêtement ramifié le plus simple de C par lui-même. 50 CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS La classe de conjugaison de la monodromie le long d’un petit cercle autour d’un point de ramification y ne dépend pas de la façon dont on la calcule. On l’appelle la monodromie locale en y et on la note O(R, y). On réservera l’appellation de point de ramification à des points où la monodromie locale n’est pas l’élément neutre. Soit π : R → M un revêtement ramifié. Soit N une composante connexe du bord de M . La restriction de π à π −1 (N ) est un G-fibré principal au-dessus de N , sans point singulier puisque nous avons supposé tous les points de ramification intérieurs à M . Sa structure est complètement déterminée par la monodromie le long de N . En fait, seule la classe de conjugaison de cette monodromie est bien définie si on ne choisit pas un point base sur N et un point dans la fibre au-dessus de ce point base. Nous allons regrouper les G-fibrés ramifiés selon leur lieu de ramification et leur structure au bord. Nous considérons en fait des classes d’isomorphismes de G-fibrés, où un isomorphisme entre π : R → M et π 0 : R0 → M est un difféomorphisme ψ : R → R0 qui entrelace les actions de G sur R et R0 et qui est tel que π 0 ◦ ψ = π. Définition 2.1.4 Soit M une surface. Soit C : B(M ) → Conj(G) un ensemble de Gcontraintes sur le bord de M (voir définition 1.3.2). Soit Y une partie finie de l’intérieur de M . On note R(M, Y, C) l’ensemble des classes d’isomorphisme de G-fibrés ramifiés sur M avec lieu de ramification Y et conditions au bord données par C. On note R(M, C) la réunion des R(M, Y, C) lorsque Y décrit l’ensemble des parties finies de l’intérieur de M . Nous noterons O1 , . . . , Op les p classes de conjugaison de G associées par C aux p composantes connexes du bord de M . Nous allons maintenant définir une mesure de probabilités sur R(M, C). Commençons par choisir un processus de Lévy admissible X sur G, caractérisé par sa mesure de sauts Π, qui est une mesure sur G \ {1}. La définition de la mesure se fait alors en trois étapes. 1. Soit R un revêtement ramifié avec lieu de ramification Y . On appelle poids de R le réel positif ou nul suivant : Π(R) = Y Π(O(R, y)) . #O(R, y) y∈Y C’est donc le produit sur les points de ramification de la masse attribuée par Π à un élément quelconque de la classe de conjugaison qu’est la monodromie locale en ce point. 2. On définit maintenant une mesure finie RBX M,Y,C sur R(M, Y, C) en posant RBX M,Y,C = #G1−g #O1 . . . #Op X R∈R(M,Y,C) Π(R) δR . #Aut(R) C’est essentiellement la mesure uniforme sur l’ensemble fini R(M, Y, C), à ceci près que, comme parfois en combinatoire, les objets sont pondérés selon leur nombre d’automorphismes. 2.2. CHAMP D’HOLONOMIE BROWNIEN ET CONNEXIONS ALÉATOIRES [L4, LN5] 51 3. Notons F(M ) l’ensemble des parties finies de M , muni d’une topologie naturelle. On considère alors sur F(M ) la measure de probabilités Ξ qui est la distribution d’un processus ponctuel de Poisson d’intensité vol. On définit une mesure finie RBX M,vol,C sur R(M, C) en posant Z X RBX RBM,vol,C = M,Y,C Ξ(dY ). F(M ) Notons que pour certaines parties Y ⊂ M , l’ensemble R(M, Y, C) peut être vide. C’est par exemple le cas si M n’a pas de bord et G = Z/2Z : si Y est de cardinal impair, R(M, Y, C) est vide alors que si Y est de cardinal pair, R(M, Y, C) contient un seul élément, qui admet deux automorphismes, l’identité et l’échange des feuillets. Dans ce cas donc, le lieu de ramification d’un revêtement tiré sous la mesure RBX M,vol,C n’est pas exactement un processus ponctuel de Poisson, mais une variante de ce processus conditionné à avoir un nombre pair de points. Dans tous les cas, la loi du lieu de ramification de ce revêtement aléatoire est absolument continue par rapport à Ξ. Soient l1 , . . . , ln des lacets sur M basés au même point m. Avec Ξ-probabilité égale à 1, l’ensemble Y ne rencontre aucune des images de ces lacets. Soit f : Gn → R une fonction continue invariante par l’action diagonale de G par conjugaison. Si nous tirons un G-fibré ramifié au hasard selon la mesure RBX M,vol,C normalisée, et si nous y choisissons un point de référence dans la fibre au-dessus de m, nous pouvons calculer les monodromies h(l1 ), . . . , h(ln ) de chacun des lacets l1 , . . . , ln . Si nous changeons de point de référence, chaque monodromie est conjuguée par le même élément de G. Ainsi, f (h(l1 ), . . . , h(ln )) est bien défini indépendamment du choix d’un point de référence. Vu la définition de la tribu I (voir la définition 1.2.8), ceci rend plausible le fait que la mesure RBX M,vol,C détermine X une mesure finie sur (M(P(M ), G), I), que nous noterons MFM,vol,C . Le résultat principal est alors le suivant. X Théorème 2.1.5 ([L7, Théorème 5.4.2]) Les mesure finies HFX M,vol,∅,C et MFM,vol,C , définies sur l’espace (M(P(M ), G), I), sont égales. Nous avons donc atteint notre but et réalisé le champ d’holonomie aléatoire markovien associé à une marche aléatoire sur un groupe fini comme le champ de monodromie aléatoire d’un revêtement ramifié aléatoire d’une surface. 2.2 Champ d’holonomie brownien et connexions aléatoires [L4, LN5] Nous allons maintenant essayer d’interpréter certains champs d’holonomie à valeurs dans des groupes continus en termes de structures géométriques analogues à celles que nous venons de décrire. Malheureusement, les objets géométriques sont un peu plus compliqués et il n’y a pas de résultat aussi satisfaisant que le théorème 2.1.5 dans ce cas. Nous allons nous intéresser uniquement au champ associé au mouvement brownien sur un groupe de Lie compact et connexe. Pour ce champ, nous allons écrire un principe de grandes déviations qui relie le processus stochastique que nous avons construit à une fonctionnelle d’énergie de nature géométrique, l’action de Yang-Mills. 52 2.2.1 CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS Une 1-forme différentielle aléatoire Commençons par examiner le cas où le groupe G est abélien. Soit M une surface. Lorsque le groupe G est abélien, disons G = U (1), il y a une façon naturelle de produire des fonctions multiplicatives des lacets, qui est de R choisir une 1-forme différentielle α sur M et d’associer à chaque lacet l l’élément exp i l α de U (1). Nous allons montrer que le mouvement brownien sur U (1) indexé par les lacets sur un disque, que nous avons décrit à la section 1.3.3 et défini par l’équation (1.8), peut être compris heuristiquement comme l’exponentielle de l’intégrale d’une 1-forme différentielle aléatoire. Plaçons nous sur le plan ou sur un disque, considérons un lacet l et traitons, sans aucun souci de rigueur, le bruit blanc W comme s’il s’agissait d’une fonction aléatoire, R de telle sorte qu’on puisse écrire par exemple W (nl ) = R2 nl (x)W (x) dx. Nous voulons écrire cette dernière intégrale comme l’intégrale d’une 1-forme le long de l. Tout d’abord, définissons, pour chaque x = (x1 , x2 ) ∈ R2 , la 1-forme dθx sur R2 \ {x} en posant ∀y = (y1 , y2 ) ∈ R2 , dθx (y) = (y2 − x2 )dy1 − (y1 − x1 )dy2 . (y1 − x1 )2 + (y2 − x2 )2 Le nombre de tours effectué par l autour du point x peut être évalué au moyen de la forme dθx , par la formule Z 1 dθx . nl (x) = 2π l 1 Introduisons la fonction G(x, y) = − 2π log d(x, y), où d est la distance euclidienne. Cette fonction est définie hors de la diagonale sur R2 × R2 et elle est le noyau de l’inverse du laplacien. R Cela signifie que si pour toute fonction lisse ψ à support 2compact on pose Gψ(x) = R2 G(x, y)ψ(y) dy, alors on a, pour toute fonction lisse ϕ : R → R à support compact, G∆ϕ = ϕ. Pour tout x, appelons Gx la fonction G(x, ·) sur R2 \x. La différentielle de cette fonction Gx ressemble beaucoup à dθx . En fait, on a 1 dθx = ∗dGx , 2π où l’opérateur de Hodge ∗ est défini par ∗(a dy1 +b dy2 ) = −b dy1 +a dy2 , si bien que pour toute forme différentielle α et tout vecteur X, on a (∗α)(X) = α(J −1 X), où J désigne la rotation d’angle π2 . En combinant formellement toutes ces observations, on trouve Z W (nl ) = nl (x)W (x) dx 2 R Z Z = ∗dGx W (x) dx 2 R l Z Z = ∗dy G(x, y)W (x) dx 2 l R Z = ∗d(GW ). l 2.2. CHAMP D’HOLONOMIE BROWNIEN ET CONNEXIONS ALÉATOIRES [L4, LN5] 53 On a donc défini heuristiquement une 1-forme aléatoire en prenant un bruit blanc, en lui appliquant l’inverse du laplacien, en prenant la différentielle totale de la fonction obtenue, puis en lui appliquant l’opérateur de Hodge. L’exponentielle de l’intégrale de cette 1-forme donne le mouvement brownien indexé par des lacets. Puisque nous l’intégrons le long de lacets, cette 1-forme peut être arbitrairement modifiée par l’ajout d’une 1-forme exacte. Ceci correspond à l’invariance des quantités observables sous l’action du groupe de jauge. Nous allons maintenant décrire le bon objet géométrique qui, sans l’hypothèse que G est abélien, permet de définir des fonctions multiplicatives des lacets. 2.2.2 Connexions Commençons par définir l’objet qui joue le rôle du revêtement ramifié dans la cas d’un groupe continu. Définition 2.2.1 Soit M une surface. Soit G un groupe de Lie compact. Un G-fibré principal sur M est une variété différentielle P munie d’une application différentiable π : P → M et d’une action libre de G à droite, notée (p, g) 7→ pg, telle que π induise un difféomorphisme du quotient P/G sur M . Ainsi, P est la réunion disjointe des fibres π −1 (m) où m parcourt M et, pour chaque m, le groupe G agit librement et transitivement sur π −1 (m). Cette définition est donc très proche de la définition que nous avons donnée dans le cas fini. Toutefois, alors que dans le cas fini, la variété que nous avons notée E puis R, l’espace total du fibré, était une surface, dans le cas présent, c’est une variété dont la dimension est la somme de celles de M et de G. Définition 2.2.2 Soient π : P → M et π 0 : P 0 → M deux G-fibrés principaux sur M . Un isomorphisme de P sur P 0 est un difféomorphisme ϕ : P → P 0 tel que π 0 ◦ ϕ = π et qui commute aux actions de G sur P et P 0 , c’est-à-dire tel que pour tout p ∈ P et tout g ∈ G, on ait ϕ(p · g) = ϕ(p) · g. Le groupe des automorphismes d’un fibré π : P → M s’appelle le groupe de jauge de ce fibré. On le note J (P ), ou simplement J . L’exemple fondamental de G-fibré principal sur M est le produit cartésien M × G, sur lequel G agit selon la relation (m, h) · g = (m, hg). Le groupe de jauge de M × G, au lieu d’être fini comme dans le cas des fibrés ramifiés, est maintenant un groupe énorme, qui s’identifie naturellement avec le groupe des applications C ∞ de M dans G. Si j : M → G est une telle application, elle agit sur P selon la formule j · (m, g) = (m, j(m)g). La structure locale d’un fibré principal est toujours celle d’un produit cartésien : la restriction de π : P → M à π −1 (U ), où U est un petit ouvert de M , est toujours isomorphe au fibré trivial U × G → U . Néanmoins, il existe des fibrés dont la structure globale n’est pas celle d’un produit cartésien, de même que par exemple le revêtement de C∗ par luimême donné par l’application z 7→ z 2 , bien qu’ayant localement la même structure que C∗ × Z/2Z → C∗ n’en a pas la structure globale. 54 CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS Une différence fondamentale entre les cas discrets et continu est que, dans un fibré dont le groupe de structure est continu, il n’y a pas de façon canonique de relever un chemin dans M en un chemin dans P . Un choix est nécessaire, celui d’une connexion sur P . Une connexion permet de relever un vecteur tangent à M en un vecteur tangent à P , puis, en résolvant une équation différentielle, de relever des chemins différentiables par morceaux. Plus précisément, une connexion définit (voir figure 2.2), pour tout m ∈ M et tout p p ∈ π −1 (m), une application linéaire injective rm : Tm M → Tp P , qui d’une part est un relèvement, au sens où, lorsqu’on la compose par la différentielle de π on retrouve p = idTm M ; et qui d’autre part se comporte bien vis-à-vis de l’action de l’identité : Tp π ◦ rm G : pour tout g ∈ G, en notant Rg l’action de g à droite sur P et Tp Rg sa différentielle en R (p) p pg . = rmg = Tp Rg ◦ rm p, on a rm π −1 (m) pg P Tpg P Tp Rg pg rm p π p rm Tpg π Tp P Tp π M m Tm M p Figure 2.2 – Ce dessin illustre les relations de compatibilité entre les applications de relèvement rm , l’application π et l’action de G sur P . Les deux sous-espaces grisés de Tp P et Tpg P sont les espaces horizontaux en p et pg. 2.2. CHAMP D’HOLONOMIE BROWNIEN ET CONNEXIONS ALÉATOIRES [L4, LN5] 55 p en tout Pour décrire une connexion, on décrit en général l’image de l’application rm point de P , qu’on appelle sous-espace horizontal en p. C’est un sous-espace de dimension égale à la dimension de M dans l’espace tangent à P en p. Or cet espace possède un supplémentaire canonique, qui est l’espace tangent à la fibre passant par p. On note ce sous-espace, appelé vertical, TpV P ⊂ Tp P . Il s’identifie canoniquement avec l’algèbre de Lie g de G par la différentielle en l’identité de l’action de G : chaque vecteur de TpV P s’écrit de façon unique comme dtd |t=0 petA pour un certain vecteur A de g. On décrit donc un connexion par la donnée, en chaque point p ∈ P , de la projection sur TpV P parallèlement au sous-espace horizontal. Avec l’identification TpV P ' g, cette projection devient une application linéaire Tp P → g, dont le noyau est le sous-espace horizontal. TpV P = Tp (π −1 (m)) θp : A 7→ d dt |t=0 p · etA g = T1 G π −1 (m) g 7→ p · g p XH TpH P G 1∈G ω(X) = θp−1 (X V ) XV X Figure 2.3 – La 1-forme de connexion est la projection sur l’espace vertical parallèlement à l’espace horizontal vue comme prenant ses valeurs dans l’algèbre de Lie de G via l’identification, ici notée θp , entre cette algèbre de Lie et T V P . La définition technique est la suivante 1 . Définition 2.2.3 Soit π : P → M un G-fibré principal sur M . Une connexion sur P est une 1-forme différentielle ω sur P à valeurs dans g qui satisfait les propriétés suivantes. 1. Pour tout A appartenant à g, tout p ∈ P , on a ω( dtd |t=0 petA ) = A. 2. Pour tout p ∈ P , tout X ∈ Tp P , tout g ∈ G, on a ω(Tp Rg (X)) = ad(g −1 )ω(X) = g −1 ω(X)g. On note A(P ), ou simplement A, l’espace des connexions sur P . Le groupe de jauge J (P ) agit sur l’espace A(P ) des connexions sur P , la transformation de jauge j envoyant la connexion ω sur la connexion j ∗ ω définie par (j ∗ ω)p (X) = 1. Pour de plus amples détails sur les fibrés principaux et les connexions, on pourra consulter le premier volume du livre de Kobayashi et Nomizu [KN96] et le livre de Morita [Mor01]. 56 CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS ωj(p) (Tp j(X)). L’espace A(P ) est un espace affine de dimension infinie et J (P ) agit par transformations affines. L’espace quotient A(P )/J (P ) est l’espace des configurations de la théorie physique qui motive l’étude du champ de Yang-Mills. Etant donné une connexion ω ∈ A(P ), un chemin c : [0, 1] → M avec c(0) = m et un point p ∈ π −1 (m), il existe un unique chemin c̃ : [0, 1] → P tel que π(c̃(t)) = c(t) pour tout ˙ t ∈ [0, 1] et ω(c̃(t)) = 0 pour tout t ∈ [0, 1]. Le chemin c̃ s’appelle le relèvement horizontal de c issu de p (voir figure 2.4). Si c est un lacet, c’est-à-dire si c(1) = c(0), le point c̃(1) appartient à π −1 (m) et s’écrit donc p · h pour un unique élément h de G. Cet élément h s’appelle l’holonomie de ω le long de c, calculée en p. On le note holp (ω, c). Les propriétés d’invariance de la connexion par rapport à l’action de G sur P entraînent que si g est un élément de G, le relevé horizontal de c issu de p·g aboutit en c̃(1)·g = p·hg = (p·g)·g −1 hg. Ainsi, on a la relation holpg (ω, c) = g −1 holp (ω, c)g. De cette relation découle par exemple que si l1 et l2 sont deux lacets basés en m, et si l1 l2 désigne leur concaténation, alors holp (ω, l1 l2 ) = holp (ω, l1 )holpholp (ω,l1 ) (ω, l2 ) = holp (ω, l2 )holp (ω, l1 ). Ceci justifie l’ordre que nous avons choisi dans la définition de la multiplicativité (définition 1.2.1). π −1 (m) p·g q·g π −1 (c([0, 1])) p·g p p · hg q p M ˜l p·h M c l m Figure 2.4 – Chaque relèvement horizontal d’un chemin est une courbe intégrale d’un champ de vecteur défini dans la réunion des fibres au-dessus de l’image du chemin, champ obtenu en prenant tous les relevés horizontaux des vecteurs vitesse du chemin. Si le chemin est un lacet, on peut comparer le point d’arrivée d’un relevé horizontal avec son point de départ. Dans le cas où le groupe G est fini, g = {0}, la seule connexion sur P est la connexion nulle et la notion de relèvement que nous venons de définir coïncide avec la notion de relèvement dans un revêtement. Etant donné un fibré principal π : P → M , un point m de M et un point p ∈ −1 π (m), chaque connexion sur P détermine une fonction multiplicative de Lm (M ) vers G, la fonction qui à un lacet l associe holp (ω, l). Changer le point de référence p conjugue 2.3. ACTION ET MESURE DE YANG-MILLS 57 cette application par un élément de G. L’action du groupe de jauge modifie également l’application l 7→ holp (ω, l) en la conjugant par un élément de G qui ne dépend pas de l. Finalement, il existe une application du quotient A(P )/J (P ) dans le quotient M(Lm (M ), G)/G. Proposition 2.2.4 Soit π : P → M un G-fibré principal sur M . Alors l’application A(P )/J (P ) −→ M(Lm (M ), G)/G induite par l’holonomie est injective. Une connexion aléatoire devrait donc déterminer un champ d’holonomie aléatoire. C’est en fait ce point de vue qui a motivé initialement l’étude des processus de la forme de ceux que nous étudions ici. En effet, la physique théorique fournit, à un niveau très heuristique, une mesure de probabilités sur les connexions sur un fibré principal, que nous allons maintenant décrire. 2.3 Action et mesure de Yang-Mills Soit π : P → M un G-fibré principal sur M . Soit ω une connexion sur P . On lui associe une 2-forme différentielle sur P , sa courbure, notée Ω et définie par Ω(X, Y ) = dω(X, Y ) + [ω(X), ω(Y )], où le crochet est le crochet de Lie de g. On peut démontrer que cette 2-forme s’annule dès que l’un de ses arguments est un vecteur vertical. Il suffit donc de la comprendre sur les vecteurs horizontaux. On peut montrer que Ω(X, Y ) = ω([X, Y ]H ), où [X, Y ]H est la composante horizontale du vecteur [X, Y ]. Ainsi, la courbure de ω est identiquement nulle si et seulement si le crochet de deux champs horizontaux quelconques est encore horizontal, c’est-à-dire, d’après un théorème de Frobenius, si la distribution horizontale est intégrable. Lorsque la courbure n’est pas nulle, elle est une sorte d’holonomie infinitésimale le long de petits lacets. Supposons ainsi que X et Y soient les relevés horizontaux de deux champs XM et YM sur M tels que [XM , YM ] = 0. Choisissons m ∈ M puis p ∈ π −1 (m). Si lε est un petit lacet carré basé en m dont deux côtés opposés suivent le flot de XM pendant un temps ε et les deux autres côtés suivent le flot de YM pendant un temps ε, alors l’holonomie de ω le long de lε calculée en p est égale à exp(ε2 Ωp (X, Y ) + o(ε2 )). Nous allons maintenant définir l’action d’une connexion ω comme une sorte de carré de norme L2 de sa courbure. La surface M est munie d’une mesure de surface notée vol. Pour simplifier, nous nous plaçons dans le cas où M est orientable et où vol peut être identifiée à une 2-forme volume sur M . Soit alors ω une connexion. La courbure de ω, comme toute 2-forme sur P qui s’annule dès qu’un de ses arguments est vertical, peut s’écrire sous la forme Ω = Kπ ∗ vol, où K : P → g est une fonction. La courbure d’une connexion hérite de celle-ci une propriété d’équivariance qui garantit que pour tout p ∈ P et tout g ∈ G, on a K(pg) = ad(g −1 )K(p) = g −1 K(p)g. L’algèbre de Lie de G est munie d’un produit scalaire invariant par conjugaison, aussi l’égalité précédente entraîne-t-elle kK(p)k = kK(pg)k. La fonction kKk est donc constante 58 CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS sur les fibres de P , elle s’identifie donc à une fonction sur M . On pose alors Z S(ω) = kKk2 dvol. M R Cette définition coïncide avec l’écriture plus classique S(ω) = M hΩ ∧ ∗Ωi, dans le cas particulier de la dimension 2. Une propriété fondamentale de S est qu’elle est invariante sous l’action du groupe de jauge : deux connexions qui diffèrent par une transformation de jauge ont la même action de Yang- Mills. L’action de Yang-Mills induit donc une fonctionnelle sur l’espace quotient S : A(P )/J (P ) → [0, +∞). La mesure de Yang-Mills, définie par les physiciens, est la mesure suivante, définie sur l’espace de toutes les connexions sur un fibré principal donné. Définition 2.3.1 (Heuristique) Soit M une surface munie d’une mesure d’aire vol. Soit P un G-fibré principal sur M . On appelle mesure de Yang-Mills sur (M, vol, P ) la mesure de probabilités YMM,vol,P sur A(P ) caractérisée par l’expression YMM,vol,P (dω) = 1 ZM,vol,P 1 e− 2 S(ω) Dω. (2.1) L’espace A(P ) de toutes les connexions sur un fibré donné P est un espace affine de dimension infinie et Dω devrait être une mesure invariante par translation sur cette espace. Comme cet espace est de dimension infinie, donc non localement compact, une telle mesure ne peut être que très pathologique (ce pourrait par exemple être la mesure de comptage). La constante ZM,vol,P est par ailleurs une constante de normalisation, qui dans cette formulation devrait être infinie à cause de l’action du groupe de jauge, qui n’est pas localement compact non plus et préserve l’action S. On pourrait espérer résoudre ces problèmes en se plaçant sur le quotient A(P )/J (P ), dont on pourrait espérer qu’il soit assez petit, mais il est lui aussi non-localement compact. Il n’y a en fait aucune façon directe de donner un sens à la définition ci-dessus. Néanmoins, si l’on pense à l’action de Yang-Mills comme au carré de la norme L2 de la courbure, l’expression (2.1) apparaît analogue à l’expression heuristique d’une mesure gaussienne en dimension infinie. Ainsi, on pourrait interpréter cette expression en disant que la mesure de Yang-Mills est la mesure sous laquelle la courbure a la loi d’un bruit blanc sur (M, vol) à valeurs dans l’algèbre de Lie g. Si l’on se souvient maintenant que la courbure est une version infinitésimale de l’holonomie le long de petits lacets, il semble naturel de prendre le champ d’holonomie associé (par le théorème 1.3.7) au mouvement brownien sur G comme candidat à une définition rigoureuse de la mesure de Yang-Mills. 2.4 2.4.1 Un principe de grandes déviations Espaces de Sobolev de connexions Pour donner un fondement rigoureux à la discussion de la section précédente, nous allons donner un énoncé qui lie le champ d’holonomie markovien associé au mouvement 2.4. UN PRINCIPE DE GRANDES DÉVIATIONS 59 brownien (que nous appellerons champ d’holonomie brownien) et l’action de Yang-Mills. Cet énoncé prendra la forme d’un principe de grandes déviations. Avant d’entrer dans le détail de la formulation de ce principe, qui requiert encore quelques explications préliminaires, nous allons rappeler brièvement le théorème qui est le protoype du résultat que nous énoncerons. ENCART 8 – Le théorème de Schilder [DZ93] Soit C00 ([0, 1]) l’espace de Banach des fonctions continues sur [0, 1] à valeurs réelles, nulles en 0, muni de la norme uniforme. La mesure de Wiener sur cet espace peut être décrite heuristiquement par la formule Z 1 1 ˙ 2 1 f (t) dt Df. W(df ) = exp − Z 2 0 Dans cetteR écriture, un espace de fonctions apparaît, qui est l’espace le plus naturel des fonctions pour 1 lesquelles 0 f˙(t)2 dt < +∞. Cet espace est l’espace de Sobolev W01,2 ([0, 1]) = H01 ([0, 1]) des fonctions L2 sur [0, 1] dont la dérivée au sens des distributions est une fonction L2 et qui sont nulles en 0. Définissons une fonctionnelle S : C00 ([0, 1]) → [0, +∞] en posant S(f ) = kf˙k2L2 ([0,1]) si f appartient à H 1 et S(f ) = +∞ sinon. Le théorème de Schilder est alors le suivant. Théorème 2.4.1 (Schilder) Soit A ⊂ C00 ([0, 1]) une partie borélienne. Pour tout λ ∈ R, posons λA = {λf : f ∈ A}. Alors 1 1 1 1 − inf◦ S ≤ lim log W √ A ≤ lim log W √ A ≤ − inf S. T →0 A 2 2 A T T T →0 Ce théorème exprime le fait que la famille des lois de √ ( T Bt )t∈[0,1] T >0 , où B désigne le processus canonique sous W, satisfont un principe de grandes déviations de vitesse T et de fonction de taux 12 S lorsque T tend vers 0. Rappelons que l’on démontre ce théorème en quatre grandes étapes. On s’occupe tout d’abord des lois marginales de dimension finie en s’appuyant sur les résultats fondamentaux des grandes déviations comme le théorème de Cramér. On rassemble ensuite les résultats obtenus pour ces lois fini-dimensionnelles, grâce au théorème de Dawson-Gärtner, pour obtenir un principe de grandes déviations sur l’espace C00 ([0, 1]) muni de la topologie de la convergence simple. On obtient, à l’issue de cette étape, la fonction de taux sous la forme Ŝ(f ) = sup 0<t1 <...<tn <1 n−1 X i=0 (f (ti+1 ) − f (ti ))2 . 2(ti+1 − ti ) La troisième étape consiste alors à identifier cette fonction de taux avec celle que nous avons définie plus haut. On vérifie immédiatement que Ŝ(f ) ≤ S(f ). Il suffit donc de vérifier que Ŝ(f ) < +∞ entraîne f ∈ H01 et S(f ) ≤ Ŝ(f ). Pour établir ce point, on considère une suite (gn )n≥0 d’interpolations affines par morceaux de f correspondant à une suite de subdivisions de [0, 1] dont le pas tend vers 0. Alors on connaît explicitement le carré de la norme H 1 de chaque gn ; il est inférieure à 2Ŝ(f ) qui par hypothèse est fini. La suite (gn )n≥0 est donc bornée dans H 1 et on peut en extraire une sous-suite faiblement convergente, vers une certaine fonction h ∈ H 1 , dont le carré de la norme H 1 est inférieur à 2Ŝ(f ). Puisque l’injection H 1 → C 0 est compacte, cette sous-suite converge uniformément vers h, qui ne peut donc être que f . Ainsi, f appartient à H 1 et S(f ) ≤ Ŝ(f ). Ceci achève la preuve du fait que Ŝ = S. Enfin, la quatrième et dernière étape consiste à passer de la topologie produit sur C 0 à la topologie uniforme. Nous reviendrons sur l’étape analogue à la troisième étape dans la preuve du principe de grandes déviations pour le champ d’holonomie brownien. Notons simplement que cette étape a fait intervenir deux choses principales : la construction (ici extrêmement simple) d’approximations affines par morceaux de f et une propriété de compacité. 60 CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS Pour énoncer un principe de grandes déviations, nous devons définir une fonction de taux et pour cela, nous devons identifier l’espace des connexions qui joue le rôle de l’espace H 1 dans le théorème de Schilder. Cet espace est, comme nous l’avons dit, l’espace des fonctions d’énergie finie. Il nous faut donc identifier un espace naturel de connexions dont l’action de Yang-Mills est finie. Pour cela, il nous faut mieux comprendre la nature locale de cette action. Pour travailler localement dans un fibré principal, on choisit un ouvert U de M , suffisamment petit pour qu’il existe une section locale de P au-dessus de U , c’est-à-dire une application différentiable σ : U → P telle que π ◦ σ soit l’identité de U . On peut alors considérer la 1-forme différentielle A = σ ∗ ω sur U et la 2-forme F = σ ∗ Ω, toutes deux à valeurs dans g. La forme A s’écrit donc, en coordonnées locales (x, y), sous la forme A = Ax dx + Ay dy, où Ax et Ay sont des fonctions de U dans g. La fonction [Ax , Ay ], où le crochet est le crochet de Lie de g, c’est-à-dire le commutateur des matrices si G est un groupe de matrices, est encore une fonction de U dans g et la forme F s’écrit F = (∂x Ay − ∂y Ax + [Ax , Ay ])dx ∧ dy. La contribution de l’ouvert U à l’action S(ω) est donc Z k∂x Ay − ∂y Ax + [Ax , Ay ]k2 vol(dxdy). U Rappelons que vol a une densité lisse et strictement positive par rapport à la mesure de Lebesgue dans chaque carte. La présence du terme quadratique [Ax , Ay ] dans cette expression fait que l’espace des connexions d’action finie n’est pas défini de façon aussi univoque que dans le cas du mouvement brownien. En effet, l’expression [Ax , Ay ] n’a pas de sens si Ax et Ay sont des distributions, et il n’y a donc pas d’espace canonique de connexions-distributions dont la courbure soit L2 . Néanmoins, l’action d’une connexion est finie dès que ses composantes ont des dérivées dans L2 et sont elles-mêmes dans L4 . Or les théorèmes de Sobolev garantissent que l’espace H 1 (M ) des fonctions L2 sur M admettant des dérivées L2 est contenu dans Lp (M ) pour tout p ∈ [1, +∞). Notons au passage que si M était de dimension 3 (resp. 4), on aurait H 1 (M ) ⊂ L6 (M ) (resp. L4 (M )), ce qui serait encore suffisant pour affirmer que l’action de Yang-Mills d’une connexion H 1 est bien définie. Nous noterons H 1 A(P ) l’espace des connexions H 1 sur P . L’espace naturel de transformations de jauge qui agit sur cet espace est H 2 J (P ), l’espace des transformations H 2 . Nous affirmons donc que l’action de Yang-Mills est bien définie et finie sur le quotient S : H 1 A(P )/H 2 J (P ) → R+ . (2.2) Toutefois, contrairement à ce qui se passe dans le cas du théorème de Schilder, la fonctionnelle que nous venons de définir ne peut pas encore être la fonction de taux de notre principe de grandes déviations, car elle n’est pas définie sur le bon espace. Le champ d’holonomie brownien n’est pas une connexion aléatoire, mais une holonomie aléatoire. Il faut donc parvenir à transporter S sur l’espace des fonctions multiplicatives des lacets et pour cela il faut s’assurer qu’une connexion H 1 a bien une holonomie. 2.4. UN PRINCIPE DE GRANDES DÉVIATIONS 2.4.2 61 Les fonctions de taux Le problème est qu’une connexion H 1 en deux dimensions est bien moins régulière qu’une fonction H 1 sur un intervalle. En particulier, alors qu’une fonction H 1 sur [0, 1] y est continue, une fonction H 1 sur [0, 1]2 ne l’est pas nécessairement et on ne peut pas l’évaluer en un point particulier. Pour calculer l’holonomie d’une connexion localement donnée par la forme A le long d’un lacet l : [0, 1] → M , il faut pouvoir résoudre l’équation différentielle ḣt = −ht A(l˙t ), h0 = 1, où h : [0, 1] → G est la fonction inconnue. L’holonomie est alors la valeur de h en 1. Il suffit donc que la fonction t 7→ A(l˙t ) soit L1 , comme on peut s’en convaincre en écrivant, par itération, la solution sous forme de série infinie d’intégrales multiples. Fort heureusement, le long d’une courbe qui est une sous-variété lisse de M , une fonction H 1 admet une trace 1 qui est dans l’espace H 2 de cette courbe, donc en particulier dans L2 , et donc dans L1 . Notons que cette remarque reste vraie en dimension 3, où la trace est L2 , mais pas en dimension 4, où la classe de la trace d’une connexion H 1 le long d’une courbe est dans 1 l’espace H − 2 . Notons P∞ (M ) l’ensemble des chemins sur M qui sont des concaténations de sousvariétés lisses. Le résultat suivant résume la discussion précédente et précise en quel sens une connexion H 1 est caractérisée par son holonomie. Proposition 2.4.2 Soit π : P → M un fibré principal. L’application induite par l’holonomie après passage au quotient par transformations de jauge H 1 A(P )/H 2 J (P ) ,→ M(P∞ (M ), G)/GM est injective. Grâce à ce résultat et à l’équation (2.2), nous pouvons maintenant définir une fonctionnelle sur l’espace des fonctions multiplicatives de lacets. Pour éviter de travailler avec des classes d’équivalence, nous introduisons la notation suivante. Définition 2.4.3 Soit ω ∈ H 1 A(P ) une connexion sur P . Soit h ∈ M(P∞ (M ), G) une fonction multiplicative. On dit que ω et h sont liées, et on écrit ω ∼ h si l’image de la classe de ω par l’injection déterminée par l’holonomie est la classe de h. La fonction de taux du principe de grandes déviations est alors la suivante. Définition 2.4.4 Soit M une surface sans bord munie d’une mesure d’aire. Soit P un G-fibré principal sur M . On définit une fonction IP : M(P∞ (M ), G) → [0, +∞] en posant 1 S(ω) s’il existe ω ∈ H 1 A(P ) tel que ω ∼ f, ∞ 2 ∀h ∈ M(P (M ), G), IP (h) = +∞ sinon. Dans le cas où la surface a un bord, nous voulons pouvoir tenir compte de conditions au bord. Supposons M donnée et C un ensemble de conditions au bord au sens de la définition 1.3.2. Nous notons alors H 1 AC (P ) l’espace des connexions H 1 qui respectent ces conditions au bord. 62 CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS Définition 2.4.5 Soit M une surface dont le bord est non vide, munie d’une mesure d’aire et d’un ensemble C de conditions au bord. Soit P un G-fibré principal sur M . On définit une fonction IP,C : M(P∞ (M ), G) → [0, +∞] en posant 1 S(ω) s’il existe ω ∈ H 1 AC (P ) tel que ω ∼ f, ∞ 2 ∀h ∈ M(P (M ), G), IP,C (h) = +∞ sinon. Il est clair que les fonctions IP et IP,C ne dépendent du fibré P qu’à isomorphisme près. Nous pouvons donc indexer ces fonctionnelles par les classes d’isomorphismes de G-fibrés principaux. Expliquons brièvement comment ces fibrés sont classifiés. Puisque nous nous intéressons au champ markovien associé au mouvement brownien, et que le mouvement brownien issu de l’élément neutre sur un groupe de Lie ne visite que la composante connexe de l’élément neutre, nous supposerons dans ce qui suit que G est connexe. ENCART 9 – Classification des G-fibrés principaux Soit M une surface et π : P → M un G-fibré principal avec G connexe. Commençons par établir rapidement le fait que P est trivial, c’est-à-dire isomorphe à M × G, si et seulement s’il existe une application lisse σ : M → P telle que π ◦ σ soit l’identité de M . Une telle application s’appelle une section globale de P . Si P est isomorphe à M × G, soit ϕ : P → M × G un isomorphisme. Alors σ(m) = ϕ−1 ((m, 1)) est une section globale de P . Réciproquement, soit σ : M → P une section globale de P . Pour tout point p de P , π(σ(π(p))) = π(p) donc il existe un unique élément de G, que nous noterons γ(p), tel que p = σ(π(p)) · γ(p). Alors l’application ϕ(p) = (π(p), γ(p)) est un isomorphisme de P sur M × G. Supposons tout d’abord que le bord de M ne soit pas vide. La surface M contient alors un graphe, ou si l’on préfère un bouquet de cercles, sur lequel elle se rétracte par déformation. Pour des raisons purement topologiques, toute section de P au-dessus de ce graphe se prolonge en une section globale de P . Or, comme G est connexe, sa restriction au graphe admet nécessairement une section. Finalement, P est nécessairement trivial. Supposons maintenant que M soit orientable et fermée, c’est-à-dire sans bord. Dans ce cas, il peut exister des fibrés non-triviaux sur M . Considérons une courbe C sur M qui sépare M en deux surfaces M1 et M2 , par exemple le bord d’un petit disque mais pas nécessairement. Les restrictions de P à M1 et M2 admettent des sections globales, car ce sont des surfaces à bord. Choisissons deux telles sections, une de chaque côté de C. L’écart entre ces deux sections peut se mesurer le long de C, avec une convention d’orientation adaptée, et détermine une courbe fermée dans G. On peut, en changeant une des deux sections qu’on a choisies dans un petit voisinage cylindrique de C, transformer cette courbe dans G en n’importe quelle courbe homotope. Il s’ensuit aisément que si en faisant avec un autre fibré P 0 ce que nous venons de faire avec P nous obtenons une courbe fermée dans G homotope à celle obtenue avec P , alors P et P 0 sont isomorphes. Il y a donc au plus autant de classes d’isomorphisme de fibrés principaux que de classes d’homotopie dans G. Il est un peu moins évident, mais vrai, qu’en changeant les sections qu’on a choisies, on ne peut pas changer la classe d’homotopie de l’écart entre les deux sections. Pour justifier cela, on peut dire que deux sections sur M1 (resp. M2 ) diffèrent par une fonction lisse de M1 (resp. M2 ) dans G. Or toute telle fonction envoie le bord de M1 (resp. M2 ) sur une courbe homotopiquement triviale dans G. En effet le groupe fondamental de G est abélien, comme celui de tout groupe topologique. Ainsi, une fonction de M1 dans G étant donnée, la classe d’homotopie de l’image de C dans G ne dépend que de cette fonction et de l’image de la classe d’homotopie de C dans le quotient π1 (M1 )/[π1 (M1 ), π1 (M1 )], qui est isomorphe à H1 (M1 , Z). Or C est le bord de M1 et représente donc la classe d’homologie nulle (on peut d’ailleurs facilement écrire explicitement sa classe d’homotopie dans π1 (M1 ) comme un produit de commutateurs). Finalement, la classe d’homotopie de G qu’on obtient en comparant deux sections des restrictions de P de part et d’autre d’une courbe séparante de M ne dépend pas du choix de ces sections et caractérise P à isomorphisme près. Il y a donc exactement autant de classes d’isomorphisme de G-fibrés principaux au-dessus de M que d’éléments dans π1 (G). Si G est semi-simple, ce qui équivaut à dire que son centre est fini, alors 2.4. UN PRINCIPE DE GRANDES DÉVIATIONS 63 ce groupe fondamental est fini. Bien entendu, si G est simplement connexe, tous les G-fibrés principaux sur des surfaces sont triviaux. Notons enfin, bien que nous ne nous en servions pas, que sur une surface fermée non- orientable, les G-fibrés principaux sont classifiés par le quotient de π1 (G) par le sous-groupe formé par les éléments qui sont des carrés. Pour finir, donnons quelques exemples de groupes fondamentaux de groupes de Lie connexes. Pour tout N ≥ 1, le groupe fondamental de U (N ) est Z, la classe d’homotopie d’un lacet t 7→ γt étant donnée par l’indice de 0 par rapport à la courbe t 7→ det γt dans C∗ . Sur une surface orientable munie d’une métrique riemannienne, le fibré unitaire tangent est un U (1)-fibré principal dont la classe d’isomorphisme est donnée par la caractéristique d’Euler de la surface. Pour tout N ≥ 2, le groupe SU (N ) est simplement connexe. Tous les SU (N )-fibrés principaux sont dont triviaux. En revanche, le centre de SU (N ) est formé des matrices scalaires racines N -ièmes de l’unité et le groupe fondamental du quotient SU (N )/Z(SU (N )) est isomorphe à Z/N Z. Notons que le groupe fondamental de U (1)d × SU (n1 )/Z(SU (n1 )) × . . . × SU (nr )/Z(SU (nr )) est isomorphe à Zd ×Z/n1 Z×. . .×Z/nr Z, si bien que tout groupe abélien de type fini est isomorphe au groupe fondamental d’un groupe de Lie connexe. Enfin, pour tout N ≥ 3, le groupe fondamental de SO(N ) est Z/2Z. Il y a donc exactement deux SO(N )-fibrés principaux non-isomorphes au- dessus d’une surface connexe fermée. Puisque tous les fibrés sur une surface à bord sont triviaux (insistons sur le fait que ceci ne s’applique pas aux groupes finis, car nous supposons le groupe connexe), la fonctionnelle IP,C ne dépend pas de P . Nous la noterons simplement IC . Dans le cas d’une surface orientable sans bord, il y a donc une fonctionnelle IP pour chaque élément de π1 (G). Nous noterons Iz la fonctionnelle associée à l’élément z ∈ π1 (G). On peut de plus calculer la classe d’homotopie de G associée à un fibré P en fonction de l’holonomie déterminée par n’importe quelle connexion sur P . Ceci signifie que les parties de M(P∞ (M ), G) sur lesquelles deux fonctionnelles Iz et Iz0 sont finies sont égales si z = z 0 et disjointes sinon. 2.4.3 Le champ d’holonomie brownien et sa désintégration En cherchant à définir une fonction de taux, nous avons été amenés à en définir plusieurs, correspondant aux différents G-fibrés principaux non-équivalents au-dessus d’une surface. Or la définition du champ d’holonomie brownien, comme celle de n’importe quel autre champ markovien d’holonomie, est indépendante du choix d’un fibré principal particulier au-dessus de la surface. Il n’est donc pas vraisemblable que le champ d’holonomie brownien tel que nous l’avons défini soit l’objet pour lequel nous pourrons énoncer un principe de grandes déviations. Il est en fait possible, et nécessaire dans le cas présent, de désintégrer le champ brownien selon les classes d’isomorphismes de fibrés principaux. Avant d’expliquer ce point, décrivons brièvement le mouvement brownien sur G afin de définir correctement le champ qui lui est associé. ENCART 10 – Mouvement brownien sur un groupe de Lie compact connexe Soit G un groupe de Lie compact et connexe. Soit g son algèbre de Lie. Chaque élément de g peut être identifié à un opérateur différentiel du premier ordre sur G : pour tout A ∈ g, on définit l’opérateur LA en 64 CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS posant, pour toute fonction différentiable f : G → R et tout g ∈ G, (LA f )(g) = d f (getA ). dt |t=0 On suppose maintenant g munie d’une métrique invariante par conjugaison. Considérons (A1 , . . . , Ad ) une base orthonormée de g. Alors nous définissons le laplacien sur G, qui est un opérateur différentiel du deuxième ordre, en posant d X ∆= (LA )2 . i=1 Le mouvement brownien sur G est le processus de Markov dont le générateur est la moitié de ce laplacien, qui n’est autre que l’opérateur de Laplace-Beltrami associé à la métrique bi-invariante sur G déterminée par le produit scalaire invariant sur g. Donnons une autre description de ce mouvement brownien comme solution d’une équation différentielle stochastique. Nous supposons G donné comme un sous-groupe du groupe unitaire U (N ) et g comme un sous-espace vectoriel de u(N ), l’espace des matrices anti-hermitiennes. Soit à nouveau (A1 , . . . , Ad ) une base orthonormée de g. Soit (Bt )t≥0 le mouvement brownien dans g, c’est-à-dire le processus dont les composantes sur A1 , . . . , Ad sont des mouvements browniens réels standard indépendants. Posons par ailleurs C = A21 + . . . + A2d . Cette matrice, dite de Casimir, commute à tous les éléments de G. Par exemple, si G est U (N ) lui-même et si u(N ) est munie du produit scalaire hA, Bi = Tr(A∗ B), alors C = −N IN . On considère alors l’équation différentielle stochastique linéaire suivante dans MN (C), écrite avec la notation d’Itô : 1 dXt = Xt dBt + CXt dt, X0 = IN . 2 On vérifie que la solution (Xt )t≥0 de cette équation reste dans G et on l’appelle le mouvement brownien dans G. Insistons sur le fait que ce mouvement brownien n’est pas l’exponentielle du mouvement brownien B dans g. C’en est une exponentielle non-commutative, aussi appelée P -exponentielle (pour path-ordered). On peut aussi dire que X est obtenu en faisant rouler G sur son algèbre de Lie sans glissement le long de B. Enfin, on peut écrire, pour tout t, Bt = lim exp X nt exp(X 2t − X 2t ) . . . exp(X (n−1)t − X nt ). n n n n→∞ n Soit G un groupe de Lie connexe muni d’une métrique bi-invariante. Notons YM le champ d’holonomie associé au mouvement brownien sur G. Théorème 2.4.6 Soit (M, vol) une surface sans bord. Il existe une variable aléatoire o : M(P(M ), G) → π1 (G), définie sous la mesure YMM,vol , qui mesure en un sens naturel la classe d’isomorphisme du fibré principal sous-jacent à une fonction multiplicative donnée. La désintégration de la mesure YMM,vol par rapport à o détermine, pour chaque élément z de π1 (G) P une mesure finie YMzM,vol sur M(P(M ), G), de telle sorte que 1. YMM,vol = z∈π1 (G) YMzM,vol , 2. pour tout z ∈ π1 (G), on a YMzM,vol (o 6= z) = 0. 2.4. UN PRINCIPE DE GRANDES DÉVIATIONS 65 Il n’est pas difficile de décrire les masses des mesures finies YMzM,vol , au moins dans le cas où M est la sphère S 2 . Dans ce cas, la masse de YMM,vol est Qvol(M ) (1), c’est-à-dire la densité en l’élément neutre de G de la loi au temps vol(M ) du mouvement brownien sur G issu de l’élément neutre. C’est donc la masse naturelle du pont brownien de longueur vol(M ) sur G. Si l’on relève ce pont brownien sur un revêtement universel de G, qui e on trouve un mouvement brownien issu de est un groupe de Lie que nous noterons G, l’élément neutre et conditionné à finir au temps vol(M ) en un point de la fibre au-dessus de l’élément neutre de G. Cette fibre s’identifie canoniquement à π1 (G) et, si nous notons evol(M ) la densité au temps vol(M ) du mouvement brownien sur G, e nous pouvons écrire Q evol(M ) (z). que la masse de YMzM,vol est égale à Q z La construction des mesures YMM,vol est l’objet de l’article [L4]. On procède par une méthode d’approximation discrète analogue à celle utilisée pour construire les champs d’holonomie markoviens. Toutefois, il faut modifier la définition de la théorie discrète pour prendre en compte le fait que la restriction d’un fibré principal à un graphe tracé sur une surface est toujours triviale, si bien que cette restriction ignore la topologie de P . On vérifie à l’issue de cette construction qu’on a une propriété de singularité mutuelle un peu plus forte. Proposition 2.4.7 Pour tous T, T 0 > 0 et tous z, z 0 ∈ π1 (G), les mesures YMzM,T vol et 0 YMzM,T 0 vol sont singulières, sauf si (T, z) = (T 0 , z 0 ). La discussion du revêtement universel de G ci-dessus ressemble fort à la discussion de la section 1.3.3. En effet, dans le cas sans bord, la variable aléatoire T qui est apparue alors était bien la même variable que nous avons appelée o. Ainsi, la désintégration donnée par le théorème 2.4.6 s’obtient explicitement, dans le cas abélien, en remplaçant la variable T par la valeur déterministe correspondant au type topologique de fibré choisi. Dans ce cadre abélien, où W , le bruit blanc, jouait le rôle de la courbure, on peut d’ailleurs également comprendre T comme la courbure totale du fibré qu’on considère, qui, d’après le théorème de Gauss-Bonnet, est un invariant topologique du fibré. 2.4.4 Le principe de grandes déviations Nous pouvons maintenant énoncer le résultat rigoureux qui lie les mesures YMzM,vol et l’action de Yang-Mills. Les deux théorèmes qui suivent sont prouvés dans [LN5]. Théorème 2.4.8 ([LN5, Theorem 4]) Soit (M, vol) une surface fermée munie d’une mesure d’aire. Soit G un groupe de Lie compact connexe muni d’une métrique riemannienne bi-invariante. Soit z un élément de π1 (G). Alors la famille de mesures de probabilités associée à la famille de mesures finies (YMzM,T vol )T >0 sur l’espace (M(P∞ (M ), G), C ) satisfait un principe de grandes déviations de vitesse T et de fonction de taux Iz . Théorème 2.4.9 ([LN5, Theorem 3]) Soit (M, vol) une surface dont le bord est non vide, munie d’une mesure d’aire et d’un ensemble C de conditions au bord. Soit G un groupe de Lie compact connexe muni d’une métrique riemannienne bi-invariante. Alors la famille de mesures de probabilités associée à la famille de mesures finies (YMM,T vol,∅,C )T >0 66 CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS sur l’espace (M(P∞ (M ), G), C ) satisfait un principe de grandes déviations de vitesse T et de fonction de taux IC . Le premier théorème signifie, par définition d’un principe de grandes déviations, que pour toute partie mesurable A ⊂ M(P∞ (M, G)), on a les inégalités − inf◦ Iz (f ) ≤ lim T log YMzM,T vol (A) ≤ lim T log YMzM,T vol (A) ≤ − inf Iz (f ), f ∈A T →0 T →0 (2.3) f ∈A où A◦ et A désignent respectivement l’intérieur et l’adhérence de A pour la topologie sur ∞ M(P∞ (M, G) qui est la trace de la topologie produit sur GP (M ) . Par ailleurs, dire que la fonction Iz est une fonction de taux sous-entend qu’elle est semi-continue inférieurement pour cette même topologie. Cette topologie est compacte. Les ensembles de niveau de la fonction Iz sont donc automatiquement compacts : c’est une bonne fonction de taux, dans le sens technique des grandes déviations. Toutefois, elle l’est de par la pauvreté de la topologie ambiante et cette précision apporte peu d’informations. Notons que nous avons énoncé (2.3) avec des mesures finies plutôt que des mesures de probabilités, mais l’effet de la normalisation de ces mesures est insensible dans l’échelle où l’on se place ici, puisque YMzM,T vol (1) = O( √1T ). La preuve de ce théorème suit les grandes étapes de la preuve du théorème de Schilder (voir plus haut l’encart 8), à ceci près que la quatrième étape est inutile puisque les deux théorèmes que nous venons d’énoncer utilisent la topologie produit sur l’espace des fonctions multiplicatives. La première étape se fait en utilisant un résultat classique de S. Varadhan [Var67a, Var67b] qui détermine la fonctionnelle de grandes déviations pour le noyau de la chaleur sur G. La deuxième étape utilise le théorème de Dawson-Gärtner [DZ93], avec une complication due au fait que toutes les marges fini-dimensionnelles des champs d’holonomies ne sont pas explicitement connues. Il faut donc procéder à des approximations et vérifier qu’elles sont pertinentes dans l’échelle exponentielle où l’on se place. La troisième étape en revanche, est beaucoup plus difficile que dans le cas du théorème de Schilder. L’expression de la fonction de taux que l’on obtient est la suivante : ˆ I(h) = sup G X dG (1, h(∂F ))2 F ∈F 2vol(F ) , ˆ où le supremum est pris sur l’ensemble des graphes sur M . Le fait que I(h) soit inférieur à I(h) lorsque h est, à transformation de jauge près, l’holonomie d’une connexion H 1 , se déduit d’une inégalité d’énergie initialement due à A. Sengupta [Sen98]. Il faut ensuite ˆ considérer un h tel que I(h) < +∞, montrer qu’il est associé à une connexion H 1 et que I(h) ≤ Ŝ(h). Pour cela, on prend des graphes sur la surface, et on cherche des connexions d’énergie minimale qui ont, le long des arêtes de ce graphe, la même valeur que h. L’existence de telles connexions est établie par le résultat suivant. e un revêtement universel de G, muni de l’unique métrique riemannienne qui Notons G e → G localement isométrique. Rappelons que le rende l’application de revêtement π : G groupe fondamental de G s’identifie avec la fibre π −1 (1). 2.4. UN PRINCIPE DE GRANDES DÉVIATIONS 67 Proposition 2.4.10 ([LN5, Proposition 22]) Soit M une surface sans bord. Soit G un graphe sur M dont les arêtes sont des sous-variétés lisses de M . Soit g un élément de e tel que pour tout e ∈ E on ait π(g̃(e)) = g(e). M(E, G). Soit g̃ un élément de M(E, G) Q Soit z un élément de π1 (G). Soit zF = (zF )F ∈F un élément de π1 (G)F tel que F ∈F zF = z. Il existe un G-fibré principal P au-dessus de M et une connexion ω sur P tels que les propriétés suivantes soient vérifiées. 1. La classe d’isomorphisme de P est représentée par z. 2. La connexion ω est lipschitzienne et sa restriction à l’intérieur de chaque face est lisse. 3. L’élement de M(E, G) déterminé par ω est égal, à une transformation de jauge près, à g. 4. La contribution de chaque face F à l’action de Yang-Mills de ω est SF (ω) = dGe (g̃(∂F )zF )2 . vol(F ) La connexion ω dont cette proposition assure l’existence est donc l’analogue de l’interpolation linéaire par morceaux d’une fonction continue dans la preuve du théorème de Schilder. Cette connexion a l’énergie minimale permise par l’inégalité d’énergie mentionnée plus haut au vu des contraintes qu’on impose sur son holonomie et sur la classe d’isomorphisme du fibré. En faisant à partir de notre élément h cette construction pour une famille de graphes de plus en plus fins, on obtient une famille de connexions dont l’action est bornée par ˆ I(h). Il faut utiliser un argument de compacité pour en extraire une limite. Or, s’il est facile de vérifier que l’énergie H 1 d’une connexion domine son action, c’est-à-dire qu’il existe une constante K telle que, au moins localement, on ait S(ω) ≤ KkωkH 1 , l’inégalité inverse n’est pas vraie. Le fait que les connexions que produit la proposition ci-dessus aient une action bornée ne permet pas d’affirmer que leur norme H 1 le soit. En revanche, un théorème difficile de K. Uhlenbeck affirme qu’on peut se ramener à cette situation en appliquant des transformations de jauge appropriées aux connexions et permet de conclure à l’égalité des fonctions de taux. Théorème 2.4.11 ([Uhl82]) Soit P un fibré principal sur M . Soit (ωn )n≥1 une suite de connexions H 1 sur P , telle que la suite (S(ωn ))n≥0 soit bornée. Alors il existe une connexion H 1 ω telle que, quitte à extraire une sous-suite de la suite (ωn )n≥1 et à faire agir sur chacun de ses termes une transformation de jauge H 2 (qui peut être différente pour chaque terme de la suite), on ait la convergence faible H1 ωn * ω. n→∞ 68 CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS Chapitre 3 Mouvement brownien unitaire Une des directions d’étude du champ de Yang-Mills qui semble les plus prometteuses et qui en tout cas me semble particulièrement attrayante est ce que les anglo-saxons désignent par large N limit, c’est-à-dire le comportement asymptotique de ce champ pris à valeurs dans le groupe unitaire U (N ) lorsque N tend vers l’infini. Ce point de vue lie le champ de Yang-Mills au vaste domaine de recherches que constitue l’étude des grandes matrices aléatoires et de leurs limites. En particulier, en accord avec ce qu’indique, à un niveau heuristique, un article fondateur d’I. Singer [Sin95], la théorie des probabilités libres semble constituer un cadre naturel pour exprimer certaines propriétés asymptotiques du champ de Yang-Mills. La première étape de l’étude asymptotique du champ de Yang-Mills consiste en l’étude asymptotique du mouvement brownien sur le groupe unitaire. Dans ce chapitre, nous allons présenter trois travaux relatifs à ce mouvement brownien, qui présentent trois aspects distincts du problème. Nous commençons par rappeler de quoi il s’agit et par présenter certains résultats connus antérieurement à nos travaux. Ce chapitre est rédigé de façon à pouvoir être lu indépendamment des deux précédents. 3.1 3.1.1 Aspects combinatoires du mouvement brownien unitaire [L6] Définition du mouvement brownien unitaire Soit N ≥ 1 un entier, qui dans tout ce qui suit représente la taille des matrices. Nous considérons le groupe unitaire U(N ) = {U ∈ GLN (C) : U U ∗ = U ∗ U = IN }. Il s’agit d’un sous-groupe compact et connexe de GLN (C). C’est aussi une sous-variété différentiable lisse réelle de dimension N 2 de MN (C). Son algèbre de Lie est le sous-espace vectoriel réel u(N ) de dimension N 2 de MN (C) formé des matrices anti-hermitiennes : u(N ) = {A ∈ MN (C) : A∗ = −A}. C’est aussi l’espace des matrices A telles que etA soit unitaire pour tout t réel. Pour tout U ∈ U(N ), l’espace vectoriel u(N ) est laissé stable par la transformation linéaire de MN (C) donnée par A 7→ U AU −1 . L’action linéaire de U (N ) sur u(N ) s’appelle l’action adjointe, ou simplement action par conjugaison. Nous munissons u(N ) du produit scalaire suivant : ∀A, B ∈ u(N ), hhA, Bii = N Tr(A∗ B). 69 70 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE Précisons une fois pour toutes que nous notons Tr(·) la trace usuelle et tr(·) la trace normalisée si bien que Tr(IN ) = N et tr(IN ) = 1. Le produit scalaire hh·, ·ii est invariant par l’action de U(N ) par conjugaison. Ce n’est pas le seul, même à une constante multiplicative près, et les raisons pour lesquelles nous le choisissons apparaitront bientôt. Sur l’espace euclidien (u(N ), hh·, ·ii), il y a un mouvement brownien naturel, qui est l’unique processus gaussien (KN (t))t≥0 indexé par R+ et à valeurs dans u(N ) dont la covariance est la suivante : ∀s, t ∈ R+ , ∀A, B ∈ u(N ), E[hhA, KN (t)iihhB, KN (s)ii] = min(s, t)hhA, Bii. On peut penser au processus KN comme à un processus stochastique à valeurs dans un sous-espace vectoriel de MN (C), ou, si l’on préfère, comme à une matrice anti-hermitienne de processus à valeurs dans C. De ce dernier point de vue, les coefficients de KN sont des mouvements browniens complexes, aussi indépendants que le permet la condition d’anti√ hermiticité. Plus précisément, chaque coefficient diagonal a la loi de iB/ N , où B est un mouvement brownien standard et chaque coefficient non diagonal a la loi de (B + √ iB 0 )/ 2N , où B et B 0 sont deux mouvements browniens standard indépendants. Enfin, les coefficients situés sur la diagonale ou au-dessus forment une famille indépendante. On vérifie que la matrice des covariations quadratiques hdKN , dKN it vaut −IN dt. On définit le mouvement brownien sur le groupe U(N ) comme la solution de l’équation différentielle stochastique linéaire suivante : 1 dUN (t) = UN (t)dKN (t) − UN (t) dt. (3.1) 2 Cette équation est écrite au sens d’Itô et sa solution est un processus à valeurs dans MN (C). On peut en déduire une EDS satisfaite par UN∗ et, connaissant la covariation quadratique hKN , KN i, une simple application de la formule d’Itô permet de vérifier que d(UN UN∗ ) = 0, si bien que pour toute condition intiale UN (0) unitaire, le processus UN reste dans le groupe unitaire. On prendra en général UN (0) = IN . Nous allons maintenant décrire le générateur de UN et écrire la formule d’Itô sous une forme qui nous sera utile. Pour cela, observons que chaque élément u(N ) détermine un opérateur différentiel invariant à gauche sur U(N ). Ainsi, si A appartient à u(N ), nous définissons un opérateur différentiel LA en posant, pour toute fonction différentiable F : U(N ) → R et tout U ∈ U(N ), (LA F )(U ) = d F (U etA ). dt |t=0 Soulignons le fait que, dans la formule ci-dessus, la fonction F n’est évaluée qu’en des points du groupe unitaire. Soit maintenant X1 , . . . , XN 2 une base orthonormée de u(N ). Alors on définit le laplacien sur U(N ) comme l’opérateur différentiel du second ordre 2 ∆= N X (LXk )2 . k=1 On vérifie aisément que cet opérateur ne dépend pas du choix de la base orthonormée. La formule d’Itô pour UN s’écrit comme suit. Notons que les processus (hhXk , KN ii : k = 1, . . . , N 2 ) sont des mouvements browniens réels standard indépendants. 3.1. ASPECTS COMBINATOIRES DU MOUVEMENT BROWNIEN UNITAIRE [L6] 71 Proposition 3.1.1 (Formule d’Itô) Soit F : R+ × U(N ) → R une fonction de classe C 2 . Alors pour tout t ≥ 0, on a l’égalité 2 F (t, UN (t)) = F (0, UN (0)) + N Z X t k=1 0 Z t + 0 (LXk F )(s, UN (s))dhhXk , KN iis 1 ∆F + ∂t F 2 (s, UN (s)) ds. En utilisant l’équation différentielle stochastique (3.1) ou la formule d’Itô, on vérifie que le mouvement brownien est invariant par conjugaison et par inversion. Ceci signifie que pour tout V ∈ U(N ), les processus UN , V UN V −1 et UN−1 ont même loi. 3.1.2 Distribution des valeurs propres et sommes de Newton Soit U un élément de U(N ). Il admet N valeurs propres z1 , . . . , zN qui sont des nombres complexes de module 1 et nous associons à U sa mesure spectrale empirique qui est la mesure de probabilités suivante sur le cercle unité U = {z ∈ C : |z| = 1} : µ̂U = N 1 X δz . N i=1 i (3.2) Pour tous N ≥ 1 entier et t ≥ 0 réel, la mesure µ̂UN (t) est une mesure aléatoire sur U et le premier résultat que nous allons présenter décrit partiellement sa loi. Puisque U est une partie compacte de C, une Rmesure de probabilités ν sur U est caractérisée par ses moments qui sont les nombres U z n ν(dz), n ∈ Z. Ces moments sont des nombres complexes de module inférieur ou égal à 1. Si ν est une mesure aléatoire, elle est caractérisée par la loi de la suite de ses moments, qui, puisque ces moments sont uniformément bornés, est à son tour caractérisée par la donnée de toutes les espérances de la forme Z Z m1 mr E z ν(dz) . . . z ν(dz) , r ≥ 1, m1 , . . . , mr ∈ Z. U U Nous allons donner une formule pour ces espérances pour la mesure µ̂UN (t) lorsque tous les entiers m1 , . . . , mr sont de même signe. Puisque le mouvement brownien a même loi que son inverse, la mesure µ̂UN (t) a même loi que son image par la conjugaison complexe et il suffit de considérer le cas où m1 , . . . , mr sont positifs. Observons que les moments de la mesure µ̂UN (t) peuvent s’écrire simplement en fonction de UN (t). En effet, pour tout n ∈ Z, notant z1 , . . . , zN les valeurs propres de UN (t), on a Z U z n µ̂UN (t) (dz) = N 1 X n zi = tr(UN (t)n ). N i=1 Nous allons donc considérer des quantités de la forme tr(UN (t)m1 ) . . . tr(UN (t)mr ) où m1 , . . . , mr sont des entiers strictement positifs. Une telle quantité, comme fonction des valeurs propres de UN (t), est une fonction symétrique, en l’occurence un produit de sommes 72 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE de Newton. La notation classique pour un tel produit est pλ , où λ est la partition de l’entier n = m1 + . . . + mr formée par m1 , . . . , mr rangés dans l’ordre décroissant. Toutefois, plutôt que des partitions, nous allons utiliser des permutations pour indexer ces fonctions. Le fait que cette indexation soit très redondante sera compensée par d’autres avantages. Dans tout ce qui suit, nous noterons les permutations comme des produits de cycles distincts en omettant les cycles de longueur 1. Ainsi, l’élément (124) de S4 est la permutation qui envoie 1 sur 2, 2 sur 4, 3 sur 3 et 4 sur 1. Définition 3.1.2 Soit n ≥ 1 un entier. Soit σ un élément de Sn . Soient m1 , . . . , mr les longueurs des cycles de σ. Soit M un élément de MN (C). On pose pσ (M ) = tr(M m1 ) . . . tr(M mr ) et Pσ (M ) = Tr(M m1 ) . . . Tr(M mr ) = N r pσ (M ). Plus généralement, soient M1 , . . . , Mn des éléments de MN (C). On pose alors Y pσ (M1 , . . . , Mn ) = tr(Mi1 . . . Mis ) (i1 ...is ) cycle de σ et Pσ (M1 , . . . , Mn ) = Y Tr(Mi1 . . . Mis ) = N r pσ (M1 , . . . , Mn ). (i1 ...is ) cycle de σ Remarquons que les deux dernières définitions ont un sens grâce à l’invariance de la trace par permutation cyclique. Ainsi par exemple, si n = 4 et σ = (124), on a pσ (M1 , M2 , M3 , M4 ) = tr(M1 M2 M4 )tr(M3 ) = tr(M2 M4 M1 )tr(M3 ). 3.1.3 Expression combinatoire des moments de la distribution spectrale Pour énoncer le résultat principal de cette section, il nous faut introduire quelques notions relatives à une géométrie discrète du groupe symétrique. Soit n ≥ 1 un entier, Sn le groupe des permutations de {1, . . . , n}, et Tn ⊂ Sn l’ensemble de toutes les transpositions de Sn . L’ensemble Tn engendre Sn et on forme le graphe de Cayley correspondant en prenant pour sommets les éléments de Sn et en reliant deux éléments σ1 et σ2 de Sn par une arête si σ1 σ2−1 appartient à Tn . Pour chaque permutation σ, on appelle |σ| la distance entre σ et l’identité, c’est-àdire la plus petite longueur d’une écriture de σ comme produit de transpositions. Si `(σ) désigne le nombre de cycles de σ, y compris les cycles de longueur 1, alors |σ| = n − `(σ). Pour comprendre cette égalité, on peut par exemple observer ce qui se passe lorsqu’on mutliplie une permutation σ par une transposition (kl). Si k et l sont dans le même cycle de σ, alors ce cycle est coupé en deux et (kl)σ a un cycle de plus que σ. En revanche, si k et l sont dans deux cycles distincts de σ, alors ces deux cycles fusionnent et (kl)σ a un cycle de moins que σ. Cette remarque entraîne aussi la conséquence suivante : lorsqu’on suit un chemin (σ0 , . . . , σk ) dans le graphe de Cayley, le nombre de cycles varie à chaque pas de 1 ou −1 : pour chaque i = 0, . . . , k − 1, on a |σi+1 | = |σi | ± 1. 3.1. ASPECTS COMBINATOIRES DU MOUVEMENT BROWNIEN UNITAIRE [L6] 73 (1234) (1243) (1324) (1342) (1423) (1432) 3 (12)(34) (13)(24) (14)(23) 2 |σ| (123) (132) (124) (142) (134) (143) (234) (243) 1 (12) (13) (14) (23) (24) (34) 0 id Figure 3.1 – Le graphe de Cayley de S4 engendré par ses transpositions. Définition 3.1.3 Soit (σ0 , . . . , σk ) un chemin dans le graphe de Cayley de Sn . On appelle longueur de ce chemin l’entier k et défaut de ce chemin l’entier d = #{i ∈ {0, . . . , k − 1} : |σi+1 | = |σi | + 1}. Pour tous σ, σ 0 appartenant à Sn , tous k, d ≥ 0, on note Πk (σ) l’ensemble des chemins de longueur k issus de σ, Πk (σ → σ 0 ) l’ensemble des chemins de longueur k issus de σ et aboutissant à σ 0 et S(σ, k, d) le nombre de chemins issus de σ, de longueur k et de défaut d. Le défaut d’un chemin est donc le nombre de pas qui l’éloignent de l’identité. Si un chemin de longueur k et de défaut d relie σ à σ 0 , on a donc |σ 0 | = |σ| − (k − 2d). En particulier, |k − 2d| ≤ n − 1. L’entier S(σ, k, d) est donc nul dès que |k − 2d| ≥ n. Par ailleurs, cet entier ne dépend que de la classe de conjugaison de σ, puisque le graphe de Cayley est inchangé si l’on renomme tous ses sommets en les conjugant par une permutation fixée. Le résultat principal est le suivant. Théorème 3.1.4 ([L6, Theorem 3.3]) Soient N, n ≥ 1 deux entiers. Soit UN le mouvement brownien sur U(N ) associé au produit scalaire hhX, Y ii = N Tr(X ∗ Y ) sur u(N ). Soient M1 , . . . , Mn des éléments de MN (C). Soit σ un élément de Sn . Alors, pour tout t ≥ 0, on a le développement en série suivant : nt E[pσ (M1 UN (t), . . . , MN UN (t))] = e− 2 X (−t)k k!N 2d k,d≥0 X |σ 0 |=|σ|−(k−2d) #Πk (σ → σ 0 )pσ0 (M1 , . . . , MN ). En particulier, notant m1 , . . . , mr les longueurs des cycles de σ, on a E[tr(UN (t) m1 m1 ) . . . tr(UN (t) − nt 2 )] = e X (−t)k S(σ, k, d). k!N 2d k,d≥0 74 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE Pour tout T ≥ 0, ces développements en série sont normalement convergents pour (N, t) ∈ N∗ × [0, T ]. La somme sur la permutation σ 0 qui intervient dans le premier développement peut se réécrire comme une somme sur tous les chemins issus de σ de longueur k et de défaut d, en prenant pour σ 0 le point où aboutit le chemin. Ceci entraîne immédiatement le second développement lorsqu’on prend toutes les matrices M1 , . . . , MN égales à la matrice identité. 3.1.4 Énumération de chemins dans le groupe symétrique L’énoncé du théorème 3.1.4 appelle plusieurs remarques. Tout d’abord, nous avons déjà observé que les nombres S(σ, k, d) sont nuls si |k − 2d| > n − 1. Ainsi, pour tout k ≥ 0, la contribution d’ordre tk est polynomiale en N12 et surtout, pour tout d ≥ 0, la contribution d’ordre N12d est polynomiale en t. Ensuite, les nombres S(σ, k, d) sont extrêmement difficiles à calculer. À titre d’amusement, on peut essayer de vérifier à l’aide de la figure 3.1 que S((12)(34), 3, 1) = 104. Il n’y a pas de formule pour la plupart de ces nombres. Les S(σ, k, 0), qui comptent les chemins qui ne font que se rapprocher de l’identité, font exception. On peut le comprendre en observant que le long de ces chemins, deux éléments qui à un moment donné n’appartiennent pas au même cycle, ne seront jamais réunis : ces chemins n’avancent qu’en fragmentant des cycles. Ceci indique qu’il suffit de connaître les S(σ, k, 0) lorsque σ n’a qu’un cycle non-trivial et que dans ce cas, ce nombre ne dépend que de la longueur de ce cycle, pas du nombre des points fixes de σ hors de ce cycle. Il suffit donc de connaître les nombres S((1 . . . n), k, 0). Proposition 3.1.5 ([L6, Proposition 6.6]) Pour tous n ≥ 1 et k ≥ 0, on a n S((1 . . . n), k, 0) = nk−1 . k+1 On retrouve par exemple le résultat classique suivant : le nombre S((1 . . . n), n − 1, 0) d’écrire le n-cycle (1 . . . n) comme produit de n − 1 transpositions vaut nn−2 . Fort heureusement, les coefficients correspondant à d = 0 sont exactement ceux qui interviennent lorsque N tend vers l’infini. Comme la série converge uniformément par rapport à N , on peut passer à la limite sous le signe somme et on retrouve le résultat suivant, qui avait été démontré d’une autre façon par P. Biane [Bia97]. Proposition 3.1.6 Pour tout n ≥ 1 et tout t ≥ 0, on a lim E[tr(UN (t) )] = e n N →∞ − nt 2 n−1 X (−t)k n nk−1 . k! k+1 k=0 Nous reviendrons plus en détail sur ce résultat. Pour le moment, mentionnons une formule qui exprime les nombres S((1 . . . n), k, d) pour tout d ≥ 0. Rappelons la définition 3.1. ASPECTS COMBINATOIRES DU MOUVEMENT BROWNIEN UNITAIRE [L6] des nombres de Stirling de deuxième espèce, s(n, k), aussi notés l’identité suivante dans C[x] : 75 n . Ils sont définis par k n X n k x(x − 1) . . . (x − n + 1) = x . k k=0 n − k de l’identité. On vérifie que nk est le nombre de permutations de Sn à distance n n En particulier, 0 = 0. Adoptons la convention selon laquelle k = 0 si k < 0. On a alors le résultat suivant. Proposition 3.1.7 Pour tous n, k, d ≥ 0, 1 S((1 . . . n), k, d) = n X k s + 1 r + 1 (−1)l+r n (s − r) . r!s! 2 s+1−l r+1−m r,s,l,m≥0 r+s=n−1 l+m=n−1−k+2d La somme ci-dessus est bien une somme finie. Notons qu’il n’est pas évident que l’expression donnée par cette formule lorsque d = 0 coïncide avec l’expression donnée précédemment. De plus, lorsque d > 0, cette formule ne suffit pas pour obtenir S(σ, k, d) pour des permutations plus générales. En effet, lorsqu’on compte des chemins de défaut non nul, on ne peut plus travailler cycle par cycle comme pour des chemins de défaut nul. Néanmoins, cette formule permet d’établir le résultat combinatoire amusant suivant. Proposition 3.1.8 Soit n ≥ 1 un entier. Pour tout entier p ≥ 0, soit cn,p le nombre de façons distinctes d’écrire le cycle (1 . . . n) ∈ Sn comme produit de p transpositions. Le nombre cn,p est non nul seulement si p = n − 1 + 2d pour un certain d ≥ 0. Dans ce cas, cn,p p n−1 np X n−1 r n−1 = S((1 . . . n), n − 1 + 2d, d) = (−1) −r . n! r=0 r 2 Pour tout n ≥ 1, on a l’égalité X p≥0 cn,p n−1 xp 1 n(n−1) = e 2 x 1 − e−nx . p! n! En particulier, cn,n−1 = nn−2 , cn,n+1 = cn,n+3 = 3.1.5 1 (n2 24 − 1)nn+1 et 1 (5n − 7)(n + 3)(n + 2)(n2 − 1)nn+3 . 5760 Mouvement brownien unitaire et marche aléatoire symétrique Dans ce paragraphe, nous allons expliquer comment la dualité de Schur-Weyl rend plausible le théorème 3.1.4 puis énoncer un résultat qui lie la mouvement brownien sur U(N ) et la marche aléatoire la plus naturelle sur le groupe symétrique Sn . 76 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE ENCART 11 – Dualité de Schur-Weyl Soient n, N ≥ 1 deux entiers. Il y a sur l’espace vectoriel (CN )⊗n des formes n-linéaires sur (CN )∗ deux actions naturelles ρ et π, respectivement du groupe unitaire U(N ) et du groupe symétrique Sn , données par ρ(U )(x1 ⊗ . . . ⊗ xn ) = U x1 ⊗ . . . ⊗ U xn π(σ)(x1 ⊗ . . . ⊗ xn ) = xσ−1 (1) ⊗ . . . ⊗ xσ−1 (n) . Ces deux actions commutent l’une à l’autre : pour tout U ∈ U(N ) et tout σ ∈ Sn , on a ρ(U ) ◦ π(σ) = π(σ) ◦ ρ(U ). Notons R la sous-algèbre de End((CN )⊗n ) engendrée par les (ρ(U ) : U ∈ U(N )) et P celle engendrée par les (π(σ) : σ ∈ Sn ). Alors tout élément de R commute à tout élément de P. Le théorème de Schur-Weyl affirme que les algèbres R et P sont le commutant l’une de l’autre. Théorème 3.1.9 (Dualité de Schur-Weyl) Tout endomorphisme de (CN )⊗n qui commute à R appartient à P et tout endomorphisme de (CN )⊗n qui commute à P appartient à R. D’après le théorème de densité de Jacobson, qui entraîne qu’une sous-algèbre de l’algèbre des endomorphismes d’un espace vectoriel de dimension finie est égale au commutant de son commutant, les deux assertions du théorème sont équivalentes. L’algèbre P est simplement l’algèbre des combinaisons linéaires des éléments π(σ) où σ décrit Sn . Il est commode pour la décrire d’introduire l’algèbre C[Sn ] du groupe Sn , qui est l’espace vectoriel des combinaisons P linéaires formelles σ λσ σ d’éléments de σ muni de la multiplication X aσ σ X bσ0 σ 0 = σ0 σ X aσ bσ0 σσ 0 . σ,σ 0 Cette algèbre s’identifie naturellement avec l’algèbre de convolution des fonctions sur Sn . L’action π : Sn → End((CN )⊗n ) se prolonge par linéarité à C[Sn ] pour donner un morphisme d’algèbres dont l’image est précisément P. Nous allons appliquer la dualité de Schur-Weyl à l’image par ρ du laplacien sur U(N ). Pour donner un sens à cette image, commençons par étendre ρ à u(N ), par différentiation : pour tout A ∈ u(N ), on peut définir ρ(A) = dtd |t=0 ρ(etA ) = (LA ρ)(IN ). Concrètement, on a N X ρ(A)(x1 ⊗ . . . ⊗ xN ) = x1 ⊗ . . . ⊗ xk−1 ⊗ Axk ⊗ xk+1 ⊗ . . . ⊗ xN . k=1 On peut alors définir 2 ρ(∆) = N X ρ(Xk )2 , k=1 qui n’est autre que (∆ρ)(IN ) si l’on voit ρ comme une application lisse de U(N ) dans l’espace vectoriel End((CN )⊗n ). L’opérateur ∆ a la propriété d’être invariant par les translations. Ceci peut se vérifier infinitésimalement en vérifiant qu’il commute à tous les opérateurs LA , où A ∈ u(N ). Ceci entraîne que l’endomorphisme ρ(∆) de (CN )⊗n commute à R. D’après le théorème de Schur-Weyl, il appartient donc à P. Il peut donc s’écrire comme combinaison linéaire d’endomorphismes de la forme π(σ) pour σ ∈ Sn . 3.1. ASPECTS COMBINATOIRES DU MOUVEMENT BROWNIEN UNITAIRE [L6] 77 Appelons L le générateur de la chaîne de Markov sur le graphe de Cayley du groupe symétrique qui saute à taux N1 de son état présent à chacun de ses n(n − 1)/2 voisins. L’opérateur L agit sur les fonctions de Sn dans C selon la formule Lf (σ) = − 1 X n(n − 1) f (σ) + f (στ ). 2N N τ ∈T n Si nous identifions l’espace des fonctions de Sn dans C avec l’algèbre C[Sn ], l’action de L est simplement la multiplication par l’élément L=− 1 X n(n − 1) + τ. 2N N τ ∈T n Le résultat, implicitement présent dans les travaux de D. Gross et W. Taylor [GT93a], est alors le suivant. Lemme 3.1.10 On a l’égalité 1 n n(n − 1) ρ(∆) + π(L) = − − . 2 2 2N Ce résultat est remarquable dans la mesure où il lie deux objets qui ont chacun une interprétation probabiliste. Au prix d’une petite manipulation algébrique, il permet de démontrer le suivant. Proposition 3.1.11 Soit (σt )t≥0 la chaîne de Markov sur Sn de générateur L. Alors le processus nt n(n−1)t e 2 + 2N Pσt (UN (t)) t≥0 est une martingale. En particulier, pour tout t ≥ 0, on a l’égalité nt E[Pσt (UN (t))] = e− 2 − n(n−1)t 2N E[N `(σ0 ) ], où `(σ0 ) désigne le nombre de cycles de σ0 . Ce résultat, outre le fait qu’il lie le mouvement brownien sur le groupe unitaire et la marche aléatoire sur le groupe symétrique, est la clé de la preuve du théorème 3.1.4. En faisant partir la chaîne (σt )t≥0 des différents éléments de Sn , on obtient suffisamment d’informations pour connaître E[Pσ (UN (t))] pour tout σ. C’est ensuite le passage de Pσ à pσ qui force à considérer les nombres de cycles des permutations qu’on considère et qui fait intervenir le défaut des chemins. 3.1.6 Revêtements ramifiés aléatoires Dans les deux articles [GT93a, GT93b], D. Gross et W. Taylor énoncent de nombreuses formules qui relient d’une part les fonctions de partition de la mesure de Yang-Mills sur des surfaces à valeurs dans le groupe unitaire et d’autre part des valeurs moyennes de 78 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE quantités géométriques simples associées à des revêtements ramifiés aléatoires au-dessus de ces surfaces. Dans certains cas, des singularités autres que des points de ramification sont autorisées pour ces revêtements. Toutefois, dans le cas le plus simple, où la surface est un disque, la fonction de partition n’est autre que le noyau de la chaleur sur le groupe unitaire et les revêtements considérés par Gross et Taylor sont de bons revêtements ramifiés. Le théorème 3.1.4 permet alors d’établir rigoureusement leur formule. Soit D le disque unité du plan R2 . Il nous faut décrire la mesure de probabilités sur les revêtements ramifiés qui intervient dans cette formule. Elle n’est pas exactement de la forme de celles que nous avons construites à la section 2.1.2, bien qu’elle y ressemble fort. Le groupe fini qui intervient ici est le groupe symétrique Sn . La première différence avec la section 2.1.2 est qu’au lieu de considérer des Sn -fibrés principaux ramifiés, nous considérons de simples revêtements ramifiés de degré n, sans action d’aucun groupe. Il y a toutefois une correspondance bijective entre ces deux types de revêtements, analogue à la correspondance entre le fibré des repères et le fibré tangent d’une variété différentiable. Soit π : R → D un revêtement ramifié de degré n. Soit y ∈ D un point de ramification. Soit l un petit lacet dans D qui fait le tour de y. Notons x le point base de l. Si nous numérotons de 1 à n les points de la fibre π −1 (x) = {x̃1 , . . . , x̃n }, alors l’application σ : {1, . . . , n} → {1, . . . , n} qui à chaque i associe le numéro de l’extrémité du relevé de l issu de xi est une bijection. Changer la numérotation de π −1 (x) affecte cette bijection en la conjugant par une autre bijection. La classe de conjugaison de σ est en fait indépendante de tous les choix qu’on a faits, en particulier celui de l, et caractérise le type de ramification en y. On l’appelle la monodromie en y. On dit qu’un point de ramification est générique si la monodromie en ce point est la classe de conjugaison d’une transposition. Cela équivaut à dire que #π −1 (y) = n − 1. De même, la restriction de π : R → D au bord de D est un revêtement du cercle unité, qui est caractérisé par une classe de conjugaison de Sn , ou encore une partition de l’entier n mais nous continuerons à travailler avec des permutations. Définition 3.1.12 Soit D le disque unité de R2 . Soit n ≥ 1 un entier. Soit σ une permutation de Sn . Soit X une partie finie de D\{0}. On note Rn,X,σ l’ensemble des revêtements ramifiés π : R → D de degré n tels que les propriétés suivantes soient satisfaites. 1. Pour tout x ∈ X, le revêtement R admet en x une ramification générique, ce qui signifie que #π −1 (x) = n − 1. 2. Le revêtement R n’est ramifié en aucun point de D \ (X ∪ {0}). 3. La monodromie de R le long du bord de D est la classe de conjugaison de σ. On note Rn,σ la réunion des Rn,X,λ où X parcourt l’ensemble des parties finies de D \{0}. Il n’y a aucune restriction sur la ramification en 0 : ce peut être un point régulier ou un point avec une ramification arbitraire. C’est un tel point que Gross et Taylor appellent un Ω-point. Pour toute partie finie X donnée dans D \ {0}, l’ensemble Rn,X,σ est fini. Nous le munissons de la mesure uniforme X n! ρn,X,σ = δR . Aut(R) R∈R n,X,σ 3.2. COMPORTEMENT ASYMPTOTIQUE DES VALEURS PROPRES [LM9] 79 Considérons maintenant une mesure d’aire vol sur D, d’aire totale égale à 1, par exemple 1 fois la mesure de Lebesgue. Pour tout t, appelons Ξt un processus de Poisson ponctuel π sur D d’intensité tvol, que nous voyons comme une mesure de probabilités sur l’ensemble X des parties finies de D \ {0}. Nous posons alors Z t ρn,σ = ρn,X,σ Ξt (dX). X n La mesure ρtn,σ est une mesure finie, de masse et( 2 )−t . Nous notons µtn,σ la mesure de probabilités sur Rn,σ associée. Enfin, pour tout π : R → M appartenant à Rn,σ , nous notons k(R) le nombre de points de ramification de R autres que 0, et χ(R) la caractéristique d’Euler de R. La formule de Gross et Taylor est alors la suivante. Théorème 3.1.13 ([L6, Theorem 8.3]) Soient N, n ≥ 1 des entiers. Soit σ un élément de Sn . Soit t ≥ 0 un réel. Alors on a l’égalité Z − nt +(n t ) 2 2 E[Pσ (UN (t))] = e (−1)k(R) N χ(R) µtn,σ (dR). Rn,σ Ce théorème donne une explication géométrique à la parité des exposants de N1 qui apparaissent dans le théorème 3.1.4. En effet, si l’on divise les deux membres de l’égalité par N `(σ) , où `(σ) est le nombre de cycles de σ, on voit que E[pσ (UN (t))] se développe en puissances de N de la forme N χ(R)−`(σ) . Notons que le bord d’un revêtement R ∈ Rn,σ a exactement `(σ) composantes connexes. Ainsi, d’une part, χ(R) − `(σ) a la même parité que χ(R) + `(σ) qui est la caractéristique d’Euler de la surface fermée obtenue en recollant un disque à chaque composante de son bord et est donc un entier pair. D’autre part, notons c(R) le nombre de composantes connexes de R, qui est aussi le nombre de composantes connexes de la surface sans bord R0 décrite à la phrase précédente. Alors `(σ) ≥ c(R) = c(R0 ) puisque de tout point régulier de R on peut atteindre la restriction de R au-dessus du cercle unité, par exemple en suivant le relèvement d’un chemin bien choisi. Ainsi, χ(R) − `(σ) = χ(R) + `(σ) − 2`(σ) = χ(R0 ) − 2`(σ) ≤ χ(R0 ) − 2c(R0 ) ≤ 0. Les puissances de N qui apparaissent sont donc des entiers pairs négatifs ou nuls. Lorsque N tend vers l’infini, seuls les revêtements ramifiés de caractéristique maximale interviennent : ce sont les revêtements par une union finie de disques. Pour finir, il convient de remarquer que le lien que ce théorème révèle entre le champ de Yang-Mills et des revêtements ramifiés aléatoires n’est pas de même nature que le lien que nous avons décrit dans la section 2.1, où il s’agissait d’un lien d’analogie. Le lien révélé par la formule de Gross et Taylor est un lien de dualité, qu’on peut comprendre comme une conséquence de la dualité de Schur-Weyl. 3.2 3.2.1 Comportement asymptotique des valeurs propres [LM9] Distribution des valeurs propres : résultats asymptotiques La proposition 3.1.6 indique que l’intensité de la mesure aléatoire µ̂UN (t) a, pour tout t ≥ 0, une limite lorsque N tend vers l’infini. Commençons par décrire cette limite. Nous 80 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE notons U = {z ∈ C : |z| = 1}. Proposition 3.2.1 Pour tout t ≥ 0, il existe une unique mesure de probabilités νt sur U telle que pour tout n ≥ 0 on ait Z Z n−1 X (−t)k n n −n − nt nk−1 . ξ νt (dξ) = ξ νt (dξ) = e 2 k! k + 1 U U k=0 Cette mesure est également caractérisée par le fait que pour tout nombre complexe z dans un voisinage de 0, on a l’égalité Z 1 νt (dξ) = 1 + z. t z tz U 1 − z+1 e e 2 ξ Pour tout t > 0, la mesure νt possède une densité par rapport à la mesure uniforme sur U, qui est analytique à l’intérieur de son support. Ce support est un intervalle symétrique par rapport à l’axe réel qui croît avec t pour recouvrir le cercle U entier à l’instant t = 4 (voir [Bia97]). Il n’est toutefois pas possible d’exprimer la densité de νt avec les fonctions usuelles, à moins d’y inclure la fonction W de Lambert, qui est la réciproque de l’application z 7→ zez . Figure 3.2 – Densité de νt en eiθ en fonction de θ ∈ [−π, π] et de t. On connaît le support de la mesure à chaque temps. Ce support est le cercle U tout entier si et seulement si t ≥ 4. La régularité de la densité de νt change lorsque t franchit cette valeur, passant de höldérienne d’exposant 21 pour t < 4 à analytique réelle pour t > 4. On observe ici une transition de phase. Pour t > 4, on voit la densité converger rapidement vers 1. Cette convergence est exponentiellement rapide, uniformément en θ. Une façon commode d’exprimer des théorèmes limites pour la distribution des valeurs propres de matrices unitaires dont la taille tend vers l’infini est de considérer une fonction 3.2. COMPORTEMENT ASYMPTOTIQUE DES VALEURS PROPRES [LM9] 81 f : U → R suffisamment régulière et de lui associer la suite de variables aléatoires réelles (tr(f (UN (t))))N ≥1 . La proposition 3.1.6 implique aisément le résultat suivant. Proposition 3.2.2 Soit f : U → R une fonction continue. Alors pour tout t ≥ 0 on a la convergence Z E[trf (UN (t))] −→ f dνt . N →∞ U À titre de comparaison, dans le cas d’une matrice prise sous la mesure de Haar, on a le résultat suivant, qui découle immédiatement de l’invariance par translation de cette mesure. Lemme 3.2.3 Soit f : U → R une fonction continue. Pour tout N ≥ 1, soit VN une matrice unitaire aléatoire distribuée selon la mesure de Haar sur U(N ). Alors pour tout N ≥ 1, on a Z E[trf (VN )] = f (ξ) dξ. U Ce lemme peut être vu comme une limite quand t tend vers +∞ du résultat précédent. Notons que, puisque la répartition moyenne des valeurs propres de VN est uniforme sur le cercle, la variable aléatoire trf (VN ) est définie presque sûrement dès que f est définie presque partout. Ainsi, le résultat précédent a un sens et reste vrai pour une fonction f ∈ L1 (U). P. Diaconis et S. Evans ont étudié les fluctuations de trf (VN ) et ont établi un théorème 1 de la limite centrale [DE01]. L’espace de Sobolev H 2 , dont la définition est rappelée cidessous, y joue un rôle primordial. Pour toute fonction f intégrable sur U et tout n ∈ Z, nous notons fˆ(n) le n-ième coefficient de Fourier de f . 1 Définition 3.2.4 L’espace H 2 (U) est le sous-espace de L2 (U) défini par X 1 H 2 (U) = {f ∈ L2 (U) : |n||fˆ(n)|2 < +∞}, n∈Z muni du produit scalaire hilbertien hf, gi2 H 1 2 = fˆ(0)ĝ(0) + X n∈Z∗ |n|fˆ(n)ĝ(n). 1 Notons que les fonctions de H 2 ne sont pas nécessairement continues. Le théorème de Diaconis et Evans est le suivant. 1 Théorème 3.2.5 ([DE01]) Soient f1 , . . . , fn : U → R des fonctions de H 2 telles que R f (ξ) dξ = 0 pour tout i ∈ {1, . . . , n}. Soit Σ la matrice n × n symétrique positive U i définie par Σ(f1 , . . . , fn ) = (hfi , fj iH 21 )i,j=1,...,n . Alors, avec les notations du lemme 3.2.3, on a, lorsque N tend vers +∞, la convergence en loi suivante : (loi) N (tr(f1 (VN )), . . . , tr(fn (Vn ))) −→ N (0, Σ(f1 , . . . , fn )). N →+∞ 82 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE Avec Mylène Maïda, nous avons établi un théorème analogue pour des variables aléatoires de la forme trf (UN (t)). L’expression de la covariance dans ce cas est toutefois plus compliquée. Elle nécessite l’introduction de quelques notions de probabilités libres. ENCART 12 – Probabilités libres et mouvement brownien multiplicatif libre [VDN92, Bia03, Bia97] Les probabilités libres sont une variante non-commutative de la théorie des probabilités dans laquelle la notion d’indépendance est remplacée par la notion de liberté. Définition 3.2.6 Un espace de probabilités non-commutatif est une paire (A, τ ) où A est une algèbre complexe unitaire involutive et τ est une forme linéaire sur A qui est 1. positive : τ (a∗ a) ≥ 0 pour tout a ∈ A, 2. normalisée : τ (1) = 1, 3. traciale : τ (ab) = τ (ba) pour tous a, b ∈ A. La forme τ s’appelle aussi un état. Les deux exemples fondamentaux d’espaces de probabilités non-commutatifs sont d’une part (L∞ (Ω, P), E), où (Ω, P) est un espace de probabilités classique, et d’autre part (MN (C), tr). Leur produit tensoriel est un nouvel espace de probabilités non-commutatif, l’espace des matrices aléatoires de taille N à coefficients bornés muni de l’état E[tr(·)]. La définition principale de la théorie des probabilités libres est la suivante. Définition 3.2.7 Soit (A, τ ) un espace de probabilités non-commutatif. Soient A1 , . . . , Ar des sous-algèbres involutives de A. On dit que la famille {A1 , . . . , Ar } est libre par rapport à τ , ou simplement libre, si la propriété suivante est vérifiée. (L) Pour tout entier n ≥ 1, pour toute suite d’entiers i1 , . . . , in appartenant à {1, . . . , r} et telle qu’on ait i1 6= i2 , i2 6= i3 , . . . , in−1 6= in , pour tous a1 , . . . , an tels que a1 ∈ Ai1 , . . . , an ∈ Ain et τ (a1 ) = . . . = τ (an ) = 0, on a τ (a1 . . . an ) = 0. On dit que des éléments b1 , . . . , br de A forment une famille libre si les sous-algèbres involutives engendrées par chacun de ces éléments forment une famille libre. Les exemples d’espaces de probabilités non-commutatifs que nous avons donnés ne sont pas suffisamment riches pour permettre de donner des exemples de familles libres. Par exemple, deux éléments de (L∞ (Ω, P), E), c’est-à-dire deux variables aléatoires classiques, sont libres si et seulement si l’une des deux est constante Ppresque sûrement. Ceci découle des égalités τ (ab) = τ (a)τ (b) et τ (abab) = (τ (a2 ) − τ (a)2 )τ (b)2 + τ (a)2 (τ (b2 ) − τ (b)2 ) + τ (a)2 τ (b)2 , (3.3) qui sont vraies pour deux éléments libres quelconques d’un espace de probabilités non-commutatif. En effet, si X et Y sont libres et d’espérance nulle, la première égalité appliquée à X 2 et Y 2 et la seconde appliquée à X et Y donnent deux expressions de E[X 2 Y 2 ] dont l’égalité impose que X ou Y soit nulle presque sûrement. Dans le cas de (MN (C), tr), on peut également démontrer que si deux matrices sont libres, alors l’une des deux est scalaire. Cet exercice ne semble pas être résolu à beaucoup d’endroits dans la littérature, aussi indiquons-nous les étapes d’une démonstration possible. On considère deux matrices A et B libres. Notons que U AU −1 et U BU −1 sont encore libres pour toute matrice unitaire U . On commence par supposer que A est un projecteur différent de 0 et IN et B est hermitienne de trace nulle. Alors en se plaçant dans une base qui diagonalise A et en utilisant les deux formules (3.3) pour A et B d’une part et IN − A et B d’autre part, on établit que B est nulle. On en déduit immédiatement que si A est un projecteur non-trivial et B est hermitienne ou anti-hermitienne, alors B est scalaire. Puisque l’hypothèse que A et B sont libres entraîne que A est libre avec n’importe quel polynôme en B et B ∗ , on en déduit qu’une matrice libre avec un projecteur non trivial est scalaire. Finalement, si on suppose seulement que A n’est pas scalaire, alors l’une des deux matrices diagonalisables A + A∗ et A − A∗ admet deux valeurs propres distinctes, si bien qu’il existe un polynôme en A et A∗ qui est un projecteur non trivial. La matrice B est libre avec ce projecteur, donc scalaire. 3.2. COMPORTEMENT ASYMPTOTIQUE DES VALEURS PROPRES [LM9] 83 L’exemple le plus simple de deux éléments libres non scalaires est le suivant, qui a motivé la définition de la notion de liberté par D. Voiculescu. Soit F2 le groupe libre sur la partie à deux éléments {x, y}. Les éléments de F2 sont donc les mots réduits en les lettres x, y et leurs inverses, et on les multiplie en les concaténant puis en les réduisant. On note 1 le mot vide, qui est l’élément neutre. On considère l’algèbre A = C[F2 ] des P combinaisons P linéaires formelles finies d’éléments de F2 à coefficients complexes, munie de l’involution ∗ ( w cw w) = w cw w−1 . On munit A de la forme linéaire ! X τ cw w = c1 . w On vérifie facilement que τ est un état. Nous avons donc construit un nouvel exemple d’espace de probabilités non-commutatif. Alors les éléments x et y de (A, τ ) sont libres, par définition même du groupe libre F2 . Soit (A, τ ) un espace de probabilités non-commutatif. On dit qu’un élément a ∈ A est auto-adjoint si a = a∗ et qu’un élément u est unitaire si uu∗ = u∗ u = 1. La condition de positivité imposée à un état assure que si a est autoadjoint, la suite (τ (an ))n≥0 est la suite des moments d’une mesure de probabilités sur R qui, si elle est unique, est appelée distribution de a. Une condition qui suffit à garantir que cette mesure soit unique est que A soit une algèbre de Banach et que τ soit continue. En effet, dans ce cas, τ (an ) = O(kakn ) ce qui assure que la distribution de a existe et est à support compact. De même, si u est unitaire, la suite (τ (un ))n∈Z est la suite des coefficients de Fourier d’une mesure de probabilités sur U, également appelée distribution de u. On vérifie successivement, dans les trois exemples que nous avons donnés, que la distribution non-commutative d’une variable aléatoire à valeurs réelles coïncide avec sa distribution usuelle, que la distribution d’une matrice hermitienne ou unitaire est sa mesure empirique spectrale (voir (3.2)) et que les élément x et y de C[F2 ], qui sont unitaires, ont pour distribution la mesure uniforme sur U. La notion de distribution en probabilités libres s’identifie avec celle de suite des moments. Par définition, la distribution d’un élément unitaire u, par exemple, est la forme linéaire sur C[t, t−1 ] qui à un polynôme P associe τ (P (u, u−1 )). Pour décrire la distribution jointe de plusieurs éléments, on utilise des polynômes à −1 plusieurs indéterminées qui ne commutent pas. On note par exemple Cht1 , . . . , tn , t−1 1 , . . . , tn i l’algèbre des polynômes à n indéterminées et leurs inverses, qu’on peut identifier naturellement avec C[Fn ], l’algèbre du groupe libre à n générateurs. Définition 3.2.8 La distribution non-commutative jointe de n éléments unitaires u1 , . . . , un est la forme −1 −1 −1 linéaire sur Cht1 , . . . , tn , t−1 1 , . . . , tn i qui à un polynôme P associe τ (P (u1 , . . . , un , u1 , . . . , un ). On définit de même la convergence en distribution comme la convergence de tous les moments. Définition 3.2.9 Soient (A, τ ) et (Ar , τr ), r ≥ 1 des espaces de probabilités non-commutatifs. Soient (ui )i∈I et (ui,r )i∈I , r ≥ 1 des familles d’élements de ces espaces indexées par le même ensemble I. On dit que la suite de familles (ui,r )i∈I , r ≥ 1 converge en distribution non- commutative vers (ui )i∈I si pour tout n ≥ 1, −1 tous i1 , . . . , in ∈ I et tout P ∈ Cht1 , . . . , tn , t−1 1 , . . . , tn i on a la convergence −1 −1 −1 τr (P (ui1 ,r , . . . , uin ,r , u−1 i1 ,r , . . . , uin ,r )) −→ τ (P (ui1 , . . . , uin , ui1 , . . . , uin )). r→∞ Nous pouvons maintenant définir le mouvement brownien unitaire libre, qui est un processus à accroissements libres stationnaires particulier. Définition 3.2.10 Soit (A, τ ) un espace de probabilités non-commutatif. Un mouvement brownien multiplicatif libre est une famille (ut )t≥0 d’éléments unitaires de A qui satisfait les propriétés suivantes. 1. Pour tous 0 ≤ t1 ≤ . . . ≤ tn , les éléments ut1 , ut2 u∗t1 , . . . , utn u∗tn−1 sont libres. 2. Pour tous 0 ≤ s ≤ t, la distribution de ut u∗s est égale à la distribution de ut−s . 3. Pour tout t ≥ 0, la distribution de ut est la mesure de probabilités νt sur U. Ce processus libre est la limite en distribution au sens de la définition 3.2.9, du mouvement brownien unitaire. 84 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE Proposition 3.2.11 La suite de familles de variables aléatoires ((UN (t))t≥0 )N ≥0 , où chaque UN (t) est vu comme un élément de l’espace de probabilités non-commutatif (L∞ (Ω, P) ⊗ MN (C), E ⊗ tr) pour un (Ω, P) approprié, converge en distribution non-commutative vers un mouvement brownien unitaire libre. Il n’est pas évident qu’il existe un mouvement brownien multiplicatif libre. C’est toutefois vrai, et on peut même s’en donner un nombre arbitraire de telle façon que les sous-algèbres respectives qu’ils engendrent soient libres. La covariance des fluctuations de variables aléatoires de la forme trf (UN (t)) est donnée par la forme bilinéaire suivante. Définition 3.2.12 Soit (A, τ ) un C ∗ -espace de probabilités non-commutatif dans lequel il existe trois mouvements browniens multiplicatifs libres u, v, w qui sont mutuellement libres. Soit T ≥ 0 un réel. Soient f, g : U → R deux fonctions de classe C 1 . On définit Z T τ (f 0 (us vT −s )g 0 (us wT −s )) ds. σT (f, g) = 0 L’hypothèse que (A, τ ) est un C ∗ -espace de probabilités signifie que A est une C ∗ algèbre, ce qui permet de définir, pour tout élément unitaire u de A et toute fonction f : U → R continue, un nouvel élément f (u) de A, par calcul fonctionnel. Le théorème de la limite centrale, analogue au théorème 3.2.5 de Diaconis et Evans, est le suivant. Théorème 3.2.13 ([LM9, Theorem 2.6]) Soit UN le mouvement brownien sur U(N ) associé au produit scalaire sur u(N ) donné par hhX, Y ii = N Tr(X ∗ Y ). Soit T ≥ 0 un réel. Soit n ≥ 1 un entier. Soient f1 , . . . , fn : U → R des fonctions de classe C 1 (U) dont la dérivée est lipschitzienne. La matrice symétrique réelle n × n définie par ΣT (f1 , . . . , fn ) = (σT (fi , fj ))i,j∈{1,...,n} est positive. De plus, lorsque N tend vers l’infini, la convergence suivante de vecteurs aléatoires de Rn a lieu en distribution : (loi) N (trfi (UN (T )) − E [trfi (UN (T ))])i∈{1,...,n} −→ N (0, ΣT (f1 , . . . , fn )). N →∞ (3.4) La régularité des fonctions que l’on considère ne sert pas à garantir la positivité de la matrice ΣT , qui est vraie pour des fonctions C 1 , mais bien à faire fonctionner notre preuve de la convergence, qui repose sur du calcul stochastique. Toutefois, le théorème de Diaconis et Evans et la convergence rapide du mouvement brownien vers sa mesure invariante qui est la mesure de Haar suggère qu’il devrait être possible d’améliorer ce résultat en élargissant la classe de fonctions pour laquelle le résultat a lieu. Nous avons au moins établi le résultat de convergence suivant pour la covariance. Théorème 3.2.14 ([LM9, Theorem 8.3]) Pour toute paire de fonctions f, g de classe C 1 sur U et dont les dérivées sont lipschitziennes, on a, avec les notations des théorèmes 3.2.5 et 3.2.13, la convergence suivante : σT (f, g) −→ hf, giH 21 . T →∞ 3.2. COMPORTEMENT ASYMPTOTIQUE DES VALEURS PROPRES [LM9] 85 Nous avons en fait obtenu un résultat un peu meilleur en montrant que pour T assez grand, on peut étendre la définition de σT (f, g) à tout paire de fonctions f, g appartenant 1 à l’espace H 2 et qu’avec cette définition étendue le résultat précédent reste vrai. Plus précisément, en notant, pour tous j, k ∈ Z et tout T ≥ 0, Z T τ (us vT −s )j (us wT −s )k ds, τj,k (T ) = 0 nous avons pu obtenir une borne qui garantit que, pour T assez grand, si f et g sont deux 1 fonctions de H 2 , alors la série X σT (f, g) = − jk fˆ(j)ĝ(k)τj,k (T ) j,k∈Z converge. De plus, d’une part, si les fonction f et g sont à dérivée lipschitzienne, alors les deux définitions que nous avons données de σT (f, g) coïncident, et d’autre part, la convergence énoncée par le théorème 3.2.14 persiste avec cette nouvelle définition de σT . 1.0 2.5 0.8 2.0 0.6 1.5 0.4 1.0 0.2 0.5 1 2 3 4 5 6 1 2 3 4 5 6 4 1.0 3 0.5 2 1 1 2 3 4 5 6 -0.5 -1.0 1 2 3 4 5 6 Figure 3.3 – Pour tout k ≥ 1, posons sk (eiθ ) = sin(kθ) et ck (eiθ ) = cos(kθ). Ces graphiques représentent des fonctions de T pour T ∈ [0, 6]. En haut à gauche : µk (T ) pour k ∈ {1, . . . , 6}. En haut à droite : σT (sk , sk+1 ) pour k ∈ {1, . . . , 15}. En bas à gauche : σT (sk , sk ) et σT (ck , ck ) pour k ∈ {1, . . . , 8}. En bas à droite : σT (sk , sk+2 ) pour k impair appartenant à {1, . . . , 13}. Il faut souligner que cette extension de la définition de σT n’est valide que lorsque T est assez grand. D’une façon générale, il est très difficile de contrôler les moments ou 86 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE les covariances en temps petit. Ceci est à rapprocher du fait que la mesure νt , la loi du mouvement brownien unitaire libre, est à support strictement inclus dans U pour t < 4, et à densité analytique pour t > 4. La figure 3.3 illustre le comportement mystérieux en temps petit de certaines des fonctions que nous avons considérées. 3.3 Entre indépendance et liberté [LBG8] Avec Florent Benaych-Georges, nous avons utilisé le mouvement brownien unitaire pour proposer une interpolation entre les notions d’indépendance et de liberté pour des éléments d’un espace de probabilités non-commutatif. Nous allons aborder cette question par le biais de la convolution des mesures. 3.3.1 Convolutions Soient µ et ν deux mesures de probabilités sur R. La convolution classique de µ et ν, notée µ ∗ ν, est une autre mesure de probabilités sur R qu’on peut décrire comme la loi de la somme de deux variables aléatoires indépendantes de lois respectives µ et ν. Une autre façon de la décrire est la suivante. Soient (AN )N ≥1 et (BN )N ≥1 deux suites de matrices diagonales telles que pour tout N ≥ 1, AN et BN soient de taille N ×N et, lorsque N tend vers l’infini, les mesures empiriques spectrales µ̂AN et µ̂BN convergent respectivement vers µ et ν. Pour tout N ≥ 1, soit SN une matrice aléatoire de loi uniforme sur l’ensemble des N ! matrices de permutation de taille N . Alors, on a la convergence suivante en loi : (loi) µ̂AN +SN BN S −1 −→ µ ∗ ν. N N →∞ Pour tout N ≥ 1, considérons maintenant une matrice VN de loi uniforme sur U(N ). Alors on a la convergence suivante : (loi) µ̂AN +VN BN V −1 −→ µ ν, N N →∞ où µ ν est la mesure sur R qui peut être décrite comme la distribution de la somme de deux éléments autoadjoints libres d’un espace de probabilités non-commutatif, de distributions respectives µ et ν. Cette mesure ne dépend que de µ et ν car, comme pour l’indépendance dans le cas classique, la distribution jointe de deux éléments libres est complètement déterminée par leurs distributions individuelles. Pour tout N ≥ 1, il y a une interpolation naturelle entre la loi de SN et celle de VN : c’est la famille des lois de UN (t)SN où t décrit R+ . Pour t = 0, on a UN (0)SN = SN et, lorsque t tend vers +∞, UN (t)SN tend en loi vers une matrice unitaire uniforme. Comme on pouvait l’espérer, on a le résultat suivant. Théorème 3.3.1 ([LBG8, Corollary 2.10]) Soient µ et ν des mesures de probabilités sur R. Soient (AN )N ≥1 et (BN )N ≥1 deux suites de matrices diagonales comme ci- dessus. Soit UN un mouvement brownien sur U(N ). Soit t ≥ 0 un réel. Alors, lorsque N tend −1 UN (t)−1 vers l’infini, la mesure empirique spectrale de la matrice AN + UN (t)SN BN SN converge faiblement en probabilité vers une mesure déterministe sur R qui ne dépend que de µ, ν et t, que nous notons µ ∗t ν et que nous appelons convolution t-libre de µ et ν. 3.3. ENTRE INDÉPENDANCE ET LIBERTÉ [LBG8] 87 Un exemple classique où l’on sait calculer explicitement la convolution libre de deux mesures est celui où µ = ν = 12 (δ1 + δ−1 ). Dans ce cas, µ ∗ ν = 41 δ−2 + 12 δ0 + 14 δ2 et µ ν = 1[−2,2] (x) π√dx , une image par homothétie de la loi de l’arcsinus. On peut 4−x2 montrer que pour tout t > 0, x ρ4t (e4i arccos 2 ) δ1 + δ−1 δ1 + δ−1 ∗t = 1[−2,2] (x) √ dx, 2 2 π 4 − x2 (3.5) où, pour tout t > 0 et tout θ ∈ R, ρt (eiθ ) est la densité en eiθ de la mesure νt par rapport à la mesure uniforme sur U. −1 ∗t δ1 +δ en x ∈ [−2, 2] en fonction de x et t. On peut décrire 2 complètement le support de la mesure à chaque temps. Ainsi le premier temps √ auquel √ ce support est l’intervalle [−2, 2] entier est t = 1 et les deux derniers points à y entrer sont − 2 et 2. Figure 3.4 – Densité de 3.3.2 δ1 +δ−1 2 Structures de dépendance et t-liberté Comme dans le cas de l’indépendance et de la liberté, l’existence de la convolution t- libre de deux mesures est un reflet de l’existence d’une structure de dépendance entre sous-algèbres d’un espace de probabilités non-commutatif. Par structure de dépendance, nous entendons la chose suivante : dans un espace de probabilités non-commutatif (A, τ ) où sont données deux sous-algèbres A1 et A2 , une façon de reconstituer la restriction de τ à la sous-algèbre engendrée par A1 ∪A2 connaissant les seules restrictions de τ à A1 et A2 . En termes commutatifs, nous dirions qu’une telle structure permet d’inférer la loi jointe d’une famille de variables aléatoires de la seule connaissance de leurs lois individuelles. ENCART 13 – Structures de dépendance et modèles universels Une façon de décrire une structure de dépendance entre deux sous-algèbres A1 et A2 d’un espace de probabilités non-commutatif est de donner une règle qui permette de calculer τ (P (a1 , a2 )) pour tous a1 ∈ A1 , a2 ∈ A2 et tout polynôme P ∈ Cht1 , t2 i connaissant les moments de a1 et a2 . C’est exactement de cette façon que nous avons défini la liberté (voir la définition 3.2.7). C’est aussi de cette nature qu’est la règle E[f (X)g(Y )] = E[f (X)]E[g(Y )] qui caractérise l’indépendance de deux variables aléatoires. Une telle 88 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE description n’assure cependant pas l’existence d’exemples non triviaux de la structure de dépendance qu’on veut définir. L’exemple que nous avons donné dans l’encart 12 de deux éléments libres, aussi naturel soit-il, n’était pas contenu dans la définition de la liberté. En probabilités classiques, la construction qui assure l’existence de variables indépendantes de loi arbitraire est celle du produit cartésien de deux espaces mesurables muni du produit tensoriel de deux mesures de probabilités. Du point de vue non pas des espaces de probabilités mais des variables aléatoires, cette construction correspond au produit tensoriel des algèbres. Considérons par exemple un espace de probabilités (Ω, P) et notons (A, τ ) l’espace de probabilités non-commutatif (commutatif !) (L∞ (Ω, P), E). Donnons-nous deux variables aléatoires bornées X et Y sur Ω. Notons (AX , τX ) la sous-algèbre de A engendrée par X, c’est-àdire l’ensemble des polynômes en X, munie de la forme linéaire induite par l’espérance. Considérons de façon analogue (AY , τY ). La sous-algèbre de A engendrée par X et Y , qui n’est rien d’autre que l’ensemble des polynômes en X et Y , n’est pas nécessairement isomorphe à C[X, Y ], car il peut y avoir des relations algébriques entre X et Y . Néanmoins, cette sous-algèbre est l’image de C[X, Y ] par le morphisme d’algèbres naturel P 7→ P (X, Y ). L’algèbre C[X, Y ] nous sert ici de modèle concret du produit tensoriel AX ⊗AY , qui d’une façon un peu vague est la plus grosse algèbre possible qui soit engendrée par AX et AY et au sein de laquelle tout élément de AX commute à tout élément de AY . Il y a en particulier un unique morphisme d’algèbre m : AX ⊗ AY → A tel que m(X ⊗ 1) = X et m(1 ⊗ Y ) = Y , et l’image de ce morphisme est exactement l’algèbre engendrée par X et Y . On peut définir un état τX ⊗ τY sur AX ⊗ AY en posant (τX ⊗ τY )(a ⊗ b) = τX (a)τY (b). Cette étape correspond à la construction du produit tensoriel de deux mesures. On peut alors, pour tout élément c de AX ⊗ AY , comparer son espérance dans AX ⊗ AY et dans A, ou plus précisément comparer (τX ⊗ τY )(c) et τ (m(c)). La proposition suivante est la reformulation purement algébrique de l’indépendance que nous cherchions : les variables X et Y sont indépendantes si et seulement si le morphisme d’algèbres m : AX ⊗AY → A préserve les espérances, c’est-à-dire si τX ⊗ τY = τ ◦ m. Nous en tirons la définition générale suivante. Définition 3.3.2 Soit (A, τ ) un espace de probabilités non-commutatif. Soient A1 et A2 deux sous-algèbres de A. Notons τ1 et τ2 les restrictions de τ à A1 et A2 respectivement. On dit que A1 et A2 sont indépendantes si tout élément de A1 commute à tout élément de A2 et si le morphisme d’algèbres naturel m : A1 ⊗ A2 → A satisfait l’égalité τ ◦ m = τ1 ⊗ τ2 . Nous avons gagné deux choses par rapport au cas commutatif : d’une part l’espace ambiant A n’a pas besoin d’être commutatif et d’autre part, aucune des deux algèbres A1 et A2 n’a besoin d’être commutative. Tout ce que nous exigeons est qu’elles commutent l’une à l’autre. C’est par exemple le cas des deux sousalgèbres R et P de End((CN )⊗n ) définies dans le cadre de la dualité de Schur-Weyl (voir théorème 3.1.9). Toutefois, ces deux sous-algèbres ne sont pas du tout indépendantes. La construction algébrique qui correspond à la liberté est le produit libre de deux algèbres. Si A1 et A2 sont deux algèbres unifères, leur produit libre A1 ∗ A2 est la plus grosse algèbre unifère possible qui soit engendrée par A1 et A2 , avec pour seule condition que l’unité de A1 coïncide avec l’unité de A2 . De façon plus précise, un produit libre de A1 et A2 est une algèbre A munie de deux morphismes d’algèbres j1 : A1 → A et j2 : A2 → A et telle que, une algèbre quelconque B étant donnée, ainsi que deux morphismes d’algèbres m1 : A1 → B et m2 : A2 → B, il existe un unique morphisme m : A → B tel que m◦j1 = m1 et m◦j2 = m2 . Cette description caractérise le triplet (A, j1 , j2 ) à isomorphisme près. Une façon de démontrer qu’un tel produit libre existe est de choisir dans chacune des algèbres unifères A1 et A2 un supplémentaire de C : on écrit A1 = C ⊕ A01 et A2 = C ⊕ A02 . Alors l’algèbre M C ⊕ A01 ⊕ A02 ⊕ A01 ⊗ A02 ⊕ A02 ⊗ A01 ⊕ A01 ⊗ A02 ⊗ A01 ⊗ . . . ⊕ A02 ⊗ A01 ⊗ A02 ⊗ . . . (3.6) {z } | {z } | n≥3 n facteurs n facteurs munie du produit le plus naturel (qui n’est pas tout à fait simple à définir précisément car le produit de deux éléments de A01 par exemple n’appartient pas nécessairement à A01 ) et des morphismes j1 et j2 qui identifient respectivement A1 et A2 avec C ⊕ A01 et C ⊕ A02 , est un produit libre de A1 et A2 . 3.3. ENTRE INDÉPENDANCE ET LIBERTÉ [LBG8] 89 Étant donné des états τ1 et τ2 sur A1 et A2 , on peut choisir A01 et A02 comme les noyaux de τ1 et τ2 . Un état naturel apparaît alors sur le produit libre, dont le noyau est l’hyperplan entre parenthèses dans (3.6). On note cet état τ1 ∗ τ2 et on vérifie que A1 et A2 sont libres par rapport à cet état. On a alors une caractérisation de la liberté analogue à celle de l’indépendance donnée ci-dessus. Définition 3.3.3 Soit (A, τ ) un espace de probabilités non-commutatif. Soient A1 et A2 deux sous-algèbres de A. Notons τ1 et τ2 les restrictions de τ à A1 et A2 respectivement. On dit que A1 et A2 sont libres si le morphisme d’algèbres naturel m : A1 ∗ A2 → A satisfait l’égalité τ ◦ m = τ1 ∗ τ2 . Nous allons définir un modèle universel pour la t-liberté en définissant un état sur le produit libre des algèbres sous-jacentes à deux espaces de probabilités non-commutatifs quelconques. Définition 3.3.4 Soient (A1 , τ1 ) et (A2 , τ2 ) deux espaces de probabilités non-commutatifs. Soit t un réel positif. Soit (U, υ) un espace de probabilités non-commutatif engendré par un élément unitaire ut dont la distribution est la mesure νt sur U. Soit m l’unique morphisme d’algèbres m : A1 ∗ A2 → (A1 ⊗ A2 ) ∗ U qui satisfait m(a1 ) = a1 ⊗ 1 pour tout a1 ∈ A1 et m(a2 ) = u(1 ⊗ a2 )u−1 pour tout a2 ∈ A2 . On appelle produit t-libre de τ1 et τ2 l’état τ1 ∗t τ2 sur A1 ∗ A2 défini par τ1 ∗t τ2 = [(τ1 ⊗ τ2 ) ∗ υ] ◦ m. Le fait que la mesure νt soit invariante par conjugaison complexe entraîne que la paire (u, u−1 ) a la même distribution que la paire (u−1 , u), si bien qu’on aurait obtenu la même définition de τ1 ∗t τ2 en remplaçant m par le morphisme m0 qui satisfait m0 (a1 ) = u(a1 ⊗ 1)u−1 et m0 (a2 ) = 1 ⊗ a2 . Si t = 0, on retrouve la définition du produit tensoriel de deux états, transporté du produit tensoriel des algèbres à leur produit libre par le morphisme naturel A1 ∗ A2 → A1 ⊗ A2 . En revanche, si t > 0, l’élément ut n’est pas scalaire dans U et ceci permet d’assurer que m est injectif. Alors la sous-algèbre de (A1 ⊗ A2 ) ∗ U engendrée par A1 ⊗ 1 et u(1 ⊗ A2 )u−1 est une réalisation du produit libre de A1 et A2 . Un modèle universel étant défini, nous pouvons définir la t-liberté. Définition 3.3.5 ([LBG8, Definition 2.5]) Soit (A, τ ) un espace de probabilités noncommutatif. Soient A1 et A2 deux sous-algèbres de A. Notons τ1 et τ2 les restrictions de τ à A1 et A2 respectivement. On dit que A1 et A2 sont t-libres si le morphisme d’algèbres naturel m : A1 ∗ A2 → A satisfait l’égalité τ ◦ m = τ1 ∗t τ2 . On dit que deux parties de A sont t-libres si les sous-algèbres involutives qu’elles engendrent le sont. La remarque faite après la définition 3.3.4 assure que cette définition est symétrique en A1 et A2 . On vérifie alors que la t-convolution correspond bien à la t-liberté. 90 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE Proposition 3.3.6 Soit (A, τ ) un espace de probabilités non-commutatif. Soit t ≥ 0 un réel et soient a, b ∈ A deux élément autoadjoints t-libres, de distributions respectives µ et ν. Alors la distribution de a + b est µ ∗t ν. Nous pouvons définir d’autres convolutions t-libres. Par exemple, nous pouvons multiplier des éléments t-libres : si, avec les notations de la proposition ci-dessus, A est une √ √ ∗ C -algèbre et a et b sont positifs, on peut définir µ t ν comme la loi de ba b. Enfin, si a et b sont unitaires, auquel cas µ et ν sont des mesures de probabilités non plus sur R mais sur U, on peut définir µ t ν comme la loi de ab. 3.3.3 Systèmes différentiels Lorsqu’on cherche à faire des calculs avec des paires de variables t-libres, on est amené à calculer des expressions de la forme τ (a1 ut b1 u∗t . . . an ut bn u∗t ), (3.7) où la famille {a1 , . . . , an } est indépendante de {b1 , . . . , bn } et ut est libre avec la réunion de ces deux familles. La meilleure prise qu’on ait sur de telles expressions est de les considérer comme des fonctions de t et d’établir un système différentiel fermé le plus petit possible qu’elles satisfassent. Pour dériver par rapport à t une expression comme (3.7), on utilise une équation différentielle stochastique libre satisfaite par le mouvement brownien libre, qui est l’analogue (et en un sens vague la limite lorsque N tend vers l’infini, conformément à la proposition 3.2.11) de l’équation différentielle stochastique (3.1) qui définit le mouvement brownien unitaire [Bia97]. Cette dérivée fait apparaître des produits d’expressions de la forme (3.7). En considérant tous les produits d’expressions de cette forme où a1 , . . . , an , ut b1 u∗t , . . . , ut bn u∗t apparaissent exactement une fois chacun, on obtient un ensemble fini de fonctions de t qui satisfait un système différentiel fermé. En résolvant de tels systèmes, on parvient à établir le résultat suivant. Proposition 3.3.7 ([LBG8, Proposition 3.5]) On définit une fonction G(t, z) dans un voisinage de (0, 0) dans R+ × C de la façon suivante. Soit (A, τ ) un espace de probabilités non-commutatif. Soient a et b deux éléments normaux dont les distributions sont à support compact et symétriques (c’est-à- dire que a et −a d’une part, b et −b d’autre part, ont même distribution). Soit t ≥ 0. On suppose a et b t-libres. On pose alors X G(t, z) = τ ((ab)2n )e2nt z n . n≥1 Alors, G est l’unique solution, dans un voisinage de (0, 0) dans R+ × C, de l’équation non-linéaire ∂t G + 2z∂z (G2 ) = 0, X G(0, z) = τ (a2n )τ (b2n )z n . n≥1 3.3. ENTRE INDÉPENDANCE ET LIBERTÉ [LBG8] 91 C’est de cette proposition qu’on déduit l’égalité (3.5). On peut également en déduire la loi du produit de deux variables de Bernoulli t-libres. Proposition 3.3.8 Pour tout t > 0, on a l’égalité de mesures suivantes sur U : δ−1 + δ1 δ−1 + δ1 t = ρ4t (ξ 2 )dξ, 2 2 où ρ4t est la densité de la mesure ν4t par rapport à la mesure uniforme. Figure 3.5 – Densité de δ−12+δ1 t δ−12+δ1 en eiθ en fonction de θ et t. Le support de la mesure remplit le cercle pour la première fois au temps t = 1. Les derniers points à entrer dans le support sont i et −i. 3.3.4 Inexistence de cumulants t-libres Par analogie avec le cas de la liberté, nous nous sommes demandé s’il était possible de trouver des cumulants t-libres, c’est-à-dire des formes multilinéaires définies sur tout espace de probabilités non-commutatif et qui s’annuleraient dès lors qu’on les évalue sur des arguments qui peuvent être regroupés en deux familles non vides et t-libres. ENCART 14 – Cumulants libres [NS06] Soit µ une mesure de probabilités à support compact sur R. Les cumulants (classiques) de µ sont les nombres complexes (cn (µ))n≥1 définis par l’égalité Z X zn log ezt µ(dt) = cn (µ) . n! R n≥1 Les cumulants linéarisent la convolution : si µ et ν sont à support compact, on a cn (µ ∗ ν) = cn (µ) + cn (ν) pour tout n ≥ 1. R nLes cumulants sont reliés de façon combinatoire aux moments. Pour tout n ≥ 1, notons mn (µ) = t µ(dt) le n-ième moment de µ. Considérons l’ensemble Pn des partitions de {1, . . . , n}. Pour tout R 92 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE π ∈ Pn , définissons mπ (µ) comme le produit des moments de µ dont les ordres sont les tailles des blocs de π. Par exemple, m{{1,3},{2,5},{4}} (µ) = m1 (µ)m2 (µ)2 . Définissons de façon similaire les cumulants cπ (µ). Alors la relation qui lie moments et cumulants est la suivante : pour tout n ≥ 1, X mn (µ) = cπ (µ). π∈Pn Cette relation peut être inversée pour exprimer chaque cumulant cn en fonction des moments mπ , en utilisant la fonction de Möbius du treillis Pn muni de la relation d’ordre partiel pour laquelle π1 ≤ π2 si chaque bloc de π1 est contenu dans un bloc de π2 . Nous notons 1n = {{1, . . . , n}} le plus grand élément de Pn . On a alors X Moeb(1n , π)mπ (µ). cn (µ) = π∈Pn Soit (Aτ ) un espace de probabilités non-commutatif. Par analogie avec ce qui précède, pour toute partition π ∈ Pn et tout a ∈ A, nous pouvons définir mπ (a) comme le produit des moments m(ak ) de a correspondant aux tailles des blocs de π. En fait, si nous choisissons un ordre cyclique sur {1, . . . , n}, par exemple le plus naturel, nous pouvons étendre cette définition en posant Y τ (ai1 . . . air ). ∀a1 , . . . , an ∈ A, mπ (a1 , . . . , an ) = B bloc de π B={i1 <...<ir } L’hypothèse de tracialité que nous avons faite sur τ entraîne que cette définition ne dépend bien que de l’ordre cyclique sur {1, . . . , n}. Pour définir les cumulants libres, il faut introduire le treillis des partitions non-croisées. Définition 3.3.9 Soit π une partition de l’ensemble {1, . . . , n} muni de l’ordre cyclique naturel. À chaque bloc 2π 2π B = {k1 , . . . , kr } de π on associe le polygône PB qui est l’enveloppe convexe des points eik1 n , . . . , eik1 n . 0 On dit que π est non-croisée si pour tous B et B blocs distincts de π, on a PB ∩ PB 0 = ∅. 4 3 5 4 5 2 1 6 10 7 8 3 2 1 6 10 7 8 9 9 Figure 3.6 – La partition {{1, 2, 3, 7}, {4, 6}, {5}, {8, 9, 10}} est non-croisée alors que {{1, 3, 7}, {2, 8, 9, 10}, {4, 6}, {5}} est croisée. L’ensemble des partitions non-croisées de {1, . . . , n} est noté N C n . La relation d’ordre sur Pn induit une relation d’ordre sur N C n qui en fait un treillis. Notons moeb la fonction de Möbius de ce treillis. Alors on définit les cumulants libres de la façon suivante. Définition 3.3.10 Soit (A, τ ) un espace de probabilités non-commutatif. Soient a1 , . . . , an des éléments de A. On définit le cumulant libre de a1 , . . . , an comme X kn (a1 , . . . , an ) = moeb(1n , π)mπ (a1 , . . . , an ). π∈N C n Enfin, pour tout a ∈ A et tout n ≥ 1, on pose kn (a) = kn (a, . . . , a). 3.3. ENTRE INDÉPENDANCE ET LIBERTÉ [LBG8] 93 On a alors les propriétés suivantes. Proposition 3.3.11 Soit (A, τ ) un espace de probabilités. Soient A1 et A2 deux sous-algèbres de A. Alors les deux propriétés suivantes sont équivalentes. 1. Pour tout n ≥ 1 et tous a1 , . . . , an éléments de A qui appartiennent chacun soit à A1 soit à A2 , mais ni tous à A1 ni tous à A2 , ce qui s’écrit {a1 , . . . , an } ⊂ A1 ∪ A2 , {a1 , . . . , an } 6⊂ A1 , {a1 , . . . , an } 6⊂ A2 , on a kn (a1 , . . . , an ) = 0. 2. A1 et A2 sont libres par rapport à τ . En particulier, si a et b sont deux éléments libres de A, on a pour tout n ≥ 1 l’égalité kn (a + b) = kn (a) + kn (b). Ainsi, les cumulants libres linéarisent la convolution libre et caractérisent la liberté. Malheureusement, dans le cas t-libre pour t > 0, nous avons montré qu’il n’existe rien d’aussi simple et puissant que les cumulants libres. Nous avons cherché des candidats au rôle de cumulant t-libre dans l’ensemble suivant de formes multilinéaires. Définition 3.3.12 Soit (A, τ ) un espace de probabilités. Soit n ≥ 1 un entier. Soit σ ∈ Sn une permutation. On définit une forme n-linéaire sur A en posant, pour tous a1 , . . . , an ∈ A, Y τσ (a1 , . . . , an ) = τ (ai1 . . . air ). (i1 ...ir ) cycle de σ Cette définition a un sens grâce à la tracialité de τ . Nous cherchons maintenant une combinaison linéaire des τσ , σ ∈ Sn qui ait la propriété de s’annuler dès lors qu’on l’évalue sur des arguments qui peuvent être répartis en deux sous-ensembles non vides et qui forment deux familles t-libres. Définition 3.3.13 Soit n ≥ 2 un entier. Soit t ≥ 0 un réel. UnX cumulant t- libre d’ordre c(σ) 6= 0 et telle que n est une collection (c(σ))σ∈Sn de nombres complexes telle que σ n−cycle la propriété suivante soit vérifiée dans tout espace de probabilités non-commutatif (A, τ ) : pour toute paire (A1 , A2 ) de sous-algèbres de A qui sont t-libres par rapport à τ , et pour tous a1 , . . . , an éléments de A qui appartiennent chacun soit à A1 soit à A2 , mais ni tous à A1 ni tous à A2 , on a X c(σ)τσ (m1 , . . . , mn ) = 0. (3.8) σ∈Sn Notre résultat est le suivant. Par t-libre pour t = +∞, nous entendons libre. Théorème 3.3.14 ([LBG8, Theorems 4.3 and 4.4]) 1. Pour tout t ∈ [0, +∞] et tout n ∈ {2, 3, 4, 5, 6}, il existe un cumulant t-libre d’ordre n. Si de plus on demande que ce cumulant soit invariant par conjugaison, c’est-à-dire tel que c(σ1 σ2 σ1−1 ) = c(σ2 ) pour tous σ1 , σ2 ∈ Sn , alors il est unique à multiplication près par une constante. 2. Il existe un cumulant t-libre d’ordre 7 si et seulement si t = 0 ou t = +∞. 94 CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE Perspectives En guise de conclusion, je vais indiquer quelques développements qui me semblent se présenter naturellement dans la continuité des travaux que j’ai exposés ici, et je vais le faire en reprenant les thèmes approximativement dans l’ordre dans lequel ils ont été traités. À la suite de la construction des champs d’holonomie markoviens telle qu’elle a été ici exposée, il me semble inévitable de souhaiter compléter le résultat de classification partielle que nous avons obtenu (théorème 1.3.6). Nous avons montré qu’à chaque champ d’holonomie markovien régulier était associé un processus de Lévy admissible. Est-il vrai que ce processus de Lévy caractérise complètement le champ d’holonomie markovien ? Autrement dit, un champ d’holonomie markovien est-il déterminé par ses fonctions de partition ? Je crois que la réponse est affirmative si le groupe de structure est abélien, mais je ne la connais pas dans le cas général. Si elle s’avérait négative, ce qui ne me semble pas exclu, il faudrait à mon avis tenter d’ajouter une hypothèse à la définition des champs d’holonomie qui permette d’éviter cette ambiguïté. En restant au niveau général de la construction, il me semblerait intéressant de poursuivre le point de vue selon lequel un champ d’holonomie aléatoire est un morphisme de groupes aléatoire entre le groupe des lacets rectifiables tracés sur une surface et un groupe de Lie compact. Ben Hambly et Terry Lyons ont donné dans [HL06] une définition précise du groupe des lacets rectifiables réduits sur un espace vectoriel ou une variété différentiable, et des outils analytiques pour les manipuler. Il est sans doute techniquement difficile de comprendre la variable aléatoire associée à un lacet par un champ d’holonomie aléatoire comme une fonction assez explicite de sa signature (voir [LCL] pour plus de détails sur la signature d’un chemin), mais y parvenir même dans des cas simples me semblerait extrêmement intéressant et serait probablement riche d’enseignements sur la régularité exacte des champs d’holonomie markoviens. Une extension possible et naturelle des champs d’holonomie markoviens consisterait à définir une holonomie aléatoire le long de chemins aléatoires, peut-être de chemins browniens. Je pense que les techniques utilisées dans [L7] pourraient difficilement suffire à définir une holonomie aléatoire le long de chemins aussi irréguliers que des chemins browniens typiques, mais on pourrait imaginer que des compensations dues à la structure particulière du mouvement brownien puissent malgré tout permettre de définir un objet non-trivial. À ma connaissance, la seule tentative dans cette direction a été faite par Sergio Albeverio et Shigeo Kusuoka [AK95]. Toutefois, une direction de recherche qui me semble bien plus importante est celle qui consiste à tenter de coupler les champs d’holonomie markoviens avec d’autres objets 95 96 PERSPECTIVES aléatoires. Ces objets aléatoires pourraient être des chemins, dans l’esprit du paragraphe précédent, mais l’origine physique des objets que nous considérons indique que les couplages les plus intéressants seraient sans doute ceux qu’on effectuerait avec des objets qu’on pourrait interpréter comme des champs de matière. Cette question du couplage a un sens aussi bien dans un cadre discret, où l’on tenterait de coupler des théories de jauge avec divers modèles de physique statistique sur réseau, que dans un cadre continu, où l’on chercherait à coupler par exemple un champ d’holonomie avec des sections aléatoires d’un fibré vectoriel associé au fibré principal sous-jacent. Il est aussi possible que les objets pertinents soient de nature non-commutative, pour tenir compte de la nature fermionique des champs de matière. Le principe de grandes déviations que nous avons démontré avec James Norris concerne le champ de Yang-Mills, qui est associé au mouvement brownien sur le groupe de structure. On peut se demander s’il y a des résultats analogues pour d’autres champs d’holonomie markoviens, associés à d’autres processus de Lévy. Pour établir de tels résultats, il faudrait sans doute comprendre ces champs markoviens comme reflets de connexions aléatoires, ou peut-être comme reflets de mixtures de connexions aléatoires et de revêtements ramifiés. Cette idée est proche de celles qui sont exposées par Gross et Taylor dans [GT93a, GT93b] où, en mélangeant la théorie de Yang-Mills et des modèles plus ou moins mystérieux de revêtements aléatoires, ils obtiennent des formules remarquables sur le mouvement brownien dans le groupe unitaire. Un aspect de la théorie de Yang-Mills en deux dimensions qui a suscité l’intérêt des physiciens est l’existence, lorsque le groupe de structure est le groupe unitaire U(N ), d’une transition de phase liée à la limite N → ∞. Cette transition de phase prend différents aspects suivant le point de vue qu’on adopte, mais il me semble qu’elle ne peut qu’être liée à cette transition fondamentale : la distribution limite des valeurs propres du mouvement brownien sur le groupe unitaire, qui pour tout t ≥ 0 est une mesure de probabilités sur le cercle unité, est d’abord égale à la masse de Dirac en 1 pour t = 0, puis voit son support croître progressivement jusqu’à t = 4, qui est le premier temps auquel ce support est le cercle unité tout entier, puis devenir analytique pour t > 4. Pour t ∈ (0, 4), les moments de cette distribution limite décroissent comme des puissances de leur ordre alors que pour t > 4 ils décroissent exponentiellement (voir la section 3.2.1). L’existence d’une transition de phase pour la mesure de Yang-Mills sur une sphère en fonction de l’aire totale de la sphère [DK94] peut être rendue plausible à partir de ces faits, mais il reste beaucoup à faire avant de pouvoir produire un énoncé rigoureux. Les calculs concernant le pont brownien sur le groupe unitaire, qui semblent être la porte d’entrée naturelle pour ces questions, deviennent en effet très rapidement inextricables, plus rapidement encore que ceux qui concernent le mouvement brownien. Une caractéristique de ces calculs est le fait qu’on s’y trouve perpétuellement en train d’exprimer des quantités petites (par exemple des nombres complexes de module inférieur à 1) comme sommes alternées de nombres gigantesques, ce qui est évidemment extrêmement peu propice à l’estimation de ces quantités. Les graphes présentés à la figure 3.3 illustrent eux aussi la différence de comportement en temps petit et en temps grand du mouvement brownien sur U(N ) lorsque N tend vers l’infini. Dans l’étude des fluctuations de variables aléatoires de la forme trf (UN ), il reste 97 beaucoup à faire. Nous avons énoncé le théorème de la limite centrale (théorème 3.2.13) pour des fonctions à dérivée lipschitzienne, mais, avec Mylène Maïda, nous conjecturons que ce théorème est vrai pour des fonctions bien moins régulières, au moins pour T assez grand. Une version plus précise de notre conjecture serait que la classe de fonctions pour 1 laquelle le théorème est vrai est l’espace H 2 pour T > 4 et que cette classe dépendrait de T pour T ≤ 4. On pourrait par exemple imaginer que pour T ≤ 4 il soit nécessaire d’imposer des conditions particulières aux deux bords du spectre du νT . Toutefois, nous n’avons pas d’idée précise de ce que pourrait être la classe exacte des fonctions pour lesquelles le théorème est vrai lorsque T ≤ 4. Avec Florent Benaych-Georges, nous poursuivons notre investigation de la notion de t-liberté, ou de notions apparentées, en cherchant en particulier à établir des théorèmes analogues à ceux qui concernent la convergence en loi de sommes de variables aléatoires classiques indépendantes. Nous espérons en particulier obtenir une interpolation entre la bijection de Bercovici-Pata et la transformation identique de l’ensemble des mesures de probabilités sur R. Mêlant un grand nombre des questions que je viens d’évoquer, un problème qui retient beaucoup mon attention est ce champ maître que décrit informellement I. Singer dans son article [Sin95] et auquel beaucoup de physiciens ont consacré des efforts. Dans le cas où l’espace-temps est un disque, ou le plan tout entier, tous les outils sont présents pour décrire ce champ limite, dans le cadre des probabilités libres, et pour démontrer des résultats de convergence des champs associés à U (N ) vers ce champ limite lorsque N tend vers l’infini. Il me semble qu’une formulation cohérente de ce champ maître pourrait faire intervenir le groupe des lacets rectifiables réduits qui est un des sous-produit de la théorie des chemins irréguliers (rough paths) développée par Terry Lyons [LCL], et que j’ai mentionné plus haut. Ce groupe, qu’il a étudié avec Ben Hambly [HL06], est une sorte de groupe libre à une infinité non dénombrable de génerateurs (bien que ce ne soit pas un groupe libre au sens algébrique) avec lequel il est possible de faire de l’analyse. En une phrase, il me semble que le champ maître que décrit I. Singer pourrait être défini rigoureusement comme une trace sur l’algèbre de ce groupe et je travaille actuellement activement dans cette direction. Parmi les différents aspects de la limite N → ∞, les équations de Makeenko-Migdal [MM79] me semblent particulièrement intrigantes et m’apparaissent comme un moyen possible de mieux comprendre la nature du champ maître. J’essaye actuellement de les établir rigoureusement et de les comprendre comme une traduction graphique, dans le groupe libre des lacets réduits dans un graphe, des règles de calcul que donne la formule d’Itô appliquée au mouvement brownien dans le groupe unitaire. La démonstration de ces équations que donnent les physiciens, basée sur les équations de Schwinger-Dyson, est à la fois belle et mystérieuse, et ne semble pas pouvoir être facilement traduite en un langage mathématique rigoureux. 98 PERSPECTIVES Annexe Des équations de Maxwell à la mesure de Yang-Mills Dans cet appendice, je vais essayer d’esquisser un chemin qui relie la description classique de l’électromagnétisme, telle qu’il est vraisemblable que le lecteur l’ait déjà étudiée et manipulée, à un petit morceau de théorie des champs qui rende plausible l’intérêt physique de la mesure de Yang-Mills. A.1 Champs et potentiels La théorie classique de l’électromagnétisme, telle qu’elle a été formulée à la fin du dixneuvième siècle, consiste en les quatre équations de Maxwell et la loi de Lorentz. Les équations de Maxwell déterminent deux champs de vecteurs dépendant du temps dans ~ et le champ magnétique B, ~ en fonction de la densité de charge R3 , le champ électrique E ρ et de la densité de courant ~. Elles s’écrivent comme suit : ~ = ρ, div E (Gauss) → ~ − ~ rot E = −∂t B, (Faraday) ~ div B = 0, (Thomson) → ~ − ~ rot B = ~ + ∂t E. (Ampère) La loi de Gauss est l’équation fondamentale de l’électrostatique, la loi de Faraday permet par exemple de calculer le courant induit dans une spire conductrice par un champ magnétique variable, la loi de Thomson est équivalente à l’inexistence de charges ou monopôles magnétiques, et la loi d’Ampère permet par exemple de calculer le champ magnétique produit par un fil conducteur traversé par un courant électrique. ~ et B ~ sont liées, indépendamment de la distribution et du Les six composantes de E mouvement des charges dans l’espace, par les deux équations homogènes que sont les lois de Faraday et de Thomson. Ceci suggère que ces six composantes doivent pouvoir s’exprimer en fonction de quatre quantités scalaires. La loi de Thomson implique en → ~ ~ tel que B ~ = − effet l’existence, au moins localement, d’un champ de vecteurs A rot A. Un tel champ est appelé potentiel vecteur. Une fois choisi un potentiel vecteur, la loi de Faraday entraîne l’existence, au moins localement, d’un champ scalaire V , appelé potentiel 99 100 ANNEXE . DES ÉQUATIONS DE MAXWELL À LA MESURE DE YANG-MILLS ~ = −∇V ~ − ∂t A. ~ Lorsqu’on travaille dans R3 tout entier, les potentiels électrique, tel que E ~ et B ~ en fonction des peuvent être définis globalement et on parvient donc à exprimer E ~ et V . quatre composantes de A ~ et V Toutefois, les potentiels ne sont jamais uniques. On vérifie aisément que si A sont des potentiels qui conviennent dans une certaine situation, alors, pour toute fonction ~ ∇ϕ ~ et V −∂t ϕ conviennent également. ϕ : R3 → R dépendant du temps, les potentiels A+ ~ V ) qui décrivent En fait, en faisant varier ϕ, on obtient de cette façon toutes les paires (A, une situation donnée. A.2 L’équation de Schrödinger pour une particule chargée La loi de Lorentz détermine la force F~ qui s’exerce sur une particule en fonction de sa ~ et magnétique B ~ : charge q, de sa vitesse ~v et des champs électrique E ~ + q~v ∧ B. ~ F~ = q E (A.1) La première étape de notre cheminement va consister à écrire l’équation de Schr ödinger pour une particule chargée soumise à un champ électrique et un champ magnétique donnés. Pour passer d’une théorie classique à une théorie quantique, la première chose à faire est de formuler la théorie classique sous forme lagrangienne, puis hamiltonienne. Dans notre cas, il nous faut trouver une fonction L (~r, ~v ) de deux vecteurs de R3 telle que les équations d’Euler-Lagrange d ∂L (~r, ~v ) ∂L (~r, ~v ) = , i ∈ {1, 2, 3}, dt ∂vi ∂ri soient équivalentes à la loi de Lorentz (A.1). On vérifie directement que si des potentiels ~ et V ont été choisis, alors la fonction A 1 ~ r) L (~r, ~v ) = mk~v k2 − qV (~r) + q~v · A(~ 2 convient. Pour passer d’une formulation lagrangienne à une formulation hamiltonienne, la règle consiste à définir une impulsion conjugée à ~r, notée p~, définie par pi = ∂L ,i ∈ ∂vi {1, 2, 3}, puis à exprimer la fonction H (~r, p~) = p~ · ~v − L (~r, ~v ) en fonction de ~r et p~. ~ (ce qui diffère du cas le plus commun où Dans notre cas, nous trouvons p~ = m~v + q A 1 on a simplement p~ = m~v ), puis H (~r, p~) = 2 mk~v k2 + qV (~r). En fonction de ~r et p~, nous trouvons 2 1 ~ + qV (~r). H (~r, p~) = p~ − q A 2m Avec cette définition de H , la loi de Lorentz s’écrit donc comme un cas particulier des équations de Hamilton : dri ∂H dpi ∂H = , =− , i ∈ {1, 2, 3}. dt ∂pi dt ∂ri A.3. L’EFFET D’UN CHANGEMENT DE JAUGE SUR LA FONCTION D’ONDE 101 Mais pour nous, l’intérêt principal de cette formulation réside dans le fait qu’elle permet d’écrire une équation de Schrödinger de façon automatique. En effet, nous allons définir un opérateur linéaire sur l’espace de Hilbert L2 (R3 ) en remplaçant, dans l’expression de H , chaque fonction scalaire de ~r par l’opérateur de multiplication par cette fonction, et chaque composante de p~ par −i fois la dérivée partielle dans la direction correspondante. De cette façon, nous trouvons l’opérateur hamiltonien 2 1 ~ ~ + qV. H=− ∇ − iq A 2m L’équation de Schrödinger s’écrit alors simplement ∂t Ψ = −iHΨ, où Ψ est la fonction d’onde d’une particule de charge q. A.3 L’effet d’un changement de jauge sur la fonction d’onde Il est satisfaisant de constater que le hamiltonien que nous venons d’écrire dépend ~ et le champ B ~ par le biais des potentiels des données physiques que sont le champ E ~ ~ et B ~ de façon V et A. En effet, ces potentiels codent l’information contenue dans E ~ et B ~ eux-mêmes. Cependant nous avons déjà mentionné que ces moins redondante que E ~ V ) particulière s’appelle faire un potentiels n’étaient pas uniques. Choisir une paire (A, choix de jauge et nous allons voir qu’il s’agit bien de la même jauge que celle dont on parle dans les théories de jauge, dont la théorie de Yang- Mills est un exemple. ~ Choisissons donc une jauge, comme nous l’avions fait plus haut, en choisissant V et A. 3 Pour toute fonction ϕ : R → R dépendant du temps, notons Hϕ le hamiltonien obtenu ~ par A ~ + ∇ϕ ~ et V par V − ∂t ϕ. Pour tout ϕ, les hamiltoniens H et en remplaçant A Hϕ décrivent la même situation physique, nous aurions pu les obtenir aussi bien l’un que l’autre par la procédure que nous avons suivie. Comme on peut donc s’y attendre, il y a une transformation simple qui fait passer d’une fonction d’onde satisfaisant l’équation de Schr ödinger associée à H à une solution de l’équation associée à Hϕ . Pour déterminer cette transformation, on observe que 2 iqϕ ~ 2 −iqϕ ~ ~ ~ ~ e (∇ − iq A) e = ∇ − iq(A + ∇ϕ) , d’où on tire la relation Hϕ = eiqϕ He−iqϕ − q∂t V, puis l’équivalence ∂t Ψ = −iHΨ ⇐⇒ ∂t eiqϕ Ψ = −iHϕ eiqϕ Ψ . Nous constatons donc que nous pouvons décrire la même situation physique avec deux fonctions d’onde qui diffèrent par une phase qui dépend du temps et du point où l’on se place. Bien entendu, la physique reste la même, car ceci se fait au prix d’une modification du hamiltonien. De plus, si nous ajoutions une deuxième particule à notre système, sa 102 ANNEXE . DES ÉQUATIONS DE MAXWELL À LA MESURE DE YANG-MILLS fonction d’onde subirait la même transformation que celle de la première particule lorsqu’on passe d’un hamiltonien à l’autre. Ainsi, d’éventuelles interférences entre les fonctions d’onde qui auraient des conséquences qu’on puisse observer seraient identiques dans les deux descriptions. A.4 La nature géométrique du potentiel vecteur Plaçons-nous pour simplifier dans une situation où le champ électrique est nul et le champ magnétique constant. Nous choisissons V = 0. Même sous ces hypothèses restrictives, nous venons de voir qu’un immense groupe agit sur l’ensemble des façons possibles de décrire la situation physique que nous nous sommes donnée : le groupe de toutes les fonctions sur R3 à valeurs dans le groupe U(1) des nombres complexes de module 1. Ce groupe s’appelle le groupe de jauge – nous savons maintenant pourquoi – et on 0 0 le note J . Le produit dans J de deux éléments eiϕ et eiϕ est simplement ei(ϕ+ϕ ) . Un élément eiϕ de J agit sur la fonction d’onde Ψ d’une particule de charge q selon la for~ en A ~ + ∇ϕ, ~ mule (eiϕ · Ψ)(~r) = eiqϕ(~r) Ψ(~r). Il transforme aussi le potentiel vecteur A et ~ ~ ~ ~ ~ l’opérateur différentiel ∇ − iq A en ∇ − iq(A + ∇ϕ). Pour passer de la multitude de descriptions à laquelle nous sommes confrontés à une description intrinsèque, qui ne nécessite aucun choix de jauge, il nous faut fonder notre description sur un objet dont le groupe de symétrie soit le groupe de jauge, c’est-à-dire un fibré principal. En l’occurence, il nous faut considérer l’espace R3 × U(1) muni de l’action, notée à droite par habitude, de U(1) donnée par (~r, eiθ ) · eiα = (~r, ei(θ+α) ). Cet espace est fibré par la projection sur la première composante R3 × U(1) → R3 . Un automorphisme de ce fibré principal est par définition un difféomorphisme de R3 × U(1) qui commute à l’action de U(1) et qui préserve les fibres, c’est-à-dire qui envoie toute paire (~r, eiθ ) sur une 0 paire de la forme (~r, eiθ ). Il n’est pas difficile de voir que le groupe des automorphismes de fibré principal de R3 × U(1) s’identifie à J : un élément eiϕ de J agit sur une paire (~r, eiθ ) selon eiϕ · (~r, eiθ ) = (~r, ei(ϕ(~r)+θ) ). Nous prétendons maintenant que la fonction d’onde d’une particule de charge q est en fait une fonction ψ : R3 × U(1) → C qui est q-équivariante au sens suivant : pour tous (~r, eiθ ) ∈ R3 × U(1) et tout eiα ∈ U(1), on a ψ((~r, eiθ ) · eiα ) = ψ(~r, ei(θ+α) ) = eiqα ψ(~r, eiθ ). Chaque fonction d’onde usuelle, une de celles que nous avons notées Ψ, n’est que la lecture de la fonction ψ à travers une section particulière du fibré R3 ×U(1) : pour chaque fonction σ : R3 → U(1), appelée section du fibré, nous pouvons poser Ψσ (~r) = ψ(~r, σ(~r)). Lorsqu’on remplace σ par une nouvelle section σ 0 , cette dernière s’écrit nécessairement sous la forme eiϕ σ pour un certain eiϕ appartenant à J et on trouve la relation suivante entre Ψσ et Ψσ0 : Ψσ0 (~r) = ψ(~r, eiϕ(~r) σ(~r)) = eiqϕ(~r) Ψσ (~r). Changer la section à travers laquelle on lit la fonction d’onde produit donc le même effet sur la fonction d’onde que changer le potentiel vecteur. A.4. LA NATURE GÉOMÉTRIQUE DU POTENTIEL VECTEUR 103 ~ dans ce nouveau contexte géométrique. Il nous faut maintenant discuter la nature de A ~ Dans l’équation de Schrödinger, le champ A apparaît comme terme d’ordre 0 dans l’opé~ − iq A. ~ Pour comprendre ce qu’est ce terme, nous allons voir comment rateur différentiel ∇ les dérivées de ψ s’expriment en fonction de celles de Ψσ . Soit donc ψ notre fonction d’onde et soit ~r un point de R3 . Choisissons une section σ : R3 → U(1) et posons σ(~r) = eiθ . Un vecteur tangent à R3 × U(1) en (~r, eiθ ) est une paire (~x, iξ) appartenant R3 ⊕ iR. Choisissons un tel vecteur (~x, iξ) et calculons la différentielle de ψ en (~r, eiθ ) dans la direction (~x, iξ) en fonction de Ψσ . En écrivant, pour tout ~s ∈ R3 , σ(~s) = ei(θ+ϕ(~s)) , avec ϕ(~r) = 0, nous trouvons d ψ(~r + t~x, ei(θ+tξ) ) dt |t=0 ~ σ (~r) · ~x − iq(−ξ + ∇ϕ(~ ~ r) · ~x)Ψσ (~r). = ∇Ψ d(~r,eiθ ) ψ(~x, iξ) = Nous voyons apparaître une expression familière. En effet, si nous lions ~x et ξ par la ~ · ~x dans l’expression précédente, nous trouvons relation ξ = −A ~ − iq(A ~ + ∇ϕ))Ψ ~ ~ · ~x). (∇ r) · ~x = d(~r,σ(~r)) ψ(~x, iA σ (~ Dans ce qui précède, nous avons implicitement utilisé la section constante égale à eiθ comme référence. Toute autre section s’écrit eiϕ eiθ pour un certain eiϕ ∈ J . En fait, le choix de θ n’a pas d’importance, nous aurions pu prendre θ = 0, et nous avons donc obtenu la relation ~ − iq(A ~ + ∇ϕ))Ψ ~ ~ · ~x). (∇ r) · ~x = d(~r,eiϕ(~r) ) ψ(~x, iA eiϕ (~ ~ − iq(A ~ + ∇ϕ) ~ Ainsi, appliquer l’opérateur différentiel ∇ à Ψeiϕ – tous deux dépendant de la jauge – revient à dériver ψ dans une certaine direction qui ne dépend pas de la jauge, ~ En fait, A ~ détermine, en chaque point ~r de R3 et pour chaque eiθ mais seulement de A. de U(1), une application linéaire de l’espace tangent à R3 en ~r dans l’espace tangent à R3 × U(1) en (~r, eiθ ) : ~ · ~x) ∈ R3 ⊕ iR. ~x 7→ (~x, iA ~ La L’image de cette application linéaire s’appelle le sous-espace horizontal associé à A. ~ collection de tous les sous-espaces horizontaux déterminés par A est une connexion. En chaque point de R3 × U(1), ils indiquent une façon d’identifier – de connecter – des fibres ~ − iq(A ~+ infinitésimalement proches. L’opérateur différentiel qui dans la jauge eiϕ se lit ∇ ~ ∇ϕ) est le gradient covariant associé à la connection. Une fonction d’onde ψ a un gradient covariant nul en un point si en ce point, sa différentielle est nulle dans toutes les directions horizontales. Finalement, notre description mathématique de la situation est la suivante : la fonction d’onde d’une particule de charge q est une fonction q-équivariante sur R3 ×U(1) et le champ magnétique détermine une connexion sur R3 ×U(1), c’est- à-dire la donnée en chaque point d’un sous-espace de l’espace tangent qu’on appelle sous-espace horizontal. Si une section σ : R3 → U(1) est donnée, on peut en chaque point caractériser la distribution horizontale en la comparant à l’image de la différentielle de l’application (id, σ) : R3 → R3 × U(1). La 104 ANNEXE . DES ÉQUATIONS DE MAXWELL À LA MESURE DE YANG-MILLS différence est un nombre imaginaire pur, qui en un point de R3 donné dépend linéairement de la direction dans laquelle on le calcule. C’est donc une 1-forme différentielle, celle qui ~ · ~x. dans la jauge de référence s’écrivait plus haut ~x 7→ A A.5 Un lagrangien pour les équations de Yang-Mills ~ Dans Nous avons maintenant élucidé la nature géométrique du potentiel vecteur A. une théorie complètement quantique de l’électromagnétisme, non seulement les particules chargées sont traitées de façon quantique, mais également le champ électromagnétique lui-même. De façon caricaturale, on peut dire que tout comme une particule, représentée classiquement à chaque instant par un point ~r dans R3 , est remplacée dans le formalisme quantique par une fonction d’onde dépendant du temps sur R3 , le champ électromagné~ B) ~ de R3 dans R6 , est remplacé par tique, représenté classiquement par une fonction (E, une “fonctionnelle d’onde” sur l’espace de ces fonctions. Et comme pour les particules, cette quantification nécessite pour le champ électromagnétique d’écrire les équation de Maxwell sous forme lagrangienne. Pour ce faire, il faut commencer par réécrire les équations de Maxwell sous une forme qui fasse mieux apparaître leur structure géométrique. Sans même faire appel à la partie ~ des expériences simples où l’on de cette discussion où nous avons analysé la nature de A, compare une expérience physique avec son image dans un miroir ou par une homothétie ~ ni E ~ ne se transforment comme des vecteurs. Ils se transforment en indiquent que ni B fait comme des formes différentielles. Plus précisément, nous allons voir qu’on gagne à définir une 1-forme E et une 2-forme B en posant E = Ex dx + Ey dy + Ez dz et B = Bx dy ∧ dz + By dz ∧ dx + Bz dx ∧ dy. On combine ensuite ces deux formes en une 2-forme F appelée champ électromagnétique en posant F = B − dt ∧ E. Enfin, on code également la densité de charge ρ et la densité de courant ~ par une forme différentielle en posant J = −ρdt + jx dx + jy dy + jz dz. En munissant R4 de la métrique −dt2 + dx2 + dy 2 + dz 2 , on définit un opérateur de Hodge sur les formes différentielles, noté ∗. Il ne diffère de l’opérateur associé à la métrique euclidienne que par un signe moins supplémentaire lorsqu’il est appliqué à une forme qui fait intervenir dt. Les équations de Maxwell se réécrivent alors en peu de symboles : dF = 0, (Gauss, Thomson) d(∗F ) = ∗J. (Faraday, Ampère) L’équation homogène implique l’existence d’une 1-forme A telle que F = dA. Avec nos notations précédentes, on peut prendre A = −V dt + Ax dx + Ay dy + Az dz. A.6. INTÉGRALES DE CHEMIN 105 Cette formulation des équations de Maxwell a l’avantage immense de mettre en évidence leur invariance par les transformations de R4 qui préservent la métrique de Minkowski. La théorie de l’électromagnétisme telle que Maxwell l’a formulée était donc déjà une théorie relativiste et ce sont d’ailleurs certaines de ses conséquences qui ont amené Einstein à formuler la théorie de la relativité restreinte. Pour nous en revanche qui voudrions quantifier le champ électromagnétique, une formulation qui comme celle-ci ne fait plus de distinction nette entre temps et espace est un peu embarrassante. Nous allons nous contenter de vérifier que le lagrangien suivant : 1 L (A) = F ∧ ∗F + A ∧ ∗J 2 est un lagrangien du champ électromagnétique en présence des charges et des courants décrits par J. Tout d’abord, ce lagrangien se déclare comme une fonction de la 1-forme A plutôt que de F , et la relation F = dA est implicite, qui entraîne immédiatement dF = 0. Sans nous préoccuper de conditions au bord, il nous faut maintenant déterminer les 1- formes A pour lesquelles l’intégrale sur R4 du lagrangien est stationnaire. Si nous varions A de δA, F varie de dδA. En utilisant le fait que, pour des 2-formes α et β quelconques on a α ∧ (∗β) = (∗α) ∧ β, nous trouvons au premier ordre Z (d ∗ F − ∗J) ∧ δA. L (A + δA) = L (A) + R4 R Comme l’appariement (α, β) 7→ R4 α ∧ β est non- dégénéré, il s’ensuit que l’intégrale du lagrangien est stationnaire si et seulement si d ∗ F = ∗J. A.6 Intégrales de chemin Maintenant que nous disposons d’une formulation lagrangienne de l’électromagnétisme dans le vide, nous pouvons appliquer la méthode de quantification par les intégrales de chemin de Feynman. Dans cetteR méthode, on attribue à chaque configuration A l’intéi grale de son lagrangien S(A) = R4 L (A) puis une amplitude de probabilité e ~ S(A) . Pour déterminer la probabilité d’observer un certain phénomène, on ajoute les amplitudes de toutes les configurations de A qui pourraient la produire et on calcule le carré du module du résultat. On aboutit donc à des intégrales de la forme Z eiS(A) dA, B où B est l’espace des configurations correspondant au phénomène dont on veut calculer la probabilité. Nous sommes arrivés à un point où des intégrales sont apparues sur des ensembles de connexions, avec un poids exponentiel faisant intervenir le lagrangien de l’électromagnétisme, c’est-à-dire presque au point où a commencé l’introduction de ces notes. En remplaçant la métrique de Minkowski sur R4 par la métrique euclidienne, l’intégrale du 106 ANNEXE . DES ÉQUATIONS DE MAXWELL À LA MESURE DE YANG-MILLS i lagrangien devient une fonction positive sur l’espace des connexions. En remplaçant e ~ S(A) 1 par e− 2 S(A) dans l’intégrale de chemins et en se plaçant dans le vide, où J = 0, on se trouve face à l’intégrale Z 1 e− 2 S(A) dA, B qui est une variante des expressions heuristiques que nous avons données pour la mesure de Yang-Mills (voir (2) et (2.1)). Liste des travaux [L1] Thierry Lévy. Construction et étude à l’échelle microscopique de la mesure de Yang-Mills sur les surfaces compactes. C. R. Acad. Sci. Paris Sér. I Math., 330(11) :1019–1024, 2000. [L2] Thierry Lévy. Yang-Mills measure on compact surfaces. Mem. Amer. Math. Soc., 166(790) :xiv+122, 2003. [L3] Thierry Lévy. Wilson loops in the light of spin networks. J. Geom. Phys., 52(4) :382–397, 2004. [L4] Thierry Lévy. Discrete and continuous Yang-Mills measure for non-trivial bundles over compact surfaces. Probab. Theory Related Fields, 136(2) :171–202, 2006. [LN5] Thierry Lévy and James R. Norris. Large deviations for the Yang-Mills measure on a compact surface. Comm. Math. Phys., 261(2) :405–450, 2006. [L6] Thierry Lévy. Schur-Weyl duality and the heat kernel measure on the unitary group. Adv. Math., 218(2) :537–575, 2008. [L7] Thierry Lévy. Two-dimensional Markovian holonomy fields. vi+166, à paraître dans Astérisque. [arXiv 0804.2230] [LBG8] Florent Benaych-Georges and Thierry Lévy. A continuous semigroup of notions of independence between the classical and the free one. Prépublication, 2009. [arXiv 0811.2335] [LM9] Thierry Lévy and Mylène Maïda. Central limit theorem for the heat kernel measure on the unitary group. Prépublication, 2009. Séminaires et actes de conférences [A1] Thierry Lévy. Comment choisir une connexion au hasard ? In Séminaire de Théorie Spectrale et Géométrie. Vol. 21. Année 2002–2003, volume 21 du Sémin. Théor. Spectr. Géom., pages 61–73. Univ. Grenoble I, Saint, 2003. [A2] Thierry Lévy. Wilson loops and spin networks. In XIVth International Congress on Mathematical Physics, pages 498–504. World Sci. Publ., Hackensack, NJ, 2005. [A3] Thierry Lévy. Large deviations for the two-dimensional Yang-Mills measure. In Stochastic analysis in mathematical physics, pages 54–68. World Sci. Publ., Hackensack, NJ, 2008. 107 108 LISTE DES TRAVAUX Notes de cours [LCL] Terry J. Lyons, Michael Caruana, and Thierry Lévy. Differential equations driven by rough paths, volume 1908 of Lecture Notes in Mathematics. Springer, Berlin, 2007. Lectures from the 34th Summer School on Probability Theory held in SaintFlour, July 6–24, 2004, With an introduction concerning the Summer School by Jean Picard. Bibliographie [AB83] M. F. Atiyah and R. Bott. The Yang-Mills equations over Riemann surfaces. Philos. Trans. Roy. Soc. London Ser. A, 308(1505) :523–615, 1983. [AHKH86] Sergio Albeverio, Raphael Høegh-Krohn, and Helge Holden. Stochastic Lie group-valued measures and their relations to stochastic curve integrals, gauge fields and Markov cosurfaces. In Stochastic processes—mathematics and physics (Bielefeld, 1984), pages 1–24. Springer, Berlin, 1986. [AHKH88] Sergio Albeverio, Raphael Høegh-Krohn, and Helge Holden. Stochastic multiplicative measures, generalized Markov semigroups, and group-valued stochastic processes and fields. J. Funct. Anal., 78(1) :154–184, 1988. [AI92] Abhay Ashtekar and Chris J. Isham. Representations of the holonomy algebras of gravity and nonabelian gauge theories. Classical Quantum Gravity, 9(6) :1433–1467, 1992. [AK95] Sergio Albeverio and Shigeo Kusuoka. A basic estimate for two-dimensional stochastic holonomy along Brownian bridges. J. Funct. Anal., 127(1) :132– 154, 1995. [AL94] Abhay Ashtekar and Jerzy Lewandowski. Representation theory of analytic holonomy C ∗ -algebras. In Knots and quantum gravity (Riverside, CA, 1993), pages 21–61. Oxford Univ. Press, New York, 1994. [AL95] Abhay Ashtekar and Jerzy Lewandowski. Projective techniques and functional integration for gauge theories. J. Math. Phys., 36(5) :2170–2191, 1995. [AMMa94] Abhay Ashtekar, Donald Marolf, and José Mourão. Integration on the space of connections modulo gauge transformations. In Proceedings of the Cornelius Lanczos International Centenary Conference (Raleigh, NC, 1993), pages 143– 160, Philadelphia, PA, 1994. SIAM. [Ans97] Michael Anshelevich. The master field in two dimensions. Notes of a talk, available at the address www.math.tamu.edu/~manshel/papers/master.pdf, 1997. [Ati88] Michael Atiyah. Topological quantum field theories. Publ. Math., Inst. Hautes Étud. Sci., 68 :175–186, 1988. [Bae96] John C. Baez. Spin networks in gauge theory. Adv. Math., 117(2) :253–272, 1996. [Bec95] Claas Becker. Wilson loops in two-dimensional space-time regarded as white noise. J. Funct. Anal., 134(2) :321–349, 1995. 109 110 BIBLIOGRAPHIE [Bia97] Philippe Biane. Free Brownian motion, free stochastic calculus and random matrices. In Free probability theory (Waterloo, ON, 1995), volume 12 of Fields Inst. Commun., pages 1–19. Amer. Math. Soc., Providence, RI, 1997. [Bia03] Philippe Biane. Free probability for probabilists. Attal, Stephane (ed.) et al., Quantum probability communications. Vol XII. Lectures from the Grenoble summer school, Grenoble, France, June 1998. River Edge, NJ : World Scientific. QP-PQ : Quantum Probability and White Noise Analysis 12, 55-71 (2003)., 2003. [BP72] Thomas F. Banchoff and William F. Pohl. A generalization of the isoperimetric inequality. J. Differential Geometry, 6 :175–192, 1971/72. [BS97] John C. Baez and Stephen Sawin. Functional integration on spaces of connections. J. Funct. Anal., 150(1) :1–26, 1997. [BS98] John C. Baez and Stephen Sawin. Diffeomorphism-invariant spin network states. J. Funct. Anal., 158(2) :253–266, 1998. [BtD85] Theodor Bröcker and Tammo tom Dieck. Representations of compact Lie groups. Graduate Texts in Mathematics, 98. New York etc. : Springer-Verlag. X, 313 p., 24 figs., 1985. [CG07] W. Noel Cottingham and Derek A. Greenwood. An introduction to the standard model of particle physics. Cambridge University Press, second edition, 2007. [DE01] Persi Diaconis and Steven N. Evans. Linear functionals of eigenvalues of random matrices. Trans. Amer. Math. Soc., 353(7) :2615–2633 (electronic), 2001. [DK94] Jean-Marc Daul and Vladimir A. Kazakov. Wilson loop for large N YangMills theory on a two-dimensional sphere. Phys. Lett. B, 335(3-4) :371–376, 1994. [DK00] Johannes J. Duistermaat and Johan A. C. Kolk. Lie groups. Universitext. Berlin : Springer., 2000. [DP04] Alessandro D’Adda and Paolo Provero. Two-dimensional gauge theories of the symmetric group Sn in the large-n limit. Comm. Math. Phys., 245(1) :1–25, 2004. [Dri89] Bruce K. Driver. YM2 : continuum expectations, lattice convergence, and lassos. Comm. Math. Phys., 123(4) :575–616, 1989. [Dri91] Bruce K. Driver. Two-dimensional Euclidean quantized Yang-Mills fields. In Probability models in mathematical physics (Colorado Springs, CO, 1990), pages 21–36. World Sci. Publ., Teaneck, NJ, 1991. [Dur80] Bergfinnur Durhuus. On the structure of gauge invariant classical observables in lattice gauge theories. Lett. Math. Phys., 4 :515–522, 1980. [DZ93] Amir Dembo and Ofer Zeitouni. Large deviations techniques and applications. Jones and Bartlett Publishers, Boston, MA, 1993. BIBLIOGRAPHIE 111 [Ehr51] Charles Ehresmann. Les connexions infinitésimales dans un espace fibré différentiable. In Colloque de topologie (espaces fibrés), Bruxelles, 1950, pages 29–55. Georges Thone, Liège, 1951. [Fin90] Dana S. Fine. Quantum Yang-Mills on the two-sphere. Comm. Math. Phys., 134(2) :273–292, 1990. [Fin91] Dana S. Fine. Quantum Yang-Mills on a Riemann surface. Comm. Math. Phys., 140(2) :321–338, 1991. [For93] Robin Forman. Small volume limits of 2-d Yang-Mills. Comm. Math. Phys., 151(1) :39–52, 1993. [GG95] Rajesh Gopakumar and David J. Gross. Mastering the master field. Nucl. Phys., B, 451(1-2) :379–415, 1995. [GM95] David J. Gross and Andrei Matytsin. Some properties of large-N twodimensional Yang-Mills theory. Nuclear Phys. B, 437(3) :541–584, 1995. [Gol84] William M. Goldman. The symplectic nature of fundamental groups of surfaces. Adv. Math., 54 :200–225, 1984. [Gro85] Leonard Gross. A Poincaré lemma for connection forms. J. Funct. Anal., 63(1) :1–46, 1985. [Gro88] Leonard Gross. The Maxwell equations for Yang-Mills theory. In Mathematical quantum field theory and related topics (Montreal, PQ, 1987), volume 9 of CMS Conf. Proc., pages 193–203. Amer. Math. Soc., Providence, RI, 1988. [GT93a] David J. Gross and Washington Taylor, IV. Twists and Wilson loops in the string theory of two-dimensional QCD. Nucl. Phys., B, 403(1-2) :395–449, 1993. [GT93b] David J. Gross and Washington Taylor, IV. Two-dimensional QCD is a string theory. Nuclear Phys. B, 400(1-3) :181–208, 1993. [HL06] Ben M. Hambly and Terry J. Lyons. Uniqueness for the signature of a path of bounded variation and continuous analogues of the free group. arXiv :math.CA/0507536, 2006. [Kaz81] Vladimir A. Kazakov. Wilson loop average for an arbitrary contour in twodimensional u(N ) gauge theory. Nuclear Phys. B, 179(2) :283–292, 1981. [KK80] Vladimir A. Kazakov and Ivan K. Kostov. Nonlinear strings in twodimensional U(∞) gauge theory. Nuclear Phys. B, 176(1) :199–215, 1980. [KN96] Shoshichi Kobayashi and Katsumi Nomizu. Foundations of differential geometry. Vol. I. Wiley Classics Library. John Wiley & Sons Inc., New York, 1996. Reprint of the 1963 original, A Wiley-Interscience Publication. [KS94] Christopher King and Ambar N. Sengupta. The semiclassical limit of the twodimensional quantum Yang-Mills model. J. Math. Phys., 35(10) :5354–5361, 1994. Topology and physics. [Lia04] Ming Liao. Lévy processes in Lie groups, volume 162 of Cambridge Tracts in Mathematics. Cambridge University Press, Cambridge, 2004. 112 BIBLIOGRAPHIE [Liu96] Kefeng Liu. Heat kernel and moduli space. Math. Res. Lett., 3(6) :743–762, 1996. [Liu97] Kefeng Liu. Heat kernel and moduli spaces. II. Math. Res. Lett., 4(4) :569–588, 1997. [Mas77] William S. Massey. Algebraic topology : an introduction. Springer-Verlag, New York, 1977. Reprint of the 1967 edition, Graduate Texts in Mathematics, Vol. 56. [Mig75] Alexander A. Migdal. Recursion equations in gauge field theories. Sov. Phys. JETP, 42(3) :413–418, 1975. [MM79] Yuri Makeenko and Alexander A. Migdal. Exact equation for the loop average in multicolor qcd. Phys. Lett. B, 88B :135, 1979. [Moi77] Edwin E. Moise. Geometric topology in dimensions 2 and 3. Springer-Verlag, New York, 1977. Graduate Texts in Mathematics, Vol. 47. [Mor01] Shigeyuki Morita. Geometry of differential forms, volume 201 of Translations of Mathematical Monographs. American Mathematical Society, Providence, RI, 2001. Translated from the two-volume Japanese original (1997, 1998) by Teruko Nagase and Katsumi Nomizu, Iwanami Series in Modern Mathematics. [NS06] Alexandru Nica and Roland Speicher. Lectures on the combinatorics of free probability. London Mathematical Society Lecture Note Series 335. Cambridge : Cambridge University Press. xv, 417 p., 2006. [Pic96] Doug Pickrell. On YM2 measures and area-preserving diffeomorphisms. J. Geom. Phys., 19(4) :315–367, 1996. [Sen92] Ambar N. Sengupta. The Yang-Mills measure for S 2 . 108(2) :231–273, 1992. [Sen94] Ambar N. Sengupta. Gauge invariant functions of connections. Proc. Am. Math. Soc., 121(3) :897–905, 1994. [Sen97a] Ambar N. Sengupta. Gauge theory on compact surfaces. Mem. Amer. Math. Soc., 126(600) :viii+85, 1997. [Sen97b] Ambar N. Sengupta. Yang-Mills on surfaces with boundary : quantum theory and symplectic limit. Comm. Math. Phys., 183(3) :661–705, 1997. [Sen98] Ambar Sengupta. A Yang-Mills inequality for compact surfaces. Infin. Dimens. Anal. Quantum Probab. Relat. Top., 1(1) :1–16, 1998. [Sen08] Ambar N. Sengupta. Traces in two-dimensional QCD : the large-N limit. In Traces in geometry, number theory and quantum fields (edited by Sergio Albeverio, Matilde Marcolli, Sylvie Paycha, and Jorge Plazas). Vieweg, 2008. [Sin95] Isadore M. Singer. On the master field in two dimensions. Gindikin, Simon (ed.) et al., Functional analysis on the eve of the 21st century. Volume I. In honor of the eightieth birthday of I. M. Gelfand. Proceedings of the conference, held at Rutgers University, New Brunswick, NJ, October 24-27, 1993. Boston, MA : Birkhäuser. Prog. Math. 131, 263-281 (1995)., 1995. J. Funct. Anal., BIBLIOGRAPHIE 113 [Uhl82] Karen K. Uhlenbeck. Connections with Lp bounds on curvature. Comm. Math. Phys., 83(1) :31–42, 1982. [Var67a] S. R. S. Varadhan. Diffusion processes in a small time interval. Comm. Pure Appl. Math., 20 :659–685, 1967. [Var67b] S. R. S. Varadhan. On the behavior of the fundamental solution of the heat equation with variable coefficients. Comm. Pure Appl. Math., 20 :431–455, 1967. [VDN92] Dan V. Voiculescu, K.J. Dykema, and A. Nica. Free random variables. A noncommutative probability approach to free products with applications to random matrices, operator algebras and harmonic analysis on free groups. CRM Monograph Series. 1. Providence, RI : American Mathematical Society (AMS). v, 70 p., 1992. [Vog81] Andrew Vogt. The isoperimetric inequality for curves with self-intersections. Canad. Math. Bull., 24(2) :161–167, 1981. [Wit91] Edward Witten. On quantum gauge theories in two dimensions. Comm. Math. Phys., 141(1) :153–209, 1991. [Wit92] Edward Witten. Two-dimensional gauge theories revisited. J. Geom. Phys., 9(4) :303–368, 1992. [Xu97] Feng Xu. A random matrix model from two-dimensional Yang-Mills theory. Comm. Math. Phys., 190(2) :287–307, 1997. [YM54] Chen Ning Yang and Robert L. Mills. Conservation of isotopic spin and isotopic gauge invariance. Physical Rev. (2), 96 :191–195, 1954. [Zel04] Steve Zelditch. Macdonald’s identities and the large N limit of Y M2 on the cylinder. Commun. Math. Phys., 245(3) :611–626, 2004. 114 BIBLIOGRAPHIE Table des matières Introduction Présentation des résultats . . . . . . . . . . . . . . . . . Les difficultés mathématiques des théories de jauge La construction de la mesure de Yang-Mills . . . . Les grandes matrices unitaires . . . . . . . . . . . . Les champs d’holonomie markoviens . . . . . . . . Localisation des énoncés principaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 4 4 7 9 11 11 1 Champs d’holonomie markoviens [L2, L3, L7] 1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Le processus de Poisson modulo n indexé par des lacets . . . 1.1.2 Une première définition des champs d’holonomie markoviens E1. Topologie des surfaces [Mas77, Moi77] . . . . . . . . . . . . 1.1.3 Noyaux de transition et chirurgie des surfaces . . . . . . . . . 1.2 Processus multiplicatifs indexés par des chemins . . . . . . . . . . . 1.2.1 L’espace mesurable . . . . . . . . . . . . . . . . . . . . . . . . E2. Groupes de Lie compacts [BtD85, DK00] . . . . . . . . . . . 1.2.2 Graphes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.3 Processus de Lévy et marges associées à des graphes . . . . . E3. Processus de Lévy sur un groupe de Lie compact [Lia04] . . . 1.2.4 Symétrie de jauge . . . . . . . . . . . . . . . . . . . . . . . . 1.2.5 Une représentation aléatoire du groupe des lacets . . . . . . . E4. Groupe des lacets dans un graphe . . . . . . . . . . . . . . . 1.2.6 Boucles de Wilson [L3] . . . . . . . . . . . . . . . . . . . . . . 1.2.7 Invariance par subdivision . . . . . . . . . . . . . . . . . . . . 1.2.8 Extension aux lacets rectifiables . . . . . . . . . . . . . . . . E5. Topologie sur l’espace des chemins . . . . . . . . . . . . . . E6. L’inégalité de Banchoff-Pohl [BP72, Vog81] . . . . . . . . . 1.3 Champs d’holonomie markoviens . . . . . . . . . . . . . . . . . . . . 1.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.2 Existence et classification partielle . . . . . . . . . . . . . . . 1.3.3 Le champ de Yang-Mills . . . . . . . . . . . . . . . . . . . . . 1.3.4 Lien avec les théories topologiques des champs quantiques . . E7. Théories topologiques des champs quantiques [Ati88] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 13 13 16 16 17 22 22 22 23 24 24 27 28 29 31 32 34 34 36 37 37 39 40 43 43 2 Champs d’holonomie, revêtements et connexions 2.1 Groupes finis et revêtements ramifiés [L7, Chapitre 5] . . . . . . 2.1.1 Groupe fondamenal et revêtements . . . . . . . . . . . . . 2.1.2 Revêtements ramifiés aléatoires . . . . . . . . . . . . . . . 2.2 Champ d’holonomie brownien et connexions aléatoires [L4, LN5] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 47 47 49 51 115 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 2.3 2.4 TABLE DES MATIÈRES 2.2.1 Une 1-forme différentielle aléatoire . . . . . . . . . . . . . . . . 2.2.2 Connexions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Action et mesure de Yang-Mills . . . . . . . . . . . . . . . . . . . . . . Un principe de grandes déviations . . . . . . . . . . . . . . . . . . . . 2.4.1 Espaces de Sobolev de connexions . . . . . . . . . . . . . . . . E8. Le théorème de Schilder [DZ93] . . . . . . . . . . . . . . . . . 2.4.2 Les fonctions de taux . . . . . . . . . . . . . . . . . . . . . . . E9. Classification des G-fibrés principaux . . . . . . . . . . . . . . 2.4.3 Le champ d’holonomie brownien et sa désintégration . . . . . . E10. Mouvement brownien sur un groupe de Lie compact connexe . 2.4.4 Le principe de grandes déviations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Mouvement brownien unitaire 3.1 Aspects combinatoires du mouvement brownien unitaire [L6] . . . . . . . . . 3.1.1 Définition du mouvement brownien unitaire . . . . . . . . . . . . . . . 3.1.2 Distribution des valeurs propres et sommes de Newton . . . . . . . . . 3.1.3 Expression combinatoire des moments de la distribution spectrale . . . 3.1.4 Énumération de chemins dans le groupe symétrique . . . . . . . . . . 3.1.5 Mouvement brownien unitaire et marche aléatoire symétrique . . . . . E11. Dualité de Schur-Weyl . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.6 Revêtements ramifiés aléatoires . . . . . . . . . . . . . . . . . . . . . . 3.2 Comportement asymptotique des valeurs propres [LM9] . . . . . . . . . . . . 3.2.1 Distribution des valeurs propres : résultats asymptotiques . . . . . . . E12. Probabilités libres et mouvement brownien multiplicatif libre [VDN92, 3.3 Entre indépendance et liberté [LBG8] . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Convolutions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2 Structures de dépendance et t-liberté . . . . . . . . . . . . . . . . . . . E13. Structures de dépendance et modèles universels . . . . . . . . . . . . 3.3.3 Systèmes différentiels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.4 Inexistence de cumulants t-libres . . . . . . . . . . . . . . . . . . . . . E14. Cumulants libres [NS06] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bia03, Bia97] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Perspectives Des A.1 A.2 A.3 A.4 A.5 A.6 équations de Maxwell à la mesure de Yang-Mills Champs et potentiels . . . . . . . . . . . . . . . . . . . . L’équation de Schrödinger pour une particule chargée . L’effet d’un changement de jauge sur la fonction d’onde La nature géométrique du potentiel vecteur . . . . . . . Un lagrangien pour les équations de Yang-Mills . . . . . Intégrales de chemin . . . . . . . . . . . . . . . . . . . . 52 53 57 58 58 59 61 62 63 63 65 69 69 69 71 72 74 75 76 77 79 79 82 86 86 87 87 90 91 91 95 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 99 100 101 102 104 105