mémoire - Laboratoire de Probabilités et Modèles Aléatoires

publicité
Habilitation à diriger les recherches
Spécialité : Mathématiques
Holonomie aléatoire,
grandes matrices unitaires
Thierry LÉVY
Rapporteurs :
M. Bruce DRIVER
M. David ELWORTHY
M. Wendelin WERNER
Soutenue le 20 novembre 2009 devant le jury composé de :
M. Philippe BIANE
M. Philippe BOUGEROL
M. David ELWORTHY
Mme Alice GUIONNET
M. Yves LE JAN
M. Wendelin WERNER
Introduction
Ce texte est une présentation synthétique des travaux de recherche mathématiques
que j’ai effectués depuis le début de ma thèse. La nature de ces travaux a dicté la forme
de ce texte et je commencerai par expliquer brièvement de quelle manière.
Un problème a été au coeur de ma réflexion depuis le début de mon activité de recherche : il s’agit de la construction et de l’étude d’une mesure de probabilités, la mesure
de Yang-Mills en deux dimensions, qui est une simplification accessible aux mathématiciens d’un des ingrédients essentiels de la formulation par les intégrales de Feynman des
théories de jauge, ces théories qui depuis presque quarante ans sont le meilleur outil dont
disposent les physiciens pour décrire les constituants de la matière et leurs interactions à
l’échelle de l’infiniment petit.
Mon travail de thèse a consisté à donner une seconde construction rigoureuse de cette
mesure, dont Ambar Sengupta avait donné la première. Depuis lors, en même temps que
j’ai utilisé cette construction pour étudier différents aspects de la mesure de Yang-Mills,
j’ai cherché à l’améliorer et à la généraliser. Cela m’a conduit à définir une classe de
processus stochastiques, que j’appelle champs d’holonomie markoviens, et qui contient la
mesure de Yang-Mills de la même façon que les processus de Lévy usuels contiennent le
mouvement brownien. Par ailleurs, au cours des dernières années, l’étude d’une certaine
limite de la mesure de Yang-Mills, que les anglo-saxons appellent large N limit, m’a
conduit à me pencher sur certaines propriétés des grandes matrices unitaires aléatoires
qui, dans une large mesure, ont un intérêt indépendant de la motivation initiale qui était
la mienne.
Le fil directeur de ma réflexion jusqu’à aujourd’hui est donc celui qui mène de l’étude
de la mesure de Yang-Mills à la définition des champs d’holonomie markoviens. Toutefois,
ni la mesure de Yang-Mills ni à plus forte raison ces champs d’holonomie markoviens ne
sont des objets classiques ou simplement bien connus. Il m’a donc semblé qu’il serait peu
judicieux de faire de ces notes de synthèse une liste de résultats brièvement remis dans
leur contexte. Au contraire, il m’a semblé qu’il était souhaitable, et qu’il serait peut-être
utile, de les concevoir, pour une grande partie, comme une introduction à la théorie des
champs d’holonomie aléatoire.
C’est ce que sont donc leurs deux premiers chapitres, que l’on peut prendre comme
un survol de la monographie [L7] 1 et, le cas échéant, comme une aide à sa lecture. Le
premier chapitre est de nature probabiliste et le deuxième de nature plus géométrique. En
1. Cette monographie paraîtra début 2010.
3
4
effet, une particularité des recherches qui sont exposées ici est qu’elles utilisent à la fois
le langage du calcul des probabilités et celui de la géométrie différentielle. Parmi d’autres
combinaisons possibles, j’ai choisi d’écrire ce texte en pensant à un lecteur familier avec les
probabilités et non hostile à la géométrie différentielle. Les objets géométriques importants
sont donc décrits en détail, bien plus sans doute qu’un expert en géométrie différentielle
ne pourrait le souhaiter. De plus, tout au long du texte, des précis sur divers sujets sont
présentés sous forme d’encarts, afin que le lecteur puisse aisément se référer à ceux dont
il a l’usage, et tout aussi aisément ne pas lire ceux dont il sait connaître le contenu.
Le troisième et dernier chapitre présente mes travaux, seul et en collaboration avec
Florent Benaych-Georges et Mylène Maïda, sur les grandes matrices unitaires aléatoires.
Dans ce domaine beaucoup plus familier à beaucoup de lecteurs potentiels, une présentation plus succinte du contexte m’a paru suffisante. Néanmoins, là encore, les objets sont
introduits en détail et des encarts balisent la progression du texte.
Enfin, en annexe à ces notes de synthèse, j’ai ajouté un texte que j’aurais beaucoup
aimé avoir à ma disposition au début de mes travaux. J’y trace un chemin (nécessairement
superficiel) qui relie les équations de Maxwell aux théories de jauge en mettant l’accent
sur la raison pour laquelle il est naturel d’introduire des fibrés principaux dans la formulation quantique de l’électromagnétisme. La seule originalité de ce texte, qui est une
synthèse de fragments glanés ici ou là, est d’être écrit par un mathématicien et pour des
mathématiciens.
Présentation des résultats
Je vais maintenant décrire plus précisément le thème de mes recherches en indiquant
tout d’abord de quelle façon il est issu de la physique théorique.
Les difficultés mathématiques des théories de jauge
La mesure de Yang-Mills porte les noms des physiciens Chen Ning Yang et Robert
L. Mills qui, en 1954, ont les premiers considéré des champs de jauge prenant leurs valeurs dans des algèbres de Lie non abéliennes pour rendre compte de certains effets de
l’interaction forte [YM54]. Les théories de jauge non abéliennes auxquelles ils ont ainsi
ouvert la voie ont ensuite servi de cadre à des modèles de plus en plus vastes et précis
des interactions entre les constituants élémentaires de la matière, pour aboutir au modèle
standard qui est, depuis le début des années 1970, la meilleure théorie disponible dans
ce domaine et qui rend compte, de façon conceptuellement homogène, des interactions
électromagnétique, faible et forte [CG07].
Dans le modèle standard, les interactions sont véhiculées par des bosons de jauge, dont
les photons sont un exemple, qui véhiculent l’interaction électromagnétique 2 . Ces bosons
sont représentés par des fluctuations d’un champ de jauge, dont la nature mathématique
est celle d’une connexion sur un fibré principal. La théorie de ces connexions a précisément
2. Pour imaginer comment deux électrons peuvent se repousser en échangeant des photons, on peut penser à
deux patineurs lancés parallèlement l’un à l’autre et qui s’envoient à tour de rôle une lourde balle, faisant ainsi à
chaque fois, par réaction, diverger un peu leurs trajectoires.
5
été formalisée par Charles Ehresmann dans les années 1950 [Ehr51], pour des raisons
internes aux mathématiques, et une anecdote raconte que Chen Ning Yang et ShiingShen Chern, discutant vers 1970, se seraient chacun étonnés de ce que l’autre trouve aussi
naturel que lui de considérer de tels objets.
Du point de vue physique, une théorie de jauge est caractérisée par son lagrangien,
qui exprime comment les différents champs en présence interagissent. Le lagrangien de
Yang-Mills, dans un espace vide de matière et où ne se trouvent que des bosons de jauge,
est donné par l’expression L(A) = Tr(F ∧ ∗F ), où F est le champ de force du champ de
jauge A, c’est-à-dire la courbure de la connexion A. Ce lagrangien étant donné, on définit
l’action de Yang-Mills comme l’intégrale
Z
L(A),
S(A) =
R4
si bien que S est une fonctionnelle à valeurs réelles sur l’espace, traditionnellement noté
A, de toutes les connexions. Conformément à la formulation de Feynman de la mécanique quantique, on peut alors calculer la probabilité qu’un certain évènement physique
survienne en calculant le carré du module d’une intégrale de la forme
Z
i
Φ(A)e ~ S(A) dA,
(1)
B
où B ⊂ A est un certain ensemble de connexions, Φ : A → C est une fonctionnelle, et dA
une mesure de référence sur A.
Des expressions comme (1) n’ont pas de sens mathématique. Le problème le plus
visible est que l’espace A des connexions n’est pas localement compact 3 et ne porte pas
de mesure de Radon invariante par translation, ce que devrait être, d’après l’usage qu’en
font les physiciens, la mesure dA. Néanmoins, la qualité inouïe des prédictions que les
physiciens parviennent à faire en manipulant de telles intégrales, et plus généralement
les théories quantiques de champs, suggère qu’il est possible et important de dégager la
nature mathématique des objets qui sont en jeu dans ces théories.
D’une façon générale, donner un cadre mathématique rigoureux pour la formulation
du modèle standard est un problème encore largement ouvert 4 , mais dans le cas d’un
espace-temps à deux dimensions, et en se plaçant dans un cadre euclidien (c’est-à-dire
en remplaçant dans (1) le i de l’exponentielle par −1), il est possible de donner un sens
rigoureux et cohérent avec leur sens physique à des intégrales de la forme (1). On parvient
ainsi à donner un sens à l’expression
µ(dA) =
1 − 1 S(A)
e 2
dA,
Z
(2)
3. On pourrait penser que la symétrie de la théorie sous l’action du groupe de jauge vient résoudre ce problème,
puisqu’il suffit de travailler sur le quotient de A par l’action de ce groupe. Ce n’est toutefois pas le cas car,
contrairement à une idée fausse que j’ai entendue plusieurs fois énoncer, le quotient de l’espace des connexions
par l’action du groupe de jauge n’est pas localement compact, ni de dimension finie en aucun sens. En revanche,
l’espace des modules de connexions plates, quotienté par les transformations de jauge, sur un fibré principal
au-dessus d’un espace raisonnable (dont le groupe fondamental est de type fini) est un objet de dimension finie.
4. Il fait partie des six problèmes restants pour la résolution desquels l’institut Clay offre un million de dollars.
Pour tenter sa chance, on pourra consulter la page www.claymath.org/millenium/Yang-Mills_Theory.
6
qui est l’écriture heuristique la plus habituelle de la mesure de Yang-Mills, comme mesure
de probabilités sur l’espace A de toutes les connexions 5 .
Dans le contexte où nous allons nous placer, avec un espace-temps bidimensionnel, on
peut penser en première approximation à une connexion comme à une 1-forme différentielle
sur une surface. Une fonctionnelle typique d’une connexion est donc son intégrale le long
d’un chemin, ou d’un lacet. Pour être un peu moins approximatif, il vaut mieux penser à
une connexion comme à une version multiplicative d’une forme différentielle. Un groupe
G est donné, qui s’appelle le groupe de structure, qui peut par exemple être le groupe
SU(2), et la connexion détermine, par intégration le long de chaque chemin, un élément
de ce groupe. Cet élément s’appelle l’holonomie de la connexion le long de ce chemin.
Naturellement, l’holonomie le long de la concaténation de deux chemins est le produit des
holonomies le long de chacun des chemins.
Il se trouve que seules les holonomies le long de lacets jouent un rôle important dans
les théories de jauge, à cause d’une symétrie de ces théories appelée précisément symétrie
de jauge. Le groupe de structure G étant fixé, on peut donc penser à une connexion sur
une surface comme à un objet qui à chaque lacet tracé sur cette surface associe un élément
de G. Ceci peut s’écrire de façon concise (mais légèrement fausse) comme suit : si M est
une surface et si L(M ) désigne l’ensemble des lacets sur M , et si G est un groupe de Lie
compact, alors on a l’inclusion 6 A ⊂ {fonctions de L(M ) dans G}.
De ce point de vue, définir une mesure de probabilités sur l’espace des connexions
revient à définir une mesure de probabilités sur l’ensemble des fonctions qui vont de
l’ensemble des lacets sur notre surface dans le groupe de structure G. Cette idée est
absolument fondamentale pour tout ce qui suit, car ce sont bien des objets de ce type
que nous allons décrire : non pas des formes différentielles aléatoires, mais des processus
stochastiques indexés par des lacets tracés sur des surfaces et à valeurs dans un groupe
de Lie compact.
Pour guider un peu l’imagination, disons que les processus que nous allons considérer
sont des processus de Lévy 7 indexés par des lacets et à valeurs dans un groupe. Si la surface
que nous considérons est par exemple un plan, et si pour chaque t ≥ 0 nous considérons la
variable aléatoire associée à un cercle qui entoure un disque d’aire t (de telle sorte que les
intérieurs de ces cercles grossissent avec t, voir la proposition 1.1.3 et ce qui précède) alors
nous obtenons un processus stochastique indexé par R+ et à valeurs dans le groupe G,
dont les accroissements multiplicatifs sont indépendants et stationnaires. Si en revanche
la surface sur laquelle nous traçons les lacets est une sphère, notre famille de lacets va, au
bout d’un temps égal à l’aire totale de la sphère, venir se refermer en un lacet constant
après avoir “fait le tour de la sphère”. Dans ce cas, nous obtiendrons plutôt un pont d’un
processus de Lévy à valeurs dans G. Des surfaces à la topologie différente conduiront à
des variantes de ce pont à valeurs dans G.
Une partie des problèmes que nous allons considérer concernent donc ces processus,
leur définition, par le biais d’une discrétisation, leur caractérisation, leur classification,
5. Pour plus de détails sur ce qui précède, on peut consulter la section 2.3 et en particulier la définition 2.3.1.
6. Pour une définition de la symétrie de jauge et un énoncé correct de cette inclusion, on pourra se reporter à
la proposition 2.2.4 et à ce qui précède. Pour une discussion du lien entre symétrie de jauge et choix de jauge en
électromagnétisme, on peut lire, dans l’annexe, les sections A.3 et A.4.
7. Il s’agit ici de Paul Lévy, 1886-1971.
7
leur signification géométrique, et l’étude de leurs comportements dans certaines limites.
Nous allons en particulier considérer la limite qui consiste à multiplier l’aire totale de la
surface sur laquelle on trace les lacets par une constante qui tend vers zéro (c’est la limite
semi-classique de la théorie de Yang-Mills), pour laquelle nous présenterons un principe
de grandes déviations, démontré en collaboration avec James R. Norris. L’étude d’une
autre limite, lorsque le groupe de structure est le groupe unitaire U(N ) et que l’on fait
tendre N vers l’infini, ne sera pas abordée ici directement, mais motive mon intérêt pour
certaines questions liées aux grandes matrices unitaires aléatoires qui sont présentées plus
bas et qui seront exposées en détail dans le dernier chapitre. Une partie de ces questions
a été résolue en collaboration avec Florent Benaych-Georges et Mylène Maïda.
La construction de la mesure de Yang-Mills
Après le travail fondateur de Yang et Mills en 1954 [YM54], on cite traditionnellement
un article de Alexander A. Migdal écrit en 1975 [Mig75] comme étant la première avancée
significative vers une description mathématiquement rigoureuse de la mesure de YangMills discrète en deux dimensions. Dans cet article, Migdal identifie en effet, peut-être
pour la première fois, le rôle fondamental joué par le noyau de la chaleur sur le groupe de
structure. Ce noyau n’y est pas nommé, mais il est écrit sous la forme non équivoque de
son développement en série de Fourier.
Dans les années 1980, Sergio Albeverio, Raphael Høegh-Krohn et Helge Holden ont
examiné, dans un cadre essentiellement discret, l’idée d’une mesure aléatoire sur une
surface qui prendrait ses valeurs dans un groupe de Lie [AHKH86, AHKH88]. Ils ont
en particulier compris l’importance pour ce problème de la propriété de semi-groupe de
convolution. Les champs d’holonomie markoviens qui sont présentés ici sont, comme nous
le verrons, en correspondance avec des semi-groupes de convolution de mesures sur le
groupe de structure et ceci peut être considéré comme un prolongement des idées de ces
auteurs.
Le problème de la construction de la mesure de Yang-Mills continue en deux dimensions
a été abordé dans les années 1980 par Leonard Gross [Gro85, Gro88], puis il a été étudié par
Bruce Driver [Dri89, Dri91] dans le cas où la surface est un plan, et il a finalement été résolu
par Ambar Sengupta sur une surface compacte arbitraire, alentour 1994 [Sen92, Sen97a].
L’approche de Gross, Driver et Sengupta est basée sur l’observation du fait qu’en se
plaçant dans une jauge adéquate, une connexion prise sous la mesure de Yang-Mills peut,
d’après l’expression (2), être comprise comme une connexion dont la courbure a la loi
d’un bruit blanc 8 , éventuellement conditionné d’une façon qui dépend de la topologie de
la surface sur laquelle on travaille. C’est donc en partant d’un bruit blanc et en donnant un
sens à un conditionnement singulier de ce bruit qu’Ambar Sengupta est parvenu à définir
une sorte de mouvement brownien indexé par les lacets tracés sur une surface compacte
et à valeurs dans un groupe de Lie compact connexe 9 .
8. Il s’agit d’un bruit blanc à valeurs dans l’algèbre de Lie du groupe de structure.
9. Pour faire un parallèle avec une situation familière, sa construction est analogue à celle qui consiste à
construire le mouvement brownien sur [0, 1] en se donnant un bruit blanc W sur [0, 1], c’est-à-dire une isométrie
de L2 ([0, 1], dt) dans un espace de variables aléatoires gaussiennes centrées, et à poser, pour tout t ∈ [0, 1],
Bt = W (1[0,t] ). En conditionnant le bruit par l’égalité W (1[0,1] ) = 0, on obtient un pont brownien.
8
Au début des années 1990, Edward Witten a publié deux articles sur la théorie de
Yang-Mills en deux dimensions [Wit91, Wit92], qui naturellement ont suscité un grand
intérêt. Dans l’un de ces articles [Wit91], il décrit dans les grandes lignes la théorie de
Yang-Mills discrète et s’en sert pour étudier la géométrie de l’espace des modules de
connexions plates sur une surface de Riemann, en particulier pour calculer son volume
symplectique. La mesure symplectique sur l’espace des connexions plates peut en effet
être comprise comme la limite semi-classique de la mesure de Yang-Mills, c’est-à-dire sa
limite lorsque le volume de l’espace-temps tend vers zéro. Je n’ai pas étudié cet aspect
de la mesure, et il n’est pas évoqué dans ce texte 10 . Néanmoins, le principe de grandes
déviations que j’ai établi avec James Norris, et sur lequel je reviendrai dans un moment,
étudie une limite, mais d’une autre nature, lorsque le volume de l’espace-temps tend vers
zéro.
À la même période, d’autres approches plus ou moins partielles du problème de la
construction de la mesure de Yang-Mills ont été proposées qui, bien que n’étant pas toutes
pleinement satisfaisantes mathématiquement, ont donné des éclairages variés sur divers
aspects de cette mesure. Il s’agit en particulier des travaux de Dana Fine [Fin90, Fin91],
Claas Becker [Bec95], Doug Pickrell [Pic96], John Baez et Stephen Sawin [BS97, BS98],
Abhay Ashtekar et al. [AI92, AL94, AL95, AMMa94].
Mon premier travail [L1, L2] a consisté à donner une autre construction de la mesure
de Yang-Mills et cela a constitué ma thèse, que j’ai écrite sous la direction d’Yves Le
Jan. Mon approche a consisté à établir rigoureusement la théorie discrète telle qu’elle est
décrite par Witten, puis à montrer qu’il est possible de la passer à la limite continue 11 .
Plus précisément, pour construire un processus d’holonomie aléatoire indexé par des lacets
tracés sur une surface, on décrit ses lois marginales de dimension finie, puis on applique un
théorème de Kolmogorov. Toutefois, le fait que ce processus soit indexé par un ensemble de
chemins pose des problèmes spécifiques, comme le fait qu’il n’est pas possible de décrire
simplement toutes ses marginales. Il faut donc procéder à des approximations, dont la
qualité détermine la classe des lacets le long desquels on saura définir une holonomie
aléatoire. Dans [L2], je suis parvenu à définir un processus indexé par des chemins lisses
par morceaux et associé, dans le sens évoqué quelques pages plus haut, au mouvement
brownien sur un groupe de Lie compact connexe.
Dans un travail postérieur à ma thèse [L4], j’ai généralisé la partie discrète de cette
construction pour pouvoir y inclure certains raffinements topologiques 12 , ce qui m’a permis, en collaboration avec James Norris à Cambridge [LN5], de démontrer un principe
10. Pour plus de détails, on pourra consulter les travaux de Michael Atiyah et Raoul Bott [AB83], William
Goldman [Gol84], Robin Forman [For93], Kefeng Liu [Liu96, Liu97], Ambar Sengupta et Christopher King [Sen97b,
KS94].
11. Pour poursuivre l’analogie de la note précédente, cette approche correspond à celle qui consiste à construire
le mouvement brownien comme limite de marches aléatoire.
12. Le problème était de parvenir à construire une mesure pour chaque classe d’isomorphisme de fibré principal
sur la surface qu’on considère, dans le cas où il en existe de non-triviales. La théorie discrète classique, qui voit un
fibré à travers ses restrictions au-dessus de graphes, c’est-à-dire d’objets de dimension 1, ne peut détecter, pourvu
que le groupe de structure soit connexe, la différence entre deux fibrés non-isomorphes. Pour pallier ce problème,
j’ai remplacé l’espace des configurations discrètes usuel par un espace plus gros, qui en est à peu de choses près
un revêtement. En passant à la limite continue, j’ai ainsi pu obtenir une construction des mesures associées à
des fibrés particuliers, et désintégrer la mesure construite dans [L2]. J’ai également démontré que les processus
d’holonomie associés à des fibrés non-équivalents ont des lois mutuellement singulières.
9
de grandes déviations pour la mesure de Yang-Mills. Il s’agit du premier, et à ce jour
du seul résultat rigoureux qui lie cette mesure à la fonctionnelle d’énergie qui lui donne
son nom. Dans ce travail, nous avons dû considérer de véritables fibrés principaux et de
véritables connexions sur ces fibrés, et les confronter aux fonctions de lacets à valeurs dans
un groupe qui étaient censées en être les holonomies 13 .
Par ailleurs, j’ai étudié, à la suite de Bergfinnur Durhuus [Dur80] et d’Ambar Sengupta
[Sen94], un aspect algébrique de la théorie de Yang-Mills discrète et amélioré un résultat de
densité qui est d’une certaine importance théorique pour justifier l’usage exclusif que font
les physiciens des boucles de Wilson comme observables dans les théories de jauge [L3].
Plus précisément, il n’est pas évident que la classe d’observables habituellement considérée
par les physiciens, à savoir l’algèbre engendrée par les boucles de Wilson, qui sont les traces
des holonomies le long de lacets, soit complète, c’est-à-dire qu’elle sépare les points de
l’espace de configuration. Les cas où le groupe de structure est unitaire ou orthogonal
impair, ou un produit de tels groupes, avaient été résolus positivement par Durhuus puis
Sengupta. En utilisant un peu de théorie classique des invariants et une autre famille
naturelle d’observables, les réseaux de spin (en anglais spin networks), inventés dans les
années 70 par Roger Penrose et introduits à la fin des années 90 dans les théories de
jauge par John Baez (voir [Bae96]), j’ai démontré la complétude de l’algèbre engendrée
par les boucles de Wilson pour tous les produits de groupes unitaires, orthogonaux et
symplectiques. Le cas des groupes de spineurs reste cependant ouvert.
Malgré l’existence de deux approches rigoureuses, celle d’Ambar Sengupta et la mienne,
pour la construction de la mesure de Yang-Mills, et malgré les généralisations que j’avais
apportées à la mienne, il me semblait que plusieurs points restaient à clarifier et que la
construction n’avait pas du tout atteint sa forme définitive.
Les grandes matrices unitaires
Vers 2005, j’ai commencé à m’intéresser à un aspect de la mesure de Yang-Mills que
j’avais ignoré jusqu’alors, et qui est son comportement asymptotique lorsque le groupe de
jauge est le groupe unitaire U(N ) avec N tendant vers l’infini. Les anglo-saxons désignent
ce champ d’investigations simplement par “large N limit”. Isadore Singer a publié un court
article [Sin95] sur ce sujet dans lequel il ouvre des perspectives mathématiques où pour
l’essentiel tout reste à faire. Michael Anshelevich a développé et explicité dans la mesure
du possible cet article dans [Ans97]. Toutefois, la littérature dans ce domaine est encore
principalement le fait de physiciens [GG95, GM95, GT93b, GT93a, Kaz81, KK80]. Les
premières questions qui se posent dans cette direction de recherche peuvent en fait être
formulées de façon largement indépendante de la théorie de Yang-Mills et concernent les
grandes matrices unitaires prises sous la mesure du noyau de la chaleur. Ces matrices
aléatoires ont été étudiées principalement par Philippe Biane [Bia97], Feng Xu [Xu97],
Steve Zelditch [Zel04]. Plus récemment, Ambar Sengupta [Sen08] a clarifié le travail de F.
Xu.
13. En particulier, nous avons dû résoudre des problèmes de minimisation sous contrainte et construire explicitement des connexions lipschitziennes dont l’holonomie était prescrite le long des arêtes d’un graphe et dont
l’action était minimale étant donné cette contrainte.
10
Dans [L6], j’ai établi un lien entre le mouvement brownien sur le groupe unitaire
et une marche aléatoire très simple sur le groupe symétrique, qui peut se comprendre
comme une conséquence de la dualité de Schur-Weyl ou de la formule d’Itô. Ce lien
m’a permis de donner une expression combinatoire des moments de la distribution des
valeurs propres d’une matrice unitaire de taille N prise sous la mesure du noyau de la
chaleur. Cette expression se présente comme une série, convergente, qui fait intervenir
des puissances paires négatives de N et qui peut être interprétée rigoureusement comme
un développement suivant le genre d’un certain revêtement ramifié aléatoire d’un disque.
Ceci fournit en fait une preuve rigoureuse de la plus simple des formules merveilleuses que
donnent David Gross et Washington Taylor dans [GT93b, GT93a]. L’expression que j’ai
établie permet également de retrouver les moments de la distribution limite des valeurs
propres et des résultats de liberté asymptotique (au sens des probabilités libres) obtenus
par P. Biane.
La familiarité avec le mouvement brownien unitaire acquise lors de ce travail m’a
permis, en collaboration avec Florent Benaych-Georges, de construire dans [LBG8] une
famille de structures de dépendance (ou d’indépendance) dans un espace de probabilités
non-commutatif qui interpolent entre l’indépendance classique et la liberté. Il était connu
que si A et B sont deux grandes matrices diagonales réelles dont les valeurs propres se
répartissent approximativement selon deux mesures de probabilités µ et ν, et si U est une
matrice de permutation choisie uniformément (resp. une matrice unitaire choisie sous la
mesure de Haar), alors les valeurs propres de A+U BU −1 se répartissent selon la mesure µ∗
ν, convolution classique de µ et ν (resp. selon la mesure µν, convolution libre de µ et ν).
En donnant à U la loi au temps t d’un mouvement brownien convenablement normalisé sur
le groupe unitaire dont la loi au temps 0 est la loi uniforme sur les matrices de permutation,
nous avons défini une opération convolution ∗t pour tout t réel positif, qui pour t =
0 est la convolution classique et pour t tendant vers l’infini tend vers la convolution
libre. Nous avons en fait défini la structure de dépendance entre deux sous-algèbres d’un
espace de probabilités non-commutatif qui sous-tend cette convolution. Notre espoir initial
était d’identifier des cumulants associés à cette convolution t-libre, c’est-à-dire des formes
multilinéaires universelles dont l’annulation caractériserait la t-liberté de certains de leurs
arguments. Nous pensions qu’ils pourraient réaliser une interpolation entre les cumulants
classiques, intimement liés à la combinatoire des partitions d’un ensemble, et les cumulants
libres, liés aux partitions non-croisées d’un ensemble muni d’un ordre cyclique. Cet espoir
a été déçu et nous avons démontré qu’il n’existait pas de cumulants t-libres.
Dans un travail en collaboration avec Mylène Maïda [LM9], nous avons établi un
théorème de la limite centrale pour des fonctions sur le groupe unitaire du type U 7→
trf (U ), où f est une fonction suffisamment régulière sur le cercle unité du plan complexe
et où tr est la trace normalisée. La fonction f étant donnée, l’expression trf (U ) a un sens
pour U élément de U (N ) quel que soit N . Les résultats de P. Biane [Bia97] décrivent
sa limite lorsque N tend vers l’infini, qui est une limite presque-sûre. Nous avons étudié
ses fluctuations, démontré qu’elles sont gaussiennes, et déterminé la forme quadratique
sur un espace de fonctions suffisamment régulières qui donne la covariance limite de ces
fluctuations. Elle s’exprime naturellement dans le cadre des probabilités libres, en termes
du mouvement brownien unitaire libre. Nous avons pu rapprocher notre résultat de celui
11
obtenu par Persi Diaconis et Steven Evans [DE01] dans le cas de matrices unitaires prises
sous la mesure de Haar, en montrant que la covariance qu’ils avaient identifiée, à savoir le
1
produit scalaire dans l’espace de Sobolev H 2 , était la limite de notre covariance lorsque
le temps tend vers l’infini.
Les champs d’holonomie markoviens
Parallèlement à ces travaux sur les grandes matrices unitaires, je me suis rendu compte
durant l’été 2006 qu’il était possible de démontrer une propriété de continuité pour la
mesure de Yang-Mills qui permettait, en ce qui concerne le point technique a priori un
peu secondaire de la régularité des lacets avec lesquels on travaille, d’en placer la définition
dans un cadre plus naturel que ceux dans lesquels elle était restée cantonnée jusqu’alors. Il
s’agissait en l’occurrence d’étendre la définition de l’holonomie aléatoire à la classe de tous
les chemins continus de longueur finie, qui est probablement à peu de choses près la plus
grande qu’on puisse considérer avec les techniques que j’ai mises en oeuvre. Cette extension
m’a amené à reconsidérer la construction de fond en comble et, progressivement, j’ai
abouti à la définition des champs d’holonomie aléatoires [L7] qui généralise complètement
la construction que j’avais donnée dans ma thèse. La propriété de Markov des champs
d’holonomie aléatoire est devenue centrale dans leur définition même, qui s’inspire de la
définition usuelle des processus de Markov et de la définition des théories topologiques
des champs quantiques. La classe d’objets que j’ai ainsi définie contient la mesure de
Yang-Mills, qui en est le prototype, comme la classe des processus de Lévy contient le
mouvement brownien.
Un des aspects importants de la généralisation apportée par les champs d’holonomie
markoviens est la possibilité de considérer des groupes de structures qui ne sont pas
connexes et en particulier des groupes finis. Dans le cas du groupe symétrique, un travail
d’Alessandro d’Adda et Paolo Provero [DP04] montrait un lien entre une théorie analogue
à la théorie de Yang-Mills et un modèle de revêtements ramifiés aléatoires. J’ai obtenu un
résultat similaire dans le cas général, qui permet de réaliser explicitement une grande classe
de champs d’holonomie markoviens à valeurs dans un groupe fini comme monodromies de
revêtements ramifiés aléatoires 14 , et dont le lieu de ramification est à peu de choses près
un processus ponctuel de Poisson.
Localisation des énoncés principaux
L’énoncé complet des résultats principaux présentés dans ces notes nécessiterait de
longues introductions qui constituent en fait une grande partie du corps du texte. Je vais
donc me contenter, sans les énoncer, d’indiquer les endroits dans le texte où ils se trouvent.
Les principaux énoncés présentés dans le premier chapitre sont :
• la définition des champs d’holonomie markoviens (définition 1.3.3, p.38),
• un théorème d’existence de ces champs (théorème 1.3.7, p.40),
14. Plutôt qu’un revêtement ramifié, il faut en fait considérer un fibré principal ramifié, c’est-à-dire un revêtement ramifié sur les fibres régulières duquel le groupe de structure agit librement et transitivement.
12
un théorème d’extension qui est la clé du passage à la limite continue d’une théorie
discrète (théorème 1.2.17, p.36),
• un résultat de classification partielle de ces champs (théorème 1.3.6, p.40),
• la construction du champ de Yang-Mills à partir d’un bruit blanc (théorème 1.3.9,
p.43),
• un résultat de densité des boucles de Wilson dans l’algèbre des observables d’une
théorie de jauge discrète, pour une certaine classe de groupes de structures (théorème
1.2.11, p.31).
Les principaux énoncés du deuxième chapitre sont :
• la réalisation des champs d’holonomie markoviens à valeurs dans des groupes finis
par des revêtements ramifiés aléatoires (théorème 2.1.5, p.51),
• la désintégration du champ de Yang-Mills selon les classes d’isomorphismes possibles
de G-fibrés principaux au-dessus d’une surface (théorème 2.4.6, p.64),
• deux théorèmes de grandes déviations pour la mesure de Yang-Mills lorsque l’aire de
la surface tend vers zéro démontrés en collaboration avec James R. Norris (théorèmes
2.4.8 et 2.4.9, p.65).
Les principaux énoncés du troisième chapitre sont :
• un théorème qui exprime en termes combinatoires les moments d’une matrice unitaire
prise sous la mesure du noyau de la chaleur (théorème 3.1.4, p.73),
• une formule due à Gross et Taylor que j’ai pu prouver grâce au résultat précédent
(théorème 3.1.13, p.79).
Puis, en collaboration avec Mylène Maïda :
• un théorème de la limite centrale pour la répartition des valeurs propres d’une matrice unitaire sous la mesure du noyau de la chaleur (théorème 3.2.13, p.84),
• la convergence, lorsque le temps tend vers l’infini, de la covariance qui apparaît dans
le théorème précédent vers celle identifiée par Persi Diaconis et Steven Evans dans
le cas des matrices unitaires uniformes [DE01] (théorème 3.2.14, p.84).
Enfin, en collaboration avec Florent Benaych-Georges :
• la définition de la convolution t-libre de deux mesures de probabilités sur R (théorème
3.3.1, p.86),
• la définition de la t-liberté de deux sous-algèbres d’un espace de probabilités noncommutatif, qui interpole entre les notions de liberté et d’indépendance (définition
3.3.5, p.89),
• un énoncé qui code le système différentiel permettant de calculer la convolution
t-libre de certaines lois (proposition 3.3.7, p.90),
• un résultat de non-existence de cumulants pour la notion de t-liberté (théorème
3.3.14, p.93).
•
Chapitre 1
Champs d’holonomie markoviens
[L2, L3, L7]
1.1
Introduction
Le but de cette introduction est de nous donner, avant que nous ne prenions les choses
au début et dans un ordre proche de l’ordre logique, un aperçu de ce que sont les champs
d’holonomie markoviens. Nous allons pour cela commencer par en examiner un exemple
simple et fondamental, qui nous donnera une idée de la nature de la propriété de Markov
qui est en jeu dans ces processus. Nous donnerons ensuite une définition provisoire de ces
champs d’holonomie, puis nous examinerons leurs “noyaux de transition”, dont les propriétés intimement liées à la chirurgie des surfaces peuvent être suggestivement dessinées.
Nous terminerons en énonçant un résultat d’existence et de classification partielle qui est
l’un des résultats principaux de notre travail sur ces processus.
Presque tout ce qui est dit dans cette introduction sera repris en plus ample détail
dans la suite du chapitre.
1.1.1
Le processus de Poisson modulo n indexé par des lacets
Plaçons-nous dans le plan euclidien R2 . Appelons temporairement lacet une application
continue l : [0, 1] → R2 telle que l(0) = l(1) et dont l’image soit de mesure de Lebesgue
nulle. Soit l un lacet et soit z un point de R2 , que nous identifions à C, non situé sur
l’image de l. L’indice de l par rapport à z est l’entier relatif nl (z) défini par
Z
1
dw
,
(1.1)
nl (z) =
2iπ l̃ w − z
où ˜l est un lacet de classe C 1 par morceaux arbitraire dont la distance uniforme à l est
inférieure à la distance de z à l’image de l, si bien que l et ˜l sont homotopes dans R2 \ {z}.
Comme nous supposons que l’image de l est de mesure de Lebesgue nulle, la fonction nl
est définie et finie presque partout sur R2 , et à support compact.
Soit n ≥ 2 un entier. Nous allons associer à chaque lacet l une variable aléatoire à
valeurs dans Z/nZ. Pour cela, nous allons ajouter modulo n les indices de l par rapport
aux points d’un ou plusieurs processus ponctuels de Poisson.
13
14
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
Définition 1.1.1 Soient λ1 , . . . , λn−1 des réels positifs ou nuls. Soient Π1 , . . . , Πn−1 des
processus ponctuels de Poisson sur R2 indépendants tels que pour chaque k ∈ {1, . . . , n −
1}, Πk soit d’intensité λk fois la mesure de Lebesgue. À chaque lacet l on associe la variable
aléatoire
n−1 Z
X
Nl =
k
nl (z) dΠk (z) (mod n).
(1.2)
k=1
R2
Figure 1.1 – Prenons n = 4. Les processus Π1 , Π2 et Π3 sont représentés respectivement par des carrés
noirs, des croix bleues et des ronds rouges. Ainsi Π1 contribue pour 2, Π2 pour 6 et Π3 pour 6. Ainsi,
dans cet exemple, Nl = 2 (mod 4).
Notons temporairement L(R2 ) l’ensemble des lacets sur R2 . Nous venons de définir
un processus stochastique indexé par L(R2 ) et à valeurs dans Z/nZ. Énonçons quelques
propriétés de ce processus. Lorsque l est un lacet, nous notons l−1 le même lacet parcouru
en sens inverse. D’autre part, lorsque l1 et l2 sont deux lacets basés au même point, nous
notons l1 l2 leur concaténation.
Proposition 1.1.2 Le processus (Nl )l∈L(R2 ) est mutliplicatif. Ceci signifie que pour tous
l, l1 , l2 ∈ L(R2 ) tels que l1 et l2 soient basés au même point, nous avons
Nl−1 = −Nl ,
Nl1 l2 = Nl1 + Nl2 .
Considérons maintenant une famille à un paramètre très simple de lacets. Pour chaque
t ≥ 0, appelons lt le bord d’un disque d’aire t, parcouru une fois dans le sens positif, ces
disques étant choisis de sorte que pour tous s ≤ t, le disque d’aire s soit contenu dans le
disque d’aire t. Alors (Nlt )t≥0 est un processus stochastique ordinaire, indexé par R+ , à
valeurs dans Z/nZ.
Proposition 1.1.3 Le processus (Nlt )t≥0 est une chaîne de Markov sur Z/nZ. Son générateur (Qa,b )a,b∈Z/nZ est donné, pour tous a 6= b, par Qa,b = λc , où c est l’unique entier
de {1, . . . , n − 1} tel que b = a + c (mod n).
Les accroissements de ce processus sont indépendants et stationnaires : c’est un processus de Lévy, dont la mesure de saut, qui est une mesure sur (Z/nZ) \ {0}, attribue la
masse λk à la classe de k pour tout k ∈ {1, . . . , n − 1}.
1.1. INTRODUCTION
15
Figure 1.2 – Avec les mêmes conventions de couleur que dans la figure précédente, les valeurs successives
de Nlt pour les quatre valeurs de lt représentées ici sont 0, 3, 1 et 0 modulo 4.
Nous dirons que le processus de Lévy décrit dans la proposition ci-dessus est associé
au processus (Nl )l∈L(R2 ) . Sa loi ne dépend pas de la façon dont on choisi les lacets (lt )t≥0 .
La propriété de Markov de ce processus de Lévy entraîne une propriété de Markov pour
le processus N , qu’on peut exprimer comme suit. Si J est un lacet qui est une courbe
de Jordan, nous noterons respectivement int(J) et ext(J) les adhérences des composantes
connexes bornée et non bornée du complémentaire dans R2 de l’image de J.
Proposition 1.1.4 Soit J un lacet qui est une courbe de Jordan. Alors les deux σ-algèbres
σ (Nl : l ⊂ int(J)) et σ (Nl : l ⊂ ext(J)) sont indépendantes conditionnellement à NJ .
Plus généralement, soient J, J1 , . . . , Jn des courbes de Jordan deux à deux disjointes
telles que les intérieurs de J1 , . . . , Jn soient deux à deux disjoints et contenus dans l’intérieur de J. On définit alors
M1 = int(J) ∩ ext(J1 ) ∩ . . . ∩ ext(Jn ) et M2 = ext(J) ∪ int(J1 ) ∪ . . . ∪ int(Jn ).
Alors les deux σ-algèbres σ (Nl : l ⊂ M1 ) et σ (Nl : l ⊂ M2 ) sont indépendantes conditionnellement à la σ-algèbre σ(NJ , NJ1 , . . . , NJn ).
J1
J4
J
J
J3
J2
Figure 1.3 – Partie gauche : les lacets situés à l’extérieur de J peuvent entourer l’intérieur de J. Partie
droite : le domaine M2 est grisé.
16
1.1.2
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
Une première définition des champs d’holonomie markoviens
La proposition 1.1.4 exprime une propriété de Markov où les notions de passé et de
futur sont remplacées par les notions d’intérieur et d’extérieur, par rapport à une ou
plusieurs courbes qui séparent le plan en plusieurs composantes connexes. Même si nous
partons d’un domaine topologiquement simple comme le plan R2 , nous voyons apparaître,
en appliquant cette propriété de Markov, des domaines plus compliqués comme le domaine
M1 représenté (en blanc) dans la partie droite de la figure 1.3, homéomorphe en l’occurence
à une sphère à cinq trous.
Outre l’opération de découpage qui conduit par exemple du plan à cette sphère à cinq
trous, des opérations de recollement sont également naturelles. Si par exemple on part des
processus de Poisson indexés par les lacets tracés sur deux disques disjoints, tous deux
conditionnés par le fait qu’ils attribuent un certain élément x de Z/nZ au bord de leur
disque respectif, il est naturel de chercher à recoller ces disques le long de leurs bords
pour définir le processus de Poisson indexé par les lacets tracés sur une sphère, ou tout
du moins le conditionnement de ce processus par l’évènement qu’il attribue la valeur x à
un certain équateur, qui est la cicatrice du recollement qu’on a effectué.
Pour prendre en compte la propriété de Markov dans toute sa généralité, il faut donc
ne pas se restreindre au plan R2 ou à un disque, mais considérer une classe de domaines
qui soit stable par les opérations de chirurgie simple que sont le découpage le long de
courbes de Jordan et le recollement le long de composantes connexes du bord. Une telle
classe est facile à identifier : dès que l’on dispose de disques et de sphères à trois trous (ou
à n trous avec n ≥ 3), on peut, par recollements, obtenir n’importe quelle surface compacte. Ce sont donc les surfaces compactes qui constituent la classe naturelle de domaines
sur lesquels vont être tracés les lacets qui indexent nos processus.
ENCART 1 – Topologie des surfaces [Mas77, Moi77]
Une surface compacte, ou simplement surface, est une variété différentiable réelle de dimension 2, compacte, orientable ou non, éventuellement avec un bord. En tant qu’espace topologique, c’est un espace séparé
compact dont chaque point admet un voisinage homéomorphe à R2 ou à R × R+ . La structure différentiable
n’apporte pas d’information nouvelle par rapport à la structure topologique : deux surfaces sont difféomorphes
si et seulement si elles sont homéomorphes.
Le bord d’une surface, s’il est non vide, est une réunion disjointe finie de cercles. On dit qu’une surface
est fermée si elle n’a pas de bord. À toute surface on peut associer une surface fermée en collant un disque
le long de chacune des composantes connexes de son bord. Deux surfaces connexes qui ont le même nombre
de composantes connexes du bord sont difféomorphes si et seulement si les surfaces fermées qui leur sont
associées sont difféomorphes. Enfin, les surfaces fermées connexes sont classées à difféomorphisme près par
leur orientabilité et leur genre, qui peut être n’importe quel entier positif pour une surface orientable et
n’importe quel entier strictement positif pour une surface non-orientable. Lorsqu’on travaille simultanément
avec des surfaces orientables et non-orientables, il est plus commode de considérer leur genre réduit, qui est
égal au genre pour les surfaces non-orientables et au double du genre pour les surfaces orientables. L’avantage
principal du genre réduit est qu’il est additif par rapport à l’opération de somme connexe.
La surface de genre 0 est la sphère, la surface orientable de genre g et de genre réduit 2g la somme
connexe de g tores et la surface non-orientable de genre g, la somme connexe de g plans projectifs. Ce plan
projectif peut être obtenu comme quotient de la sphère unité de R3 par la relation qui identifie un point avec
son symétrique par rapport à l’origine.
À la différence du cas unidimensionnel, une orientation d’une surface orientable ne permet pas de dis-
1.1. INTRODUCTION
17
tinguer parmi les composantes connexes de son bord entre des composantes entrantes et des composantes
sortantes : pour toute permutation des composantes connexes du bord d’une surface, même orientée, il existe
un difféomorphisme, préservant l’orientation le cas échéant, qui induit cette permutation.
Tout comme le processus de Poisson que nous avons examiné à la section précédente
prenait ses valeurs dans Z/nZ, les champs d’holonomie markoviens prennent général leurs
valeurs dans un groupe, mais ce groupe en général ne sera pas commutatif. Ce sera un
groupe de Lie compact, c’est-à-dire un groupe de matrices compact. Nous allons imposer
que les champs d’holonomie satisfassent une propriété de multiplicativité analogue à celle
exprimée par la proposition 1.1.2, et qui dans le cas d’un groupe non-commutatif s’exprime
naturellement comme suit (voir aussi la définition 1.2.1 plus bas) : si G est un groupe,
si M est une surface et m un point de M , une famile (Hl )l∈Lm (M ) de variables aléatoires
indexée par l’ensemble des lacets sur M basés en m est multiplicative si
∀l1 , l2 ∈ Lm (M ) , Hl1−1 = Hl−1
et Hl1 l2 = Hl2 Hl1 presque sûrement.
1
La raison pour laquelle l’ordre de l1 et l2 est inversé dans la dernière égalité sera expliquée
à la section 2.2.2.
Un autre aspect important du processus de Poisson indexé par les lacets est le rôle
qu’a joué la mesure de Lebesgue sur R2 dans sa définition, par le biais de l’intensité de
Π1 , . . . , Πn−1 . Dans le cas général, il est nécessaire de munir les surfaces sur lesquelles on
travaille d’une mesure d’aire, qui joue comme nous le verrons un rôle analogue à celui
joué par la mesure des longueurs dans le cas des processus de Markov usuels indexés par
des intervalles de temps.
Nous pouvons maintenant donner une définition provisoire et très vague des champs
d’holonomie markoviens.
Définition 1.1.5 (Champs d’holonomie markoviens : définition provisoire) Soit
G un groupe de Lie compact. Un champ d’holonomie markovien bidimensionnel à valeurs
dans G est une collection de processus stochastiques à valeurs dans G, un pour chaque
surface compacte munie d’une mesure d’aire et d’un choix de conditions au bord le long
de certaines composantes connexes de son bord. Pour chaque telle surface, le processus est
indexé par l’ensemble des lacets sur la surface et il est multiplicatif. Enfin, la collection
de tous ces processus stochastiques se comporte vis-à-vis de la chirurgie des surfaces (découpage le long de courbes de Jordan et recollements de composantes connexes de bords)
d’une façon qui est gouvernée par la propriété de Markov.
1.1.3
Noyaux de transition et chirurgie des surfaces
Pour comprendre le rôle des conditions au bord qui sont mentionnées dans la définition
ci-dessus, nous allons faire un bref parallèle avec le cas des processus de Markov usuels,
indexés par des intervalles de temps. La donnée d’un tel processus, prenant ses valeurs
dans un espace d’états X , permet entre autres d’associer à chaque intervalle de longueur
t et à chaque condition initiale x ∈ X une mesure Pt (x, dy) sur X . Les transitions de
18
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
ce processus ont donc lieu le long d’intervalles, auxquels on peut penser, de façon un
peu inutilement sophistiquée, comme à des transitions topologiques (ou cobordismes)
entre des paires de points. On peut dire, de façon analogue, que les transitions d’un
champ d’holonomie markovien ont lieu le long de surfaces, elles-mêmes vues comme des
cobordismes entre des familles de cercles (voir par exemple la figure 1.4 ci-dessous).
Toutefois, comme nous l’avons dit à la fin de l’encart 1, et contrairement à ce qui se
passe pour un intervalle, le bord d’une surface, même orientée, ne se sépare pas canoniquement en des composantes connexes entrantes et des composantes connexes sortantes.
Elle peut en outre, même si elle est connexe, avoir un nombre arbitraire et éventuellement nul de composantes connexes de bord. La décision de regarder une surface orientée
donnée comme une transition entre certaines de ces composantes connexes de bord (entrantes) et les autres (sortantes) est donc arbitraire. La contrepartie analytique de cette
plus grande symétrie entre ces composantes connexes qu’entre le point initial et le point
final d’un intervalle, est qu’il faut renoncer à la distinction qui fait du noyau de transition
Pt (x, dy) d’un processus de Markov usuel une fonction en x et une mesure en y. Dans le
cas usuel, cette distinction disparaît partiellement lorsque le processus est suffisamment
régulier pour que, pour tout t > 0 et tout x ∈ X , la mesure Pt (x, dy) ait une densité,
habituellement notée pt (x, y), par rapport à une mesure de référence sur X . La théorie des champs d’holonomie markoviens telle que nous la développons se restreint à des
champs suffisamment réguliers pour qu’on se trouve dans une situation analogue, où tous
les noyaux de transition ont une densité.
Il est temps de décrire ces noyaux de transition. De même que la transition d’un
processus usuel le long d’un intervalle ne dépend que de la longueur de l’intervalle et pas
de sa position dans la droite réelle, la transition d’un champ d’holonomie markovien le long
d’une surface ne dépend de cette surface qu’à isomorphisme près, pour une bonne notion
d’isomorphisme. La structure pertinente est la suivante. Nous avons besoin de considérer
une surface, caractérisée par son orientabilité, que nous notons par un signe, + ou −, par
le nombre des composantes connexes de son bord, que nous notons p, et par son genre
réduit que nous notons g (voir la définition du genre réduit à l’encart 1). Cette structure
topologique est complétée par ce qui joue le rôle de la longueur d’un intervalle, à savoir
l’aire totale, notée t, d’une mesure d’aire dont nous munissons la surface. Un théorème
de Moser assure que le seul invariant par difféomorphismes d’une telle mesure d’aire
est précisément son aire totale. Le quadruplet (±, p, g, t) caractérise donc complètement
la surface à difféomorphismes près et les noyaux de transition d’un champ d’holonomie
markovien sont une famille de fonctions
±
Zp,g,t
: Gp → R+ ,
(1.3)
analogues des densités pt (x, y) dont nous avons parlé plus haut.
Considérons maintenant une surface avec un bord ayant p composantes connexes, de
genre réduit g et d’aire totale t. Choisissons q composantes connexes de son bord, que
nous déclarons entrantes, et regardons les p − q autres comme des composantes sortantes.
Si nous fixons des conditions “initiales”, qui sont des éléments x1 , . . . , xq ∈ G, le long des
q composantes entrantes, orientées arbitrairement, le champ conditionné à respecter ces
conditions initiales détermine un processus indexé par les lacets tracés sur notre surface,
1.1. INTRODUCTION
19
et nous pouvons en particulier considérer la distribution des variables aléatoires associées
au p − q composantes sortantes, vues comme des lacets particuliers sur notre surface, et
qui est donnée par
−1
±
(x−1
Zp,g,t
1 , . . . , xq , y1 , . . . , yp−q ) dy1 . . . dyq .
La mesure dy sur le groupe G est sa mesure de Haar normalisée, son unique mesure
borélienne de probabilités invariante par les translations. Les exposants qui apparaissent
servent à prendre en compte notre décision de regarder certaines composantes comme
±
entrantes et d’autres comme sortantes, et permettent d’assurer que la fonction Zp,g,t
soit
symétrique en tous ses arguments.
x1
y1
x2
y2
x3
y3
x4
Figure 1.4 – Ici, p = 7, q = 4 et g = 6 (il s’agit du genre réduit).
La propriété de Markov usuelle, pour des processus indexés par le temps, se reflète dans
le fait que les densités des noyaux de transition forment un semi-groupe de convolution.
Du point de vue des intervalles comme cobordismes entre paires de points, cette propriété
donne un renseignement sur le comportement du processus sur un intervalle de temps
qui est le recollement de deux intervalles ayant un instant en commun. Dans le contexte
bidimensionnel, en recollant des surfaces le long de certaines composantes de leurs bords,
ou en recollant deux composantes du bord d’une même surface, voire en recollant avec ellemême une composante du bord d’une surface, on obtient de nouvelles surfaces et chacune
de ces opérations de chirurgie donne lieu à une relation entre les noyaux de transition
d’un champ d’holonomie markovien, analogue à la relation de Chapman-Kolmogorov.
Si ε et ε0 sont deux signes, nous notons ε ∧ ε0 le signe qui vaut + si et seulement si ε
et ε0 sont eux-mêmes le signe +.
±
Proposition 1.1.6 Soient (Zp,g,t
) les fonctions de partitions d’un champ d’holonomie
markovien. Pour tout choix admissible des paramètres, on a les relations suivantes.
Z
0
ε
Zp,g,t
(x1 , . . . , xp−1 , z)Zpε0 ,g0 ,t0 (y1 , . . . , yp0 −1 , z −1 ) dz =
(1.4)
G
0
ε∧ε
Zp+p
0 −2,g+g 0 ,t+t0 (x1 , . . . , xp−1 , y1 , . . . , yp0 −1 ).
Cette relation correspond au recollement de deux surfaces distinctes le long d’une composante du bord de chacune.
Z
ε
ε
Zp,g,t
(x1 , . . . , xp−2 , z, z −1 ) dz = Zp−2,g+2,t
(x1 , . . . , xp−2 ).
(1.5)
G
20
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
x1
z
x1
z
y1
x2
y1
x2
Figure 1.5 – Ici, ε = ε0 = +, p = 3, g = 0, p0 = 2 et g 0 = 2. L’orientation la plus intuitive des
surfaces étant sous-entendue, seule la composante de bord marquée z du tore à deux trous est orientée
négativement, ce qui explique pourquoi elle apparaît avec un exposant −1 dans l’intégrale.
Cette relation correspond au recollement de deux composantes du bord d’une même surface.
Observons que notre convention sur le genre réduit permet de ne pas avoir à distinguer
le cas orientable (où le genre usuel augmente de 1) du cas non-orientable (où le genre
augemente de 2).
z
x1
x1
z
Figure 1.6 – Ici, ε = +, p = 3, g = 0.
Z
ε
−
Zp,g,t
(x1 , . . . , xp−1 , z 2 ) dz = Zp−1,g+1,t
(x1 , . . . , xp−1 ).
(1.6)
G
Cette dernière relation correspond au recollement d’une composante du bord d’une surface
avec elle-même selon un difféomorphisme involutif sans point fixe qui préserve l’orientation. La surface qu’on obtient est toujours non-orientable, homéomorphe à celle qu’on
aurait obtenue en recollant un ruban de Möbius le long de la composante du bord considérée.
Figure 1.7 – Il est difficile de dessiner le résultat final d’un tel recollement. Nous représentons plutôt
la façon dont une composante connexe du bord de la surface se colle le long bord d’un ruban de Möbius.
L’infinité de noyaux de transition d’un champ d’holonomie markovien satisfait donc
une infinité de relations, une pour chaque opération de chirurgie des surfaces. Le fait,
1.1. INTRODUCTION
21
évoqué plus haut, que toute surface compacte peut être obtenue par recollement de disques
et de sphères percées de trois trous (voir figure 1.8), entraîne donc que l’ensemble des
noyaux de transion est en fait déterminé par un très petit nombre d’entre eux.
Figure 1.8 – La surface orientable de genre réduit 6 avec 5 composantes de bord réalisée par recollements de sphères à trois trous et d’un disque. Une telle décomposition n’est pas unique et celle représentée
n’utilise pas un nombre minimal de blocs élémentaires.
Proposition 1.1.7 Tous les noyaux de transition d’un champ d’holonomie markovien
+
+
sont déterminés par les noyaux (Z1,0,t
)t>0 et (Z3,0,t
)t>0 , associés respectivement aux disques
et aux sphères à trois trous de toutes les aires.
De plus, sous une hypothèse de régularité que nous détaillerons plus tard, les seuls
+
noyaux (Z1,0,t
)t>0 suffisent à déterminer tous les autres.
+
Dans le cas du processus de Poisson indexé par les lacets, les noyaux (Z1,0,t
)t>0 , associés
à des disques, sont les marges unidimensionnelles du processus indexé par R+ que nous
avons décrit à la proposition 1.1.3. Dans le cas général, on a le résultat suivant, valable
sous certaines hypothèses de régularité pour le champ d’holonomie markovien.
Proposition 1.1.8 Considérons un champ d’holonomie markovien à valeurs dans un
+
groupe G. Les mesures (Z1,0,t
(x) dx)t>0 sur G forment un semi-groupe de convolution. Ce
sont les lois marginales unidimensionnelles d’un processus de Lévy à valeurs dans G, qui
est dit associé au champ considéré.
À ceci près qu’il n’est pas démontré dans tous les cas qu’un champ d’holonomie aléatoire markovien est complètement déterminé par ses noyaux de transition, il y a donc
une correspondance entre processus de Lévy sur un groupe de Lie compact et champs
d’holonomie à valeurs dans ce groupe. Le résultat qui suit est l’un de nos résultats fondamentaux sur les champs d’holonomie markoviens. Nous l’énoncerons à nouveau, plus
précisément, à la fin de ce chapitre, après avoir introduit les définitions nécessaires.
Théorème 1.1.9 ([L7, Théorème 4.3.1]) Soit G un groupe de Lie compact. Pour tout
processus de Lévy à valeurs dans G satisfaisant certaines hypothèses techniques, il existe un
champ d’holonomie aléatoire markovien à valeurs dans G auquel ce processus est associé.
La preuve de ce théorème d’existence est constructive et nous allons consacrer l’essentiel de ce chapitre à indiquer comment on parvient à construire un champ d’holonomie
markovien.
22
1.2
1.2.1
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
Processus multiplicatifs indexés par des chemins
L’espace mesurable
Commençons par préciser les objets qui sont en jeu. Nous nous donnons une surface
M . Elle est munie de sa structure différentiable, d’une orientation si elle est orientable
et d’une mesure borélienne qui nous servira à mesurer les aires. Nous supposerons que
cette mesure a, dans chaque système local de coordonnées, une densité lisse et strictement
positive par rapport à la mesure de Lebesgue. Nous la noterons vol. Si M est orientée, on
peut identifier la mesure vol à une 2-forme volume, c’est-à-dire une 2-forme différentielle
qui ne s’annule pas.
La classe des chemins que nous considérons est la classe des chemins rectifiables, c’està-dire continus et de longueur finie. Le fait qu’un chemin soit de longueur finie n’est
pas une notion métrique, mais bien une notion différentiable : c’est invariant par difféomorphismes. Nous noterons P(M ) l’ensemble des chemins de longueur finie, considérés
à reparamétrisation près. Lorsque c est un chemin, nous noterons c−1 le même chemin
parcouru dans l’autre sens, et c et c l’origine et l’extrémité de c. Si c1 et c2 sont deux
chemins tels que c1 = c2 , nous noterons c1 c2 leur concaténation.
Le groupe que nous allons considérer et dans lequel le champ prendra ses valeurs est
un groupe de Lie compact, que nous noterons G.
ENCART 2 – Groupes de Lie compacts [BtD85, DK00]
Un groupe de Lie compact est un groupe topologique compact qui est également une variété différentiable
de telle sorte que le produit et l’inversion soient des applications lisses. Un tel groupe est isomorphe, par un
isomorphisme de groupe qui est aussi un difféomorphisme, à un sous-groupe fermé du groupe unitaire U (N )
pour un certain N . On perd donc un certain caractère intrinsèque de la description, mais aucune généralité, à
penser à un groupe de Lie compact comme à un groupe compact de matrices à coefficients complexes. C’est ce
que nous ferons désormais sans le signaler dès lors que cela nous semblera utile pour simplifier la présentation.
Notons que tout groupe fini muni de la topologie discrète est un groupe de Lie compact.
Soit G un groupe de Lie compact. Il a deux propriétés fondamentales de notre point de vue. Premièrement,
il porte une unique mesure borélienne de probabilités invariante par
R les translations, la mesure de Haar, que
nous ne noterons pas, c’est-à-dire que nous écrirons simplement G f (g) dg pour l’intégrale d’une fonction
continue f : G → R par rapport à cette mesure. Deuxièmement, son algèbre de Lie porte un produit scalaire
invariant par adjonction. L’algèbre de Lie de G peut être définie comme le sous-espace vectoriel réel de MN (C)
donné par
g = {A ∈ MN (C) : ∀t ∈ R, etA ∈ G}.
L’espace vectoriel g porte un produit scalaire (non unique en général, même à une constante multiplicative
près) invariant par l’action de G par adjonction, c’est-à-dire par conjugaison : ad(g)A = gAg −1 . La donnée
d’un tel produit scalaire sur g est équivalent à la donnée d’une métrique riemannienne sur G pour laquelle
toutes les translations, à droite et à gauche, sont des isométries. Le volume riemannien d’une telle métrique
est une mesure invariante par les translations, donc un multiple de la mesure de Haar.
Dans le cas du groupe unitaire U (N ), l’algèbre de Lie u(N ) est l’espace des matrices anti-hermitiennes. Le
produit scalaire Tr(A∗ B) = −Tr(AB) est alors un produit scalaire invariant. La forme bilinéaire Tr(A∗ B) +
αTr(A∗ )Tr(B) est également invariante pour tout α réel, c’est donc un produit scalaire invariant dès que c’est
un produit scalaire, c’est-à-dire dès que α > − N1 .
Nous aurons besoin plus loin de quelques considérations topologiques sur G. Si G n’est pas connexe, la
composante connexe de l’élément neutre, est un sous-groupe distingué de G noté G0 et tel que le quotient
G/G0 soit fini.
1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS
23
Supposons G connexe. Le groupe fondamental de G, comme celui de tout groupe topologique, est commutatif. En fait, étant donné deux lacets continus γ1 , γ2 : [0, 1] → G, la concaténation γ1 γ2 de ces deux
lacets est homotope à leur produit point par point t 7→ γ1 (t)γ2 (t), ainsi qu’à leur produit point par point
dans l’autre sens t 7→ γ2 (t)γ1 (t). La multiplication point par point munit les classes d’homotopie sans condition d’extrémités fixées d’une structure de groupe abélien canoniquement isomorphe à π1 (G, 1), où 1 désigne
l’élément neutre de G. Ce groupe est fini si et seulement si le centre de G est fini, auquel cas on dit que G
est semi-simple. Dans ce cas, G adment un revêtement universel par un autre groupe de Lie compact. Par
exemple, le groupe fondamental de SO(3) est isomorphe à Z/2Z et SO(3) admet un revêtement universel,
de degré 2, par SU (2). Dans le cas où le centre de G n’est pas fini, par exemple si G = U (N ), un revêtement
universel de G est isomorphe au produit d’un groupe compact et de Rn pour un certain n ≥ 1.
Décrivons l’espace canonique d’un processus multiplicatif indexé par une partie de
P(M ) et à valeurs dans G.
Définition 1.2.1 Soit P une partie de P(M ). On dit qu’une fonction h : P → G est
multiplicative si
1. ∀c ∈ P, c−1 ∈ P ⇒ h(c−1 ) = h(c)−1 .
2. ∀c1 , c2 ∈ P, c1 c2 ∈ P ⇒ h(c1 c2 ) = h(c2 )h(c1 ).
On note M(P, G) l’ensemble des fonctions multiplicatives de P dans G.
Nous allons munir M(P, G) de la σ-algèbre C engendrée par les applications d’évaluation h 7→ h(c), pour c décrivant P . Un champ d’holonomie aléatoire sur M est une mesure
finie ou de probabilités sur (M(P(M ), G), C).
1.2.2
Graphes
Pour construire une mesure sur (M(P(M ), G), C), on voudrait procéder comme d’habitude lorsqu’on construit un processus stochastique, en décrivant d’abord ses marges
fini-dimensionnelles, puis en appliquant un théorème de Kolmogorov. Ceci n’est malheureusement pas possible directement, car on ne sait pas décrire simplement toutes les lois
marginales fini-dimensionnelles des mesures qu’on veut construire. Avant d’expliquer d’où
vient ce problème, commençons par décrire celles de ces lois pour lesquelles c’est possible.
Nous dirons qu’un lacet l : [0, 1] → M est simple s’il est injectif sur [0, 1).
Définition 1.2.2 Un graphe sur M est un triplet G = (V, E, F) tel que
1. E est un ensemble d’arêtes, c’est-à-dire de chemins injectifs ou de lacets simples, qui
soit ne rencontrent pas le bord de M , soit sont contenus dedans ; on suppose que dès que
E contient une arête e il contient l’arête e−1 , et que deux arêtes qui ne sont pas inverse
l’une de l’autre ne se recontrent, le cas échéant, qu’en certaines de leurs extrémités,
2. V est l’ensemble des extrémités des arêtes de E,
3. F est l’ensemble des composantes connexes du complémentaire dans M de la réunion
des images des arêtes de E,
4. chaque élément de F est homéomorphe à un disque ouvert de R2 .
Les éléments de V s’appellent les sommets du graphe, et les éléments de F ses faces.
24
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
Figure 1.9 – Un graphe sur une sphère percée de trois trous. L’hypothèse que les faces sont homéomorphes à des disques ouverts impose que le bord de la surface soit couvert par des arêtes du graphe, ici
deux arêtes injectives et deux lacets simples.
Soit G un graphe sur M . Notons P(G) l’ensemble des chemins que l’on peut former en concaténant des arêtes de G. Nous allons décrire une mesure de probabilités sur
M(P(G), G). Il ne s’agit pas strictement parlant d’une loi marginale fini-dimensionnelle
du champ d’holonomie, car P(G) est infini, mais on vérifie aisément que l’application de
restriction M(P(G), G) → M(E, G) est une bijection. En d’autres termes, une fonction
multiplicative sur les chemins tracés dans un graphe est complètement déterminée par ses
valeurs sur les arêtes. De plus, si on choisit une orientation de G, c’est-à-dire une partie E+
de E telle que E soit la réunion disjointe de E+ et (E+ )−1 , alors il suffit même de connaître
une fonction multiplicative sur E+ : on a à nouveau une application de restriction bijective
M(E, G) → M(E+ , G). Enfin, toute fonction de E+ dans G est multiplicative, car E+
ne contient l’inverse d’aucun de ses éléments, ni aucune de leurs concaténations. Ainsi,
+
M(E+ , G) = GE .
+
+
La mesure dg ⊗E , qui est la mesure de Haar sur le groupe de Lie compact GE , détermine par les bijections que nous avons décrites des mesures sur M(E, G) et M(P(G), G),
que nous appellerons uniformes et que nous noterons simplement dh. La mesure que nous
allons définir sur M(P(G), G) a une densité par rapport à cette mesure uniforme, qui
dépend du choix d’un processus de Lévy sur G.
1.2.3
Processus de Lévy et marges associées à des graphes
Commençons par décrire brièvement les processus de Lévy sur G.
ENCART 3 – Processus de Lévy sur un groupe de Lie compact [Lia04]
On dit qu’un processus X = (Xt )t≥0 à valeurs dans G est un processus de Lévy s’il est càdlàg et si ses
accroissements sont indépendants et stationnaires. Comme la multiplication dans G n’est pas commutative,
il faut choisir un côté pour définir les accroissements, et nous décidons que l’accroissement de X entre s
et t est Xs−1 Xt (on parle de processus de Lévy à gauche). Soit X un processus de Lévy. Alors la formule
Pt f (x) = E[f (xX0−1 Xt )] définit un semi-groupe de Feller invariant à gauche, au sens où pour tous x, y ∈ G
et tout borélien Γ de G, on a Pt (yx, yΓ) = Pt (x, Γ). Réciproquement, tout processus de Feller dans G dont le
noyau de transition est invariant à gauche est un processus de Lévy à gauche. Enfin, la donnée d’un processus
1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS
25
de Lévy à gauche équivaut à la donnée d’un semi-groupe de convolution faiblement continu de mesures de
probabilités sur G, le semi-groupe des lois marginales unidimensionnelles de X.
Le générateur d’un processus de Lévy est la somme d’un terme diffusif, d’un terme de dérive et d’un terme
de saut, ce dernier étant caractérisé
par une mesure notée Π qui ne charge pas l’élément neutre et qui satisfait
R
la condition d’intégrabilité G dG (1, x)2 Π(dx) < +∞, où dG est une distance riemannienne bi-invariante sur
G. Nous allons considérer des processus issus de l’identité et invariants par conjugaison, c’est-à-dire tels que
pour tout g ∈ G, les processus X et gXg −1 aient la même loi. Pour de tels processus, les trois parties du
générateur sont invariantes par conjugaison. Cette contrainte est particulièrement restrictive pour les parties
diffusive et de dérive : si le groupe G est simple, par exemple si G = SU (N ), alors la dérive est nulle et la
partie diffusive du générateur est imposée à une constante multiplicative positive près.
Nous avons besoin de considérer des processus de Lévy dont la loi à tout instant strictement positif a
une densité continue par rapport à la mesure de Haar. Le résultat suivant montre que ceci a lieu sous une
hypothèse bien plus faible. Rappelons que G0 est la composante connexe de l’élément neutre dans G et que
le quotient G/G0 est fini.
Proposition 1.2.3 ([L7, Proposition 4.2.3]) Soit X un processus de Lévy invariant par conjugaison sur G,
issu de l’élément neutre. S’il existe p > 1 tel que pour tout t > 0 la loi de Xt admette une densité Lp
par rapport à la mesure de Haar sur G, alors cette densité, qu’on notera (t, x) 7→ Qt (x) est continue sur
(0, +∞) × G et strictement positive sur (0, +∞) × G0 . Si de plus le support de la mesure image de Π par la
projection G → G/G0 engendre G/G0 , alors Q est strictement positive sur (0, +∞) × G.
Définition 1.2.4 Nous dirons qu’un processus de Lévy X sur G est admissible s’il est
issu de l’élément neutre, invariant par conjugaison et si pour tout t > 0 la loi de Xt admet
une densité Qt par rapport à la mesure de Haar telle que (t, x) 7→ Qt (x) soit continue et
strictement positive sur (0, +∞) × G.
Le groupe G, qui est compact, admet une métrique riemannienne telle que les translations soient des isométries (voir l’encart 2). Une telle métrique n’est pas unique, mais
nous en choisissons une sur G et nous notons dG la distance riemannienne associée. Pour
la plupart des usages que nous en ferons, nous écrirons des distances entre un élément de
G et l’élément neutre. Cette distance peut être remplacée sans dommage dans toutes les
formules par une distance euclidienne dans MN (C) entre l’élément considéré et la matrice
identité.
Donnons des exemples de processus admissibles.
• Si G est un groupe fini, les processus admissibles sont exactement les chaînes de
Markov dont le générateur est invariant, et dont la mesure de saut est invariante par
conjugaison et a un support qui engendre G.
• Si G est connexe et si on le munit d’une métrique riemannienne bi-invariante, alors
le mouvement brownien sur G est un processus de Lévy admissible.
• Si X est un processus admissible, on peut ajouter ou soustraire à sa mesure de saut
n’importe quelle mesure finie portée par G0 sans changer le fait qu’il soit admissible.
• Il existe des processus de saut pur admissibles, par exemple le processus sur SU (2)
dont la mesure de saut est Π(dx) = dG (1, x)α dx pour α ∈ (−5, −3).
26
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
Soit X un processus de Lévy admissible sur G dont nous notons Q la densité. Soit
M une surface munie d’un graphe G. Nous allons maintenant définir une mesure sur
M(P(G), G) associée à X.
Observons que chaque face de G est bordée par un lacet dans G. Cette affirmation
ne va pas tout-à-fait de soi : d’une part ce lacet n’est pas unique, car il n’est défini qu’à
changement d’orientation et d’origine près, d’autre part il n’est pas forcément un lacet
simple, c’est-à-dire qu’il peut emprunter deux fois une même arête, éventuellement deux
fois dans le même sens si la surface n’est pas orientable (voir figure 1.10). Pour simplifier
l’exposition, nous ne nous préoccuperons pas du cas non-orientable dans la plupart des
énoncés qui suivent. Dans une surface orientable et orientée, le bord d’une face F est donc
un lacet ∂F défini au choix de son origine près. Ainsi, si h : P(G) → G est une fonction
multiplicative, la valeur de h(∂F ) est définie à conjugaison près. Ceci suffit à ce que la
définition suivante ait un sens.
Définition 1.2.5 Soit M une surface munie d’une mesure d’aire notée vol. Soit G un
graphe sur M . On définit la mesure de probabilités DFX,G
M,vol sur (M(P(G), G), C) par
DFX,G
M,vol (dh) =
1
Y
X,G
ZM,vol
F ∈F
Qvol(F ) (h(∂F )) dh.
Il est possible d’incorporer des conditions au bord dans la définition de DFX,G
M,vol mais
nous préférons ne pas le faire en détail pour ne pas allonger inutilement l’exposition.
Indiquons simplement que la densité n’est pas affectée par les conditions au bord, mais
qu’on ne conditionne en fait que la mesure uniforme dh à satisfaire les contraintes qu’on
X,G
a choisies. La constante de normalisation ZM,vol
est alors modifiée et devient une fonction
des conditions au bord.
Mentionnons également que dans le cas non-orientable, il est nécessaire de supposer
que le processus X est invariant par inversion, c’est-à-dire qu’il a même loi que X −1 .
Figure 1.10 – Ce graphe sur un ruban de Möbius a deux sommets, trois arêtes et une seule face, dont
le bord emprunte deux fois l’équateur (ici en gras) dans le même sens.
Nous allons maintenant justifier dans la mesure du possible la définition 1.2.5, c’està-dire de trouver un sens en lequel elle est naturelle. Pour cela, il est opportun de parler
de symétrie de jauge.
1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS
1.2.4
27
Symétrie de jauge
Définition 1.2.6 On appelle groupe de jauge le groupe J = F(M, G) de toutes les fonctions de M dans G. Si P est une partie de P(M ), alors J agit sur M(P, G) de la façon
suivante : l’élément j de J transforme l’élément h de M(P, G) en l’élément j · h défini
par
∀c ∈ P , (j · h)(c) = j(c)−1 h(c)j(c).
Pour des raisons géométriques ou physiques que nous expliquerons plus tard, on ne doit
considérer sur M(P(M ), G) que des objets, mesures ou fonctions, invariants sous l’action
du groupe de jauge. Ceci restreint énormément l’espace des observables, c’est-à-dire des
fonctions autorisées. Par exemple, si c est un chemin dont les extrémités sont distinctes,
alors les seules fonctions f : G → R telles que h 7→ f (h(c)) soit invariante sous l’action
de J sont les fonctions constantes. En effet, la valeur de h(c) peut être transformée en
n’importe quel élément de G par une transformation de jauge appropriée. Si c est un lacet
en revanche, toute fonction f : G → R invariante par conjugaison, c’est-à-dire telle que
f (yxy −1 ) = f (x) pour tous x, y, donne lieu à une fonction h 7→ f (h(c)) invariante par
transformation de jauge.
En y regardant de plus près, on s’aperçoit qu’une transformation de jauge non seulement conjugue les valeurs de la fonction h sur les lacets, mais conjugue par le même
élément la valeur de h sur tous les lacets basés au même point. Définissons l’action
par conjugaison diagonale de G sur Gn pour tout entier n ≥ 1 par y · (x1 , . . . , xn ) =
(yx1 y −1 , . . . , yxn y −1 ). Alors, pour toute fonction f : Gn → R invariante par cette action diagonale et toute famille l1 , . . . , ln de lacets basés au même point, la fonction
h 7→ f (h(l1 ), . . . , h(ln )) est une fonction invariante par transformation de jauge, et c’est
essentiellement la plus générale possible.
Avant d’énoncer un résultat, donnons un exemple de classes de conjugaison diagonales.
Dans le groupe SO(3), chaque rotation qui n’est ni l’identité ni une symétrie axiale (appelons de telles rotations des rotations propres) a un axe, qui est une droite orientée, et un
angle, qui appartient à (0, π). Cet angle caractérise la classe de conjugaison de la rotation.
Considérons maintenant deux collections (r1 , . . . , rn ) et (r10 , . . . , rn0 ) de rotations propres.
Alors ri est conjuguée à ri0 pour tout i = 1, . . . , n si et seulement si ri et ri0 ont même
angle pour tout i = 1, . . . , n. Cependant, il existe une rotation r telle que ri0 = rri r−1
pour tout i = 1, . . . , n si et seulement si, en plus de la condition précédente, il existe une
rotation (qui n’est autre que r) qui, pour tout i = 1, . . . , n, envoie l’axe orienté de ri sur
l’axe orienté de ri0 . Ainsi, la classe de conjugaison diagonale d’une famille de rotations est
donnée par les angles de ces rotations et la position relative de leurs axes.
Proposition 1.2.7 Soit P une partie de P(M ) stable par inversion et par concaténation.
On suppose que toute extrémité d’un chemin de P est reliée à toute autre par un chemin
de P . Soit m une extrémité d’un chemin de P . Soit Lm l’ensemble des lacets basés en m
qui appartiennent à P . Alors on a les deux propositions suivantes.
1. L’application composée M(P, G) −→ M(Lm , G) −→ M(Lm , G)/G, où la première
application est la restriction et la deuxième le quotient par l’action de G par conjugaison
diagonale sur tous les facteurs, passe au quotient en une injection
M(P, G)/J −→ M(Lm , G)/G.
28
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
2. Soient c1 , . . . , cn des éléments de P . Soit f : Gn → R une fonction continue telle que
la fonction h 7→ f (h(c1 ), . . . , h(cn )) soit invariante par transformations de jauge. Alors
il existe n lacets l1 , . . . , ln basés en m et une fonction continue f˜ : Gn → R invariante
sous l’action diagonale de G par conjugaison telle que pour tout h ∈ M(P, G) on ait
f (h(c1 ), . . . , h(cn )) = f˜(h(l1 ), . . . , h(ln )).
Lorsqu’on se restreint à des observables invariantes par transformations de jauge, on
ne perd donc rien à se restreindre à des lacets, ni même aux lacets basés en un point
arbitraire.
La proposition ci-dessus rend intelligible la définition, que nous donnons maintenant,
d’une σ-algèbre sur M(P, G) plus petite que la tribu des cyclindres que nous avons considérée jusqu’à présent.
Définition 1.2.8 Soit P une partie de P(M ) stable par inversion et par concaténation.
On suppose que toute extrémité d’un chemin de P est reliée à toute autre par un chemin
de P . On appelle σ-algèbre invariante et on note I la plus petite σ-algèbre qui rende
mesurable toutes les fonctions h 7→ f (h(l1 ), . . . , h(ln )) où l1 , . . . , ln sont des lacets de P
basés au même point et où f : Gn → R est invariante par l’action diagonale de G par
conjugaison.
Revenons à la mesure de probabilités que nous avons définie sur M(P(G), G). La
proposition suivante ne devrait pas constituer une surprise.
Lemme 1.2.9 La mesure DFX,G
M,vol est invariante sous l’action du groupe de jauge.
Terminons ce paragraphe par une observation sur la nature des conditions au bord
qu’on peut imposer au champ d’holonomie. Lorsqu’on met des conditions au bord sur la
mesure DFX,G
M,vol , on impose la valeur des fonctions multiplicatives des lacets le long des
composantes connexes du bord de M . Ces composantes connexes n’ont d’une part pas
d’origine privilégiée et d’autre part, en eussent-elles chacune une que celles-ci seraient
nécessairement deux à deux distinctes. Il n’a donc pas de sens, à transformation de jauge
près, d’imposer plus que la classe de conjugaison de la valeur des fonctions le long de
chaque composante du bord. Les conditions au bord consistent donc en la donnée d’une
classe de conjugaison pour chaque composante connexe orientée du bord de M (voir la
définition 1.3.2).
1.2.5
Une représentation aléatoire du groupe des lacets
L’invariance de jauge de la mesure DFX,G
M,vol nous autorise à la considérer comme un bon
objet du point de vue géométrique et physique, mais ne suffit pas à la rendre naturelle.
Pour mieux la comprendre, étudions la structure de l’ensemble des lacets basés en un
point dans un graphe.
1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS
29
ENCART 4 – Groupe des lacets dans un graphe
Soit G un graphe. Soit m un sommet de G et soit Lm (G) l’ensemble des lacets dans G basés en m. La concaténation munit Lm (G) d’une structure de monoïde. Déclarons deux lacets équivalents si l’on peut passer de
l’un à l’autre par une suite d’insertions ou d’effacements de chemins de la forme ee−1 où e est une arête de G.
Cette relation est compatible avec la concaténation et le quotient de Lm (G) par cette relation est un groupe.
Appelons lacet réduit un lacet qui ne contient aucun sous-chemin de la forme ee−1 . Alors on démontre que
chaque classe d’équivalence contient un unique lacet réduit, qui en est aussi l’unique élément de longueur
minimale. On peut donc choisir de représenter chaque classe par son unique représentant réduit, et considérer
comme opération de groupe l’opération de concaténation-réduction. On obtient le groupe des lacets réduits,
noté RLm (G), qui est est canoniquement isomorphe au groupe fondamental π1 (M \ Y, m) où Y est une partie
finie de M qui contient exactement un point dans chaque face de G.
Le groupe RLm (G) est libre et la façon la plus simple d’en exhiber une base est de choisir un arbre couvrant
de G et d’associer à chaque arête non couverte par cet arbre un lacet de RLm (G). Pour cela, à chaque arête
e non couverte par l’arbre, on associe le lacet qui part de m, va à l’origine de e par l’unique chemin injectif
entre m et e dans l’arbre, parcourt e, puis retourne à m par l’unique chemin injectif de e à m dans l’arbre.
Notons v = #V, e = #E/2 et f = #F les nombres de sommets, d’arêtes non orientées et de faces de G.
Notons également g le genre réduit de M (c’est-à-dire le genre réduit de la surface obtenue en recollant un
disque le long de chaque composante du bord de M ) et p le nombre de composantes connexes du bord de M .
Alors il y a e − v + 1 arêtes non couvertes par un arbre couvrant de G. La caractéristique d’Euler de M vaut
d’une part 2 − g − p et d’autre part v − e + f. Ainsi, le nombre d’arêtes non couvertes par un arbre couvrant
de G vaut g + p + f − 1.
Le groupe RLm (G) est donc libre de rang g + p + f − 1. Sur un disque par exemple, ce nombre vaut f,
le nombre de faces de G. On peut alors donner une, et même de nombreuses bases de ce groupe qui soient
en bijection explicite avec l’ensemble des faces. Appelons lasso un lacet qui est de la forme sbs−1 , où s est
un chemin issu de m et b est un lacet simple (c’est-à-dire injectif au fait près que ses deux extrémités sont
confondues) basé en l’extrémité de s. La lacet b s’appelle la boucle du lasso. On dit qu’un lasso est facial
si sa boucle est le bord d’une face de G. Pour un graphe sur un disque, il est possible de donner une base
de RLm (G) formée de lassos faciaux, un pour chaque face de G, de telle façon que le produit de ces lassos
dans un certain ordre soit un lasso dont la boucle est le bord du disque. Dans le cas général, on a le résultat
suivant. On observera que, bien que RLm (G) soit libre, on préfère en donner une présentation qui contient
une relation, de même par exemple que l’espace des suites réelles finies (a0 , . . . , an ) de somme nulle, bien que
de dimension n, est plus aisément décrit comme le noyau d’une forme linéaire sur Rn+1 que comme l’image
d’une application linéaire Rn → Rn+1 .
Proposition 1.2.10 Soit M une surface connexe de genre réduit g avec un bord à p composantes connexes.
Soit G un graphe sur M avec f faces. Soit m un sommet de G. Il existe g lassos a1 , . . . , ag , un mot w en g
lettres et leurs inverses, p lassos c1 , . . . , cp , dont les boucles sont les p composantes du bord de M , et f lassos
faciaux l1 , . . . , lf bordant les f faces de G tels que le groupe RLm (G) admette la présentation
hai , cj , lk | w(a1 , . . . , ag )c1 . . . cp l1 . . . lf = 1i,
et, pour toute fonction continue f : Gg+p+f → R, on ait
Z
f (h(a1 ), . . . , h(ag ), h(c1 ), . . . , h(cp ), h(l1 ), . . . , h(lf )) dh
M(P (G),G)
Z
=
f (x1 , . . . , xg , y1 , . . . , yp , z1 , . . . , zf−1 , zf )dxi dyj dzk ,
Gg+p+f
où on a posé zf = (w(x1 , . . . , xg )c1 . . . cp z1 . . . zf−1 )−1 .
Les lassos a1 , . . . , ag engendrent en particulier, avec la relation w(a1 , . . . , ag ) = 1, le groupe fondamental
de la surface obtenue à partir de M en recollant un disque le long de chaque composante connexe du bord.
30
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
En présence de conditions au bord, les variables h(ci ) seraient uniformes sur les classes de conjugaison
qui leur seraient assignées. Dans le cas présent, nous voyons que les variables h(l1 ), . . . , h(lf ) sont aussi
indépendantes que le leur permet la topologie de M .
Considérons une fonction multiplicative h : P(G) → G. Nous savons par la proposition
1.2.7 qu’à transformation de jauge près, h est caractérisée par sa restriction à Lm (G), où
m est un sommet de G choisi arbitrairement. Il découle immédiatement de la multiplicativité de h que deux lacets équivalents au sens défini ci-dessus ont la même image par
h. Ainsi, h détermine une application multiplicative de RLm (G) dans G, ce qui n’est rien
d’autre qu’un homomorphisme de groupes de RLm (G) dans G. Nous pouvons écrire, un
peu abstraitement,
M(P(G), G)/J ' Hom(RLm (G), G)/Int(G),
où Int(G) est le groupe des automorphismes intérieurs de G, c’est-à-dire ceux qui sont
donnés par la conjugaison par un élément fixe de G, qui agit par composition à droite sur
Hom(RLm (G), G).
La mesure DFX,G
M,vol détermine donc un homomorphisme aléatoire de RLm (G) dans G
dont la loi est invariante par composition par un automorphisme intérieur. Un tel homomorphisme aléatoire est caractérisé par la loi de l’image d’une partie génératrice de
RLm (G) et puisque le groupe RLm (G) est libre, on a tout intérêt à prendre pour partie
génératrice une base, afin que ne pèse aucune contrainte de nature algébrique sur la loi
de son image, à part le fait qu’elle soit invariante par conjugaison diagonale.
Vu la description que nous avons donnée de RLm (G) et le processus de Lévy X sur
G étant donné, l’homomorphisme aléatoire déterminé par la mesure DFX,G
M,vol est le plus
naturel possible. Sur un disque par exemple, il envoie les lassos l1 , . . . , lf de la base décrite
par la proposition 1.2.10 sur des variables aléatoires indépendantes de loi respectivement
égales à celles de Xvol(F1 ) , . . . , Xvol(Ff ) , où les faces ont été numérotées de telle sorte que la
boucle du lasso li borde Fi .
Sur des surfaces de genre supérieur, ou en présence de conditions au bord, les lois des
images des lassos faciaux sont modifiées de la façon la plus naturelle possible. Par exemple,
sur un disque avec condition au bord donnée par un élément x1 de G, on conditionne le
processus X à atteindre la classe de conjugaison de x1 au temps égal à l’aire totale du
disque, et les images de l1 , . . . , lf ont les lois des incréments de ce pont du processus
X. Un autre exemple simple est celui de la sphère, où le processus X est conditionné à
revenir à l’élément neutre au temps égal à l’aire totale de la sphère. On voit au passage
que l’on trouve donc quelque chose qui ressemble beaucoup à ce qui se passe sur un
disque avec condition au bord donnée par l’élément neutre. Enfin, on peut décrire par
exemple ce qui se passe sur une surface fermée de genre réduit 4 : si le graphe G est
assez fin, on peut choisir la base de telle sorte que le mot w en 4 lettres soit le mot
aba−1 b−1 cdc−1 d−1 . Alors les lassos faciaux sont envoyés sur des variables ayant les lois des
incréments du processus X conditionné à avoir, au temps égal à l’aire totale du tore, la
loi de U V U −1 V −1 W ZW −1 Z −1 , où U, V, Z, W sont uniformes indépendantes sur G. Pour
certains graphes, le mot w peut être différent, par exemple abcda−1 b−1 c−1 d−1 , mais on
1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS
31
vérifie que la loi de w(U1 , U2 , U3 , U4 ) où U1 , U2 , U3 , U4 sont uniformes et indépendantes sur
G ne dépend pas du graphe G, mais seulement de la topologie de M .
1.2.6
Boucles de Wilson [L3]
En marge de la progression vers la définition des champs d’holonomie markoviens,
cette section présente un résultat qui concerne la théorie discrète que nous venons de
décrire. Elle peut être ignorée sans dommage pour la compréhension de la construction
principale.
Soit G un graphe sur une surface M , bien qu’à vrai dire la surface ne joue ici aucun
rôle. Sur l’espace M(P(G), G), les considérations de symétrie de jauge nous ont amené à
introduire des fonctions de la forme h 7→ f (h(l1 ), . . . , h(ln )) où l1 , . . . , ln sont des lacets
basés au même sommet et où f est invariante par conjugaison diagonale. Les propositions
1.2.7 et 1.2.10 permettent de vérifier que ces fonctions séparent les points de l’espace
quotient M(P(G), G)/J . Elles engendrent donc, d’un point de vue physique, une bonne
algèbre d’observables.
Toutefois, dans l’étude des théories de jauge discrètes, les physiciens considèrent le plus
souvent une algèbre plus petite d’observables, engendrée par des fonctions plus simples,
les boucles de Wilson. Il s’agit de fonctions de la forme h 7→ f (h(l)) où l est un lacet
et où f est invariante par conjugaison. La question naturelle qui se pose est de savoir si
ces observables suffisent à engendrer toutes les fonctions continues sur l’espace quotient
M(P(G), G)/J , c’est-à-dire, d’après le théorème de Stone-Weierstrass, si elles séparent
les points.
Soit h une fonction multiplicative. La question est la suivante : connaissant la classe
de conjugaison de h(l) pour tout lacet l, connaît-on h à transformation de jauge près,
c’est-à-dire, connaît-on la classe de conjugaison diagonale de (h(l1 ), . . . , h(ln )) pour tout
n-uplets de lacets basés au même point ? Etant donné l1 , . . . , ln , nous avons accès à la classe
de conjugaison de h(l1 ), . . . , h(ln ), mais aussi à celles de h(l1 l2 ) = h(l2 )h(l1 ), h(l1 l2 l3 ) =
h(l3 )h(l2 )h(l1 ) ou de l’image par h de tout autre lacet qu’on peut former en concaténant
des copies de l1 , . . . , ln . Nous avons donc accès à la classe de conjugaison de tout produit
des éléments h(l1 ), . . . , h(ln ) de G.
Il s’agit d’une question purement algébrique sur le groupe dans lequel la fonction
h prend ses valeurs. Si ce groupe est SO(3), on peut poser la question de la manière
suivante : étant donné n rotations r1 , . . . , rn de R3 , la connaissance de l’angle de toute
rotation qu’on peut former en multipliant des éléments pris, avec répétition possible, dans
l’ensemble {r1 , . . . , rn , r1−1 , . . . , rn−1 }, suffit-elle pour déterminer la position relative des
axes de r1 , . . . , rn ?
Dans ce cas précis, la réponse est positive.
Théorème 1.2.11 ([L3, Proposition 3.4]) Soit G un produit fini de groupes pris dans
la liste suivante : unitaire, spécial unitaire, orthogonal, spécial orthogonal, symplectique.
Soit r ≥ 1 un entier. Soient g = (g1 , . . . , gr ) et g 0 = (g10 , . . . , gr0 ) deux éléments de Gr .
Supposons que pour tout mot w en r lettres et leurs inverses, les éléments w(g) et w(g 0 )
de G soient conjugués. Alors il existe k ∈ G tel que pour tout i compris entre 1 et r on
ait gi0 = kgi k −1 .
32
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
Ce théorème avait été démontré par B. Durhuus pour le groupe unitaire et spécial
unitaire [Dur80] et par A. Sengupta pour les groupes unitaires et orthogonaux impairs
[Sen94]. La preuve du théorème ci-dessus repose sur l’utilisation des spin networks, qui
sont un ensemble de fonctions invariantes sur M(P(G), G) d’une nature différente et pour
lesquelles il est immédiat de vérifier qu’elles engendrent une algèbre dense de fonctions
[Bae96]. On démontre ensuite, en utilisant les théorèmes fondamentaux de la théorie des
invariants, que ces spin networks peuvent s’exprimer en termes de boucles de Wilson.
1.2.7
Invariance par subdivision
Reprenons le cours principal de la construction des champs d’holonomie markoviens.
X,G
La constante de normalisation ZM,vol
qui apparaît dans la définition 1.2.5 et qui est,
en présence de conditions au bord, une fonction de ces conditions, sera bien, comme la
notation le suggère, un des noyaux de transition du champ d’holonomie associé à X que
nous essayons de construire. Elle semble pourtant dépendre du graphe qu’on considère.
Un premier résultat important affirme que ce n’est pas le cas.
X,G
Proposition 1.2.12 ([L7, Prop. 3.2.5, Prop. 4.1.10]) Le nombre ZM,vol
, qui, en préX,G
sence de conditions au bord, est une fonction de ces conditions ZM,vol (x1 , . . . , xp ), ne déX
pend pas du graphe G et on la note ZM,vol
(x1 , . . . , xp ). Si M est orientable de genre réduit
g, alors on a l’expression explicite suivante :
Z
X
−1
ZM,vol (x1 , . . . , xp ) =
Qvol(M ) ([a1 , a2 ] . . . [ag−1 , ag ]c1 x1 c−1
1 . . . cp xp cp ) dai dck ,
G
où l’on a noté [a, b] = aba−1 b−1 .
Si M est non-orientable de genre g, alors
Z
X
−1
ZM,vol (x1 , . . . , xp ) =
Qvol(M ) (a21 . . . a2g c1 x1 c−1
1 . . . cp xp cp ) dai dck .
G
On voit ici apparaître des expressions qui rappellent les présentations classiques des
groupes fondamentaux des surfaces. Ceci n’est pas surprenant si l’on pense que ces présentations peuvent être calculées à partir de modèles polygonaux des surfaces, dont on
identifie les arêtes par paires, et que ces mêmes modèles polygonaux fournissent par ailleurs
des graphes à une seule face sur les surfaces, dans lesquels on peut calculer la fonction de
partition et obtenir presque directement les expressions ci-dessus.
Nous voudrions maintenant regrouper toutes les mesures DFX,G
M,vol en une unique mesure
sur M(P(M ), G). Comme nous l’avons annoncé au début de la section 1.2.2, ceci ne
fonctionne pas directement. D’une part, les mesures DFX,G
M,vol ne suffisent pas à décrire
toutes les lois marginales de dimension finie d’une mesure sur M(P(M ), G) : en général,
un nombre fini de chemins, ou même un seul chemin, ne sont pas des chemins qu’on
peut réaliser en concaténant des arêtes d’un graphe. Par exemple, un chemin même très
régulier peut tout à fait avoir un complémentaire dans M constitué d’une infinité de
composantes connexes. D’autre part, et c’est un autre aspect du même problème, l’ordre
partiel naturel sur l’ensemble des graphes n’a pas la propriété requise pour appliquer un
théorème analogue au théorème de Kolmogorov. L’ordre partiel est le suivant.
1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS
33
Définition 1.2.13 On dit qu’un graphe G2 est plus fin qu’un graphe G1 si E1 ⊂ P(G2 )
ou, ce qui revient au même, si P(G1 ) ⊂ P(G2 ).
L’ensemble de tous les graphes ainsi partiellement ordonné n’est pas filtrant à droite,
ce qui signifie qu’étant donné deux graphes, il n’en existe pas toujours un troisième qui
soit simultanément plus fin que les deux premiers.
On résout ces deux problèmes en restreignant temporairement la classe de chemins
qu’on considère sur M . On souhaite considérer des chemins qui, comme les chemins affines par morceaux ou analytiques réels sur R2 par exemple, aient une propriété de rigidité
qui empêche deux d’entre eux de s’intersecter de façon pathologique. La seule structure
différentiable sur M ne permet pas de définir une telle classe. Il faut donc enrichir la
structure de M en gardant à l’esprit que l’objet final doit être indépendant de cet enrichisement. Nous choisissons de munir M d’une structure riemannienne, que nous choisissons
de telle sorte que le volume riemannien coïncide avec la mesure d’aire. On appelle alors
A(M ) l’ensemble des chemins géodésiques par morceaux sur M , ou Aγ (M ) si l’on veut
faire explicitement référence à une métrique riemannienne donnée γ. Etant donné deux
graphes G1 et G2 tels que G2 soit plus fin que G1 , on dispose d’une application de restriction M(P(G2 ), G) → M(P(G1 ), G) induite par l’inclusion P(G1 ) ⊂ P(G2 ).
Le résultat fondamental de la théorie est le résultat d’invariance par subdivision suivant. Il est démontré dans [L7], principalement à la proposition 4.3.4.
Proposition 1.2.14 1. Soient G1 et G2 deux graphes tels que G2 soit plus fin que G1 .
2
Alors l’application de restriction M(P(G2 ), G) → M(P(G1 ), G) envoie la mesure DFX,G
M,vol
1
sur la mesure DFX,G
M,vol .
2. Soit γ une métrique riemannienne sur M . La famille des espaces de probabilités
n
o
M(P(G), G), I, DFX,G
:
G
graphe
géodésique
par
morceaux
M,vol
est une famille cohérente. On peut en prendre la limite projective et obtenir un espace de
probabilités (M(Aγ (M ), G), I, DFX
M,vol ), de telle sorte que la loi marginale du processus
canonique sur cet espace associée à un graphe à arêtes géodésiques par morceaux G soit
la mesure DFX,G
M,vol .
C’est dans la preuve de cette propriété que la propriété de semi-groupe des lois unidimensionnelles de X joue son rôle. Illustrons cela sur un exemple. Considérons les deux
graphes représentés à la figure 1.11. Le graphe G1 est obtenu à partir de G2 en retirant
l’arête e. Dans G2 , cette arête est commune au bords de deux faces F1 et F2 , l’une bordée
par le lacet e1 e2 e, l’autre par e−1 e3 e4 . Ces deux faces sont réunies dans G1 pour former
une seule face F , bordée par le lacet e1 e2 e3 e4 .
Soit f : M(P(G1 ), G) → R une fonction. Elle induit une fonction f˜ : M(P(G2 ), G) →
R, telle que la valeur f˜(h) de f˜ sur une fonction multiplicative
h ne dépende pas de la
R
1
valeur de h(e). L’invariance par subdivision signifie que M(P(G1 ),G) f (h) DFX,G
M,vol (dh) =
R
f˜(h) DFX,G2 (dh). Si nous choisissons une orientation de G2 (ce que nous avons
M(P(G2 ),G)
M,vol
partiellement fait sur la figure), nous pouvons voir l’intégrale de gauche comme une inté+
+
grale sur GE1 et celle de droite comme une intégrale sur GE2 . Il y a donc une variable en
34
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
e1
e4
F2
e
F1
e4
e3
e3
e1
e2
F
e2
G2
G1
Figure 1.11 – Enlever une arête à un graphe est l’opération élémentaire la plus importante qui permet
de passer d’un graphe plus fin à un graphe moins fin.
plus dans l’intégrale de droite, qui correspond à l’arête e. Or précisément la fonction f˜ ne
2
dépend pas de cette variable. Seule la densité de DFX,G
M,vol en dépend, par le biais des deux
termes associés
R aux deux faces bordées par e : il y a dans l’intégrale de droite un terme
de la forme . . . Qvol(F1 ) (h(e)h(e2 )h(e1 ))Qvol(F2 ) (h(e4 )h(e3 )h(e)−1 ) . . . d(h(e1 )) ce qui, en
renommant x1 , x2 , x3 , x4 , x les variables h(e1 ), h(e2 ), h(e3 ), h(e4 ), h(e) et en tenant compte
de l’invariance par conjugaison de Q, se réécrit plus suggestivement
Z
. . . Qvol(F1 ) (x2 x1 x)Qvol(F2 ) (x−1 x4 x3 ) . . . dx.
La propriété de semi-groupe de convolution de Q permet d’intégrer par rapport à x pour
faire apparaître le terme Qvol(F1 )+vol(F2 ) (x2 x1 x4 x3 ) = Qvol(F ) (x4 x3 x2 x1 ), qui est exactement
2
le terme correspondant à F dans la densité de DFX,G
M,vol .
Une fois l’invariance par subdivision établie, on peut appliquer un théorème de Kolmogorov, dans une version qui n’est pas tout à fait classique du fait de la taille de l’espace
des indices, mais pour laquelle la compacité de G fait plus que compenser cette petite
difficulté et permet même une preuve légèrement plus simple que celle de la version la
plus fréquente adaptée à des processus réels indexés par le temps.
1.2.8
Extension aux lacets rectifiables
Nous disposons maintenant, au prix d’un supplément artificiel de struture sur M ,
d’un processus à valeurs dans G indexé par les lacets géodésiques par morceaux. Pour
passer des lacets géodésiques par morceaux aux lacets rectifiables, nous allons procéder
par approximation, ce pour quoi il faut commencer par munir P(M ) d’une topologie
convenable.
ENCART 5 – Topologie sur l’espace des chemins
La donnée d’une métrique riemannienne sur M en fait un espace métrique (M, d) et permet de mesurer les
longueurs des chemins rectifiables. Nous noterons `(c) la longueur du chemin c. Nous définissons une distance
sur P(M ) en posant, pour tous chemins c, c0 paramétrés à vitesse constante par [0, 1],
d` (c, c0 ) = max{d(c(t), c0 (t)) : t ∈ [0, 1]} + |`(c) − `(c0 )|.
1.2. PROCESSUS MULTIPLICATIFS INDEXÉS PAR DES CHEMINS
35
La topologie de l’espace métrique (P(M ), d` ) ne dépend pas de la métrique riemannienne qu’on a choisie sur
M . Cette distance est assez facile à manier, mais elle a l’inconvénient que l’espace (P(M ), d` ) n’est jamais
complet. En effet, il est facile de construire une suite de chemins de longueur 2 qui converge uniformément
(mais en faisant des zigzag) vers un segment géodésique de longueur 1.
En fait, il existe une autre distance sur P(M ), complète et qui métrise la même topologie que d` . Il s’agit
d’une variante de la distance en 1-variation qui sur R2 par exemple s’écrit
Z 1
|ċ(t) − ċ0 (t)| dt.
d1 (c, c0 ) = max{d(c(t), c0 (t)) : t ∈ [0, 1]} +
0
Cette distance est toutefois beaucoup moins pratique à manier que la distance d` et elle nous intéresse surtout
dans la mesure où elle métrise la topologie que nous considérons de façon complète.
La plupart du temps, à cause de l’invariance par transformations de jauge, nous considérerons des convergences à extrémités fixées : nous dirons qu’une suite (cn )n≥0 de chemins converge vers un chemin c à extrémités
fixées si d` (cn , c) tend vers 0 et si pour tout n ≥ 0, le chemin cn a les mêmes extrémités que c.
L’ensemble A(M ) des chemins géodésiques par morceaux est bien entendu dense dans P(M ) pour la
convergence à extrémités fixées.
Pour définir une mesure sur M(P(M ), G), il nous faut donc deux choses : une propriété de régularité de la mesure DFX
M,vol sur M(A(M ), G) et un théorème d’extension.
Commençons par la première. Rappelons que dG est la distance riemannienne sur G pour
une métrique bi-invariante.
Proposition 1.2.15 Considérons la mesure DFX
M,vol sur M(A(M ), G). Il existe K > 0
tel que pour tout lacet simple l ∈ A(M ) bordant un disque D et tel que `(l) < K −1 , on ait
Z
p
dG (1, h(l)) DFX
(dh)
≤
K
vol(D).
M,vol
M(A(M ),G)
Cette propriété, qui exprime que l’holonomie le long du bord d’un petit disque est
proche de l’élément neutre, ne peut venir que d’une propriété analogue du processus de
Lévy X.
Proposition 1.2.16 ([Lia04, Lemma 3.5]) Soit X = (Xt )t≥0 un processus de Lévy
issu de l’élément neutre sur G. Il existe une constante K telle que
√
∀t ≥ 0, E[dG (1, Xt )] ≤ K t.
Pour utiliser cette propriété de régularité de DFX
M,vol , nous allons considérer le groupe
Γ de toutes les variables aléatoires à valeurs dans G définies sur l’espace de probabilités
(M(A(M ), G), DFX
M,vol ). Ce groupe est muni d’une distance δ définie par la formule
∀S, T ∈ Γ, δ(S, T ) = E[dG (S, T )].
La paire (Γ, δ) est un groupe topologique métrique complet sur lequel les propriétés d’invariance de dG entraînent que les translations et l’inversion sont des isométries.
Nous allons considérer le processus canonique sur (M(A(M ), G), DFX
M,vol ) comme une
fonction multiplicative de A(M ) dans Γ : à chaque chemin c est associée la variable
36
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
aléatoire Hc définie par Hc (h) = h(c). La propriété de régularité énoncée à la proposition
1.2.15 peut se réécrire
p
δ(1, Hl ) ≤ K vol(D).
Nous appliquons alors le théorème suivant.
Théorème 1.2.17 ([L7, Theorem 3.3.1]) Soit M une surface munie d’une métrique
riemannienne dont on note vol le volume riemannien. Soit (Γ, δ) un groupe métrique complet sur lequel les translations et l’inversion sont des isométries. Soit H ∈ M(A(M ), Γ)
une fonction multiplicative. Supposons qu’il existe K > 0 telle que pour tout lacet simple
−1
l ∈
p A(M ) bordant un disque D et tel que `(l) < K , on ait l’inégalité δ(1, H(l)) ≤
K vol(D).
Alors H admet une unique extension, toujours notée H, appartenant à M(P(M ), Γ)
telle que pour toute suite (cn )n≥0 de chemins convergeant à extrémités fixées vers un chemin c, on ait convergence de H(cn ) vers H(c).
La fonction multiplicative H : P(M ) → Γ détermine, à rebours de ce que nous avons
fait quelques lignes plus haut, une mesure de probabilités sur M(P(M ), G), que nous notons HFX
M,vol . Le théorème suivant, dont la preuve est malheureusement assez peu agréable,
garantit que nous avons atteint notre but.
Théorème 1.2.18 ([L7, Proposition 3.4.1]) La mesure HFX
M,vol ne dépend pas du choix
de la métrique riemannienne sur M . De plus, pour tout graphe G sur M , dont les arêtes
ne sont pas nécessairement géodésiques par morceaux pour quelque métrique que ce soit,
X
la loi marginale de HFX
M,vol associée à P(G) est la mesure DFM,vol .
ENCART 6 – L’inégalité de Banchoff-Pohl [BP72, Vog81]
Nous allons donner une autre application du théorème 1.2.17, dans un cadre plus habituel. Plaçons-nous dans
R2 et rappelons que nous avons défini, pour tout lacet continu l : [0, 1] → R2 , la fonction nl hors de l’image
de l (voir l’équation (1.1)). Considérons la métrique euclidienne usuelle sur R2 et notons A(R2 ) l’ensemble
des chemins affines par morceaux. Si le lacet l est affine par morceaux, son complémentaire n’a qu’un nombre
fini de composantes connexes et la fonction nl , localement constante, ne prend qu’un nombre fini de valeurs.
Elle est donc bornée et à support compact, et donc en particulier de carré intégrable.
À tout chemin c affine par morceaux, associons le lacet obtenu en concaténant à c des segments qui
relient l’origine de R2 à chacune de ses extrémités et notons par abus nc la fonction associée à ce lacet. Avec
cette notation et au vu de la remarque précédente, on vérifie immédiatement que l’application c 7→ nc est une
fonction multiplicative (ou plutôt, en l’occurence, additive)
n : A(R2 ) → L2 (R2 ).
p
Si l est un lacet simple qui borde un disque D, on a l’égalité knl kL2 = aire(D).
Pour être tout à fait dans le cadre d’application du théorème, il nous faudrait nous restreindre à un disque
compact du plan, mais nous prendrons ce disque suffisamment grand pour ne pas avoir à nous en préoccuper.
Nous pouvons donc affirmer que la fonction c 7→ nc se prolonge en une fonction continue de P(R2 ) dans
L2 (R2 ).
En particulier, nous en déduisons que pour tout lacet rectifiable l, la fonction nl est de carré intégrable.
De plus, elle dépend continûment (au sens de L2 ) du lacet l (au sens de la convergence pour la distance d`
ou la distance en 1-variation).
1.3. CHAMPS D’HOLONOMIE MARKOVIENS
37
Le fait que nl soit de carré intégrable pour tout lacet rectifiable est connu, et quantifié par l’inégalité de
Banchoff-Pohl, qui généralise l’inégalité isopérimétrique usuelle en affiramant que
knl k2L2 ≤
1.3
1.3.1
1
`(l)2 .
4π
(1.7)
Champs d’holonomie markoviens
Définition
La construction qui aboutit à la définition de la mesure HFX
M,vol se place exclusivement
sur une surface, avec éventuellement un jeu de conditions au bord fixées dès le départ. Pour
passer à la définition des champs d’holonomie markoviens, il ne nous manque plus qu’une
petite étape où nous allons considérer simultanément toutes les surfaces possibles et les
opérations de découpage et de recollement. Pour donner une définition précise, il nous
faut donc donner un cadre un peu plus formel aux conditions au bord et au recollement
de deux surfaces.
Lorsqu’on recolle deux surfaces le long de deux composantes de leur bord, le long
desquelles on avait imposé des conditions compatibles, on obtient une surface plus grande
mais sur laquelle reste, comme une cicatrice de cette opération, une courbe le long de
laquelle le champ est contraint. Ceci nous amène à définir une surface marquée.
Définition 1.3.1 Une surface marquée est une paire (M, C ), où M est une surface et où
C est un ensemble fini de sous-variétés lisses de dimension 1 deux à deux disjointes de
l’intérieur de M . Les éléments de C sont orientés et on suppose que chaque élément de
C apparaît dans C avec les deux orientations possibles.
Figure 1.12 – Une surface marquée par trois courbes.
On note B(M ) l’ensemble des composantes connexes du bord de M , chacune prise avec
les deux orientations possibles. On note Conj(G) l’ensemble des classes de conjugaison de
G. Notons que l’inverse d’une classe de conjugaison est encore une classe de conjugaison.
Définition 1.3.2 On appelle ensemble de G-contraintes sur (M, C ) une application C :
C ∪ B(M ) → Conj(G) telle que pour tout N ∈ C ∪ B(M ), et avec la notation N −1 pour
la même courbe orientée dans l’autre sens, on ait C(N −1 ) = C(N )−1 .
38
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
Soit (M, C ) une surface marquée et soit l ∈ C une marque. On note Spll (M ) la
surface, non nécessairement connexe, obtenue en coupant M le long de l. Cette surface est naturellement munie d’une application de recollement ψ : Spll (M ) → M . Les
marques de M autres que l (resp. une mesure d’aire sur M , resp. un ensemble de Gcontraintes sur (M, C )) déterminent des marques sur Spll (M ), notées Spll (C ) (resp. une
mesure d’aire notée Spll (vol) sur Spll (M ), un ensemble de G-contraintes noté Spll (C) sur
(Spll (M ), Spll (C ))).
Soit (M, C , C) une surface marquée munie d’un ensemble de G-contraintes, soit l ∈ C
une marque et soit x un élément de G. On note Cl→x l’ensemble de G-contraintes qui
coïncide avec C sur toutes les marques sauf l et l−1 et tel que C(l) soit la classe de
conjugaison de x.
Nous pouvons enfin donner la définition principale.
Définition 1.3.3 (Champ d’holonomie markovien. [L7, Definition 3.1.2])
Soit G un groupe de Lie compact. Un champ bidimensionnel markovien d’holonomie à
valeurs dans G est la donnée, pour chaque quadruplet (M, vol, C , C) formé d’une surface
marquée munie d’une mesure d’aire et d’un ensemble de G-contraintes, d’une mesure finie
HFM,vol,C ,C sur (M(P(M ), G), I), de telle sorte que les sept propriétés suivantes soient
vérifiées.
A1 . Pour tout (M, vol, C , C), on a HFM,vol,C ,C (∃l ∈ C ∪ B(M ) : h(l) ∈
/ C(l)) = 0.
A2 . Pour tout (M, vol, C ) et pour tout évènement Γ ∈ I, la mesure HFM,vol,C ,C (Γ) est
une fonction mesurable de C.
A3 . Pour tout (M, vol, C , C) et pour tout l ∈ C , on a
Z
HFM,vol,C ,Cl→x dx.
HFM,vol,C \{l,l−1 },C|B(M )∪C \{l,l−1 } =
G
A4 . Si ψ : (M, vol, C , C) → (M 0 , vol0 , C 0 , C 0 ) est un difféomorphisme qui préserve
toutes les structures que nous considérons, alors l’application induite ψ : M(P(M 0 ), G) →
M(P(M ), G) vérifie
HFM,vol,C ,C = HFM 0 ,vol0 ,C 0 ,C 0 ◦ ψ −1 .
A5 . Pour tous (M1 , vol1 , C1 , C1 ) et (M2 , vol2 , C2 , C2 ), on a
HFM1 ∪M2 ,vol1 ∪vol2 ,C1 ∪C2 ,C1 ∪C2 = HFM1 ,vol1 ,C1 ,C1 ⊗ HFM2 ,vol2 ,C2 ,C2 .
A6 . Pour tout (M, vol, C , C) et tout l ∈ C , notant ψ : Spll (M ) → M l’application de
recollement, on a
HFSpll (M ),Spll (vol),Spll (C ),Spll (C) = HFM,vol,C ,C ◦ ψ −1 .
A7 . Pour tout (M, vol, ∅, C) et tout l ∈ B(M ), on a
Z
HFM,vol,∅,Cl→x (1) dx = 1.
G
1.3. CHAMPS D’HOLONOMIE MARKOVIENS
39
Les axiomes A1 , A2 et A3 concernent les conditions au bord : ils garantissent que les
mesures HFM,vol,C ,C , lorsque les marques et les contraintes varient, sont bien des désintégrations les unes des autres au sens où on s’attend qu’elles le soient.
L’axiome A4 assure que la mesure HFM,vol,C ,C ne dépend pas de plus de structure que
ce que nous avons considéré. Rappelons qu’un théorème classique de Moser assure que si
deux surfaces difféomorphes munies de mesures d’aire ont même aire totale, alors il existe
un difféomorphisme de l’une sur l’autre qui préserve les aires. On peut raffiner ce résultat
en présence de marques (voir la proposition 1.4.3 dans [L7]).
L’axiome A5 concerne les réunions disjointes de surfaces et permet de se restreindre
au cas de surfaces connexes.
L’axiome A6 est la propriété de Markov proprement dite. Il englobe toutes les situations
possibles eu égard à la connexité et à l’orientabilité de la surface qu’on obtient en coupant
M le long de l. Nous mentionnons l’orientabilité car il peut arriver qu’une surface nonorientable devienne orientable lorsqu’on la coupe le long d’une courbe, par exemple un
ruban de Möbius le long d’un équateur.
Enfin l’axiome A7 est un axiome de normalisation. Sans lui, étant donné un champ
HF, nous pourrions pour tout α réel non nul définir un autre champ eαvol(M ) HFM,vol,C ,C .
1.3.2
Existence et classification partielle
Nous allons maintenant énoncer nos deux résultats principaux qui sont un résultat
d’existence et un résultat de classification. L’ordre naturel pour énoncer et prouver ces
résultats est de commencer par le résultat de classification.
Il est très important de se souvenir que les mesures HFM,vol,C ,C sont des mesures finies
et non pas des mesures de probabilité. Les noyaux de transition, dont nous avons déjà
longuement parlé, ne sont autres que les masses de ces mesures.
Définition 1.3.4 Soit HF un champ d’holonomie markovien. Soient p, g des entiers naturels et t un réel strictement positif. Soient x1 , . . . , xp des éléments de G. Soit M une
surface orientée de genre réduit g dont le bord a p composantes connexes. Soit vol une
mesure d’aire sur M d’aire totale t. Soit enfin C l’ensemble de conditions au bord qui aux
composantes de M orientées positivement et arbitrairement ordonnées associe les classes
de conjugaison de x1 , . . . , xp . On définit alors
+
Zp,g,t
(x1 , . . . , xp ) = HFM,vol,∅,C (1).
Supposons maintenant g ≥ 1. Soit M 0 une surface non-orientable de genre réduit g dont le
bord a p composantes connexes. Soit vol une mesure d’aire sur M d’aire totale t. Soit enfin
C l’ensemble de conditions au bord qui aux composantes de M arbitrairement orientées et
ordonnées associe les classes de conjugaison de x1 , . . . , xp . On définit alors
−
Zp,g,t
(x1 , . . . , xp ) = HFM 0 ,vol,∅,C (1).
Les fonctions ainsi définies s’appellent les fonctions de partition du champ d’holonomie.
On démontre que ces fonctions satisfont la première partie de la proposition 1.1.7 :
elles sont toutes déterminées par les fonctions associées au disque et à la sphère à trois
trous.
40
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
L’axiome A7 garantit que chaque fonction de partition est, par rapport à chacune de
ses variables et pour toute valeur des autres, la densité d’une mesure de probabilités sur
+
G. En particulier, la famille de mesures (Z1,0,t
(x) dx)t>0 est une famille à un paramètre de
mesures de probabilités sur G. Pour l’étudier, et plus généralement pour étudier les champs
d’holonomie que nous venons de définir, il est nécessaire de faire quelques hypothèses de
régularité.
Définition 1.3.5 Soit HF un champ d’holonomie markovien. On dit que HF est régulier
si les deux conditions suivantes sont vérifiées.
1. Pour tout (M, vol, C , C), et pour toute suite (cn )n≥0 de chemins sur M qui converge
à extrémités fixées vers c, on a
Z
dG (h(cn ), h(c)) HFM,vol,C ,C (dh) −→ 0.
M(P(M ),G)
n→∞
2. Pour tout (M, vol, C ), la fonction (t, C) 7→ HFM,tvol,C ,C (1) est continue.
Pour un champ d’holonomie régulier, la deuxième partie de la proposition 1.1.7 est
+
vraie : toutes les fonctions de partition sont déterminées par les Z1,0,t
. Le théorème suivant
éclaire leur structure et classifie en partie les champs d’holonomie aléatoires.
Théorème 1.3.6 ([L7, Proposition 4.2.1]) Soit HF un champ d’holonomie markovien
+
régulier. Alors les mesures de probabilités (Z1,0,t
(x) dx)t>0 sur G sont les lois marginales
unidimensionnelles d’un processus de Lévy invariant par conjugaison issu de l’élément
neutre. Ce processus de Lévy, qui est dit associé à HF, en détermine toutes les fonctions
de partition. Il est admissible au sens de la définition 1.2.4.
Il est tentant de penser que ce processus de Lévy détermine tout le champ d’holonomie,
mais, sauf quand le groupe G est abélien, cela ne semble pas facile à démontrer. En
revanche, la construction que nous avons détaillée dans les sections précédentes permet
d’établir le théorème d’existence suivant.
Théorème 1.3.7 ([L7, Theorem 4.3.1]) Tout processus de Lévy admissible sur un groupe
de Lie compact est associé à un champ d’holonomie markovien régulier.
Ce théorème, sans doute le plus important de tout ce chapitre, est l’aboutissement de
mes travaux visant à améliorer et à généraliser la construction de la mesure de Yang-Mills.
Sa preuve occupe l’essentiel de la monographie [L7].
1.3.3
Le champ de Yang-Mills
Parmi tous les processus de Lévy admissibles sur un groupe de Lie connexe, le mouvement brownien joue un rôle particulier. Le champ d’holonomie qu’on construit en partant
du mouvement brownien a un nom : c’est le champ de Yang-Mills. C’est le premier à
avoir été construit et c’est celui qui est utilisé par les physiciens dans la théorie quantique
des champs. Nous reviendrons sur ce champ particulier dans le chapitre suivant, où nous
1.3. CHAMPS D’HOLONOMIE MARKOVIENS
41
examinerons, sous la forme d’un principe de grandes déviations, les liens entre l’objet que
nous avons construit et les expressions que les physiciens manipulent avec tant de succès.
Dans cette section, nous donnons une description simple de ce champ, analogue à celle
du processus de Poisson indexé par les lacets (voir section 1.1.1), lorsque le groupe G est
abélien, c’est-à-dire, puisque nous supposons G compact et connexe, lorsque G = U (1)n
pour un certain n ≥ 0. Ce cas a été le premier compris et les premiers travaux pour
des groupes plus généraux ont procédé en se ramenant à une situation analogue au cas
abélien. Par souci de simplicité, nous nous restreignons dans ce qui suit au cas n = 1.
Plaçons-nous pour commencer dans le plan R2 . Soit W un bruit blanc sur R2 , c’està-dire une isométrie de L2 (R2 ) dans un espace de variables aléatoires réelles gaussiennes
centrées. De façon équivalente, W est le processus gaussien indexé par L2 (R2 ) dont la
fonction de covariance est donnée par le produit scalaire L2 . Nous notons W (f ) la variable
gaussienne associée à une fonction f de carré intégrable sur R2 .
Par analogie avec la définition 1.1.1, nous associons à chaque lacet l la variable aléatoire
Bl = eiW (nl ) .
(1.8)
Cette définition n’a de sens que si la fonction nl est de carré intégrable. Nous avons discuté
ce point plus haut et indiqué que l’inégalité de Banchoff-Pohl nous le garantissait lorsque
le lacet l est de longueur finie (voir l’équation (1.7) et la discussion qui précède).
2
Si nous nous restreignons à un disque D contenu dans
R R , la famille de variables
(Bl )l∈L(D) ainsi définie a la loi de (Hl )l∈L(D) sous la mesure U (1) HFD,vol,∅,∂D7→x dx, où HF
est le champ d’holonomie associé au mouvement brownien que l’on intègre ici par rapport
à la condition au bord. Notons que, d’après l’axiome A7 , cette mesure est bien une mesure
de probabilités.
Pour pouvoir mettre une condition au bord spécifique sur le disque D, introduisons
une variante de la fonction nl en posant
Z
1
0
nl = nl −
nl dvol,
vol(D) D
c’est-à-dire en retirant sa moyenne à nl . Si nous définissons, pour tout lacet rectifiable l
0
dans D, Bl0 = eiW (nl ) , nous obtenons un processus indexé par L(D) qui ressemble au pro0
cessus B et qui vérifie B∂D
= 1 presque sûrement. Toutefois, la loi de (Bl0 )l∈L(D) n’est pas
+
égale à celle du processus canonique sous la mesure normalisée Z1,0,vol(D)
(1)−1 HFD,vol,∅,∂D7→1 .
Pour nous en rendre compte, recommençons dans le contexte présent la construction du
processus (Nlt )t≥0 que nous avions faite pour le processus de Poisson (voir la proposition
1.1.3). Supposons pour fixer les idées que D soit le disque de rayon √1π centré en l’ori√
gine et appelons, pour tout t ∈ [0, 1], lt le cercle centré en l’origine de rayon √πt . Alors
la fonction n0lt vaut 1 − t dans le disque bordé par lt et −t à l’extérieur. On en déduit
immédiatement que pour tous s, t ∈ [0, 1],
hn0ls , n0lt iL2 (D,vol) = min(s, t) − st.
Ainsi, le processus réel (W (n0lt ))t∈[0,1] est un pont brownien de 0 à 0 de longueur 1, et
le processus (Bl0t )t∈[0,1] est l’exponentielle de (i fois) ce pont. Or ce processus n’est pas
42
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
markovien. En effet, ses trajectoires sont toutes homotopiquement triviales dans le cercle
U (1) : c’est le pont de 1 à 1 de longueur 1 du mouvement brownien sur U (1) conditionné
par le fait que ses trajectoires sont homotopes au lacet constant. Ce conditionnement n’est
pas singulier, mais détruit la propriété de Markov.
Le pont de longueur 1 du mouvement brownien sur U (1) est l’exponentielle du mouvement brownien sur R conditionné non pas à revenir en 0, mais à aboutir en un point de
2πZ. Sa valeur finale est alors une certaine variable aléatoire T dont la loi est donnée par
∀k ∈ Z, P(T = 2kπ) ∝ e−2k
2 π2
.
(1.9)
Une meilleure définition consiste alors à prendre une variable aléatoire TR dont la loi est
1
n dvol, puis
celle décrite ci-desus, indépendante du bruit blanc W , à poser n̄l = vol(D)
D l
(1)
Bl
= ei(W (nl )+n̄l T ) .
0
Le processus B (1) ainsi défini a bien la loi du processus canonique sous la mesure normalisée
+
Z1,0,vol(D)
(1)−1 HFD,vol,∅,∂D7→1 .
Pour définir le champ sur des surfaces plus générales que le disque, il faut parvenir à y
étendre la définition de la fonction n0l et du nombre n̄l . Une telle extension est possible au
prix de certains choix. Soit M une surface orientée de genre réduit g. Notons N1 , . . . , Np
les composantes connexes de son bord, orientées positivement. Soit C1 , . . . , Cg une famille
de courbes lisses orientées sur M (il suffit qu’elles soient rectifiables) qui déterminent une
base du premier groupe d’homologie de la surface obtenue en fermant M , c’est-à-dire en
recollant un disque le long de chaque composante du bord de M . Alors les classes de
N1 , . . . , Np , C1 , . . . , Cg engendrent H 1 (M, Z) avec la relation [N1 ] + . . . + [Np ] = 0. Soit
mainenant l un lacet sur M . Sa classe d’homologie se décompose de façon unique sous la
forme
g
p−1
X
X
[l] =
ζi [Ci ] +
νj [Nj ],
i=1
j=1
où les ζi et les νj sont des entiers. Le cycle
⊥
l =l−
g
X
i=1
ζi Ci −
p−1
X
νj Nj
j=1
est donc homologue à 0. Il existe alors une unique fonction de moyenne nulle sur M
localement constante sur le complémentaire de l’image de l⊥ qui varie de 1 ou −1 à
chaque traversée de l⊥ , suivant l’orientation de l et de la surface. Cette description n’est
bien entendu valide que si l est suffisamment régulier mais nous n’entrerons pas dans
le détail technique de la définition. Nous noterons n0l⊥ cette fonction. Les valeurs qu’elle
prend sont toutes égales modulo 1 et nous notons −n̄l la classe de R/Z correspondante.
On vérifie aisément que cette notation est cohérente avec le cas du disque étudié plus
haut.
Nous pouvons maintenant définir un processus indexé par les lacets sur une surface
quelconque. Nous utilisons les notations du paragraphe ci-dessus.
1.3. CHAMPS D’HOLONOMIE MARKOVIENS
43
Définition 1.3.8 Soit (M, vol, ∅, C) une surface mesurée avec des conditions au bord.
Notons x1 , . . . , xp les conditions au bord le long de N1 , . . . , Np . Posons x = x1 . . . xp . Soit
W un bruit blanc sur (M, vol), c’est-à-dire une isométrie de L2 (M, vol) dans un espace
gaussien réel. Soit T une variable aléatoire à valeurs dans {t ∈ R : eit = x}, indépendante
de W et dont la loi est donnée par
t2
∀t ∈ R, eit = x, P(T = t) ∝ e− 2vol(M ) .
Soient U1 , . . . , Ug des variables i.i.d. de loi uniforme sur U (1), indépendantes de W et T .
Pour tout lacet l ∈ L(M ), nous posons
(x1 ,...,xp )
Bl
0
= eiW (nl⊥ ) ein̄l T U1ζ1 . . . Ugζg xν11 . . . xνpp .
(1.10)
Théorème 1.3.9 ([L2, Theorem 3.2]) Le processus B (x1 ,...,xp ) ainsi défini a la loi du
+
−1
processus canonique sous la mesure normalisée Zp,g,vol(M
) (x1 , . . . , xp ) HFM,vol,∅,C .
Dans le cas abélien, la structure du champ d’holonomie associé au mouvement brownien est donc celle d’un bruit blanc auquel s’ajoute un aléa fini-dimensionnel. Il est par
exemple possible de reconstruire un bruit blanc à partir du champ d’holonomie aléatoire.
Ceci indique, incidemment, que la mesure d’aire est entièrement codée dans le champ
d’holonomie.
Nous discuterons dans le chapitre suivant l’intérêt et la signification de la définition
(1.10) lorsqu’on y substitue à la variable T une valeur déterministe t telle que eit = x.
1.3.4
Lien avec les théories topologiques des champs quantiques
Nous avons présenté la définition des champs d’holonomie aléatoire (définition 1.3.3)
comme une généralisation de la définition des processus de Markov usuels, indexés par
des intervalles de temps. Dans cette section, nous allons détailler une autre analogie,
entre cette définition et celle d’une théorie topologique des champs quantiques (abrégée
en TQFT, pour topological quantum field theory), due à M. Atiyah.
ENCART 7 – Théories topologiques des champs quantiques [Ati88]
Soit n ≥ 0 un entier. Il existe une catégorie, notée Cobn , dont les objets sont les variétés différentiables compactes orientées sans bord de dimension n et dont les morphismes sont donnés par les cobordismes : si N1
et N2 sont deux variétés orientées de dimension n, Hom(N1 , N2 ) est l’ensemble des variétés orientées de
dimension n + 1 dont le bord est muni d’un difféomorphisme avec la réunion disjointe de N1∗ et N2 , où on
a noté N1∗ la variété obtenue à partir de N1 en renversant l’orientation. Par ailleurs, il existe une catégorie,
beaucoup plus familière, notée Vect, dont les objets sont les espaces vectoriels complexes de dimension finie
et dont les morphismes sont les applications linéaires.
Une TQFT de dimension n + 1 est un foncteur covariant de Cobn dans Vect, qu’on note en général
Z pour rappeler que cette définition a été initialement donnée comme un cadre général pour les fonctions
de partition de certaines théories quantiques ou statistiques des champs. Ainsi, par définition, Z associe à
toute variété N de dimension n un espace vectoriel Z(N ) et à toute variété M de dimension n + 1 munie
d’un difféomorphisme entre son bord et la réunion disjointe N1∗ t N2 de deux variétés de dimension n, une
application linéaire Z(M ) : Z(N1 ) → Z(N2 ).
Ce foncteur doit de plus satisfaire un certain nombre de propriétés naturelles.
1. Il doit être multiplicatif : si N1 et N2 sont deux variétés de dimension n, on demande que Z(N1 tN2 ) =
44
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
n=0
n=1
Figure 1.13 – Deux exemples de cobordismes, en dimensions n + 1 = 1 et n + 1 = 2.
Z(N1 ) ⊗ Z(N2 ) (le produit tensoriel des espaces vectoriels) et, pour tous M1 et M2 de dimension n + 1, que
Z(M1 t M2 ) = Z(M1 ) ⊗ Z(M2 ) (le produit tensoriel des applications linéaires).
2. Il doit également être involutif : pour toute variété N de dimension n, on demande que Z(N ∗ ) = Z(N )∗
(l’espace vectoriel dual), et pour toute variété M de dimension n, que Z(M ∗ ) = Z(M )∗ (l’application linéaire
adjointe).
3. Il doit également se comporter de façon naturelle vis-à-vis des compositions de cobordismes : si M1
réalise un cobordisme entre N1 et N2 , et M2 un cobordisme entre N2 et N3 , et si M est obtenue en recollant
M1 et M2 le long de N2 , alors on demande que Z(M ) = Z(M2 ) ◦ Z(M1 ).
M1
M2
Z(M1 )
Z(M2 )
Z(S 1 )⊗4 −→ Z(S 1 )⊗5 −→ Z(S 1 )⊗2
Figure 1.14 – Composition de deux cobordismes en dimension 2.
On peut reformuler cet axiome de façon plus générale en changeant très légèrement de point de vue. En
identifiant l’espace des applications linéaires de Z(N1 ) dans Z(N2 ) avec Z(N1 )∗ ⊗ Z(N2 ) = Z(N1∗ t N2 ), on
peut dire que l’application linéaire Z(M ) est un élément de l’espace vectoriel Z(∂M ). Alors on demande que
la propriété suivante soit vérifiée.
3’. Si le bord de M s’écrit N1 t N1∗ t N2 et si M 0 est obtenue à partir de M en recollant les deux copies
de N1 , on ait Z(M 0 ) = κ(Z(M )), où κ : Z(N1 )∗ ⊗ Z(N1 ) ⊗ Z(N2 ) → Z(N2 ) est la contraction naturelle
des deux premiers facteurs.
4. Enfin, on demande que Z se comporte bien vis-à-vis des difféomorphismes préservant l’orientation des
variétés de dimension n et n + 1, c’est-à-dire qu’à des variétés de dimension n difféomorphes soient associés
des espaces vectoriels isomorphes et à des cobordismes difféomorphes soient associées des applications linéaires
conjuguées par les isomorphismes linéaires associés aux difféomorphismes induits sur les bords.
1.3. CHAMPS D’HOLONOMIE MARKOVIENS
45
N1
N2
N1∗
M
N2
M0
Figure 1.15 – Recollement de deux composantes du bord d’une surface.
La condition de multiplicativité impose par exemple que si ∅ désigne la variété vide de dimension n, on
ait Z(∅) = Z(∅) ⊗ Z(∅). Ainsi, Z(∅) est soit l’espace vectoriel nul soit l’espace vectoriel C. On supposera,
pour éviter des situations triviales que Z(∅) = C. Alors, pour toute variété M de dimension n + 1 sans bord,
Z(M ) est une application linéaire de C dans lui-même, c’est-à-dire un nombre complexe.
Si N est une variété de dimension n, Z(N × [0, 1]) est un endomorphisme de Z(N ). Puisque le cylindre
N × [0, 1] est difféomorphe à deux copies du même cylindre mises bout à bout et recollées, on a
Z(N × [0, 1]) = Z(N × [0, 2]) = Z(N × [0, 1]) ◦ Z(N × [0, 1]).
Ainsi, Z(N × [0, 1]) est un projecteur de Z(N ) et on ne restreint pas la généralité en supposant que ce projecteur est l’identité. Alors, en recollant les deux bouts et en utilisant la propriété 30 , on trouve que Z(N × S 1 ),
où S 1 est le cercle, est la contraction naturelle de Z(N × [0, 1]), l’identité de Z(N ) vue comme élément de
Z(N )∗ ⊗ Z(N ), c’est-à-dire la trace de cette application linéaire, c’est-à-dire encore la dimension de Z(N ).
Dans le cadre qui nous intéresse, il faut modifier légèrement la définition d’une TQFT
pour y incorporer la notion de volume, ou d’aire puisque nous nous intéresserons au cas
n + 1 = 2. On remplacera donc partout les variétés orientées de dimension n + 1 par des
variétés munies d’une mesure de n + 1-volume, dont le seul invariant à difféomorphisme
près est, d’après un théorème de Moser, le volume total. Nous ne modifions donc que
les objets de la catégorie Cobn . Les axiomes 1 à 4 sont inchangés. L’objet qu’on obtient
s’appelle une théorie topologique des champs quantiques dépendant du volume (disons :
une v-TQFT). Pour M de dimension n + 1, nous noterons Zt (M ) l’élément de Z(∂M )
associé à M lorsqu’elle est munie d’une mesure de n + 1-volume de volume total égal à t.
Examinons ce que peut être une v-TQFT de dimension 1. Choisissons-en donc une,
notée Z. Il n’y a qu’une variété connexe de dimension 0, c’est le point que nous notons pt et
qui peut avoir deux orientations, notées + et −. Il n’y a donc qu’un espace vectoriel en jeu,
qui est Z(pt+ ) et que nous notons V . Il n’y a ensuite que deux variétés connexes orientées
de dimension 1, l’intervalle et le cercle. Il est pratique de représenter les intervalles comme
des intervalles de R munis de leur longueur naturelle. Alors, pour tous s < t réels, Z([s, t])
est un endomorphisme de V , qui ne dépend que de t − s et que nous notons Pt−s . De plus,
l’axiome 3 permet d’affirmer que pour tous s < t < u, on a Z([s, u]) = Z([t, u]) ◦ Z([s, t]),
si bien que (Pt )t>0 est un semi-groupe d’endomorphismes de V . Enfin, le raisonnement fait
à la fin de la description générale des TQFT s’applique à pt × [0, t] et permet d’affirmer
que, pour tout t > 0, Zt (S 1 ) = Tr(Pt ).
Finalement, une v-TQFT de dimension 1 est la donnée d’un semi-groupe d’endomorphismes d’un espace vectoriel. Notons que contrairement au cas purement topologique,
46
CHAPITRE 1. CHAMPS D’HOLONOMIE MARKOVIENS [L2, L3, L7]
rien ici n’impose que V soit de dimension finie. Si nous nous plaçons par exemple dans
un cadre hilbertien, il suffit que Pt soit un opérateur à trace pour tout t > 0.
Un processus de Markov usuel, indexé par des intervalles de temps, donne lieu, pourvu
qu’il soit assez régulier, par le biais de ses noyaux de transition, à une v-TQFT de dimension 1. Prenons par exemple un processus de Lévy X admissible sur un groupe de
Lie compact G, et dont nous notons Qt (x) la densité. Définissons Z(pt) comme l’espace
L2 (G)G des fonctions sur G de carré intégrable et invariantes par conjugaison. Alors pour
tous s < t, nous pouvons définir Z([s, t]) comme la fonction (x, y) 7→ Qt−s (x−1 y) qu’on
peut voir soit comme le noyau intégral d’une application linéaire de L2 (G)G dans lui2
même, soit comme un élément de L2 (G2 )G ' L2 (G)G ⊗ L2 (G)G .
Notre définition des champs d’holonomie markoviens contient la définition d’une vTQFT de dimension 2, qui est donnée par les masses des mesures finies HFM,vol,∅,C , de
la façon suivante. Ici encore, il n’y a qu’une variété orientée de dimension 1 sans bord,
à savoir le cercle S 1 , si bien qu’il n’y a qu’un espace vectoriel en jeu, Z(S 1 ), que nous
prenons égal à L2 (G)G . Notons que cet espace est de dimension finie si et seulement si G
est fini. Alors la masse de la mesure associée à une surface M , vue comme fonction des
conditions au bord, est un élément de la puissance tensorielle de L2 (G)G correspondant
au nombre de composantes connexes du bord de M . Autrement dit, pour tous p,
g ≥ 0 et
+
2
p Gp
2
G ⊗p
tout t > 0, nous pouvons voir Zp,g,t comme un élément de L (G ) ' L (G)
. Nous
pouvons donc énoncer le résultat suivant.
Proposition 1.3.10 Soit G un groupe de Lie compact. Soit HF un champ d’holonomie
+
markovien à valeurs dans G. Soient (Zp,g,t
)p,g≥0,t>0 les fonctions de partition de HF associées à des surfaces orientées. Posons Z(S 1 ) = L2 (G)G , l’espace des fonctions de carré
intégrable invariantes par conjugaison sur G. Pour toute surface mesurée M d’aire totale
+
t, de genre réduit g et telle que ∂M ait p composantes connexes, posons Z(M ) = Zp,g,t
.
Alors le foncteur Z est une v-TQFT de dimension 2.
Chapitre 2
Champs d’holonomie, revêtements et
connexions
Dans ce deuxième chapitre, nous allons décrire plusieurs structures géométriques qui
donnent lieu à des fonctions multiplicatives de l’ensemble des lacets sur une surface à
valeurs dans un groupe. Dans deux situations bien distinctes, nous allons montrer qu’on
peut relier certains des processus construits au chapitre précédent à des versions aléatoires
de ces structures géométriques.
2.1
Groupes finis et revêtements ramifiés [L7, Chapitre 5]
Dans cette section, nous allons montrer que lorsque le groupe G est fini, le champ
d’holonomie markovien associé par le théorème 1.3.7 à une marche aléatoire sur G peut
être réalisé explicitement à l’aide de revêtements ramifiés aléatoires de la surface sur
laquelle on travaille. La présentation de ce résultat sera aussi pour nous l’occasion de
comprendre dans une situation simple comment les champs d’holonomie aléatoire sont
liés à des notions de relèvement horizontal et de transport parallèle.
2.1.1
Groupe fondamenal et revêtements
Nous allons commencer par chercher les structures géométriques les plus simples possibles qui donnent lieu à des fonctions multiplicatives de l’ensemble des lacets sur une
surface, à valeurs dans un groupe quelconque.
Soit donc M une surface, sur laquelle nous fixons un point m. Chaque lacet l ∈ Lm (M )
a une classe d’homotopie, qui est un élément du groupe fondamental π1 (M, m). L’application l 7→ [l] qui à un lacet associe sa classe d’homotopie est une fonction multiplicative
Lm (M ) → π1 (M, m), qui nous est donnée par la seule structure topologique de M . Nous
allons commencer par réinterpréter cette fonction d’une façon apparemment bien compliquée mais qui va nous permettre de comprendre de nombreuses fonctions multiplicatives.
f → M un revêtement universel de M . Choisissons m̃ ∈ π −1 (m). Le choix
Soit π : M
f, de la façon suivante. Soit [l] une
de m̃ détermine une action du groupe π1 (M, m) sur M
classe d’homotopie de lacets basés en m, représentée par un lacet l. Soit ˜l le relèvement
47
48
CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS
de l issu de m̃ et soit ñ l’extrémité finale de ˜l, qui ne dépend pas du choix de l dans [l]. Il
f → M (c’est-à-dire un unique
existe alors un unique automorphisme du revêtement π : M
f tel que π ◦ h = π) qui envoie m̃ sur ñ. Cet automorphisme de
homéomorphisme h de M
revêtement est celui qu’on associe à l’élément [l] de π1 (M, m).
f → M ) et un groupe (ici π1 (M, m))
Nous avons donc un revêtement de M (ici π : M
qui agit simplement et transitivement sur les fibres de ce revêtement, ce qui signifie que
pour toute paire de points d’une même fibre, il existe un élément et un seul du groupe
qui envoie le premier sur le second. Nous avons de plus un point base sur M (ici m) et
un élément du revêtement au-dessus de ce point base (ici m̃). Pour chaque lacet l sur
M basé en m, nous pouvons relever l en partant de m̃, déterminer le point final ñ de
ce relèvement et associer au lacet l l’unique élément du groupe qui envoie m̃ sur ñ. Ici,
tautologiquement, cet élément est la classe d’homotopie de l.
Pour comprendre ce que nous avons gagné avec cette formulation obscure, donnonsnous un groupe G, par exemple un groupe fini, et un homomorphisme de groupes ρ :
π1 (M, m) → G. Alors nous pouvons former la fonction multiplicative l 7→ ρ([l]) de Lm (M )
dans G. Cette fonction multiplicative s’interprète de la même façon que la précédente,
comme nous allons le voir maintenant. Quitte à restreindre G, nous supposerons que ρ
est surjectif. La théorie des revêtements garantit qu’au noyau de l’homomorphisme ρ, qui
est un sous-groupe distingué de π1 (M, m), est associé un revêtement E → M dont le
groupe des automorphismes s’identifie au quotient de π1 (M, m) par le noyau de ρ, qui à
son tour s’identifie à G. Une façon de construire le revêtement E est de le réaliser comme
f ×π (M,m) G, qui est le quotient du produit cartésien M
f × G par la
le produit fibré M
1
f, tout g ∈ G et tout γ ∈ π1 (M, m), identifie
relation d’équivalence qui pour tout x̃ ∈ M
−1
(x̃, g) et (x̃ · γ, ρ(γ )g).
Cette façon de construire E montre que G agit à droite sur E, simplement et transitivement sur les fibres : il suffit de poser (x̃, g) · g 0 = (x̃, gg 0 ). Le revêtement E est donc un
G-fibré principal.
Définition 2.1.1 Soit G un groupe fini. On appelle G-fibré principal au-dessus de M un
revêtement π : E → M muni d’une action à droite de G sur E, qui est libre et transitive
sur les fibres.
La construction que nous avons déjà fait deux fois est la suivante.
Proposition 2.1.2 Soit G un groupe fini. Soit π : E → M un G-fibré principal. Soit m
un point de M . Soit e un point de E tel que π(e) = m. Soit l un lacet sur M basé en
m. Soit ˜l le relèvement de l issu de e. L’unique élément de G qui envoie e sur l’extrémité
finale de ˜l s’appelle indifféremment la monodromie ou l’holonomie de l. La fonction de
Lm (M ) dans G qui à un lacet associe sa monodromie est multiplicative.
Cette proposition est l’exemple fondamental, et le plus simple, de la façon dont nous
allons interpréter des fonctions multiplicatives en termes géométriques. Elle n’est toutefois
pas une source très riche de fonctions multiplicatives. D’une part, les seuls groupes G pour
lesquels on peut faire une construction non-triviale sont ceux qui sont isomorphes à des
quotients du groupe fondamendal de M . D’autre part, l’image d’un lacet ne dépend que
2.1. GROUPES FINIS ET REVÊTEMENTS RAMIFIÉS [L7, CHAPITRE 5]
49
de sa classe d’homotopie dans M . Si M est simplement connexe, par exemple un disque
ou une sphère, nous ne pouvons construire que la fonction multiplicative identiquement
égale à l’élément neutre. Si le groupe fondamental de M est abélien, par exemple si M
est un tore ou un plan projectif, G doit être abélien. Dans le cas du plan projectif, ce ne
peut même qu’être Z/2Z.
2.1.2
Revêtements ramifiés aléatoires
Pour enrichir cette construction, nous allons nous autoriser à percer M , c’est-à-dire à
lui enlever un nombre fini de points. Cela va permettre de résoudre les deux difficultés
d’un coup. En effet, le groupe fondamental d’une surface privée d’un nombre fini non nul
de points est toujours un groupe libre, et le fait d’enlever des points permet de distinguer
homotopiquement des lacets qui sont homotopes dans M . Le seul inconvénient est que
nous ne pouvons plus considérer les lacets qui passent par les points que nous avons
enlevés. Cependant, l’ensemble de points qu’on enlève est voué à devenir aléatoire, et un
lacet donné ne le rencontrera qu’avec probabilité nulle.
Définition 2.1.3 Un G-fibré principal ramifié sur M avec lieu de ramification Y , où Y
est une partie finie de l’intérieur de M , est un revêtement π : R → M \ Y muni d’une
action à droite de G sur R, qui est libre et transitive sur les fibres.
La structure d’un revêtement ramifié au voisinage d’un point de ramification est simple.
Si y est un point de Y , il existe un voisinage V de y tel que la restriction de π à chaque
composante connexe de π −1 (V \ {y}) soit conjuguée topologiquement à l’application z 7→
z n de C∗ dans lui-même, pour un certain entier n ≥ 1 (voir figure 2.1). En particulier, il
est possible d’ajouter un nombre fini de points à R pour en faire une surface lisse, de telle
sorte que tous les points ajoutés soient envoyés sur Y par π. L’application π : R → M
ainsi obtenue s’appelle un revêtement ramifié.
1
i
−i
0
−1
1
z 7→ z 2
−1
0
1
Figure 2.1 – L’application z 7→ z 2 est le revêtement ramifié le plus simple de C par lui-même.
50
CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS
La classe de conjugaison de la monodromie le long d’un petit cercle autour d’un point
de ramification y ne dépend pas de la façon dont on la calcule. On l’appelle la monodromie
locale en y et on la note O(R, y). On réservera l’appellation de point de ramification à
des points où la monodromie locale n’est pas l’élément neutre.
Soit π : R → M un revêtement ramifié. Soit N une composante connexe du bord
de M . La restriction de π à π −1 (N ) est un G-fibré principal au-dessus de N , sans point
singulier puisque nous avons supposé tous les points de ramification intérieurs à M . Sa
structure est complètement déterminée par la monodromie le long de N . En fait, seule la
classe de conjugaison de cette monodromie est bien définie si on ne choisit pas un point
base sur N et un point dans la fibre au-dessus de ce point base.
Nous allons regrouper les G-fibrés ramifiés selon leur lieu de ramification et leur structure au bord. Nous considérons en fait des classes d’isomorphismes de G-fibrés, où un
isomorphisme entre π : R → M et π 0 : R0 → M est un difféomorphisme ψ : R → R0 qui
entrelace les actions de G sur R et R0 et qui est tel que π 0 ◦ ψ = π.
Définition 2.1.4 Soit M une surface. Soit C : B(M ) → Conj(G) un ensemble de Gcontraintes sur le bord de M (voir définition 1.3.2). Soit Y une partie finie de l’intérieur
de M . On note R(M, Y, C) l’ensemble des classes d’isomorphisme de G-fibrés ramifiés sur
M avec lieu de ramification Y et conditions au bord données par C. On note R(M, C) la
réunion des R(M, Y, C) lorsque Y décrit l’ensemble des parties finies de l’intérieur de M .
Nous noterons O1 , . . . , Op les p classes de conjugaison de G associées par C aux p
composantes connexes du bord de M .
Nous allons maintenant définir une mesure de probabilités sur R(M, C). Commençons
par choisir un processus de Lévy admissible X sur G, caractérisé par sa mesure de sauts
Π, qui est une mesure sur G \ {1}. La définition de la mesure se fait alors en trois étapes.
1. Soit R un revêtement ramifié avec lieu de ramification Y . On appelle poids de R le
réel positif ou nul suivant :
Π(R) =
Y Π(O(R, y))
.
#O(R, y)
y∈Y
C’est donc le produit sur les points de ramification de la masse attribuée par Π à
un élément quelconque de la classe de conjugaison qu’est la monodromie locale en
ce point.
2. On définit maintenant une mesure finie RBX
M,Y,C sur R(M, Y, C) en posant
RBX
M,Y,C =
#G1−g
#O1 . . . #Op
X
R∈R(M,Y,C)
Π(R)
δR .
#Aut(R)
C’est essentiellement la mesure uniforme sur l’ensemble fini R(M, Y, C), à ceci près
que, comme parfois en combinatoire, les objets sont pondérés selon leur nombre
d’automorphismes.
2.2. CHAMP D’HOLONOMIE BROWNIEN ET CONNEXIONS ALÉATOIRES [L4, LN5] 51
3. Notons F(M ) l’ensemble des parties finies de M , muni d’une topologie naturelle. On
considère alors sur F(M ) la measure de probabilités Ξ qui est la distribution d’un
processus ponctuel de Poisson d’intensité vol. On définit une mesure finie RBX
M,vol,C
sur R(M, C) en posant
Z
X
RBX
RBM,vol,C =
M,Y,C Ξ(dY ).
F(M )
Notons que pour certaines parties Y ⊂ M , l’ensemble R(M, Y, C) peut être vide.
C’est par exemple le cas si M n’a pas de bord et G = Z/2Z : si Y est de cardinal impair,
R(M, Y, C) est vide alors que si Y est de cardinal pair, R(M, Y, C) contient un seul élément, qui admet deux automorphismes, l’identité et l’échange des feuillets. Dans ce cas
donc, le lieu de ramification d’un revêtement tiré sous la mesure RBX
M,vol,C n’est pas exactement un processus ponctuel de Poisson, mais une variante de ce processus conditionné
à avoir un nombre pair de points. Dans tous les cas, la loi du lieu de ramification de ce
revêtement aléatoire est absolument continue par rapport à Ξ.
Soient l1 , . . . , ln des lacets sur M basés au même point m. Avec Ξ-probabilité égale
à 1, l’ensemble Y ne rencontre aucune des images de ces lacets. Soit f : Gn → R une
fonction continue invariante par l’action diagonale de G par conjugaison. Si nous tirons un
G-fibré ramifié au hasard selon la mesure RBX
M,vol,C normalisée, et si nous y choisissons un
point de référence dans la fibre au-dessus de m, nous pouvons calculer les monodromies
h(l1 ), . . . , h(ln ) de chacun des lacets l1 , . . . , ln . Si nous changeons de point de référence,
chaque monodromie est conjuguée par le même élément de G. Ainsi, f (h(l1 ), . . . , h(ln )) est
bien défini indépendamment du choix d’un point de référence. Vu la définition de la tribu
I (voir la définition 1.2.8), ceci rend plausible le fait que la mesure RBX
M,vol,C détermine
X
une mesure finie sur (M(P(M ), G), I), que nous noterons MFM,vol,C . Le résultat principal
est alors le suivant.
X
Théorème 2.1.5 ([L7, Théorème 5.4.2]) Les mesure finies HFX
M,vol,∅,C et MFM,vol,C ,
définies sur l’espace (M(P(M ), G), I), sont égales.
Nous avons donc atteint notre but et réalisé le champ d’holonomie aléatoire markovien
associé à une marche aléatoire sur un groupe fini comme le champ de monodromie aléatoire
d’un revêtement ramifié aléatoire d’une surface.
2.2
Champ d’holonomie brownien et connexions aléatoires [L4,
LN5]
Nous allons maintenant essayer d’interpréter certains champs d’holonomie à valeurs
dans des groupes continus en termes de structures géométriques analogues à celles que
nous venons de décrire. Malheureusement, les objets géométriques sont un peu plus compliqués et il n’y a pas de résultat aussi satisfaisant que le théorème 2.1.5 dans ce cas.
Nous allons nous intéresser uniquement au champ associé au mouvement brownien sur
un groupe de Lie compact et connexe. Pour ce champ, nous allons écrire un principe
de grandes déviations qui relie le processus stochastique que nous avons construit à une
fonctionnelle d’énergie de nature géométrique, l’action de Yang-Mills.
52
2.2.1
CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS
Une 1-forme différentielle aléatoire
Commençons par examiner le cas où le groupe G est abélien. Soit M une surface.
Lorsque le groupe G est abélien, disons G = U (1), il y a une façon naturelle de produire
des fonctions multiplicatives des lacets, qui est de
R choisir une 1-forme différentielle α sur
M et d’associer à chaque lacet l l’élément exp i l α de U (1). Nous allons montrer que le
mouvement brownien sur U (1) indexé par les lacets sur un disque, que nous avons décrit
à la section 1.3.3 et défini par l’équation (1.8), peut être compris heuristiquement comme
l’exponentielle de l’intégrale d’une 1-forme différentielle aléatoire.
Plaçons nous sur le plan ou sur un disque, considérons un lacet l et traitons, sans
aucun souci de rigueur, le bruit blanc W comme s’il s’agissait
d’une fonction aléatoire,
R
de telle sorte qu’on puisse écrire par exemple W (nl ) = R2 nl (x)W (x) dx. Nous voulons
écrire cette dernière intégrale comme l’intégrale d’une 1-forme le long de l. Tout d’abord,
définissons, pour chaque x = (x1 , x2 ) ∈ R2 , la 1-forme dθx sur R2 \ {x} en posant
∀y = (y1 , y2 ) ∈ R2 , dθx (y) =
(y2 − x2 )dy1 − (y1 − x1 )dy2
.
(y1 − x1 )2 + (y2 − x2 )2
Le nombre de tours effectué par l autour du point x peut être évalué au moyen de la
forme dθx , par la formule
Z
1
dθx .
nl (x) =
2π l
1
Introduisons la fonction G(x, y) = − 2π
log d(x, y), où d est la distance euclidienne. Cette
fonction est définie hors de la diagonale sur R2 × R2 et elle est le noyau de l’inverse
du laplacien.
R Cela signifie que si pour toute fonction lisse ψ à support 2compact on pose
Gψ(x) = R2 G(x, y)ψ(y) dy, alors on a, pour toute fonction lisse ϕ : R → R à support
compact, G∆ϕ = ϕ.
Pour tout x, appelons Gx la fonction G(x, ·) sur R2 \x. La différentielle de cette fonction
Gx ressemble beaucoup à dθx . En fait, on a
1
dθx = ∗dGx ,
2π
où l’opérateur de Hodge ∗ est défini par ∗(a dy1 +b dy2 ) = −b dy1 +a dy2 , si bien que pour
toute forme différentielle α et tout vecteur X, on a (∗α)(X) = α(J −1 X), où J désigne la
rotation d’angle π2 .
En combinant formellement toutes ces observations, on trouve
Z
W (nl ) =
nl (x)W (x) dx
2
R
Z Z
=
∗dGx W (x) dx
2
R
l
Z
Z
= ∗dy
G(x, y)W (x) dx
2
l
R
Z
= ∗d(GW ).
l
2.2. CHAMP D’HOLONOMIE BROWNIEN ET CONNEXIONS ALÉATOIRES [L4, LN5] 53
On a donc défini heuristiquement une 1-forme aléatoire en prenant un bruit blanc, en lui
appliquant l’inverse du laplacien, en prenant la différentielle totale de la fonction obtenue,
puis en lui appliquant l’opérateur de Hodge. L’exponentielle de l’intégrale de cette 1-forme
donne le mouvement brownien indexé par des lacets.
Puisque nous l’intégrons le long de lacets, cette 1-forme peut être arbitrairement modifiée par l’ajout d’une 1-forme exacte. Ceci correspond à l’invariance des quantités observables sous l’action du groupe de jauge. Nous allons maintenant décrire le bon objet
géométrique qui, sans l’hypothèse que G est abélien, permet de définir des fonctions multiplicatives des lacets.
2.2.2
Connexions
Commençons par définir l’objet qui joue le rôle du revêtement ramifié dans la cas d’un
groupe continu.
Définition 2.2.1 Soit M une surface. Soit G un groupe de Lie compact. Un G-fibré
principal sur M est une variété différentielle P munie d’une application différentiable
π : P → M et d’une action libre de G à droite, notée (p, g) 7→ pg, telle que π induise un
difféomorphisme du quotient P/G sur M .
Ainsi, P est la réunion disjointe des fibres π −1 (m) où m parcourt M et, pour chaque
m, le groupe G agit librement et transitivement sur π −1 (m). Cette définition est donc très
proche de la définition que nous avons donnée dans le cas fini. Toutefois, alors que dans
le cas fini, la variété que nous avons notée E puis R, l’espace total du fibré, était une
surface, dans le cas présent, c’est une variété dont la dimension est la somme de celles de
M et de G.
Définition 2.2.2 Soient π : P → M et π 0 : P 0 → M deux G-fibrés principaux sur M .
Un isomorphisme de P sur P 0 est un difféomorphisme ϕ : P → P 0 tel que π 0 ◦ ϕ = π et
qui commute aux actions de G sur P et P 0 , c’est-à-dire tel que pour tout p ∈ P et tout
g ∈ G, on ait ϕ(p · g) = ϕ(p) · g.
Le groupe des automorphismes d’un fibré π : P → M s’appelle le groupe de jauge de
ce fibré. On le note J (P ), ou simplement J .
L’exemple fondamental de G-fibré principal sur M est le produit cartésien M × G, sur
lequel G agit selon la relation (m, h) · g = (m, hg). Le groupe de jauge de M × G, au lieu
d’être fini comme dans le cas des fibrés ramifiés, est maintenant un groupe énorme, qui
s’identifie naturellement avec le groupe des applications C ∞ de M dans G. Si j : M → G
est une telle application, elle agit sur P selon la formule j · (m, g) = (m, j(m)g).
La structure locale d’un fibré principal est toujours celle d’un produit cartésien : la
restriction de π : P → M à π −1 (U ), où U est un petit ouvert de M , est toujours isomorphe
au fibré trivial U × G → U . Néanmoins, il existe des fibrés dont la structure globale n’est
pas celle d’un produit cartésien, de même que par exemple le revêtement de C∗ par luimême donné par l’application z 7→ z 2 , bien qu’ayant localement la même structure que
C∗ × Z/2Z → C∗ n’en a pas la structure globale.
54
CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS
Une différence fondamentale entre les cas discrets et continu est que, dans un fibré
dont le groupe de structure est continu, il n’y a pas de façon canonique de relever un
chemin dans M en un chemin dans P . Un choix est nécessaire, celui d’une connexion sur
P . Une connexion permet de relever un vecteur tangent à M en un vecteur tangent à P ,
puis, en résolvant une équation différentielle, de relever des chemins différentiables par
morceaux.
Plus précisément, une connexion définit (voir figure 2.2), pour tout m ∈ M et tout
p
p ∈ π −1 (m), une application linéaire injective rm
: Tm M → Tp P , qui d’une part est
un relèvement, au sens où, lorsqu’on la compose par la différentielle de π on retrouve
p
= idTm M ; et qui d’autre part se comporte bien vis-à-vis de l’action de
l’identité : Tp π ◦ rm
G : pour tout g ∈ G, en notant Rg l’action de g à droite sur P et Tp Rg sa différentielle en
R (p)
p
pg
.
= rmg = Tp Rg ◦ rm
p, on a rm
π −1 (m)
pg
P
Tpg P
Tp Rg
pg
rm
p
π
p
rm
Tpg π
Tp P
Tp π
M
m
Tm M
p
Figure 2.2 – Ce dessin illustre les relations de compatibilité entre les applications de relèvement rm
,
l’application π et l’action de G sur P . Les deux sous-espaces grisés de Tp P et Tpg P sont les espaces
horizontaux en p et pg.
2.2. CHAMP D’HOLONOMIE BROWNIEN ET CONNEXIONS ALÉATOIRES [L4, LN5] 55
p
en tout
Pour décrire une connexion, on décrit en général l’image de l’application rm
point de P , qu’on appelle sous-espace horizontal en p. C’est un sous-espace de dimension
égale à la dimension de M dans l’espace tangent à P en p. Or cet espace possède un
supplémentaire canonique, qui est l’espace tangent à la fibre passant par p. On note ce
sous-espace, appelé vertical, TpV P ⊂ Tp P . Il s’identifie canoniquement avec l’algèbre de Lie
g de G par la différentielle en l’identité de l’action de G : chaque vecteur de TpV P s’écrit
de façon unique comme dtd |t=0 petA pour un certain vecteur A de g. On décrit donc un
connexion par la donnée, en chaque point p ∈ P , de la projection sur TpV P parallèlement
au sous-espace horizontal. Avec l’identification TpV P ' g, cette projection devient une
application linéaire Tp P → g, dont le noyau est le sous-espace horizontal.
TpV P = Tp (π −1 (m))
θp : A 7→
d
dt |t=0 p
· etA
g = T1 G
π −1 (m)
g 7→ p · g
p
XH
TpH P
G
1∈G
ω(X) = θp−1 (X V )
XV
X
Figure 2.3 – La 1-forme de connexion est la projection sur l’espace vertical parallèlement à l’espace
horizontal vue comme prenant ses valeurs dans l’algèbre de Lie de G via l’identification, ici notée θp ,
entre cette algèbre de Lie et T V P .
La définition technique est la suivante 1 .
Définition 2.2.3 Soit π : P → M un G-fibré principal sur M . Une connexion sur P est
une 1-forme différentielle ω sur P à valeurs dans g qui satisfait les propriétés suivantes.
1. Pour tout A appartenant à g, tout p ∈ P , on a ω( dtd |t=0 petA ) = A.
2. Pour tout p ∈ P , tout X ∈ Tp P , tout g ∈ G, on a ω(Tp Rg (X)) = ad(g −1 )ω(X) =
g −1 ω(X)g.
On note A(P ), ou simplement A, l’espace des connexions sur P .
Le groupe de jauge J (P ) agit sur l’espace A(P ) des connexions sur P , la transformation de jauge j envoyant la connexion ω sur la connexion j ∗ ω définie par (j ∗ ω)p (X) =
1. Pour de plus amples détails sur les fibrés principaux et les connexions, on pourra consulter le premier volume
du livre de Kobayashi et Nomizu [KN96] et le livre de Morita [Mor01].
56
CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS
ωj(p) (Tp j(X)). L’espace A(P ) est un espace affine de dimension infinie et J (P ) agit par
transformations affines. L’espace quotient A(P )/J (P ) est l’espace des configurations de
la théorie physique qui motive l’étude du champ de Yang-Mills.
Etant donné une connexion ω ∈ A(P ), un chemin c : [0, 1] → M avec c(0) = m et un
point p ∈ π −1 (m), il existe un unique chemin c̃ : [0, 1] → P tel que π(c̃(t)) = c(t) pour tout
˙
t ∈ [0, 1] et ω(c̃(t))
= 0 pour tout t ∈ [0, 1]. Le chemin c̃ s’appelle le relèvement horizontal
de c issu de p (voir figure 2.4). Si c est un lacet, c’est-à-dire si c(1) = c(0), le point c̃(1)
appartient à π −1 (m) et s’écrit donc p · h pour un unique élément h de G. Cet élément h
s’appelle l’holonomie de ω le long de c, calculée en p. On le note holp (ω, c). Les propriétés
d’invariance de la connexion par rapport à l’action de G sur P entraînent que si g est un
élément de G, le relevé horizontal de c issu de p·g aboutit en c̃(1)·g = p·hg = (p·g)·g −1 hg.
Ainsi, on a la relation
holpg (ω, c) = g −1 holp (ω, c)g.
De cette relation découle par exemple que si l1 et l2 sont deux lacets basés en m, et
si l1 l2 désigne leur concaténation, alors holp (ω, l1 l2 ) = holp (ω, l1 )holpholp (ω,l1 ) (ω, l2 ) =
holp (ω, l2 )holp (ω, l1 ). Ceci justifie l’ordre que nous avons choisi dans la définition de la
multiplicativité (définition 1.2.1).
π −1 (m)
p·g
q·g
π −1 (c([0, 1]))
p·g
p
p · hg
q
p
M
˜l
p·h
M
c
l
m
Figure 2.4 – Chaque relèvement horizontal d’un chemin est une courbe intégrale d’un champ de vecteur
défini dans la réunion des fibres au-dessus de l’image du chemin, champ obtenu en prenant tous les relevés
horizontaux des vecteurs vitesse du chemin. Si le chemin est un lacet, on peut comparer le point d’arrivée
d’un relevé horizontal avec son point de départ.
Dans le cas où le groupe G est fini, g = {0}, la seule connexion sur P est la connexion
nulle et la notion de relèvement que nous venons de définir coïncide avec la notion de
relèvement dans un revêtement.
Etant donné un fibré principal π : P → M , un point m de M et un point p ∈
−1
π (m), chaque connexion sur P détermine une fonction multiplicative de Lm (M ) vers G,
la fonction qui à un lacet l associe holp (ω, l). Changer le point de référence p conjugue
2.3. ACTION ET MESURE DE YANG-MILLS
57
cette application par un élément de G.
L’action du groupe de jauge modifie également l’application l 7→ holp (ω, l) en la conjugant par un élément de G qui ne dépend pas de l. Finalement, il existe une application
du quotient A(P )/J (P ) dans le quotient M(Lm (M ), G)/G.
Proposition 2.2.4 Soit π : P → M un G-fibré principal sur M . Alors l’application
A(P )/J (P ) −→ M(Lm (M ), G)/G
induite par l’holonomie est injective.
Une connexion aléatoire devrait donc déterminer un champ d’holonomie aléatoire.
C’est en fait ce point de vue qui a motivé initialement l’étude des processus de la forme
de ceux que nous étudions ici. En effet, la physique théorique fournit, à un niveau très
heuristique, une mesure de probabilités sur les connexions sur un fibré principal, que nous
allons maintenant décrire.
2.3
Action et mesure de Yang-Mills
Soit π : P → M un G-fibré principal sur M . Soit ω une connexion sur P . On lui
associe une 2-forme différentielle sur P , sa courbure, notée Ω et définie par Ω(X, Y ) =
dω(X, Y ) + [ω(X), ω(Y )], où le crochet est le crochet de Lie de g. On peut démontrer
que cette 2-forme s’annule dès que l’un de ses arguments est un vecteur vertical. Il suffit
donc de la comprendre sur les vecteurs horizontaux. On peut montrer que Ω(X, Y ) =
ω([X, Y ]H ), où [X, Y ]H est la composante horizontale du vecteur [X, Y ]. Ainsi, la courbure
de ω est identiquement nulle si et seulement si le crochet de deux champs horizontaux
quelconques est encore horizontal, c’est-à-dire, d’après un théorème de Frobenius, si la
distribution horizontale est intégrable. Lorsque la courbure n’est pas nulle, elle est une
sorte d’holonomie infinitésimale le long de petits lacets. Supposons ainsi que X et Y
soient les relevés horizontaux de deux champs XM et YM sur M tels que [XM , YM ] = 0.
Choisissons m ∈ M puis p ∈ π −1 (m). Si lε est un petit lacet carré basé en m dont deux
côtés opposés suivent le flot de XM pendant un temps ε et les deux autres côtés suivent
le flot de YM pendant un temps ε, alors l’holonomie de ω le long de lε calculée en p est
égale à exp(ε2 Ωp (X, Y ) + o(ε2 )).
Nous allons maintenant définir l’action d’une connexion ω comme une sorte de carré
de norme L2 de sa courbure. La surface M est munie d’une mesure de surface notée vol.
Pour simplifier, nous nous plaçons dans le cas où M est orientable et où vol peut être
identifiée à une 2-forme volume sur M . Soit alors ω une connexion. La courbure de ω,
comme toute 2-forme sur P qui s’annule dès qu’un de ses arguments est vertical, peut
s’écrire sous la forme Ω = Kπ ∗ vol, où K : P → g est une fonction. La courbure d’une
connexion hérite de celle-ci une propriété d’équivariance qui garantit que pour tout p ∈ P
et tout g ∈ G, on a K(pg) = ad(g −1 )K(p) = g −1 K(p)g.
L’algèbre de Lie de G est munie d’un produit scalaire invariant par conjugaison, aussi
l’égalité précédente entraîne-t-elle kK(p)k = kK(pg)k. La fonction kKk est donc constante
58
CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS
sur les fibres de P , elle s’identifie donc à une fonction sur M . On pose alors
Z
S(ω) =
kKk2 dvol.
M
R
Cette définition coïncide avec l’écriture plus classique S(ω) = M hΩ ∧ ∗Ωi, dans le cas
particulier de la dimension 2. Une propriété fondamentale de S est qu’elle est invariante
sous l’action du groupe de jauge : deux connexions qui diffèrent par une transformation
de jauge ont la même action de Yang- Mills. L’action de Yang-Mills induit donc une
fonctionnelle sur l’espace quotient
S : A(P )/J (P ) → [0, +∞).
La mesure de Yang-Mills, définie par les physiciens, est la mesure suivante, définie sur
l’espace de toutes les connexions sur un fibré principal donné.
Définition 2.3.1 (Heuristique) Soit M une surface munie d’une mesure d’aire vol.
Soit P un G-fibré principal sur M . On appelle mesure de Yang-Mills sur (M, vol, P ) la
mesure de probabilités YMM,vol,P sur A(P ) caractérisée par l’expression
YMM,vol,P (dω) =
1
ZM,vol,P
1
e− 2 S(ω) Dω.
(2.1)
L’espace A(P ) de toutes les connexions sur un fibré donné P est un espace affine
de dimension infinie et Dω devrait être une mesure invariante par translation sur cette
espace. Comme cet espace est de dimension infinie, donc non localement compact, une
telle mesure ne peut être que très pathologique (ce pourrait par exemple être la mesure
de comptage). La constante ZM,vol,P est par ailleurs une constante de normalisation, qui
dans cette formulation devrait être infinie à cause de l’action du groupe de jauge, qui n’est
pas localement compact non plus et préserve l’action S.
On pourrait espérer résoudre ces problèmes en se plaçant sur le quotient A(P )/J (P ),
dont on pourrait espérer qu’il soit assez petit, mais il est lui aussi non-localement compact.
Il n’y a en fait aucune façon directe de donner un sens à la définition ci-dessus.
Néanmoins, si l’on pense à l’action de Yang-Mills comme au carré de la norme L2 de
la courbure, l’expression (2.1) apparaît analogue à l’expression heuristique d’une mesure
gaussienne en dimension infinie. Ainsi, on pourrait interpréter cette expression en disant
que la mesure de Yang-Mills est la mesure sous laquelle la courbure a la loi d’un bruit
blanc sur (M, vol) à valeurs dans l’algèbre de Lie g. Si l’on se souvient maintenant que la
courbure est une version infinitésimale de l’holonomie le long de petits lacets, il semble
naturel de prendre le champ d’holonomie associé (par le théorème 1.3.7) au mouvement
brownien sur G comme candidat à une définition rigoureuse de la mesure de Yang-Mills.
2.4
2.4.1
Un principe de grandes déviations
Espaces de Sobolev de connexions
Pour donner un fondement rigoureux à la discussion de la section précédente, nous
allons donner un énoncé qui lie le champ d’holonomie markovien associé au mouvement
2.4. UN PRINCIPE DE GRANDES DÉVIATIONS
59
brownien (que nous appellerons champ d’holonomie brownien) et l’action de Yang-Mills.
Cet énoncé prendra la forme d’un principe de grandes déviations. Avant d’entrer dans le
détail de la formulation de ce principe, qui requiert encore quelques explications préliminaires, nous allons rappeler brièvement le théorème qui est le protoype du résultat que
nous énoncerons.
ENCART 8 – Le théorème de Schilder [DZ93]
Soit C00 ([0, 1]) l’espace de Banach des fonctions continues sur [0, 1] à valeurs réelles, nulles en 0, muni de la
norme uniforme. La mesure de Wiener sur cet espace peut être décrite heuristiquement par la formule
Z
1 1 ˙ 2
1
f (t) dt Df.
W(df ) = exp −
Z
2 0
Dans cetteR écriture, un espace de fonctions apparaît, qui est l’espace le plus naturel des fonctions pour
1
lesquelles 0 f˙(t)2 dt < +∞. Cet espace est l’espace de Sobolev W01,2 ([0, 1]) = H01 ([0, 1]) des fonctions L2
sur [0, 1] dont la dérivée au sens des distributions est une fonction L2 et qui sont nulles en 0. Définissons une
fonctionnelle S : C00 ([0, 1]) → [0, +∞] en posant S(f ) = kf˙k2L2 ([0,1]) si f appartient à H 1 et S(f ) = +∞
sinon. Le théorème de Schilder est alors le suivant.
Théorème 2.4.1 (Schilder) Soit A ⊂ C00 ([0, 1]) une partie borélienne. Pour tout λ ∈ R, posons λA = {λf :
f ∈ A}. Alors
1
1
1
1
− inf◦ S ≤ lim log W √ A ≤ lim log W √ A ≤ − inf S.
T
→0
A 2
2
A
T
T
T →0
Ce théorème exprime le fait que la famille des lois de
√
( T Bt )t∈[0,1]
T >0
, où B désigne le processus
canonique sous W, satisfont un principe de grandes déviations de vitesse T et de fonction de taux 12 S lorsque
T tend vers 0.
Rappelons que l’on démontre ce théorème en quatre grandes étapes. On s’occupe tout d’abord des lois
marginales de dimension finie en s’appuyant sur les résultats fondamentaux des grandes déviations comme le
théorème de Cramér. On rassemble ensuite les résultats obtenus pour ces lois fini-dimensionnelles, grâce au
théorème de Dawson-Gärtner, pour obtenir un principe de grandes déviations sur l’espace C00 ([0, 1]) muni de
la topologie de la convergence simple. On obtient, à l’issue de cette étape, la fonction de taux sous la forme
Ŝ(f ) =
sup
0<t1 <...<tn <1
n−1
X
i=0
(f (ti+1 ) − f (ti ))2
.
2(ti+1 − ti )
La troisième étape consiste alors à identifier cette fonction de taux avec celle que nous avons définie plus haut.
On vérifie immédiatement que Ŝ(f ) ≤ S(f ). Il suffit donc de vérifier que Ŝ(f ) < +∞ entraîne f ∈ H01 et
S(f ) ≤ Ŝ(f ). Pour établir ce point, on considère une suite (gn )n≥0 d’interpolations affines par morceaux de
f correspondant à une suite de subdivisions de [0, 1] dont le pas tend vers 0. Alors on connaît explicitement le
carré de la norme H 1 de chaque gn ; il est inférieure à 2Ŝ(f ) qui par hypothèse est fini. La suite (gn )n≥0 est
donc bornée dans H 1 et on peut en extraire une sous-suite faiblement convergente, vers une certaine fonction
h ∈ H 1 , dont le carré de la norme H 1 est inférieur à 2Ŝ(f ). Puisque l’injection H 1 → C 0 est compacte,
cette sous-suite converge uniformément vers h, qui ne peut donc être que f . Ainsi, f appartient à H 1 et
S(f ) ≤ Ŝ(f ). Ceci achève la preuve du fait que Ŝ = S. Enfin, la quatrième et dernière étape consiste à passer
de la topologie produit sur C 0 à la topologie uniforme.
Nous reviendrons sur l’étape analogue à la troisième étape dans la preuve du principe de grandes déviations
pour le champ d’holonomie brownien. Notons simplement que cette étape a fait intervenir deux choses principales : la construction (ici extrêmement simple) d’approximations affines par morceaux de f et une propriété
de compacité.
60
CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS
Pour énoncer un principe de grandes déviations, nous devons définir une fonction
de taux et pour cela, nous devons identifier l’espace des connexions qui joue le rôle de
l’espace H 1 dans le théorème de Schilder. Cet espace est, comme nous l’avons dit, l’espace
des fonctions d’énergie finie. Il nous faut donc identifier un espace naturel de connexions
dont l’action de Yang-Mills est finie. Pour cela, il nous faut mieux comprendre la nature
locale de cette action.
Pour travailler localement dans un fibré principal, on choisit un ouvert U de M , suffisamment petit pour qu’il existe une section locale de P au-dessus de U , c’est-à-dire une
application différentiable σ : U → P telle que π ◦ σ soit l’identité de U . On peut alors
considérer la 1-forme différentielle A = σ ∗ ω sur U et la 2-forme F = σ ∗ Ω, toutes deux
à valeurs dans g. La forme A s’écrit donc, en coordonnées locales (x, y), sous la forme
A = Ax dx + Ay dy, où Ax et Ay sont des fonctions de U dans g. La fonction [Ax , Ay ], où
le crochet est le crochet de Lie de g, c’est-à-dire le commutateur des matrices si G est un
groupe de matrices, est encore une fonction de U dans g et la forme F s’écrit
F = (∂x Ay − ∂y Ax + [Ax , Ay ])dx ∧ dy.
La contribution de l’ouvert U à l’action S(ω) est donc
Z
k∂x Ay − ∂y Ax + [Ax , Ay ]k2 vol(dxdy).
U
Rappelons que vol a une densité lisse et strictement positive par rapport à la mesure
de Lebesgue dans chaque carte. La présence du terme quadratique [Ax , Ay ] dans cette
expression fait que l’espace des connexions d’action finie n’est pas défini de façon aussi
univoque que dans le cas du mouvement brownien. En effet, l’expression [Ax , Ay ] n’a pas
de sens si Ax et Ay sont des distributions, et il n’y a donc pas d’espace canonique de
connexions-distributions dont la courbure soit L2 . Néanmoins, l’action d’une connexion
est finie dès que ses composantes ont des dérivées dans L2 et sont elles-mêmes dans L4 .
Or les théorèmes de Sobolev garantissent que l’espace H 1 (M ) des fonctions L2 sur M
admettant des dérivées L2 est contenu dans Lp (M ) pour tout p ∈ [1, +∞). Notons au
passage que si M était de dimension 3 (resp. 4), on aurait H 1 (M ) ⊂ L6 (M ) (resp. L4 (M )),
ce qui serait encore suffisant pour affirmer que l’action de Yang-Mills d’une connexion H 1
est bien définie.
Nous noterons H 1 A(P ) l’espace des connexions H 1 sur P . L’espace naturel de transformations de jauge qui agit sur cet espace est H 2 J (P ), l’espace des transformations H 2 .
Nous affirmons donc que l’action de Yang-Mills est bien définie et finie sur le quotient
S : H 1 A(P )/H 2 J (P ) → R+ .
(2.2)
Toutefois, contrairement à ce qui se passe dans le cas du théorème de Schilder, la fonctionnelle que nous venons de définir ne peut pas encore être la fonction de taux de notre
principe de grandes déviations, car elle n’est pas définie sur le bon espace. Le champ
d’holonomie brownien n’est pas une connexion aléatoire, mais une holonomie aléatoire. Il
faut donc parvenir à transporter S sur l’espace des fonctions multiplicatives des lacets et
pour cela il faut s’assurer qu’une connexion H 1 a bien une holonomie.
2.4. UN PRINCIPE DE GRANDES DÉVIATIONS
2.4.2
61
Les fonctions de taux
Le problème est qu’une connexion H 1 en deux dimensions est bien moins régulière
qu’une fonction H 1 sur un intervalle. En particulier, alors qu’une fonction H 1 sur [0, 1]
y est continue, une fonction H 1 sur [0, 1]2 ne l’est pas nécessairement et on ne peut pas
l’évaluer en un point particulier. Pour calculer l’holonomie d’une connexion localement
donnée par la forme A le long d’un lacet l : [0, 1] → M , il faut pouvoir résoudre l’équation
différentielle
ḣt = −ht A(l˙t ), h0 = 1,
où h : [0, 1] → G est la fonction inconnue. L’holonomie est alors la valeur de h en 1. Il suffit
donc que la fonction t 7→ A(l˙t ) soit L1 , comme on peut s’en convaincre en écrivant, par
itération, la solution sous forme de série infinie d’intégrales multiples. Fort heureusement,
le long d’une courbe qui est une sous-variété lisse de M , une fonction H 1 admet une trace
1
qui est dans l’espace H 2 de cette courbe, donc en particulier dans L2 , et donc dans L1 .
Notons que cette remarque reste vraie en dimension 3, où la trace est L2 , mais pas en
dimension 4, où la classe de la trace d’une connexion H 1 le long d’une courbe est dans
1
l’espace H − 2 .
Notons P∞ (M ) l’ensemble des chemins sur M qui sont des concaténations de sousvariétés lisses. Le résultat suivant résume la discussion précédente et précise en quel sens
une connexion H 1 est caractérisée par son holonomie.
Proposition 2.4.2 Soit π : P → M un fibré principal. L’application induite par l’holonomie après passage au quotient par transformations de jauge
H 1 A(P )/H 2 J (P ) ,→ M(P∞ (M ), G)/GM
est injective.
Grâce à ce résultat et à l’équation (2.2), nous pouvons maintenant définir une fonctionnelle sur l’espace des fonctions multiplicatives de lacets. Pour éviter de travailler avec
des classes d’équivalence, nous introduisons la notation suivante.
Définition 2.4.3 Soit ω ∈ H 1 A(P ) une connexion sur P . Soit h ∈ M(P∞ (M ), G) une
fonction multiplicative. On dit que ω et h sont liées, et on écrit ω ∼ h si l’image de la
classe de ω par l’injection déterminée par l’holonomie est la classe de h.
La fonction de taux du principe de grandes déviations est alors la suivante.
Définition 2.4.4 Soit M une surface sans bord munie d’une mesure d’aire. Soit P un
G-fibré principal sur M . On définit une fonction IP : M(P∞ (M ), G) → [0, +∞] en posant
1
S(ω) s’il existe ω ∈ H 1 A(P ) tel que ω ∼ f,
∞
2
∀h ∈ M(P (M ), G), IP (h) =
+∞ sinon.
Dans le cas où la surface a un bord, nous voulons pouvoir tenir compte de conditions
au bord. Supposons M donnée et C un ensemble de conditions au bord au sens de la
définition 1.3.2. Nous notons alors H 1 AC (P ) l’espace des connexions H 1 qui respectent
ces conditions au bord.
62
CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS
Définition 2.4.5 Soit M une surface dont le bord est non vide, munie d’une mesure
d’aire et d’un ensemble C de conditions au bord. Soit P un G-fibré principal sur M . On
définit une fonction IP,C : M(P∞ (M ), G) → [0, +∞] en posant
1
S(ω) s’il existe ω ∈ H 1 AC (P ) tel que ω ∼ f,
∞
2
∀h ∈ M(P (M ), G), IP,C (h) =
+∞ sinon.
Il est clair que les fonctions IP et IP,C ne dépendent du fibré P qu’à isomorphisme près.
Nous pouvons donc indexer ces fonctionnelles par les classes d’isomorphismes de G-fibrés
principaux. Expliquons brièvement comment ces fibrés sont classifiés. Puisque nous nous
intéressons au champ markovien associé au mouvement brownien, et que le mouvement
brownien issu de l’élément neutre sur un groupe de Lie ne visite que la composante connexe
de l’élément neutre, nous supposerons dans ce qui suit que G est connexe.
ENCART 9 – Classification des G-fibrés principaux
Soit M une surface et π : P → M un G-fibré principal avec G connexe. Commençons par établir rapidement
le fait que P est trivial, c’est-à-dire isomorphe à M × G, si et seulement s’il existe une application lisse
σ : M → P telle que π ◦ σ soit l’identité de M . Une telle application s’appelle une section globale de P .
Si P est isomorphe à M × G, soit ϕ : P → M × G un isomorphisme. Alors σ(m) = ϕ−1 ((m, 1)) est une
section globale de P . Réciproquement, soit σ : M → P une section globale de P . Pour tout point p de P ,
π(σ(π(p))) = π(p) donc il existe un unique élément de G, que nous noterons γ(p), tel que p = σ(π(p)) · γ(p).
Alors l’application ϕ(p) = (π(p), γ(p)) est un isomorphisme de P sur M × G.
Supposons tout d’abord que le bord de M ne soit pas vide. La surface M contient alors un graphe, ou
si l’on préfère un bouquet de cercles, sur lequel elle se rétracte par déformation. Pour des raisons purement
topologiques, toute section de P au-dessus de ce graphe se prolonge en une section globale de P . Or, comme
G est connexe, sa restriction au graphe admet nécessairement une section. Finalement, P est nécessairement
trivial.
Supposons maintenant que M soit orientable et fermée, c’est-à-dire sans bord. Dans ce cas, il peut exister
des fibrés non-triviaux sur M . Considérons une courbe C sur M qui sépare M en deux surfaces M1 et M2 ,
par exemple le bord d’un petit disque mais pas nécessairement. Les restrictions de P à M1 et M2 admettent
des sections globales, car ce sont des surfaces à bord. Choisissons deux telles sections, une de chaque côté de
C. L’écart entre ces deux sections peut se mesurer le long de C, avec une convention d’orientation adaptée,
et détermine une courbe fermée dans G. On peut, en changeant une des deux sections qu’on a choisies dans
un petit voisinage cylindrique de C, transformer cette courbe dans G en n’importe quelle courbe homotope. Il
s’ensuit aisément que si en faisant avec un autre fibré P 0 ce que nous venons de faire avec P nous obtenons
une courbe fermée dans G homotope à celle obtenue avec P , alors P et P 0 sont isomorphes. Il y a donc au
plus autant de classes d’isomorphisme de fibrés principaux que de classes d’homotopie dans G.
Il est un peu moins évident, mais vrai, qu’en changeant les sections qu’on a choisies, on ne peut pas changer
la classe d’homotopie de l’écart entre les deux sections. Pour justifier cela, on peut dire que deux sections
sur M1 (resp. M2 ) diffèrent par une fonction lisse de M1 (resp. M2 ) dans G. Or toute telle fonction envoie
le bord de M1 (resp. M2 ) sur une courbe homotopiquement triviale dans G. En effet le groupe fondamental
de G est abélien, comme celui de tout groupe topologique. Ainsi, une fonction de M1 dans G étant donnée,
la classe d’homotopie de l’image de C dans G ne dépend que de cette fonction et de l’image de la classe
d’homotopie de C dans le quotient π1 (M1 )/[π1 (M1 ), π1 (M1 )], qui est isomorphe à H1 (M1 , Z). Or C est le
bord de M1 et représente donc la classe d’homologie nulle (on peut d’ailleurs facilement écrire explicitement
sa classe d’homotopie dans π1 (M1 ) comme un produit de commutateurs).
Finalement, la classe d’homotopie de G qu’on obtient en comparant deux sections des restrictions de P
de part et d’autre d’une courbe séparante de M ne dépend pas du choix de ces sections et caractérise P à
isomorphisme près. Il y a donc exactement autant de classes d’isomorphisme de G-fibrés principaux au-dessus
de M que d’éléments dans π1 (G). Si G est semi-simple, ce qui équivaut à dire que son centre est fini, alors
2.4. UN PRINCIPE DE GRANDES DÉVIATIONS
63
ce groupe fondamental est fini. Bien entendu, si G est simplement connexe, tous les G-fibrés principaux sur
des surfaces sont triviaux.
Notons enfin, bien que nous ne nous en servions pas, que sur une surface fermée non- orientable, les
G-fibrés principaux sont classifiés par le quotient de π1 (G) par le sous-groupe formé par les éléments qui sont
des carrés.
Pour finir, donnons quelques exemples de groupes fondamentaux de groupes de Lie connexes. Pour tout
N ≥ 1, le groupe fondamental de U (N ) est Z, la classe d’homotopie d’un lacet t 7→ γt étant donnée par
l’indice de 0 par rapport à la courbe t 7→ det γt dans C∗ . Sur une surface orientable munie d’une métrique
riemannienne, le fibré unitaire tangent est un U (1)-fibré principal dont la classe d’isomorphisme est donnée par
la caractéristique d’Euler de la surface. Pour tout N ≥ 2, le groupe SU (N ) est simplement connexe. Tous les
SU (N )-fibrés principaux sont dont triviaux. En revanche, le centre de SU (N ) est formé des matrices scalaires
racines N -ièmes de l’unité et le groupe fondamental du quotient SU (N )/Z(SU (N )) est isomorphe à Z/N Z.
Notons que le groupe fondamental de U (1)d × SU (n1 )/Z(SU (n1 )) × . . . × SU (nr )/Z(SU (nr )) est isomorphe
à Zd ×Z/n1 Z×. . .×Z/nr Z, si bien que tout groupe abélien de type fini est isomorphe au groupe fondamental
d’un groupe de Lie connexe. Enfin, pour tout N ≥ 3, le groupe fondamental de SO(N ) est Z/2Z. Il y a donc
exactement deux SO(N )-fibrés principaux non-isomorphes au- dessus d’une surface connexe fermée.
Puisque tous les fibrés sur une surface à bord sont triviaux (insistons sur le fait que ceci
ne s’applique pas aux groupes finis, car nous supposons le groupe connexe), la fonctionnelle
IP,C ne dépend pas de P . Nous la noterons simplement IC . Dans le cas d’une surface
orientable sans bord, il y a donc une fonctionnelle IP pour chaque élément de π1 (G).
Nous noterons Iz la fonctionnelle associée à l’élément z ∈ π1 (G).
On peut de plus calculer la classe d’homotopie de G associée à un fibré P en fonction
de l’holonomie déterminée par n’importe quelle connexion sur P . Ceci signifie que les
parties de M(P∞ (M ), G) sur lesquelles deux fonctionnelles Iz et Iz0 sont finies sont égales
si z = z 0 et disjointes sinon.
2.4.3
Le champ d’holonomie brownien et sa désintégration
En cherchant à définir une fonction de taux, nous avons été amenés à en définir plusieurs, correspondant aux différents G-fibrés principaux non-équivalents au-dessus d’une
surface. Or la définition du champ d’holonomie brownien, comme celle de n’importe quel
autre champ markovien d’holonomie, est indépendante du choix d’un fibré principal particulier au-dessus de la surface. Il n’est donc pas vraisemblable que le champ d’holonomie
brownien tel que nous l’avons défini soit l’objet pour lequel nous pourrons énoncer un
principe de grandes déviations.
Il est en fait possible, et nécessaire dans le cas présent, de désintégrer le champ brownien selon les classes d’isomorphismes de fibrés principaux. Avant d’expliquer ce point,
décrivons brièvement le mouvement brownien sur G afin de définir correctement le champ
qui lui est associé.
ENCART 10 – Mouvement brownien sur un groupe de Lie compact connexe
Soit G un groupe de Lie compact et connexe. Soit g son algèbre de Lie. Chaque élément de g peut être
identifié à un opérateur différentiel du premier ordre sur G : pour tout A ∈ g, on définit l’opérateur LA en
64
CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS
posant, pour toute fonction différentiable f : G → R et tout g ∈ G,
(LA f )(g) =
d
f (getA ).
dt |t=0
On suppose maintenant g munie d’une métrique invariante par conjugaison. Considérons (A1 , . . . , Ad ) une
base orthonormée de g. Alors nous définissons le laplacien sur G, qui est un opérateur différentiel du deuxième
ordre, en posant
d
X
∆=
(LA )2 .
i=1
Le mouvement brownien sur G est le processus de Markov dont le générateur est la moitié de ce laplacien,
qui n’est autre que l’opérateur de Laplace-Beltrami associé à la métrique bi-invariante sur G déterminée par
le produit scalaire invariant sur g.
Donnons une autre description de ce mouvement brownien comme solution d’une équation différentielle
stochastique. Nous supposons G donné comme un sous-groupe du groupe unitaire U (N ) et g comme un
sous-espace vectoriel de u(N ), l’espace des matrices anti-hermitiennes.
Soit à nouveau (A1 , . . . , Ad ) une base orthonormée de g. Soit (Bt )t≥0 le mouvement brownien dans g,
c’est-à-dire le processus dont les composantes sur A1 , . . . , Ad sont des mouvements browniens réels standard
indépendants. Posons par ailleurs C = A21 + . . . + A2d . Cette matrice, dite de Casimir, commute à tous les
éléments de G. Par exemple, si G est U (N ) lui-même et si u(N ) est munie du produit scalaire hA, Bi =
Tr(A∗ B), alors C = −N IN . On considère alors l’équation différentielle stochastique linéaire suivante dans
MN (C), écrite avec la notation d’Itô :
1
dXt = Xt dBt + CXt dt, X0 = IN .
2
On vérifie que la solution (Xt )t≥0 de cette équation reste dans G et on l’appelle le mouvement brownien dans
G.
Insistons sur le fait que ce mouvement brownien n’est pas l’exponentielle du mouvement brownien B dans
g. C’en est une exponentielle non-commutative, aussi appelée P -exponentielle (pour path-ordered). On peut
aussi dire que X est obtenu en faisant rouler G sur son algèbre de Lie sans glissement le long de B. Enfin, on
peut écrire, pour tout t,
Bt = lim exp X nt exp(X 2t
− X 2t
) . . . exp(X (n−1)t − X nt
).
n
n
n
n→∞
n
Soit G un groupe de Lie connexe muni d’une métrique bi-invariante. Notons YM le
champ d’holonomie associé au mouvement brownien sur G.
Théorème 2.4.6 Soit (M, vol) une surface sans bord. Il existe une variable aléatoire
o : M(P(M ), G) → π1 (G),
définie sous la mesure YMM,vol , qui mesure en un sens naturel la classe d’isomorphisme
du fibré principal sous-jacent à une fonction multiplicative donnée.
La désintégration de la mesure YMM,vol par rapport à o détermine, pour chaque élément z de π1 (G) P
une mesure finie YMzM,vol sur M(P(M ), G), de telle sorte que
1. YMM,vol = z∈π1 (G) YMzM,vol ,
2. pour tout z ∈ π1 (G), on a YMzM,vol (o 6= z) = 0.
2.4. UN PRINCIPE DE GRANDES DÉVIATIONS
65
Il n’est pas difficile de décrire les masses des mesures finies YMzM,vol , au moins dans le
cas où M est la sphère S 2 . Dans ce cas, la masse de YMM,vol est Qvol(M ) (1), c’est-à-dire la
densité en l’élément neutre de G de la loi au temps vol(M ) du mouvement brownien sur
G issu de l’élément neutre. C’est donc la masse naturelle du pont brownien de longueur
vol(M ) sur G. Si l’on relève ce pont brownien sur un revêtement universel de G, qui
e on trouve un mouvement brownien issu de
est un groupe de Lie que nous noterons G,
l’élément neutre et conditionné à finir au temps vol(M ) en un point de la fibre au-dessus
de l’élément neutre de G. Cette fibre s’identifie canoniquement à π1 (G) et, si nous notons
evol(M ) la densité au temps vol(M ) du mouvement brownien sur G,
e nous pouvons écrire
Q
evol(M ) (z).
que la masse de YMzM,vol est égale à Q
z
La construction des mesures YMM,vol est l’objet de l’article [L4]. On procède par une
méthode d’approximation discrète analogue à celle utilisée pour construire les champs
d’holonomie markoviens. Toutefois, il faut modifier la définition de la théorie discrète
pour prendre en compte le fait que la restriction d’un fibré principal à un graphe tracé
sur une surface est toujours triviale, si bien que cette restriction ignore la topologie de P .
On vérifie à l’issue de cette construction qu’on a une propriété de singularité mutuelle un
peu plus forte.
Proposition 2.4.7 Pour tous T, T 0 > 0 et tous z, z 0 ∈ π1 (G), les mesures YMzM,T vol et
0
YMzM,T 0 vol sont singulières, sauf si (T, z) = (T 0 , z 0 ).
La discussion du revêtement universel de G ci-dessus ressemble fort à la discussion de
la section 1.3.3. En effet, dans le cas sans bord, la variable aléatoire T qui est apparue alors
était bien la même variable que nous avons appelée o. Ainsi, la désintégration donnée par
le théorème 2.4.6 s’obtient explicitement, dans le cas abélien, en remplaçant la variable T
par la valeur déterministe correspondant au type topologique de fibré choisi. Dans ce cadre
abélien, où W , le bruit blanc, jouait le rôle de la courbure, on peut d’ailleurs également
comprendre T comme la courbure totale du fibré qu’on considère, qui, d’après le théorème
de Gauss-Bonnet, est un invariant topologique du fibré.
2.4.4
Le principe de grandes déviations
Nous pouvons maintenant énoncer le résultat rigoureux qui lie les mesures YMzM,vol et
l’action de Yang-Mills. Les deux théorèmes qui suivent sont prouvés dans [LN5].
Théorème 2.4.8 ([LN5, Theorem 4]) Soit (M, vol) une surface fermée munie d’une
mesure d’aire. Soit G un groupe de Lie compact connexe muni d’une métrique riemannienne bi-invariante. Soit z un élément de π1 (G). Alors la famille de mesures de probabilités associée à la famille de mesures finies (YMzM,T vol )T >0 sur l’espace (M(P∞ (M ), G), C )
satisfait un principe de grandes déviations de vitesse T et de fonction de taux Iz .
Théorème 2.4.9 ([LN5, Theorem 3]) Soit (M, vol) une surface dont le bord est non
vide, munie d’une mesure d’aire et d’un ensemble C de conditions au bord. Soit G un
groupe de Lie compact connexe muni d’une métrique riemannienne bi-invariante. Alors la
famille de mesures de probabilités associée à la famille de mesures finies (YMM,T vol,∅,C )T >0
66
CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS
sur l’espace (M(P∞ (M ), G), C ) satisfait un principe de grandes déviations de vitesse T
et de fonction de taux IC .
Le premier théorème signifie, par définition d’un principe de grandes déviations, que
pour toute partie mesurable A ⊂ M(P∞ (M, G)), on a les inégalités
− inf◦ Iz (f ) ≤ lim T log YMzM,T vol (A) ≤ lim T log YMzM,T vol (A) ≤ − inf Iz (f ),
f ∈A
T →0
T →0
(2.3)
f ∈A
où A◦ et A désignent respectivement l’intérieur et l’adhérence de A pour la topologie sur
∞
M(P∞ (M, G) qui est la trace de la topologie produit sur GP (M ) . Par ailleurs, dire que la
fonction Iz est une fonction de taux sous-entend qu’elle est semi-continue inférieurement
pour cette même topologie. Cette topologie est compacte. Les ensembles de niveau de
la fonction Iz sont donc automatiquement compacts : c’est une bonne fonction de taux,
dans le sens technique des grandes déviations. Toutefois, elle l’est de par la pauvreté de
la topologie ambiante et cette précision apporte peu d’informations.
Notons que nous avons énoncé (2.3) avec des mesures finies plutôt que des mesures de
probabilités, mais l’effet de la normalisation de ces mesures est insensible dans l’échelle
où l’on se place ici, puisque YMzM,T vol (1) = O( √1T ).
La preuve de ce théorème suit les grandes étapes de la preuve du théorème de Schilder
(voir plus haut l’encart 8), à ceci près que la quatrième étape est inutile puisque les
deux théorèmes que nous venons d’énoncer utilisent la topologie produit sur l’espace des
fonctions multiplicatives. La première étape se fait en utilisant un résultat classique de
S. Varadhan [Var67a, Var67b] qui détermine la fonctionnelle de grandes déviations pour
le noyau de la chaleur sur G. La deuxième étape utilise le théorème de Dawson-Gärtner
[DZ93], avec une complication due au fait que toutes les marges fini-dimensionnelles des
champs d’holonomies ne sont pas explicitement connues. Il faut donc procéder à des
approximations et vérifier qu’elles sont pertinentes dans l’échelle exponentielle où l’on
se place. La troisième étape en revanche, est beaucoup plus difficile que dans le cas du
théorème de Schilder. L’expression de la fonction de taux que l’on obtient est la suivante :
ˆ
I(h)
= sup
G
X dG (1, h(∂F ))2
F ∈F
2vol(F )
,
ˆ
où le supremum est pris sur l’ensemble des graphes sur M . Le fait que I(h)
soit inférieur
à I(h) lorsque h est, à transformation de jauge près, l’holonomie d’une connexion H 1 , se
déduit d’une inégalité d’énergie initialement due à A. Sengupta [Sen98]. Il faut ensuite
ˆ
considérer un h tel que I(h)
< +∞, montrer qu’il est associé à une connexion H 1 et
que I(h) ≤ Ŝ(h). Pour cela, on prend des graphes sur la surface, et on cherche des
connexions d’énergie minimale qui ont, le long des arêtes de ce graphe, la même valeur
que h. L’existence de telles connexions est établie par le résultat suivant.
e un revêtement universel de G, muni de l’unique métrique riemannienne qui
Notons G
e → G localement isométrique. Rappelons que le
rende l’application de revêtement π : G
groupe fondamental de G s’identifie avec la fibre π −1 (1).
2.4. UN PRINCIPE DE GRANDES DÉVIATIONS
67
Proposition 2.4.10 ([LN5, Proposition 22]) Soit M une surface sans bord. Soit G
un graphe sur M dont les arêtes sont des sous-variétés lisses de M . Soit g un élément de
e tel que pour tout e ∈ E on ait π(g̃(e)) = g(e).
M(E, G). Soit g̃ un élément de M(E, G)
Q
Soit z un élément de π1 (G). Soit zF = (zF )F ∈F un élément de π1 (G)F tel que F ∈F zF = z.
Il existe un G-fibré principal P au-dessus de M et une connexion ω sur P tels que les
propriétés suivantes soient vérifiées.
1. La classe d’isomorphisme de P est représentée par z.
2. La connexion ω est lipschitzienne et sa restriction à l’intérieur de chaque face est
lisse.
3. L’élement de M(E, G) déterminé par ω est égal, à une transformation de jauge
près, à g.
4. La contribution de chaque face F à l’action de Yang-Mills de ω est
SF (ω) =
dGe (g̃(∂F )zF )2
.
vol(F )
La connexion ω dont cette proposition assure l’existence est donc l’analogue de l’interpolation linéaire par morceaux d’une fonction continue dans la preuve du théorème
de Schilder. Cette connexion a l’énergie minimale permise par l’inégalité d’énergie mentionnée plus haut au vu des contraintes qu’on impose sur son holonomie et sur la classe
d’isomorphisme du fibré.
En faisant à partir de notre élément h cette construction pour une famille de graphes
de plus en plus fins, on obtient une famille de connexions dont l’action est bornée par
ˆ
I(h).
Il faut utiliser un argument de compacité pour en extraire une limite. Or, s’il est
facile de vérifier que l’énergie H 1 d’une connexion domine son action, c’est-à-dire qu’il
existe une constante K telle que, au moins localement, on ait S(ω) ≤ KkωkH 1 , l’inégalité
inverse n’est pas vraie. Le fait que les connexions que produit la proposition ci-dessus
aient une action bornée ne permet pas d’affirmer que leur norme H 1 le soit. En revanche,
un théorème difficile de K. Uhlenbeck affirme qu’on peut se ramener à cette situation en
appliquant des transformations de jauge appropriées aux connexions et permet de conclure
à l’égalité des fonctions de taux.
Théorème 2.4.11 ([Uhl82]) Soit P un fibré principal sur M . Soit (ωn )n≥1 une suite
de connexions H 1 sur P , telle que la suite (S(ωn ))n≥0 soit bornée. Alors il existe une
connexion H 1 ω telle que, quitte à extraire une sous-suite de la suite (ωn )n≥1 et à faire
agir sur chacun de ses termes une transformation de jauge H 2 (qui peut être différente
pour chaque terme de la suite), on ait la convergence faible
H1
ωn * ω.
n→∞
68
CHAPITRE 2. CHAMPS D’HOLONOMIE, REVÊTEMENTS ET CONNEXIONS
Chapitre 3
Mouvement brownien unitaire
Une des directions d’étude du champ de Yang-Mills qui semble les plus prometteuses
et qui en tout cas me semble particulièrement attrayante est ce que les anglo-saxons
désignent par large N limit, c’est-à-dire le comportement asymptotique de ce champ pris
à valeurs dans le groupe unitaire U (N ) lorsque N tend vers l’infini. Ce point de vue lie
le champ de Yang-Mills au vaste domaine de recherches que constitue l’étude des grandes
matrices aléatoires et de leurs limites. En particulier, en accord avec ce qu’indique, à un
niveau heuristique, un article fondateur d’I. Singer [Sin95], la théorie des probabilités libres
semble constituer un cadre naturel pour exprimer certaines propriétés asymptotiques du
champ de Yang-Mills.
La première étape de l’étude asymptotique du champ de Yang-Mills consiste en l’étude
asymptotique du mouvement brownien sur le groupe unitaire. Dans ce chapitre, nous allons présenter trois travaux relatifs à ce mouvement brownien, qui présentent trois aspects
distincts du problème. Nous commençons par rappeler de quoi il s’agit et par présenter
certains résultats connus antérieurement à nos travaux.
Ce chapitre est rédigé de façon à pouvoir être lu indépendamment des deux précédents.
3.1
3.1.1
Aspects combinatoires du mouvement brownien unitaire [L6]
Définition du mouvement brownien unitaire
Soit N ≥ 1 un entier, qui dans tout ce qui suit représente la taille des matrices.
Nous considérons le groupe unitaire U(N ) = {U ∈ GLN (C) : U U ∗ = U ∗ U = IN }.
Il s’agit d’un sous-groupe compact et connexe de GLN (C). C’est aussi une sous-variété
différentiable lisse réelle de dimension N 2 de MN (C). Son algèbre de Lie est le sous-espace
vectoriel réel u(N ) de dimension N 2 de MN (C) formé des matrices anti-hermitiennes :
u(N ) = {A ∈ MN (C) : A∗ = −A}. C’est aussi l’espace des matrices A telles que etA soit
unitaire pour tout t réel. Pour tout U ∈ U(N ), l’espace vectoriel u(N ) est laissé stable
par la transformation linéaire de MN (C) donnée par A 7→ U AU −1 . L’action linéaire de
U (N ) sur u(N ) s’appelle l’action adjointe, ou simplement action par conjugaison. Nous
munissons u(N ) du produit scalaire suivant :
∀A, B ∈ u(N ), hhA, Bii = N Tr(A∗ B).
69
70
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
Précisons une fois pour toutes que nous notons Tr(·) la trace usuelle et tr(·) la trace
normalisée si bien que Tr(IN ) = N et tr(IN ) = 1. Le produit scalaire hh·, ·ii est invariant par
l’action de U(N ) par conjugaison. Ce n’est pas le seul, même à une constante multiplicative
près, et les raisons pour lesquelles nous le choisissons apparaitront bientôt.
Sur l’espace euclidien (u(N ), hh·, ·ii), il y a un mouvement brownien naturel, qui est
l’unique processus gaussien (KN (t))t≥0 indexé par R+ et à valeurs dans u(N ) dont la
covariance est la suivante :
∀s, t ∈ R+ , ∀A, B ∈ u(N ), E[hhA, KN (t)iihhB, KN (s)ii] = min(s, t)hhA, Bii.
On peut penser au processus KN comme à un processus stochastique à valeurs dans un
sous-espace vectoriel de MN (C), ou, si l’on préfère, comme à une matrice anti-hermitienne
de processus à valeurs dans C. De ce dernier point de vue, les coefficients de KN sont des
mouvements browniens complexes, aussi indépendants que le permet la condition
d’anti√
hermiticité. Plus précisément, chaque coefficient diagonal a la loi de iB/ N , où B est
un mouvement
brownien standard et chaque coefficient non diagonal a la loi de (B +
√
iB 0 )/ 2N , où B et B 0 sont deux mouvements browniens standard indépendants. Enfin,
les coefficients situés sur la diagonale ou au-dessus forment une famille indépendante. On
vérifie que la matrice des covariations quadratiques hdKN , dKN it vaut −IN dt.
On définit le mouvement brownien sur le groupe U(N ) comme la solution de l’équation
différentielle stochastique linéaire suivante :
1
dUN (t) = UN (t)dKN (t) − UN (t) dt.
(3.1)
2
Cette équation est écrite au sens d’Itô et sa solution est un processus à valeurs dans
MN (C). On peut en déduire une EDS satisfaite par UN∗ et, connaissant la covariation
quadratique hKN , KN i, une simple application de la formule d’Itô permet de vérifier que
d(UN UN∗ ) = 0, si bien que pour toute condition intiale UN (0) unitaire, le processus UN
reste dans le groupe unitaire. On prendra en général UN (0) = IN .
Nous allons maintenant décrire le générateur de UN et écrire la formule d’Itô sous
une forme qui nous sera utile. Pour cela, observons que chaque élément u(N ) détermine
un opérateur différentiel invariant à gauche sur U(N ). Ainsi, si A appartient à u(N ),
nous définissons un opérateur différentiel LA en posant, pour toute fonction différentiable
F : U(N ) → R et tout U ∈ U(N ),
(LA F )(U ) =
d
F (U etA ).
dt |t=0
Soulignons le fait que, dans la formule ci-dessus, la fonction F n’est évaluée qu’en des
points du groupe unitaire. Soit maintenant X1 , . . . , XN 2 une base orthonormée de u(N ).
Alors on définit le laplacien sur U(N ) comme l’opérateur différentiel du second ordre
2
∆=
N
X
(LXk )2 .
k=1
On vérifie aisément que cet opérateur ne dépend pas du choix de la base orthonormée.
La formule d’Itô pour UN s’écrit comme suit. Notons que les processus (hhXk , KN ii : k =
1, . . . , N 2 ) sont des mouvements browniens réels standard indépendants.
3.1. ASPECTS COMBINATOIRES DU MOUVEMENT BROWNIEN UNITAIRE [L6]
71
Proposition 3.1.1 (Formule d’Itô) Soit F : R+ × U(N ) → R une fonction de classe
C 2 . Alors pour tout t ≥ 0, on a l’égalité
2
F (t, UN (t)) = F (0, UN (0)) +
N Z
X
t
k=1 0
Z t
+
0
(LXk F )(s, UN (s))dhhXk , KN iis
1
∆F + ∂t F
2
(s, UN (s)) ds.
En utilisant l’équation différentielle stochastique (3.1) ou la formule d’Itô, on vérifie
que le mouvement brownien est invariant par conjugaison et par inversion. Ceci signifie
que pour tout V ∈ U(N ), les processus UN , V UN V −1 et UN−1 ont même loi.
3.1.2
Distribution des valeurs propres et sommes de Newton
Soit U un élément de U(N ). Il admet N valeurs propres z1 , . . . , zN qui sont des nombres
complexes de module 1 et nous associons à U sa mesure spectrale empirique qui est la
mesure de probabilités suivante sur le cercle unité U = {z ∈ C : |z| = 1} :
µ̂U =
N
1 X
δz .
N i=1 i
(3.2)
Pour tous N ≥ 1 entier et t ≥ 0 réel, la mesure µ̂UN (t) est une mesure aléatoire sur U et
le premier résultat que nous allons présenter décrit partiellement sa loi.
Puisque U est une partie compacte de C, une Rmesure de probabilités ν sur U est
caractérisée par ses moments qui sont les nombres U z n ν(dz), n ∈ Z. Ces moments sont
des nombres complexes de module inférieur ou égal à 1. Si ν est une mesure aléatoire,
elle est caractérisée par la loi de la suite de ses moments, qui, puisque ces moments sont
uniformément bornés, est à son tour caractérisée par la donnée de toutes les espérances
de la forme
Z
Z
m1
mr
E
z ν(dz) . . . z ν(dz) , r ≥ 1, m1 , . . . , mr ∈ Z.
U
U
Nous allons donner une formule pour ces espérances pour la mesure µ̂UN (t) lorsque tous
les entiers m1 , . . . , mr sont de même signe. Puisque le mouvement brownien a même loi
que son inverse, la mesure µ̂UN (t) a même loi que son image par la conjugaison complexe
et il suffit de considérer le cas où m1 , . . . , mr sont positifs.
Observons que les moments de la mesure µ̂UN (t) peuvent s’écrire simplement en fonction
de UN (t). En effet, pour tout n ∈ Z, notant z1 , . . . , zN les valeurs propres de UN (t), on a
Z
U
z n µ̂UN (t) (dz) =
N
1 X n
zi = tr(UN (t)n ).
N i=1
Nous allons donc considérer des quantités de la forme tr(UN (t)m1 ) . . . tr(UN (t)mr ) où
m1 , . . . , mr sont des entiers strictement positifs. Une telle quantité, comme fonction des valeurs propres de UN (t), est une fonction symétrique, en l’occurence un produit de sommes
72
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
de Newton. La notation classique pour un tel produit est pλ , où λ est la partition de l’entier n = m1 + . . . + mr formée par m1 , . . . , mr rangés dans l’ordre décroissant. Toutefois,
plutôt que des partitions, nous allons utiliser des permutations pour indexer ces fonctions.
Le fait que cette indexation soit très redondante sera compensée par d’autres avantages.
Dans tout ce qui suit, nous noterons les permutations comme des produits de cycles
distincts en omettant les cycles de longueur 1. Ainsi, l’élément (124) de S4 est la permutation qui envoie 1 sur 2, 2 sur 4, 3 sur 3 et 4 sur 1.
Définition 3.1.2 Soit n ≥ 1 un entier. Soit σ un élément de Sn . Soient m1 , . . . , mr les
longueurs des cycles de σ. Soit M un élément de MN (C). On pose
pσ (M ) = tr(M m1 ) . . . tr(M mr )
et Pσ (M ) = Tr(M m1 ) . . . Tr(M mr ) = N r pσ (M ).
Plus généralement, soient M1 , . . . , Mn des éléments de MN (C). On pose alors
Y
pσ (M1 , . . . , Mn ) =
tr(Mi1 . . . Mis )
(i1 ...is )
cycle de σ
et Pσ (M1 , . . . , Mn ) =
Y
Tr(Mi1 . . . Mis ) = N r pσ (M1 , . . . , Mn ).
(i1 ...is )
cycle de σ
Remarquons que les deux dernières définitions ont un sens grâce à l’invariance de
la trace par permutation cyclique. Ainsi par exemple, si n = 4 et σ = (124), on a
pσ (M1 , M2 , M3 , M4 ) = tr(M1 M2 M4 )tr(M3 ) = tr(M2 M4 M1 )tr(M3 ).
3.1.3
Expression combinatoire des moments de la distribution spectrale
Pour énoncer le résultat principal de cette section, il nous faut introduire quelques
notions relatives à une géométrie discrète du groupe symétrique. Soit n ≥ 1 un entier, Sn
le groupe des permutations de {1, . . . , n}, et Tn ⊂ Sn l’ensemble de toutes les transpositions de Sn . L’ensemble Tn engendre Sn et on forme le graphe de Cayley correspondant
en prenant pour sommets les éléments de Sn et en reliant deux éléments σ1 et σ2 de Sn
par une arête si σ1 σ2−1 appartient à Tn .
Pour chaque permutation σ, on appelle |σ| la distance entre σ et l’identité, c’est-àdire la plus petite longueur d’une écriture de σ comme produit de transpositions. Si `(σ)
désigne le nombre de cycles de σ, y compris les cycles de longueur 1, alors |σ| = n − `(σ).
Pour comprendre cette égalité, on peut par exemple observer ce qui se passe lorsqu’on
mutliplie une permutation σ par une transposition (kl). Si k et l sont dans le même cycle
de σ, alors ce cycle est coupé en deux et (kl)σ a un cycle de plus que σ. En revanche, si
k et l sont dans deux cycles distincts de σ, alors ces deux cycles fusionnent et (kl)σ a un
cycle de moins que σ.
Cette remarque entraîne aussi la conséquence suivante : lorsqu’on suit un chemin
(σ0 , . . . , σk ) dans le graphe de Cayley, le nombre de cycles varie à chaque pas de 1 ou −1 :
pour chaque i = 0, . . . , k − 1, on a |σi+1 | = |σi | ± 1.
3.1. ASPECTS COMBINATOIRES DU MOUVEMENT BROWNIEN UNITAIRE [L6]
73
(1234) (1243) (1324) (1342) (1423) (1432)
3
(12)(34)
(13)(24)
(14)(23)
2
|σ|
(123) (132) (124) (142) (134) (143) (234) (243)
1
(12)
(13)
(14)
(23)
(24)
(34)
0
id
Figure 3.1 – Le graphe de Cayley de S4 engendré par ses transpositions.
Définition 3.1.3 Soit (σ0 , . . . , σk ) un chemin dans le graphe de Cayley de Sn . On appelle
longueur de ce chemin l’entier k et défaut de ce chemin l’entier
d = #{i ∈ {0, . . . , k − 1} : |σi+1 | = |σi | + 1}.
Pour tous σ, σ 0 appartenant à Sn , tous k, d ≥ 0, on note Πk (σ) l’ensemble des chemins
de longueur k issus de σ, Πk (σ → σ 0 ) l’ensemble des chemins de longueur k issus de σ et
aboutissant à σ 0 et S(σ, k, d) le nombre de chemins issus de σ, de longueur k et de défaut
d.
Le défaut d’un chemin est donc le nombre de pas qui l’éloignent de l’identité. Si un
chemin de longueur k et de défaut d relie σ à σ 0 , on a donc |σ 0 | = |σ| − (k − 2d). En
particulier, |k − 2d| ≤ n − 1.
L’entier S(σ, k, d) est donc nul dès que |k − 2d| ≥ n. Par ailleurs, cet entier ne dépend
que de la classe de conjugaison de σ, puisque le graphe de Cayley est inchangé si l’on
renomme tous ses sommets en les conjugant par une permutation fixée.
Le résultat principal est le suivant.
Théorème 3.1.4 ([L6, Theorem 3.3]) Soient N, n ≥ 1 deux entiers. Soit UN le mouvement brownien sur U(N ) associé au produit scalaire hhX, Y ii = N Tr(X ∗ Y ) sur u(N ).
Soient M1 , . . . , Mn des éléments de MN (C). Soit σ un élément de Sn . Alors, pour tout
t ≥ 0, on a le développement en série suivant :
nt
E[pσ (M1 UN (t), . . . , MN UN (t))] = e− 2
X (−t)k
k!N 2d
k,d≥0
X
|σ 0 |=|σ|−(k−2d)
#Πk (σ → σ 0 )pσ0 (M1 , . . . , MN ).
En particulier, notant m1 , . . . , mr les longueurs des cycles de σ, on a
E[tr(UN (t)
m1
m1
) . . . tr(UN (t)
− nt
2
)] = e
X (−t)k
S(σ, k, d).
k!N 2d
k,d≥0
74
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
Pour tout T ≥ 0, ces développements en série sont normalement convergents pour (N, t) ∈
N∗ × [0, T ].
La somme sur la permutation σ 0 qui intervient dans le premier développement peut
se réécrire comme une somme sur tous les chemins issus de σ de longueur k et de défaut
d, en prenant pour σ 0 le point où aboutit le chemin. Ceci entraîne immédiatement le
second développement lorsqu’on prend toutes les matrices M1 , . . . , MN égales à la matrice
identité.
3.1.4
Énumération de chemins dans le groupe symétrique
L’énoncé du théorème 3.1.4 appelle plusieurs remarques. Tout d’abord, nous avons
déjà observé que les nombres S(σ, k, d) sont nuls si |k − 2d| > n − 1. Ainsi, pour tout
k ≥ 0, la contribution d’ordre tk est polynomiale en N12 et surtout, pour tout d ≥ 0, la
contribution d’ordre N12d est polynomiale en t.
Ensuite, les nombres S(σ, k, d) sont extrêmement difficiles à calculer. À titre d’amusement, on peut essayer de vérifier à l’aide de la figure 3.1 que S((12)(34), 3, 1) = 104. Il n’y
a pas de formule pour la plupart de ces nombres. Les S(σ, k, 0), qui comptent les chemins
qui ne font que se rapprocher de l’identité, font exception. On peut le comprendre en observant que le long de ces chemins, deux éléments qui à un moment donné n’appartiennent
pas au même cycle, ne seront jamais réunis : ces chemins n’avancent qu’en fragmentant
des cycles. Ceci indique qu’il suffit de connaître les S(σ, k, 0) lorsque σ n’a qu’un cycle
non-trivial et que dans ce cas, ce nombre ne dépend que de la longueur de ce cycle, pas
du nombre des points fixes de σ hors de ce cycle. Il suffit donc de connaître les nombres
S((1 . . . n), k, 0).
Proposition 3.1.5 ([L6, Proposition 6.6]) Pour tous n ≥ 1 et k ≥ 0, on a
n
S((1 . . . n), k, 0) =
nk−1 .
k+1
On retrouve par exemple le résultat classique suivant : le nombre S((1 . . . n), n − 1, 0)
d’écrire le n-cycle (1 . . . n) comme produit de n − 1 transpositions vaut nn−2 .
Fort heureusement, les coefficients correspondant à d = 0 sont exactement ceux qui
interviennent lorsque N tend vers l’infini. Comme la série converge uniformément par
rapport à N , on peut passer à la limite sous le signe somme et on retrouve le résultat
suivant, qui avait été démontré d’une autre façon par P. Biane [Bia97].
Proposition 3.1.6 Pour tout n ≥ 1 et tout t ≥ 0, on a
lim E[tr(UN (t) )] = e
n
N →∞
− nt
2
n−1
X
(−t)k
n
nk−1 .
k!
k+1
k=0
Nous reviendrons plus en détail sur ce résultat. Pour le moment, mentionnons une
formule qui exprime les nombres S((1 . . . n), k, d) pour tout d ≥ 0. Rappelons la définition
3.1. ASPECTS COMBINATOIRES DU MOUVEMENT BROWNIEN UNITAIRE [L6]
des nombres de Stirling de deuxième espèce, s(n, k), aussi notés
l’identité suivante dans C[x] :
75
n
. Ils sont définis par
k
n X
n k
x(x − 1) . . . (x − n + 1) =
x .
k
k=0
n − k de l’identité.
On vérifie que nk est le nombre de permutations de Sn à distance
n
n
En particulier, 0 = 0. Adoptons la convention selon laquelle k = 0 si k < 0. On a alors
le résultat suivant.
Proposition 3.1.7 Pour tous n, k, d ≥ 0,
1
S((1 . . . n), k, d) =
n
X
k s + 1 r + 1 (−1)l+r n
(s − r)
.
r!s!
2
s+1−l r+1−m
r,s,l,m≥0
r+s=n−1
l+m=n−1−k+2d
La somme ci-dessus est bien une somme finie. Notons qu’il n’est pas évident que
l’expression donnée par cette formule lorsque d = 0 coïncide avec l’expression donnée
précédemment. De plus, lorsque d > 0, cette formule ne suffit pas pour obtenir S(σ, k, d)
pour des permutations plus générales. En effet, lorsqu’on compte des chemins de défaut
non nul, on ne peut plus travailler cycle par cycle comme pour des chemins de défaut nul.
Néanmoins, cette formule permet d’établir le résultat combinatoire amusant suivant.
Proposition 3.1.8 Soit n ≥ 1 un entier. Pour tout entier p ≥ 0, soit cn,p le nombre de
façons distinctes d’écrire le cycle (1 . . . n) ∈ Sn comme produit de p transpositions. Le
nombre cn,p est non nul seulement si p = n − 1 + 2d pour un certain d ≥ 0. Dans ce cas,
cn,p
p
n−1
np X
n−1
r n−1
= S((1 . . . n), n − 1 + 2d, d) =
(−1)
−r .
n! r=0
r
2
Pour tout n ≥ 1, on a l’égalité
X
p≥0
cn,p
n−1
xp
1 n(n−1)
= e 2 x 1 − e−nx
.
p!
n!
En particulier, cn,n−1 = nn−2 , cn,n+1 =
cn,n+3 =
3.1.5
1
(n2
24
− 1)nn+1 et
1
(5n − 7)(n + 3)(n + 2)(n2 − 1)nn+3 .
5760
Mouvement brownien unitaire et marche aléatoire symétrique
Dans ce paragraphe, nous allons expliquer comment la dualité de Schur-Weyl rend
plausible le théorème 3.1.4 puis énoncer un résultat qui lie la mouvement brownien sur
U(N ) et la marche aléatoire la plus naturelle sur le groupe symétrique Sn .
76
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
ENCART 11 – Dualité de Schur-Weyl
Soient n, N ≥ 1 deux entiers. Il y a sur l’espace vectoriel (CN )⊗n des formes n-linéaires sur (CN )∗ deux
actions naturelles ρ et π, respectivement du groupe unitaire U(N ) et du groupe symétrique Sn , données par
ρ(U )(x1 ⊗ . . . ⊗ xn ) = U x1 ⊗ . . . ⊗ U xn
π(σ)(x1 ⊗ . . . ⊗ xn ) = xσ−1 (1) ⊗ . . . ⊗ xσ−1 (n) .
Ces deux actions commutent l’une à l’autre : pour tout U ∈ U(N ) et tout σ ∈ Sn , on a ρ(U ) ◦ π(σ) =
π(σ) ◦ ρ(U ). Notons R la sous-algèbre de End((CN )⊗n ) engendrée par les (ρ(U ) : U ∈ U(N )) et P celle
engendrée par les (π(σ) : σ ∈ Sn ). Alors tout élément de R commute à tout élément de P. Le théorème de
Schur-Weyl affirme que les algèbres R et P sont le commutant l’une de l’autre.
Théorème 3.1.9 (Dualité de Schur-Weyl) Tout endomorphisme de (CN )⊗n qui commute à R appartient
à P et tout endomorphisme de (CN )⊗n qui commute à P appartient à R.
D’après le théorème de densité de Jacobson, qui entraîne qu’une sous-algèbre de l’algèbre des endomorphismes
d’un espace vectoriel de dimension finie est égale au commutant de son commutant, les deux assertions du
théorème sont équivalentes.
L’algèbre P est simplement l’algèbre des combinaisons linéaires des éléments π(σ) où σ décrit Sn . Il est
commode pour la décrire
d’introduire l’algèbre C[Sn ] du groupe Sn , qui est l’espace vectoriel des combinaisons
P
linéaires formelles σ λσ σ d’éléments de σ muni de la multiplication
X
aσ σ
X
bσ0 σ 0 =
σ0
σ
X
aσ bσ0 σσ 0 .
σ,σ 0
Cette algèbre s’identifie naturellement avec l’algèbre de convolution des fonctions sur Sn . L’action π : Sn →
End((CN )⊗n ) se prolonge par linéarité à C[Sn ] pour donner un morphisme d’algèbres dont l’image est
précisément P.
Nous allons appliquer la dualité de Schur-Weyl à l’image par ρ du laplacien sur U(N ).
Pour donner un sens à cette image, commençons par étendre ρ à u(N ), par différentiation :
pour tout A ∈ u(N ), on peut définir ρ(A) = dtd |t=0 ρ(etA ) = (LA ρ)(IN ). Concrètement, on
a
N
X
ρ(A)(x1 ⊗ . . . ⊗ xN ) =
x1 ⊗ . . . ⊗ xk−1 ⊗ Axk ⊗ xk+1 ⊗ . . . ⊗ xN .
k=1
On peut alors définir
2
ρ(∆) =
N
X
ρ(Xk )2 ,
k=1
qui n’est autre que (∆ρ)(IN ) si l’on voit ρ comme une application lisse de U(N ) dans
l’espace vectoriel End((CN )⊗n ).
L’opérateur ∆ a la propriété d’être invariant par les translations. Ceci peut se vérifier
infinitésimalement en vérifiant qu’il commute à tous les opérateurs LA , où A ∈ u(N ).
Ceci entraîne que l’endomorphisme ρ(∆) de (CN )⊗n commute à R. D’après le théorème
de Schur-Weyl, il appartient donc à P. Il peut donc s’écrire comme combinaison linéaire
d’endomorphismes de la forme π(σ) pour σ ∈ Sn .
3.1. ASPECTS COMBINATOIRES DU MOUVEMENT BROWNIEN UNITAIRE [L6]
77
Appelons L le générateur de la chaîne de Markov sur le graphe de Cayley du groupe
symétrique qui saute à taux N1 de son état présent à chacun de ses n(n − 1)/2 voisins.
L’opérateur L agit sur les fonctions de Sn dans C selon la formule
Lf (σ) = −
1 X
n(n − 1)
f (σ) +
f (στ ).
2N
N τ ∈T
n
Si nous identifions l’espace des fonctions de Sn dans C avec l’algèbre C[Sn ], l’action de
L est simplement la multiplication par l’élément
L=−
1 X
n(n − 1)
+
τ.
2N
N τ ∈T
n
Le résultat, implicitement présent dans les travaux de D. Gross et W. Taylor [GT93a],
est alors le suivant.
Lemme 3.1.10 On a l’égalité
1
n n(n − 1)
ρ(∆) + π(L) = − −
.
2
2
2N
Ce résultat est remarquable dans la mesure où il lie deux objets qui ont chacun une
interprétation probabiliste. Au prix d’une petite manipulation algébrique, il permet de
démontrer le suivant.
Proposition 3.1.11 Soit (σt )t≥0 la chaîne de Markov sur Sn de générateur L. Alors le
processus
nt n(n−1)t
e 2 + 2N Pσt (UN (t))
t≥0
est une martingale. En particulier, pour tout t ≥ 0, on a l’égalité
nt
E[Pσt (UN (t))] = e− 2 −
n(n−1)t
2N
E[N `(σ0 ) ],
où `(σ0 ) désigne le nombre de cycles de σ0 .
Ce résultat, outre le fait qu’il lie le mouvement brownien sur le groupe unitaire et
la marche aléatoire sur le groupe symétrique, est la clé de la preuve du théorème 3.1.4.
En faisant partir la chaîne (σt )t≥0 des différents éléments de Sn , on obtient suffisamment
d’informations pour connaître E[Pσ (UN (t))] pour tout σ. C’est ensuite le passage de Pσ
à pσ qui force à considérer les nombres de cycles des permutations qu’on considère et qui
fait intervenir le défaut des chemins.
3.1.6
Revêtements ramifiés aléatoires
Dans les deux articles [GT93a, GT93b], D. Gross et W. Taylor énoncent de nombreuses
formules qui relient d’une part les fonctions de partition de la mesure de Yang-Mills sur
des surfaces à valeurs dans le groupe unitaire et d’autre part des valeurs moyennes de
78
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
quantités géométriques simples associées à des revêtements ramifiés aléatoires au-dessus de
ces surfaces. Dans certains cas, des singularités autres que des points de ramification sont
autorisées pour ces revêtements. Toutefois, dans le cas le plus simple, où la surface est un
disque, la fonction de partition n’est autre que le noyau de la chaleur sur le groupe unitaire
et les revêtements considérés par Gross et Taylor sont de bons revêtements ramifiés. Le
théorème 3.1.4 permet alors d’établir rigoureusement leur formule.
Soit D le disque unité du plan R2 . Il nous faut décrire la mesure de probabilités sur
les revêtements ramifiés qui intervient dans cette formule. Elle n’est pas exactement de la
forme de celles que nous avons construites à la section 2.1.2, bien qu’elle y ressemble fort.
Le groupe fini qui intervient ici est le groupe symétrique Sn . La première différence
avec la section 2.1.2 est qu’au lieu de considérer des Sn -fibrés principaux ramifiés, nous
considérons de simples revêtements ramifiés de degré n, sans action d’aucun groupe. Il y
a toutefois une correspondance bijective entre ces deux types de revêtements, analogue à
la correspondance entre le fibré des repères et le fibré tangent d’une variété différentiable.
Soit π : R → D un revêtement ramifié de degré n. Soit y ∈ D un point de ramification.
Soit l un petit lacet dans D qui fait le tour de y. Notons x le point base de l. Si nous
numérotons de 1 à n les points de la fibre π −1 (x) = {x̃1 , . . . , x̃n }, alors l’application
σ : {1, . . . , n} → {1, . . . , n} qui à chaque i associe le numéro de l’extrémité du relevé de l
issu de xi est une bijection. Changer la numérotation de π −1 (x) affecte cette bijection en la
conjugant par une autre bijection. La classe de conjugaison de σ est en fait indépendante
de tous les choix qu’on a faits, en particulier celui de l, et caractérise le type de ramification
en y. On l’appelle la monodromie en y. On dit qu’un point de ramification est générique si
la monodromie en ce point est la classe de conjugaison d’une transposition. Cela équivaut
à dire que #π −1 (y) = n − 1.
De même, la restriction de π : R → D au bord de D est un revêtement du cercle unité,
qui est caractérisé par une classe de conjugaison de Sn , ou encore une partition de l’entier
n mais nous continuerons à travailler avec des permutations.
Définition 3.1.12 Soit D le disque unité de R2 . Soit n ≥ 1 un entier. Soit σ une permutation de Sn . Soit X une partie finie de D\{0}. On note Rn,X,σ l’ensemble des revêtements
ramifiés π : R → D de degré n tels que les propriétés suivantes soient satisfaites.
1. Pour tout x ∈ X, le revêtement R admet en x une ramification générique, ce qui
signifie que #π −1 (x) = n − 1.
2. Le revêtement R n’est ramifié en aucun point de D \ (X ∪ {0}).
3. La monodromie de R le long du bord de D est la classe de conjugaison de σ.
On note Rn,σ la réunion des Rn,X,λ où X parcourt l’ensemble des parties finies de D \{0}.
Il n’y a aucune restriction sur la ramification en 0 : ce peut être un point régulier ou
un point avec une ramification arbitraire. C’est un tel point que Gross et Taylor appellent
un Ω-point.
Pour toute partie finie X donnée dans D \ {0}, l’ensemble Rn,X,σ est fini. Nous le
munissons de la mesure uniforme
X
n!
ρn,X,σ =
δR .
Aut(R)
R∈R
n,X,σ
3.2. COMPORTEMENT ASYMPTOTIQUE DES VALEURS PROPRES [LM9]
79
Considérons maintenant une mesure d’aire vol sur D, d’aire totale égale à 1, par exemple
1
fois la mesure de Lebesgue. Pour tout t, appelons Ξt un processus de Poisson ponctuel
π
sur D d’intensité tvol, que nous voyons comme une mesure de probabilités sur l’ensemble
X des parties finies de D \ {0}. Nous posons alors
Z
t
ρn,σ =
ρn,X,σ Ξt (dX).
X
n
La mesure ρtn,σ est une mesure finie, de masse et( 2 )−t . Nous notons µtn,σ la mesure de
probabilités sur Rn,σ associée.
Enfin, pour tout π : R → M appartenant à Rn,σ , nous notons k(R) le nombre de
points de ramification de R autres que 0, et χ(R) la caractéristique d’Euler de R. La
formule de Gross et Taylor est alors la suivante.
Théorème 3.1.13 ([L6, Theorem 8.3]) Soient N, n ≥ 1 des entiers. Soit σ un élément
de Sn . Soit t ≥ 0 un réel. Alors on a l’égalité
Z
− nt
+(n
t
)
2
2
E[Pσ (UN (t))] = e
(−1)k(R) N χ(R) µtn,σ (dR).
Rn,σ
Ce théorème donne une explication géométrique à la parité des exposants de N1 qui
apparaissent dans le théorème 3.1.4. En effet, si l’on divise les deux membres de l’égalité
par N `(σ) , où `(σ) est le nombre de cycles de σ, on voit que E[pσ (UN (t))] se développe
en puissances de N de la forme N χ(R)−`(σ) . Notons que le bord d’un revêtement R ∈
Rn,σ a exactement `(σ) composantes connexes. Ainsi, d’une part, χ(R) − `(σ) a la même
parité que χ(R) + `(σ) qui est la caractéristique d’Euler de la surface fermée obtenue en
recollant un disque à chaque composante de son bord et est donc un entier pair. D’autre
part, notons c(R) le nombre de composantes connexes de R, qui est aussi le nombre de
composantes connexes de la surface sans bord R0 décrite à la phrase précédente. Alors
`(σ) ≥ c(R) = c(R0 ) puisque de tout point régulier de R on peut atteindre la restriction
de R au-dessus du cercle unité, par exemple en suivant le relèvement d’un chemin bien
choisi. Ainsi, χ(R) − `(σ) = χ(R) + `(σ) − 2`(σ) = χ(R0 ) − 2`(σ) ≤ χ(R0 ) − 2c(R0 ) ≤ 0.
Les puissances de N qui apparaissent sont donc des entiers pairs négatifs ou nuls.
Lorsque N tend vers l’infini, seuls les revêtements ramifiés de caractéristique maximale
interviennent : ce sont les revêtements par une union finie de disques.
Pour finir, il convient de remarquer que le lien que ce théorème révèle entre le champ
de Yang-Mills et des revêtements ramifiés aléatoires n’est pas de même nature que le lien
que nous avons décrit dans la section 2.1, où il s’agissait d’un lien d’analogie. Le lien révélé
par la formule de Gross et Taylor est un lien de dualité, qu’on peut comprendre comme
une conséquence de la dualité de Schur-Weyl.
3.2
3.2.1
Comportement asymptotique des valeurs propres [LM9]
Distribution des valeurs propres : résultats asymptotiques
La proposition 3.1.6 indique que l’intensité de la mesure aléatoire µ̂UN (t) a, pour tout
t ≥ 0, une limite lorsque N tend vers l’infini. Commençons par décrire cette limite. Nous
80
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
notons U = {z ∈ C : |z| = 1}.
Proposition 3.2.1 Pour tout t ≥ 0, il existe une unique mesure de probabilités νt sur U
telle que pour tout n ≥ 0 on ait
Z
Z
n−1
X
(−t)k
n
n
−n
− nt
nk−1 .
ξ νt (dξ) =
ξ νt (dξ) = e 2
k!
k
+
1
U
U
k=0
Cette mesure est également caractérisée par le fait que pour tout nombre complexe z dans
un voisinage de 0, on a l’égalité
Z
1
νt (dξ) = 1 + z.
t
z
tz
U 1 − z+1 e e 2 ξ
Pour tout t > 0, la mesure νt possède une densité par rapport à la mesure uniforme sur
U, qui est analytique à l’intérieur de son support. Ce support est un intervalle symétrique
par rapport à l’axe réel qui croît avec t pour recouvrir le cercle U entier à l’instant
t = 4 (voir [Bia97]). Il n’est toutefois pas possible d’exprimer la densité de νt avec les
fonctions usuelles, à moins d’y inclure la fonction W de Lambert, qui est la réciproque de
l’application z 7→ zez .
Figure 3.2 – Densité de νt en eiθ en fonction de θ ∈ [−π, π] et de t. On connaît le support de la
mesure à chaque temps. Ce support est le cercle U tout entier si et seulement si t ≥ 4. La régularité de
la densité de νt change lorsque t franchit cette valeur, passant de höldérienne d’exposant 21 pour t < 4
à analytique réelle pour t > 4. On observe ici une transition de phase. Pour t > 4, on voit la densité
converger rapidement vers 1. Cette convergence est exponentiellement rapide, uniformément en θ.
Une façon commode d’exprimer des théorèmes limites pour la distribution des valeurs
propres de matrices unitaires dont la taille tend vers l’infini est de considérer une fonction
3.2. COMPORTEMENT ASYMPTOTIQUE DES VALEURS PROPRES [LM9]
81
f : U → R suffisamment régulière et de lui associer la suite de variables aléatoires réelles
(tr(f (UN (t))))N ≥1 . La proposition 3.1.6 implique aisément le résultat suivant.
Proposition 3.2.2 Soit f : U → R une fonction continue. Alors pour tout t ≥ 0 on a la
convergence
Z
E[trf (UN (t))] −→
f dνt .
N →∞
U
À titre de comparaison, dans le cas d’une matrice prise sous la mesure de Haar, on
a le résultat suivant, qui découle immédiatement de l’invariance par translation de cette
mesure.
Lemme 3.2.3 Soit f : U → R une fonction continue. Pour tout N ≥ 1, soit VN une
matrice unitaire aléatoire distribuée selon la mesure de Haar sur U(N ). Alors pour tout
N ≥ 1, on a
Z
E[trf (VN )] =
f (ξ) dξ.
U
Ce lemme peut être vu comme une limite quand t tend vers +∞ du résultat précédent.
Notons que, puisque la répartition moyenne des valeurs propres de VN est uniforme sur
le cercle, la variable aléatoire trf (VN ) est définie presque sûrement dès que f est définie
presque partout. Ainsi, le résultat précédent a un sens et reste vrai pour une fonction
f ∈ L1 (U).
P. Diaconis et S. Evans ont étudié les fluctuations de trf (VN ) et ont établi un théorème
1
de la limite centrale [DE01]. L’espace de Sobolev H 2 , dont la définition est rappelée cidessous, y joue un rôle primordial. Pour toute fonction f intégrable sur U et tout n ∈ Z,
nous notons fˆ(n) le n-ième coefficient de Fourier de f .
1
Définition 3.2.4 L’espace H 2 (U) est le sous-espace de L2 (U) défini par
X
1
H 2 (U) = {f ∈ L2 (U) :
|n||fˆ(n)|2 < +∞},
n∈Z
muni du produit scalaire hilbertien
hf, gi2
H
1
2
= fˆ(0)ĝ(0) +
X
n∈Z∗
|n|fˆ(n)ĝ(n).
1
Notons que les fonctions de H 2 ne sont pas nécessairement continues. Le théorème de
Diaconis et Evans est le suivant.
1
Théorème
3.2.5 ([DE01]) Soient f1 , . . . , fn : U → R des fonctions de H 2 telles que
R
f (ξ) dξ = 0 pour tout i ∈ {1, . . . , n}. Soit Σ la matrice n × n symétrique positive
U i
définie par Σ(f1 , . . . , fn ) = (hfi , fj iH 21 )i,j=1,...,n . Alors, avec les notations du lemme 3.2.3,
on a, lorsque N tend vers +∞, la convergence en loi suivante :
(loi)
N (tr(f1 (VN )), . . . , tr(fn (Vn ))) −→ N (0, Σ(f1 , . . . , fn )).
N →+∞
82
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
Avec Mylène Maïda, nous avons établi un théorème analogue pour des variables aléatoires de la forme trf (UN (t)). L’expression de la covariance dans ce cas est toutefois plus
compliquée. Elle nécessite l’introduction de quelques notions de probabilités libres.
ENCART 12 – Probabilités libres et mouvement brownien multiplicatif libre [VDN92, Bia03, Bia97]
Les probabilités libres sont une variante non-commutative de la théorie des probabilités dans laquelle la notion
d’indépendance est remplacée par la notion de liberté.
Définition 3.2.6 Un espace de probabilités non-commutatif est une paire (A, τ ) où A est une algèbre complexe unitaire involutive et τ est une forme linéaire sur A qui est
1. positive : τ (a∗ a) ≥ 0 pour tout a ∈ A,
2. normalisée : τ (1) = 1,
3. traciale : τ (ab) = τ (ba) pour tous a, b ∈ A.
La forme τ s’appelle aussi un état.
Les deux exemples fondamentaux d’espaces de probabilités non-commutatifs sont d’une part (L∞ (Ω, P), E),
où (Ω, P) est un espace de probabilités classique, et d’autre part (MN (C), tr). Leur produit tensoriel est un
nouvel espace de probabilités non-commutatif, l’espace des matrices aléatoires de taille N à coefficients bornés
muni de l’état E[tr(·)]. La définition principale de la théorie des probabilités libres est la suivante.
Définition 3.2.7 Soit (A, τ ) un espace de probabilités non-commutatif. Soient A1 , . . . , Ar des sous-algèbres
involutives de A. On dit que la famille {A1 , . . . , Ar } est libre par rapport à τ , ou simplement libre, si la
propriété suivante est vérifiée.
(L) Pour tout entier n ≥ 1, pour toute suite d’entiers i1 , . . . , in appartenant à {1, . . . , r} et telle qu’on
ait i1 6= i2 , i2 6= i3 , . . . , in−1 6= in , pour tous a1 , . . . , an tels que a1 ∈ Ai1 , . . . , an ∈ Ain et τ (a1 ) = . . . =
τ (an ) = 0, on a
τ (a1 . . . an ) = 0.
On dit que des éléments b1 , . . . , br de A forment une famille libre si les sous-algèbres involutives engendrées
par chacun de ces éléments forment une famille libre.
Les exemples d’espaces de probabilités non-commutatifs que nous avons donnés ne sont pas suffisamment
riches pour permettre de donner des exemples de familles libres. Par exemple, deux éléments de (L∞ (Ω, P), E),
c’est-à-dire deux variables aléatoires classiques, sont libres si et seulement si l’une des deux est constante Ppresque sûrement. Ceci découle des égalités
τ (ab) = τ (a)τ (b) et τ (abab) = (τ (a2 ) − τ (a)2 )τ (b)2 + τ (a)2 (τ (b2 ) − τ (b)2 ) + τ (a)2 τ (b)2 ,
(3.3)
qui sont vraies pour deux éléments libres quelconques d’un espace de probabilités non-commutatif. En effet,
si X et Y sont libres et d’espérance nulle, la première égalité appliquée à X 2 et Y 2 et la seconde appliquée à
X et Y donnent deux expressions de E[X 2 Y 2 ] dont l’égalité impose que X ou Y soit nulle presque sûrement.
Dans le cas de (MN (C), tr), on peut également démontrer que si deux matrices sont libres, alors l’une
des deux est scalaire. Cet exercice ne semble pas être résolu à beaucoup d’endroits dans la littérature, aussi
indiquons-nous les étapes d’une démonstration possible. On considère deux matrices A et B libres. Notons
que U AU −1 et U BU −1 sont encore libres pour toute matrice unitaire U . On commence par supposer que
A est un projecteur différent de 0 et IN et B est hermitienne de trace nulle. Alors en se plaçant dans une
base qui diagonalise A et en utilisant les deux formules (3.3) pour A et B d’une part et IN − A et B d’autre
part, on établit que B est nulle. On en déduit immédiatement que si A est un projecteur non-trivial et B est
hermitienne ou anti-hermitienne, alors B est scalaire. Puisque l’hypothèse que A et B sont libres entraîne que
A est libre avec n’importe quel polynôme en B et B ∗ , on en déduit qu’une matrice libre avec un projecteur non
trivial est scalaire. Finalement, si on suppose seulement que A n’est pas scalaire, alors l’une des deux matrices
diagonalisables A + A∗ et A − A∗ admet deux valeurs propres distinctes, si bien qu’il existe un polynôme en
A et A∗ qui est un projecteur non trivial. La matrice B est libre avec ce projecteur, donc scalaire.
3.2. COMPORTEMENT ASYMPTOTIQUE DES VALEURS PROPRES [LM9]
83
L’exemple le plus simple de deux éléments libres non scalaires est le suivant, qui a motivé la définition de
la notion de liberté par D. Voiculescu. Soit F2 le groupe libre sur la partie à deux éléments {x, y}. Les éléments
de F2 sont donc les mots réduits en les lettres x, y et leurs inverses, et on les multiplie en les concaténant
puis en les réduisant. On note 1 le mot vide, qui est l’élément neutre. On considère l’algèbre A = C[F2 ]
des
P combinaisons
P linéaires formelles finies d’éléments de F2 à coefficients complexes, munie de l’involution
∗
( w cw w) = w cw w−1 . On munit A de la forme linéaire
!
X
τ
cw w = c1 .
w
On vérifie facilement que τ est un état. Nous avons donc construit un nouvel exemple d’espace de probabilités
non-commutatif. Alors les éléments x et y de (A, τ ) sont libres, par définition même du groupe libre F2 .
Soit (A, τ ) un espace de probabilités non-commutatif. On dit qu’un élément a ∈ A est auto-adjoint si
a = a∗ et qu’un élément u est unitaire si uu∗ = u∗ u = 1. La condition de positivité imposée à un état assure
que si a est autoadjoint, la suite (τ (an ))n≥0 est la suite des moments d’une mesure de probabilités sur R qui,
si elle est unique, est appelée distribution de a. Une condition qui suffit à garantir que cette mesure soit unique
est que A soit une algèbre de Banach et que τ soit continue. En effet, dans ce cas, τ (an ) = O(kakn ) ce qui
assure que la distribution de a existe et est à support compact. De même, si u est unitaire, la suite (τ (un ))n∈Z
est la suite des coefficients de Fourier d’une mesure de probabilités sur U, également appelée distribution de u.
On vérifie successivement, dans les trois exemples que nous avons donnés, que la distribution non-commutative
d’une variable aléatoire à valeurs réelles coïncide avec sa distribution usuelle, que la distribution d’une matrice
hermitienne ou unitaire est sa mesure empirique spectrale (voir (3.2)) et que les élément x et y de C[F2 ], qui
sont unitaires, ont pour distribution la mesure uniforme sur U.
La notion de distribution en probabilités libres s’identifie avec celle de suite des moments. Par définition,
la distribution d’un élément unitaire u, par exemple, est la forme linéaire sur C[t, t−1 ] qui à un polynôme
P associe τ (P (u, u−1 )). Pour décrire la distribution jointe de plusieurs éléments, on utilise des polynômes à
−1
plusieurs indéterminées qui ne commutent pas. On note par exemple Cht1 , . . . , tn , t−1
1 , . . . , tn i l’algèbre des
polynômes à n indéterminées et leurs inverses, qu’on peut identifier naturellement avec C[Fn ], l’algèbre du
groupe libre à n générateurs.
Définition 3.2.8 La distribution non-commutative jointe de n éléments unitaires u1 , . . . , un est la forme
−1
−1
−1
linéaire sur Cht1 , . . . , tn , t−1
1 , . . . , tn i qui à un polynôme P associe τ (P (u1 , . . . , un , u1 , . . . , un ).
On définit de même la convergence en distribution comme la convergence de tous les moments.
Définition 3.2.9 Soient (A, τ ) et (Ar , τr ), r ≥ 1 des espaces de probabilités non-commutatifs. Soient (ui )i∈I
et (ui,r )i∈I , r ≥ 1 des familles d’élements de ces espaces indexées par le même ensemble I. On dit que la
suite de familles (ui,r )i∈I , r ≥ 1 converge en distribution non- commutative vers (ui )i∈I si pour tout n ≥ 1,
−1
tous i1 , . . . , in ∈ I et tout P ∈ Cht1 , . . . , tn , t−1
1 , . . . , tn i on a la convergence
−1
−1
−1
τr (P (ui1 ,r , . . . , uin ,r , u−1
i1 ,r , . . . , uin ,r )) −→ τ (P (ui1 , . . . , uin , ui1 , . . . , uin )).
r→∞
Nous pouvons maintenant définir le mouvement brownien unitaire libre, qui est un processus à accroissements libres stationnaires particulier.
Définition 3.2.10 Soit (A, τ ) un espace de probabilités non-commutatif. Un mouvement brownien multiplicatif libre est une famille (ut )t≥0 d’éléments unitaires de A qui satisfait les propriétés suivantes.
1. Pour tous 0 ≤ t1 ≤ . . . ≤ tn , les éléments ut1 , ut2 u∗t1 , . . . , utn u∗tn−1 sont libres.
2. Pour tous 0 ≤ s ≤ t, la distribution de ut u∗s est égale à la distribution de ut−s .
3. Pour tout t ≥ 0, la distribution de ut est la mesure de probabilités νt sur U.
Ce processus libre est la limite en distribution au sens de la définition 3.2.9, du mouvement brownien
unitaire.
84
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
Proposition 3.2.11 La suite de familles de variables aléatoires ((UN (t))t≥0 )N ≥0 , où chaque UN (t) est vu
comme un élément de l’espace de probabilités non-commutatif (L∞ (Ω, P) ⊗ MN (C), E ⊗ tr) pour un (Ω, P)
approprié, converge en distribution non-commutative vers un mouvement brownien unitaire libre.
Il n’est pas évident qu’il existe un mouvement brownien multiplicatif libre. C’est toutefois vrai, et on peut
même s’en donner un nombre arbitraire de telle façon que les sous-algèbres respectives qu’ils engendrent soient
libres.
La covariance des fluctuations de variables aléatoires de la forme trf (UN (t)) est donnée
par la forme bilinéaire suivante.
Définition 3.2.12 Soit (A, τ ) un C ∗ -espace de probabilités non-commutatif dans lequel
il existe trois mouvements browniens multiplicatifs libres u, v, w qui sont mutuellement
libres. Soit T ≥ 0 un réel. Soient f, g : U → R deux fonctions de classe C 1 . On définit
Z T
τ (f 0 (us vT −s )g 0 (us wT −s )) ds.
σT (f, g) =
0
L’hypothèse que (A, τ ) est un C ∗ -espace de probabilités signifie que A est une C ∗ algèbre, ce qui permet de définir, pour tout élément unitaire u de A et toute fonction
f : U → R continue, un nouvel élément f (u) de A, par calcul fonctionnel. Le théorème
de la limite centrale, analogue au théorème 3.2.5 de Diaconis et Evans, est le suivant.
Théorème 3.2.13 ([LM9, Theorem 2.6]) Soit UN le mouvement brownien sur U(N )
associé au produit scalaire sur u(N ) donné par hhX, Y ii = N Tr(X ∗ Y ). Soit T ≥ 0 un réel.
Soit n ≥ 1 un entier. Soient f1 , . . . , fn : U → R des fonctions de classe C 1 (U) dont la
dérivée est lipschitzienne. La matrice symétrique réelle n × n définie par ΣT (f1 , . . . , fn ) =
(σT (fi , fj ))i,j∈{1,...,n} est positive. De plus, lorsque N tend vers l’infini, la convergence
suivante de vecteurs aléatoires de Rn a lieu en distribution :
(loi)
N (trfi (UN (T )) − E [trfi (UN (T ))])i∈{1,...,n} −→ N (0, ΣT (f1 , . . . , fn )).
N →∞
(3.4)
La régularité des fonctions que l’on considère ne sert pas à garantir la positivité de
la matrice ΣT , qui est vraie pour des fonctions C 1 , mais bien à faire fonctionner notre
preuve de la convergence, qui repose sur du calcul stochastique. Toutefois, le théorème
de Diaconis et Evans et la convergence rapide du mouvement brownien vers sa mesure
invariante qui est la mesure de Haar suggère qu’il devrait être possible d’améliorer ce
résultat en élargissant la classe de fonctions pour laquelle le résultat a lieu. Nous avons
au moins établi le résultat de convergence suivant pour la covariance.
Théorème 3.2.14 ([LM9, Theorem 8.3]) Pour toute paire de fonctions f, g de classe
C 1 sur U et dont les dérivées sont lipschitziennes, on a, avec les notations des théorèmes
3.2.5 et 3.2.13, la convergence suivante :
σT (f, g) −→ hf, giH 21 .
T →∞
3.2. COMPORTEMENT ASYMPTOTIQUE DES VALEURS PROPRES [LM9]
85
Nous avons en fait obtenu un résultat un peu meilleur en montrant que pour T assez
grand, on peut étendre la définition de σT (f, g) à tout paire de fonctions f, g appartenant
1
à l’espace H 2 et qu’avec cette définition étendue le résultat précédent reste vrai. Plus
précisément, en notant, pour tous j, k ∈ Z et tout T ≥ 0,
Z T τ (us vT −s )j (us wT −s )k ds,
τj,k (T ) =
0
nous avons pu obtenir une borne qui garantit que, pour T assez grand, si f et g sont deux
1
fonctions de H 2 , alors la série
X
σT (f, g) = −
jk fˆ(j)ĝ(k)τj,k (T )
j,k∈Z
converge. De plus, d’une part, si les fonction f et g sont à dérivée lipschitzienne, alors
les deux définitions que nous avons données de σT (f, g) coïncident, et d’autre part, la
convergence énoncée par le théorème 3.2.14 persiste avec cette nouvelle définition de σT .
1.0
2.5
0.8
2.0
0.6
1.5
0.4
1.0
0.2
0.5
1
2
3
4
5
6
1
2
3
4
5
6
4
1.0
3
0.5
2
1
1
2
3
4
5
6
-0.5
-1.0
1
2
3
4
5
6
Figure 3.3 – Pour tout k ≥ 1, posons sk (eiθ ) = sin(kθ) et ck (eiθ ) = cos(kθ). Ces graphiques représentent
des fonctions de T pour T ∈ [0, 6]. En haut à gauche : µk (T ) pour k ∈ {1, . . . , 6}. En haut à droite :
σT (sk , sk+1 ) pour k ∈ {1, . . . , 15}. En bas à gauche : σT (sk , sk ) et σT (ck , ck ) pour k ∈ {1, . . . , 8}. En bas
à droite : σT (sk , sk+2 ) pour k impair appartenant à {1, . . . , 13}.
Il faut souligner que cette extension de la définition de σT n’est valide que lorsque
T est assez grand. D’une façon générale, il est très difficile de contrôler les moments ou
86
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
les covariances en temps petit. Ceci est à rapprocher du fait que la mesure νt , la loi du
mouvement brownien unitaire libre, est à support strictement inclus dans U pour t < 4,
et à densité analytique pour t > 4. La figure 3.3 illustre le comportement mystérieux en
temps petit de certaines des fonctions que nous avons considérées.
3.3
Entre indépendance et liberté [LBG8]
Avec Florent Benaych-Georges, nous avons utilisé le mouvement brownien unitaire
pour proposer une interpolation entre les notions d’indépendance et de liberté pour des
éléments d’un espace de probabilités non-commutatif. Nous allons aborder cette question
par le biais de la convolution des mesures.
3.3.1
Convolutions
Soient µ et ν deux mesures de probabilités sur R. La convolution classique de µ et ν,
notée µ ∗ ν, est une autre mesure de probabilités sur R qu’on peut décrire comme la loi de
la somme de deux variables aléatoires indépendantes de lois respectives µ et ν. Une autre
façon de la décrire est la suivante. Soient (AN )N ≥1 et (BN )N ≥1 deux suites de matrices
diagonales telles que pour tout N ≥ 1, AN et BN soient de taille N ×N et, lorsque N tend
vers l’infini, les mesures empiriques spectrales µ̂AN et µ̂BN convergent respectivement vers
µ et ν. Pour tout N ≥ 1, soit SN une matrice aléatoire de loi uniforme sur l’ensemble des
N ! matrices de permutation de taille N . Alors, on a la convergence suivante en loi :
(loi)
µ̂AN +SN BN S −1 −→ µ ∗ ν.
N
N →∞
Pour tout N ≥ 1, considérons maintenant une matrice VN de loi uniforme sur U(N ). Alors
on a la convergence suivante :
(loi)
µ̂AN +VN BN V −1 −→ µ ν,
N
N →∞
où µ ν est la mesure sur R qui peut être décrite comme la distribution de la somme
de deux éléments autoadjoints libres d’un espace de probabilités non-commutatif, de distributions respectives µ et ν. Cette mesure ne dépend que de µ et ν car, comme pour
l’indépendance dans le cas classique, la distribution jointe de deux éléments libres est
complètement déterminée par leurs distributions individuelles.
Pour tout N ≥ 1, il y a une interpolation naturelle entre la loi de SN et celle de VN :
c’est la famille des lois de UN (t)SN où t décrit R+ . Pour t = 0, on a UN (0)SN = SN et,
lorsque t tend vers +∞, UN (t)SN tend en loi vers une matrice unitaire uniforme. Comme
on pouvait l’espérer, on a le résultat suivant.
Théorème 3.3.1 ([LBG8, Corollary 2.10]) Soient µ et ν des mesures de probabilités
sur R. Soient (AN )N ≥1 et (BN )N ≥1 deux suites de matrices diagonales comme ci- dessus.
Soit UN un mouvement brownien sur U(N ). Soit t ≥ 0 un réel. Alors, lorsque N tend
−1
UN (t)−1
vers l’infini, la mesure empirique spectrale de la matrice AN + UN (t)SN BN SN
converge faiblement en probabilité vers une mesure déterministe sur R qui ne dépend que
de µ, ν et t, que nous notons µ ∗t ν et que nous appelons convolution t-libre de µ et ν.
3.3. ENTRE INDÉPENDANCE ET LIBERTÉ [LBG8]
87
Un exemple classique où l’on sait calculer explicitement la convolution libre de deux
mesures est celui où µ = ν = 12 (δ1 + δ−1 ). Dans ce cas, µ ∗ ν = 41 δ−2 + 12 δ0 + 14 δ2 et
µ ν = 1[−2,2] (x) π√dx
, une image par homothétie de la loi de l’arcsinus. On peut
4−x2
montrer que pour tout t > 0,
x
ρ4t (e4i arccos 2 )
δ1 + δ−1 δ1 + δ−1
∗t
= 1[−2,2] (x) √
dx,
2
2
π 4 − x2
(3.5)
où, pour tout t > 0 et tout θ ∈ R, ρt (eiθ ) est la densité en eiθ de la mesure νt par rapport
à la mesure uniforme sur U.
−1
∗t δ1 +δ
en x ∈ [−2, 2] en fonction de x et t. On peut décrire
2
complètement le support de la mesure à chaque temps. Ainsi le premier temps
√ auquel
√ ce support est
l’intervalle [−2, 2] entier est t = 1 et les deux derniers points à y entrer sont − 2 et 2.
Figure 3.4 – Densité de
3.3.2
δ1 +δ−1
2
Structures de dépendance et t-liberté
Comme dans le cas de l’indépendance et de la liberté, l’existence de la convolution
t- libre de deux mesures est un reflet de l’existence d’une structure de dépendance entre
sous-algèbres d’un espace de probabilités non-commutatif. Par structure de dépendance,
nous entendons la chose suivante : dans un espace de probabilités non-commutatif (A, τ )
où sont données deux sous-algèbres A1 et A2 , une façon de reconstituer la restriction de τ
à la sous-algèbre engendrée par A1 ∪A2 connaissant les seules restrictions de τ à A1 et A2 .
En termes commutatifs, nous dirions qu’une telle structure permet d’inférer la loi jointe
d’une famille de variables aléatoires de la seule connaissance de leurs lois individuelles.
ENCART 13 – Structures de dépendance et modèles universels
Une façon de décrire une structure de dépendance entre deux sous-algèbres A1 et A2 d’un espace de
probabilités non-commutatif est de donner une règle qui permette de calculer τ (P (a1 , a2 )) pour tous a1 ∈
A1 , a2 ∈ A2 et tout polynôme P ∈ Cht1 , t2 i connaissant les moments de a1 et a2 . C’est exactement de
cette façon que nous avons défini la liberté (voir la définition 3.2.7). C’est aussi de cette nature qu’est la
règle E[f (X)g(Y )] = E[f (X)]E[g(Y )] qui caractérise l’indépendance de deux variables aléatoires. Une telle
88
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
description n’assure cependant pas l’existence d’exemples non triviaux de la structure de dépendance qu’on
veut définir. L’exemple que nous avons donné dans l’encart 12 de deux éléments libres, aussi naturel soit-il,
n’était pas contenu dans la définition de la liberté.
En probabilités classiques, la construction qui assure l’existence de variables indépendantes de loi arbitraire est celle du produit cartésien de deux espaces mesurables muni du produit tensoriel de deux mesures de
probabilités. Du point de vue non pas des espaces de probabilités mais des variables aléatoires, cette construction correspond au produit tensoriel des algèbres. Considérons par exemple un espace de probabilités (Ω, P)
et notons (A, τ ) l’espace de probabilités non-commutatif (commutatif !) (L∞ (Ω, P), E). Donnons-nous deux
variables aléatoires bornées X et Y sur Ω. Notons (AX , τX ) la sous-algèbre de A engendrée par X, c’est-àdire l’ensemble des polynômes en X, munie de la forme linéaire induite par l’espérance. Considérons de façon
analogue (AY , τY ).
La sous-algèbre de A engendrée par X et Y , qui n’est rien d’autre que l’ensemble des polynômes en X
et Y , n’est pas nécessairement isomorphe à C[X, Y ], car il peut y avoir des relations algébriques entre X et
Y . Néanmoins, cette sous-algèbre est l’image de C[X, Y ] par le morphisme d’algèbres naturel P 7→ P (X, Y ).
L’algèbre C[X, Y ] nous sert ici de modèle concret du produit tensoriel AX ⊗AY , qui d’une façon un peu vague
est la plus grosse algèbre possible qui soit engendrée par AX et AY et au sein de laquelle tout élément de
AX commute à tout élément de AY . Il y a en particulier un unique morphisme d’algèbre m : AX ⊗ AY → A
tel que m(X ⊗ 1) = X et m(1 ⊗ Y ) = Y , et l’image de ce morphisme est exactement l’algèbre engendrée par
X et Y .
On peut définir un état τX ⊗ τY sur AX ⊗ AY en posant (τX ⊗ τY )(a ⊗ b) = τX (a)τY (b). Cette étape
correspond à la construction du produit tensoriel de deux mesures. On peut alors, pour tout élément c de
AX ⊗ AY , comparer son espérance dans AX ⊗ AY et dans A, ou plus précisément comparer (τX ⊗ τY )(c)
et τ (m(c)). La proposition suivante est la reformulation purement algébrique de l’indépendance que nous
cherchions : les variables X et Y sont indépendantes si et seulement si le morphisme d’algèbres m : AX ⊗AY →
A préserve les espérances, c’est-à-dire si τX ⊗ τY = τ ◦ m. Nous en tirons la définition générale suivante.
Définition 3.3.2 Soit (A, τ ) un espace de probabilités non-commutatif. Soient A1 et A2 deux sous-algèbres
de A. Notons τ1 et τ2 les restrictions de τ à A1 et A2 respectivement. On dit que A1 et A2 sont indépendantes
si tout élément de A1 commute à tout élément de A2 et si le morphisme d’algèbres naturel m : A1 ⊗ A2 → A
satisfait l’égalité τ ◦ m = τ1 ⊗ τ2 .
Nous avons gagné deux choses par rapport au cas commutatif : d’une part l’espace ambiant A n’a pas
besoin d’être commutatif et d’autre part, aucune des deux algèbres A1 et A2 n’a besoin d’être commutative.
Tout ce que nous exigeons est qu’elles commutent l’une à l’autre. C’est par exemple le cas des deux sousalgèbres R et P de End((CN )⊗n ) définies dans le cadre de la dualité de Schur-Weyl (voir théorème 3.1.9).
Toutefois, ces deux sous-algèbres ne sont pas du tout indépendantes.
La construction algébrique qui correspond à la liberté est le produit libre de deux algèbres. Si A1 et A2
sont deux algèbres unifères, leur produit libre A1 ∗ A2 est la plus grosse algèbre unifère possible qui soit
engendrée par A1 et A2 , avec pour seule condition que l’unité de A1 coïncide avec l’unité de A2 . De façon
plus précise, un produit libre de A1 et A2 est une algèbre A munie de deux morphismes d’algèbres j1 : A1 → A
et j2 : A2 → A et telle que, une algèbre quelconque B étant donnée, ainsi que deux morphismes d’algèbres
m1 : A1 → B et m2 : A2 → B, il existe un unique morphisme m : A → B tel que m◦j1 = m1 et m◦j2 = m2 .
Cette description caractérise le triplet (A, j1 , j2 ) à isomorphisme près.
Une façon de démontrer qu’un tel produit libre existe est de choisir dans chacune des algèbres unifères A1
et A2 un supplémentaire de C : on écrit A1 = C ⊕ A01 et A2 = C ⊕ A02 . Alors l’algèbre


M


C ⊕ A01 ⊕ A02 ⊕ A01 ⊗ A02 ⊕ A02 ⊗ A01 ⊕
A01 ⊗ A02 ⊗ A01 ⊗ . . . ⊕ A02 ⊗ A01 ⊗ A02 ⊗ . . .  (3.6)
{z
} |
{z
}
|
n≥3
n facteurs
n facteurs
munie du produit le plus naturel (qui n’est pas tout à fait simple à définir précisément car le produit de deux
éléments de A01 par exemple n’appartient pas nécessairement à A01 ) et des morphismes j1 et j2 qui identifient
respectivement A1 et A2 avec C ⊕ A01 et C ⊕ A02 , est un produit libre de A1 et A2 .
3.3. ENTRE INDÉPENDANCE ET LIBERTÉ [LBG8]
89
Étant donné des états τ1 et τ2 sur A1 et A2 , on peut choisir A01 et A02 comme les noyaux de τ1 et τ2 . Un
état naturel apparaît alors sur le produit libre, dont le noyau est l’hyperplan entre parenthèses dans (3.6). On
note cet état τ1 ∗ τ2 et on vérifie que A1 et A2 sont libres par rapport à cet état. On a alors une caractérisation
de la liberté analogue à celle de l’indépendance donnée ci-dessus.
Définition 3.3.3 Soit (A, τ ) un espace de probabilités non-commutatif. Soient A1 et A2 deux sous-algèbres
de A. Notons τ1 et τ2 les restrictions de τ à A1 et A2 respectivement. On dit que A1 et A2 sont libres si le
morphisme d’algèbres naturel m : A1 ∗ A2 → A satisfait l’égalité τ ◦ m = τ1 ∗ τ2 .
Nous allons définir un modèle universel pour la t-liberté en définissant un état sur le
produit libre des algèbres sous-jacentes à deux espaces de probabilités non-commutatifs
quelconques.
Définition 3.3.4 Soient (A1 , τ1 ) et (A2 , τ2 ) deux espaces de probabilités non-commutatifs.
Soit t un réel positif. Soit (U, υ) un espace de probabilités non-commutatif engendré par un
élément unitaire ut dont la distribution est la mesure νt sur U. Soit m l’unique morphisme
d’algèbres
m : A1 ∗ A2 → (A1 ⊗ A2 ) ∗ U
qui satisfait m(a1 ) = a1 ⊗ 1 pour tout a1 ∈ A1 et m(a2 ) = u(1 ⊗ a2 )u−1 pour tout a2 ∈ A2 .
On appelle produit t-libre de τ1 et τ2 l’état τ1 ∗t τ2 sur A1 ∗ A2 défini par
τ1 ∗t τ2 = [(τ1 ⊗ τ2 ) ∗ υ] ◦ m.
Le fait que la mesure νt soit invariante par conjugaison complexe entraîne que la
paire (u, u−1 ) a la même distribution que la paire (u−1 , u), si bien qu’on aurait obtenu la
même définition de τ1 ∗t τ2 en remplaçant m par le morphisme m0 qui satisfait m0 (a1 ) =
u(a1 ⊗ 1)u−1 et m0 (a2 ) = 1 ⊗ a2 .
Si t = 0, on retrouve la définition du produit tensoriel de deux états, transporté du
produit tensoriel des algèbres à leur produit libre par le morphisme naturel A1 ∗ A2 →
A1 ⊗ A2 . En revanche, si t > 0, l’élément ut n’est pas scalaire dans U et ceci permet
d’assurer que m est injectif. Alors la sous-algèbre de (A1 ⊗ A2 ) ∗ U engendrée par A1 ⊗ 1
et u(1 ⊗ A2 )u−1 est une réalisation du produit libre de A1 et A2 .
Un modèle universel étant défini, nous pouvons définir la t-liberté.
Définition 3.3.5 ([LBG8, Definition 2.5]) Soit (A, τ ) un espace de probabilités noncommutatif. Soient A1 et A2 deux sous-algèbres de A. Notons τ1 et τ2 les restrictions de
τ à A1 et A2 respectivement. On dit que A1 et A2 sont t-libres si le morphisme d’algèbres
naturel m : A1 ∗ A2 → A satisfait l’égalité τ ◦ m = τ1 ∗t τ2 . On dit que deux parties de A
sont t-libres si les sous-algèbres involutives qu’elles engendrent le sont.
La remarque faite après la définition 3.3.4 assure que cette définition est symétrique
en A1 et A2 .
On vérifie alors que la t-convolution correspond bien à la t-liberté.
90
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
Proposition 3.3.6 Soit (A, τ ) un espace de probabilités non-commutatif. Soit t ≥ 0 un
réel et soient a, b ∈ A deux élément autoadjoints t-libres, de distributions respectives µ et
ν. Alors la distribution de a + b est µ ∗t ν.
Nous pouvons définir d’autres convolutions t-libres. Par exemple, nous pouvons multiplier des éléments t-libres : si, avec les notations de la proposition ci-dessus,
A est une
√ √
∗
C -algèbre et a et b sont positifs, on peut définir µ t ν comme la loi de ba b. Enfin,
si a et b sont unitaires, auquel cas µ et ν sont des mesures de probabilités non plus sur R
mais sur U, on peut définir µ t ν comme la loi de ab.
3.3.3
Systèmes différentiels
Lorsqu’on cherche à faire des calculs avec des paires de variables t-libres, on est amené
à calculer des expressions de la forme
τ (a1 ut b1 u∗t . . . an ut bn u∗t ),
(3.7)
où la famille {a1 , . . . , an } est indépendante de {b1 , . . . , bn } et ut est libre avec la réunion
de ces deux familles.
La meilleure prise qu’on ait sur de telles expressions est de les considérer comme des
fonctions de t et d’établir un système différentiel fermé le plus petit possible qu’elles
satisfassent. Pour dériver par rapport à t une expression comme (3.7), on utilise une
équation différentielle stochastique libre satisfaite par le mouvement brownien libre, qui
est l’analogue (et en un sens vague la limite lorsque N tend vers l’infini, conformément à la
proposition 3.2.11) de l’équation différentielle stochastique (3.1) qui définit le mouvement
brownien unitaire [Bia97].
Cette dérivée fait apparaître des produits d’expressions de la forme (3.7). En considérant tous les produits d’expressions de cette forme où a1 , . . . , an , ut b1 u∗t , . . . , ut bn u∗t apparaissent exactement une fois chacun, on obtient un ensemble fini de fonctions de t qui
satisfait un système différentiel fermé. En résolvant de tels systèmes, on parvient à établir
le résultat suivant.
Proposition 3.3.7 ([LBG8, Proposition 3.5]) On définit une fonction G(t, z) dans
un voisinage de (0, 0) dans R+ × C de la façon suivante.
Soit (A, τ ) un espace de probabilités non-commutatif. Soient a et b deux éléments
normaux dont les distributions sont à support compact et symétriques (c’est-à- dire que a
et −a d’une part, b et −b d’autre part, ont même distribution). Soit t ≥ 0. On suppose a
et b t-libres. On pose alors
X
G(t, z) =
τ ((ab)2n )e2nt z n .
n≥1
Alors, G est l’unique solution, dans un voisinage de (0, 0) dans R+ × C, de l’équation
non-linéaire
∂t G + 2z∂z (G2 ) = 0,
X
G(0, z) =
τ (a2n )τ (b2n )z n .
n≥1
3.3. ENTRE INDÉPENDANCE ET LIBERTÉ [LBG8]
91
C’est de cette proposition qu’on déduit l’égalité (3.5). On peut également en déduire
la loi du produit de deux variables de Bernoulli t-libres.
Proposition 3.3.8 Pour tout t > 0, on a l’égalité de mesures suivantes sur U :
δ−1 + δ1
δ−1 + δ1
t
= ρ4t (ξ 2 )dξ,
2
2
où ρ4t est la densité de la mesure ν4t par rapport à la mesure uniforme.
Figure 3.5 – Densité de δ−12+δ1 t δ−12+δ1 en eiθ en fonction de θ et t. Le support de la mesure
remplit le cercle pour la première fois au temps t = 1. Les derniers points à entrer dans le support
sont i et −i.
3.3.4
Inexistence de cumulants t-libres
Par analogie avec le cas de la liberté, nous nous sommes demandé s’il était possible
de trouver des cumulants t-libres, c’est-à-dire des formes multilinéaires définies sur tout
espace de probabilités non-commutatif et qui s’annuleraient dès lors qu’on les évalue sur
des arguments qui peuvent être regroupés en deux familles non vides et t-libres.
ENCART 14 – Cumulants libres [NS06]
Soit µ une mesure de probabilités à support compact sur R. Les cumulants (classiques) de µ sont les
nombres complexes (cn (µ))n≥1 définis par l’égalité
Z
X
zn
log ezt µ(dt) =
cn (µ) .
n!
R
n≥1
Les cumulants linéarisent la convolution : si µ et ν sont à support compact, on a cn (µ ∗ ν) = cn (µ) + cn (ν)
pour tout n ≥ 1.
R nLes cumulants sont reliés de façon combinatoire aux moments. Pour tout n ≥ 1, notons mn (µ) =
t µ(dt) le n-ième moment de µ. Considérons l’ensemble Pn des partitions de {1, . . . , n}. Pour tout
R
92
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
π ∈ Pn , définissons mπ (µ) comme le produit des moments de µ dont les ordres sont les tailles des blocs de π.
Par exemple, m{{1,3},{2,5},{4}} (µ) = m1 (µ)m2 (µ)2 . Définissons de façon similaire les cumulants cπ (µ). Alors
la relation qui lie moments et cumulants est la suivante : pour tout n ≥ 1,
X
mn (µ) =
cπ (µ).
π∈Pn
Cette relation peut être inversée pour exprimer chaque cumulant cn en fonction des moments mπ , en utilisant
la fonction de Möbius du treillis Pn muni de la relation d’ordre partiel pour laquelle π1 ≤ π2 si chaque bloc de
π1 est contenu dans un bloc de π2 . Nous notons 1n = {{1, . . . , n}} le plus grand élément de Pn . On a alors
X
Moeb(1n , π)mπ (µ).
cn (µ) =
π∈Pn
Soit (Aτ ) un espace de probabilités non-commutatif. Par analogie avec ce qui précède, pour toute partition
π ∈ Pn et tout a ∈ A, nous pouvons définir mπ (a) comme le produit des moments m(ak ) de a correspondant
aux tailles des blocs de π. En fait, si nous choisissons un ordre cyclique sur {1, . . . , n}, par exemple le plus
naturel, nous pouvons étendre cette définition en posant
Y
τ (ai1 . . . air ).
∀a1 , . . . , an ∈ A, mπ (a1 , . . . , an ) =
B bloc de π
B={i1 <...<ir }
L’hypothèse de tracialité que nous avons faite sur τ entraîne que cette définition ne dépend bien que de l’ordre
cyclique sur {1, . . . , n}.
Pour définir les cumulants libres, il faut introduire le treillis des partitions non-croisées.
Définition 3.3.9 Soit π une partition de l’ensemble {1, . . . , n} muni de l’ordre cyclique naturel. À chaque bloc
2π
2π
B = {k1 , . . . , kr } de π on associe le polygône PB qui est l’enveloppe convexe des points eik1 n , . . . , eik1 n .
0
On dit que π est non-croisée si pour tous B et B blocs distincts de π, on a PB ∩ PB 0 = ∅.
4
3
5
4
5
2
1
6
10
7
8
3
2
1
6
10
7
8
9
9
Figure 3.6 – La partition {{1, 2, 3, 7}, {4, 6}, {5}, {8, 9, 10}} est non-croisée alors que
{{1, 3, 7}, {2, 8, 9, 10}, {4, 6}, {5}} est croisée.
L’ensemble des partitions non-croisées de {1, . . . , n} est noté N C n . La relation d’ordre sur Pn induit une
relation d’ordre sur N C n qui en fait un treillis. Notons moeb la fonction de Möbius de ce treillis. Alors on
définit les cumulants libres de la façon suivante.
Définition 3.3.10 Soit (A, τ ) un espace de probabilités non-commutatif. Soient a1 , . . . , an des éléments de
A. On définit le cumulant libre de a1 , . . . , an comme
X
kn (a1 , . . . , an ) =
moeb(1n , π)mπ (a1 , . . . , an ).
π∈N C n
Enfin, pour tout a ∈ A et tout n ≥ 1, on pose kn (a) = kn (a, . . . , a).
3.3. ENTRE INDÉPENDANCE ET LIBERTÉ [LBG8]
93
On a alors les propriétés suivantes.
Proposition 3.3.11 Soit (A, τ ) un espace de probabilités. Soient A1 et A2 deux sous-algèbres de A. Alors
les deux propriétés suivantes sont équivalentes.
1. Pour tout n ≥ 1 et tous a1 , . . . , an éléments de A qui appartiennent chacun soit à A1 soit à A2 , mais
ni tous à A1 ni tous à A2 , ce qui s’écrit
{a1 , . . . , an } ⊂ A1 ∪ A2 , {a1 , . . . , an } 6⊂ A1 , {a1 , . . . , an } 6⊂ A2 ,
on a kn (a1 , . . . , an ) = 0.
2. A1 et A2 sont libres par rapport à τ .
En particulier, si a et b sont deux éléments libres de A, on a pour tout n ≥ 1 l’égalité kn (a + b) =
kn (a) + kn (b).
Ainsi, les cumulants libres linéarisent la convolution libre et caractérisent la liberté.
Malheureusement, dans le cas t-libre pour t > 0, nous avons montré qu’il n’existe rien
d’aussi simple et puissant que les cumulants libres. Nous avons cherché des candidats au
rôle de cumulant t-libre dans l’ensemble suivant de formes multilinéaires.
Définition 3.3.12 Soit (A, τ ) un espace de probabilités. Soit n ≥ 1 un entier. Soit
σ ∈ Sn une permutation. On définit une forme n-linéaire sur A en posant, pour tous
a1 , . . . , an ∈ A,
Y
τσ (a1 , . . . , an ) =
τ (ai1 . . . air ).
(i1 ...ir ) cycle de σ
Cette définition a un sens grâce à la tracialité de τ . Nous cherchons maintenant une
combinaison linéaire des τσ , σ ∈ Sn qui ait la propriété de s’annuler dès lors qu’on l’évalue
sur des arguments qui peuvent être répartis en deux sous-ensembles non vides et qui
forment deux familles t-libres.
Définition 3.3.13 Soit n ≥ 2 un entier. Soit t ≥ 0 un réel. UnX
cumulant t- libre d’ordre
c(σ) 6= 0 et telle que
n est une collection (c(σ))σ∈Sn de nombres complexes telle que
σ n−cycle
la propriété suivante soit vérifiée dans tout espace de probabilités non-commutatif (A, τ ) :
pour toute paire (A1 , A2 ) de sous-algèbres de A qui sont t-libres par rapport à τ , et pour
tous a1 , . . . , an éléments de A qui appartiennent chacun soit à A1 soit à A2 , mais ni tous
à A1 ni tous à A2 , on a
X
c(σ)τσ (m1 , . . . , mn ) = 0.
(3.8)
σ∈Sn
Notre résultat est le suivant. Par t-libre pour t = +∞, nous entendons libre.
Théorème 3.3.14 ([LBG8, Theorems 4.3 and 4.4]) 1. Pour tout t ∈ [0, +∞] et tout
n ∈ {2, 3, 4, 5, 6}, il existe un cumulant t-libre d’ordre n. Si de plus on demande que ce
cumulant soit invariant par conjugaison, c’est-à-dire tel que c(σ1 σ2 σ1−1 ) = c(σ2 ) pour tous
σ1 , σ2 ∈ Sn , alors il est unique à multiplication près par une constante.
2. Il existe un cumulant t-libre d’ordre 7 si et seulement si t = 0 ou t = +∞.
94
CHAPITRE 3. MOUVEMENT BROWNIEN UNITAIRE
Perspectives
En guise de conclusion, je vais indiquer quelques développements qui me semblent se
présenter naturellement dans la continuité des travaux que j’ai exposés ici, et je vais le
faire en reprenant les thèmes approximativement dans l’ordre dans lequel ils ont été traités.
À la suite de la construction des champs d’holonomie markoviens telle qu’elle a été
ici exposée, il me semble inévitable de souhaiter compléter le résultat de classification
partielle que nous avons obtenu (théorème 1.3.6). Nous avons montré qu’à chaque champ
d’holonomie markovien régulier était associé un processus de Lévy admissible. Est-il vrai
que ce processus de Lévy caractérise complètement le champ d’holonomie markovien ?
Autrement dit, un champ d’holonomie markovien est-il déterminé par ses fonctions de
partition ? Je crois que la réponse est affirmative si le groupe de structure est abélien,
mais je ne la connais pas dans le cas général. Si elle s’avérait négative, ce qui ne me
semble pas exclu, il faudrait à mon avis tenter d’ajouter une hypothèse à la définition des
champs d’holonomie qui permette d’éviter cette ambiguïté.
En restant au niveau général de la construction, il me semblerait intéressant de poursuivre le point de vue selon lequel un champ d’holonomie aléatoire est un morphisme
de groupes aléatoire entre le groupe des lacets rectifiables tracés sur une surface et un
groupe de Lie compact. Ben Hambly et Terry Lyons ont donné dans [HL06] une définition
précise du groupe des lacets rectifiables réduits sur un espace vectoriel ou une variété différentiable, et des outils analytiques pour les manipuler. Il est sans doute techniquement
difficile de comprendre la variable aléatoire associée à un lacet par un champ d’holonomie aléatoire comme une fonction assez explicite de sa signature (voir [LCL] pour plus
de détails sur la signature d’un chemin), mais y parvenir même dans des cas simples me
semblerait extrêmement intéressant et serait probablement riche d’enseignements sur la
régularité exacte des champs d’holonomie markoviens.
Une extension possible et naturelle des champs d’holonomie markoviens consisterait
à définir une holonomie aléatoire le long de chemins aléatoires, peut-être de chemins
browniens. Je pense que les techniques utilisées dans [L7] pourraient difficilement suffire
à définir une holonomie aléatoire le long de chemins aussi irréguliers que des chemins
browniens typiques, mais on pourrait imaginer que des compensations dues à la structure
particulière du mouvement brownien puissent malgré tout permettre de définir un objet
non-trivial. À ma connaissance, la seule tentative dans cette direction a été faite par Sergio
Albeverio et Shigeo Kusuoka [AK95].
Toutefois, une direction de recherche qui me semble bien plus importante est celle
qui consiste à tenter de coupler les champs d’holonomie markoviens avec d’autres objets
95
96
PERSPECTIVES
aléatoires. Ces objets aléatoires pourraient être des chemins, dans l’esprit du paragraphe
précédent, mais l’origine physique des objets que nous considérons indique que les couplages les plus intéressants seraient sans doute ceux qu’on effectuerait avec des objets
qu’on pourrait interpréter comme des champs de matière. Cette question du couplage a
un sens aussi bien dans un cadre discret, où l’on tenterait de coupler des théories de jauge
avec divers modèles de physique statistique sur réseau, que dans un cadre continu, où l’on
chercherait à coupler par exemple un champ d’holonomie avec des sections aléatoires d’un
fibré vectoriel associé au fibré principal sous-jacent. Il est aussi possible que les objets
pertinents soient de nature non-commutative, pour tenir compte de la nature fermionique
des champs de matière.
Le principe de grandes déviations que nous avons démontré avec James Norris concerne
le champ de Yang-Mills, qui est associé au mouvement brownien sur le groupe de structure.
On peut se demander s’il y a des résultats analogues pour d’autres champs d’holonomie
markoviens, associés à d’autres processus de Lévy. Pour établir de tels résultats, il faudrait
sans doute comprendre ces champs markoviens comme reflets de connexions aléatoires, ou
peut-être comme reflets de mixtures de connexions aléatoires et de revêtements ramifiés.
Cette idée est proche de celles qui sont exposées par Gross et Taylor dans [GT93a, GT93b]
où, en mélangeant la théorie de Yang-Mills et des modèles plus ou moins mystérieux
de revêtements aléatoires, ils obtiennent des formules remarquables sur le mouvement
brownien dans le groupe unitaire.
Un aspect de la théorie de Yang-Mills en deux dimensions qui a suscité l’intérêt des
physiciens est l’existence, lorsque le groupe de structure est le groupe unitaire U(N ), d’une
transition de phase liée à la limite N → ∞. Cette transition de phase prend différents
aspects suivant le point de vue qu’on adopte, mais il me semble qu’elle ne peut qu’être liée
à cette transition fondamentale : la distribution limite des valeurs propres du mouvement
brownien sur le groupe unitaire, qui pour tout t ≥ 0 est une mesure de probabilités sur
le cercle unité, est d’abord égale à la masse de Dirac en 1 pour t = 0, puis voit son
support croître progressivement jusqu’à t = 4, qui est le premier temps auquel ce support
est le cercle unité tout entier, puis devenir analytique pour t > 4. Pour t ∈ (0, 4), les
moments de cette distribution limite décroissent comme des puissances de leur ordre alors
que pour t > 4 ils décroissent exponentiellement (voir la section 3.2.1). L’existence d’une
transition de phase pour la mesure de Yang-Mills sur une sphère en fonction de l’aire
totale de la sphère [DK94] peut être rendue plausible à partir de ces faits, mais il reste
beaucoup à faire avant de pouvoir produire un énoncé rigoureux. Les calculs concernant
le pont brownien sur le groupe unitaire, qui semblent être la porte d’entrée naturelle pour
ces questions, deviennent en effet très rapidement inextricables, plus rapidement encore
que ceux qui concernent le mouvement brownien. Une caractéristique de ces calculs est
le fait qu’on s’y trouve perpétuellement en train d’exprimer des quantités petites (par
exemple des nombres complexes de module inférieur à 1) comme sommes alternées de
nombres gigantesques, ce qui est évidemment extrêmement peu propice à l’estimation de
ces quantités.
Les graphes présentés à la figure 3.3 illustrent eux aussi la différence de comportement
en temps petit et en temps grand du mouvement brownien sur U(N ) lorsque N tend vers
l’infini. Dans l’étude des fluctuations de variables aléatoires de la forme trf (UN ), il reste
97
beaucoup à faire. Nous avons énoncé le théorème de la limite centrale (théorème 3.2.13)
pour des fonctions à dérivée lipschitzienne, mais, avec Mylène Maïda, nous conjecturons
que ce théorème est vrai pour des fonctions bien moins régulières, au moins pour T assez
grand. Une version plus précise de notre conjecture serait que la classe de fonctions pour
1
laquelle le théorème est vrai est l’espace H 2 pour T > 4 et que cette classe dépendrait
de T pour T ≤ 4. On pourrait par exemple imaginer que pour T ≤ 4 il soit nécessaire
d’imposer des conditions particulières aux deux bords du spectre du νT . Toutefois, nous
n’avons pas d’idée précise de ce que pourrait être la classe exacte des fonctions pour
lesquelles le théorème est vrai lorsque T ≤ 4.
Avec Florent Benaych-Georges, nous poursuivons notre investigation de la notion de
t-liberté, ou de notions apparentées, en cherchant en particulier à établir des théorèmes
analogues à ceux qui concernent la convergence en loi de sommes de variables aléatoires
classiques indépendantes. Nous espérons en particulier obtenir une interpolation entre la
bijection de Bercovici-Pata et la transformation identique de l’ensemble des mesures de
probabilités sur R.
Mêlant un grand nombre des questions que je viens d’évoquer, un problème qui retient
beaucoup mon attention est ce champ maître que décrit informellement I. Singer dans
son article [Sin95] et auquel beaucoup de physiciens ont consacré des efforts. Dans le
cas où l’espace-temps est un disque, ou le plan tout entier, tous les outils sont présents
pour décrire ce champ limite, dans le cadre des probabilités libres, et pour démontrer
des résultats de convergence des champs associés à U (N ) vers ce champ limite lorsque N
tend vers l’infini. Il me semble qu’une formulation cohérente de ce champ maître pourrait
faire intervenir le groupe des lacets rectifiables réduits qui est un des sous-produit de la
théorie des chemins irréguliers (rough paths) développée par Terry Lyons [LCL], et que
j’ai mentionné plus haut. Ce groupe, qu’il a étudié avec Ben Hambly [HL06], est une sorte
de groupe libre à une infinité non dénombrable de génerateurs (bien que ce ne soit pas
un groupe libre au sens algébrique) avec lequel il est possible de faire de l’analyse. En
une phrase, il me semble que le champ maître que décrit I. Singer pourrait être défini
rigoureusement comme une trace sur l’algèbre de ce groupe et je travaille actuellement
activement dans cette direction.
Parmi les différents aspects de la limite N → ∞, les équations de Makeenko-Migdal
[MM79] me semblent particulièrement intrigantes et m’apparaissent comme un moyen
possible de mieux comprendre la nature du champ maître. J’essaye actuellement de les
établir rigoureusement et de les comprendre comme une traduction graphique, dans le
groupe libre des lacets réduits dans un graphe, des règles de calcul que donne la formule
d’Itô appliquée au mouvement brownien dans le groupe unitaire. La démonstration de ces
équations que donnent les physiciens, basée sur les équations de Schwinger-Dyson, est à la
fois belle et mystérieuse, et ne semble pas pouvoir être facilement traduite en un langage
mathématique rigoureux.
98
PERSPECTIVES
Annexe
Des équations de Maxwell à la mesure
de Yang-Mills
Dans cet appendice, je vais essayer d’esquisser un chemin qui relie la description classique de l’électromagnétisme, telle qu’il est vraisemblable que le lecteur l’ait déjà étudiée
et manipulée, à un petit morceau de théorie des champs qui rende plausible l’intérêt
physique de la mesure de Yang-Mills.
A.1
Champs et potentiels
La théorie classique de l’électromagnétisme, telle qu’elle a été formulée à la fin du dixneuvième siècle, consiste en les quatre équations de Maxwell et la loi de Lorentz. Les
équations de Maxwell déterminent deux champs de vecteurs dépendant du temps dans
~ et le champ magnétique B,
~ en fonction de la densité de charge
R3 , le champ électrique E
ρ et de la densité de courant ~. Elles s’écrivent comme suit :

~ = ρ,

div E
(Gauss)


→ ~
 −
~
rot E = −∂t B,
(Faraday)
~

div
B
=
0,
(Thomson)


→ ~
 −
~
rot B
= ~ + ∂t E.
(Ampère)
La loi de Gauss est l’équation fondamentale de l’électrostatique, la loi de Faraday
permet par exemple de calculer le courant induit dans une spire conductrice par un champ
magnétique variable, la loi de Thomson est équivalente à l’inexistence de charges ou
monopôles magnétiques, et la loi d’Ampère permet par exemple de calculer le champ
magnétique produit par un fil conducteur traversé par un courant électrique.
~ et B
~ sont liées, indépendamment de la distribution et du
Les six composantes de E
mouvement des charges dans l’espace, par les deux équations homogènes que sont les
lois de Faraday et de Thomson. Ceci suggère que ces six composantes doivent pouvoir
s’exprimer en fonction de quatre quantités scalaires. La loi de Thomson implique en
→ ~
~ tel que B
~ = −
effet l’existence, au moins localement, d’un champ de vecteurs A
rot A.
Un tel champ est appelé potentiel vecteur. Une fois choisi un potentiel vecteur, la loi de
Faraday entraîne l’existence, au moins localement, d’un champ scalaire V , appelé potentiel
99
100
ANNEXE . DES ÉQUATIONS DE MAXWELL À LA MESURE DE YANG-MILLS
~ = −∇V
~ − ∂t A.
~ Lorsqu’on travaille dans R3 tout entier, les potentiels
électrique, tel que E
~ et B
~ en fonction des
peuvent être définis globalement et on parvient donc à exprimer E
~ et V .
quatre composantes de A
~ et V
Toutefois, les potentiels ne sont jamais uniques. On vérifie aisément que si A
sont des potentiels qui conviennent dans une certaine situation, alors, pour toute fonction
~ ∇ϕ
~ et V −∂t ϕ conviennent également.
ϕ : R3 → R dépendant du temps, les potentiels A+
~ V ) qui décrivent
En fait, en faisant varier ϕ, on obtient de cette façon toutes les paires (A,
une situation donnée.
A.2
L’équation de Schrödinger pour une particule chargée
La loi de Lorentz détermine la force F~ qui s’exerce sur une particule en fonction de sa
~ et magnétique B
~ :
charge q, de sa vitesse ~v et des champs électrique E
~ + q~v ∧ B.
~
F~ = q E
(A.1)
La première étape de notre cheminement va consister à écrire l’équation de Schr ödinger
pour une particule chargée soumise à un champ électrique et un champ magnétique donnés.
Pour passer d’une théorie classique à une théorie quantique, la première chose à faire
est de formuler la théorie classique sous forme lagrangienne, puis hamiltonienne. Dans
notre cas, il nous faut trouver une fonction L (~r, ~v ) de deux vecteurs de R3 telle que les
équations d’Euler-Lagrange
d ∂L (~r, ~v )
∂L (~r, ~v )
=
, i ∈ {1, 2, 3},
dt
∂vi
∂ri
soient équivalentes à la loi de Lorentz (A.1). On vérifie directement que si des potentiels
~ et V ont été choisis, alors la fonction
A
1
~ r)
L (~r, ~v ) = mk~v k2 − qV (~r) + q~v · A(~
2
convient. Pour passer d’une formulation lagrangienne à une formulation hamiltonienne,
la règle consiste à définir une impulsion conjugée à ~r, notée p~, définie par pi = ∂L
,i ∈
∂vi
{1, 2, 3}, puis à exprimer la fonction H (~r, p~) = p~ · ~v − L (~r, ~v ) en fonction de ~r et p~.
~ (ce qui diffère du cas le plus commun où
Dans notre cas, nous trouvons p~ = m~v + q A
1
on a simplement p~ = m~v ), puis H (~r, p~) = 2 mk~v k2 + qV (~r). En fonction de ~r et p~, nous
trouvons
2
1 ~ + qV (~r).
H (~r, p~) =
p~ − q A
2m
Avec cette définition de H , la loi de Lorentz s’écrit donc comme un cas particulier des
équations de Hamilton :
dri
∂H dpi
∂H
=
,
=−
, i ∈ {1, 2, 3}.
dt
∂pi
dt
∂ri
A.3. L’EFFET D’UN CHANGEMENT DE JAUGE SUR LA FONCTION D’ONDE
101
Mais pour nous, l’intérêt principal de cette formulation réside dans le fait qu’elle permet
d’écrire une équation de Schrödinger de façon automatique. En effet, nous allons définir
un opérateur linéaire sur l’espace de Hilbert L2 (R3 ) en remplaçant, dans l’expression de
H , chaque fonction scalaire de ~r par l’opérateur de multiplication par cette fonction, et
chaque composante de p~ par −i fois la dérivée partielle dans la direction correspondante.
De cette façon, nous trouvons l’opérateur hamiltonien
2
1 ~
~ + qV.
H=−
∇ − iq A
2m
L’équation de Schrödinger s’écrit alors simplement
∂t Ψ = −iHΨ,
où Ψ est la fonction d’onde d’une particule de charge q.
A.3
L’effet d’un changement de jauge sur la fonction d’onde
Il est satisfaisant de constater que le hamiltonien que nous venons d’écrire dépend
~ et le champ B
~ par le biais des potentiels
des données physiques que sont le champ E
~
~ et B
~ de façon
V et A. En effet, ces potentiels codent l’information contenue dans E
~ et B
~ eux-mêmes. Cependant nous avons déjà mentionné que ces
moins redondante que E
~ V ) particulière s’appelle faire un
potentiels n’étaient pas uniques. Choisir une paire (A,
choix de jauge et nous allons voir qu’il s’agit bien de la même jauge que celle dont on
parle dans les théories de jauge, dont la théorie de Yang- Mills est un exemple.
~
Choisissons donc une jauge, comme nous l’avions fait plus haut, en choisissant V et A.
3
Pour toute fonction ϕ : R → R dépendant du temps, notons Hϕ le hamiltonien obtenu
~ par A
~ + ∇ϕ
~ et V par V − ∂t ϕ. Pour tout ϕ, les hamiltoniens H et
en remplaçant A
Hϕ décrivent la même situation physique, nous aurions pu les obtenir aussi bien l’un que
l’autre par la procédure que nous avons suivie. Comme on peut donc s’y attendre, il y a
une transformation simple qui fait passer d’une fonction d’onde satisfaisant l’équation de
Schr ödinger associée à H à une solution de l’équation associée à Hϕ . Pour déterminer
cette transformation, on observe que
2
iqϕ ~
2 −iqϕ
~
~
~
~
e (∇ − iq A) e
= ∇ − iq(A + ∇ϕ) ,
d’où on tire la relation
Hϕ = eiqϕ He−iqϕ − q∂t V,
puis l’équivalence
∂t Ψ = −iHΨ ⇐⇒ ∂t eiqϕ Ψ = −iHϕ eiqϕ Ψ .
Nous constatons donc que nous pouvons décrire la même situation physique avec deux
fonctions d’onde qui diffèrent par une phase qui dépend du temps et du point où l’on se
place. Bien entendu, la physique reste la même, car ceci se fait au prix d’une modification
du hamiltonien. De plus, si nous ajoutions une deuxième particule à notre système, sa
102
ANNEXE . DES ÉQUATIONS DE MAXWELL À LA MESURE DE YANG-MILLS
fonction d’onde subirait la même transformation que celle de la première particule lorsqu’on passe d’un hamiltonien à l’autre. Ainsi, d’éventuelles interférences entre les fonctions
d’onde qui auraient des conséquences qu’on puisse observer seraient identiques dans les
deux descriptions.
A.4
La nature géométrique du potentiel vecteur
Plaçons-nous pour simplifier dans une situation où le champ électrique est nul et le
champ magnétique constant. Nous choisissons V = 0. Même sous ces hypothèses restrictives, nous venons de voir qu’un immense groupe agit sur l’ensemble des façons possibles
de décrire la situation physique que nous nous sommes donnée : le groupe de toutes
les fonctions sur R3 à valeurs dans le groupe U(1) des nombres complexes de module
1. Ce groupe s’appelle le groupe de jauge – nous savons maintenant pourquoi – et on
0
0
le note J . Le produit dans J de deux éléments eiϕ et eiϕ est simplement ei(ϕ+ϕ ) . Un
élément eiϕ de J agit sur la fonction d’onde Ψ d’une particule de charge q selon la for~ en A
~ + ∇ϕ,
~
mule (eiϕ · Ψ)(~r) = eiqϕ(~r) Ψ(~r). Il transforme aussi le potentiel vecteur A
et
~
~
~
~
~
l’opérateur différentiel ∇ − iq A en ∇ − iq(A + ∇ϕ).
Pour passer de la multitude de descriptions à laquelle nous sommes confrontés à une
description intrinsèque, qui ne nécessite aucun choix de jauge, il nous faut fonder notre
description sur un objet dont le groupe de symétrie soit le groupe de jauge, c’est-à-dire un
fibré principal. En l’occurence, il nous faut considérer l’espace R3 × U(1) muni de l’action,
notée à droite par habitude, de U(1) donnée par (~r, eiθ ) · eiα = (~r, ei(θ+α) ). Cet espace est
fibré par la projection sur la première composante R3 × U(1) → R3 . Un automorphisme
de ce fibré principal est par définition un difféomorphisme de R3 × U(1) qui commute à
l’action de U(1) et qui préserve les fibres, c’est-à-dire qui envoie toute paire (~r, eiθ ) sur une
0
paire de la forme (~r, eiθ ). Il n’est pas difficile de voir que le groupe des automorphismes
de fibré principal de R3 × U(1) s’identifie à J : un élément eiϕ de J agit sur une paire
(~r, eiθ ) selon eiϕ · (~r, eiθ ) = (~r, ei(ϕ(~r)+θ) ).
Nous prétendons maintenant que la fonction d’onde d’une particule de charge q est en
fait une fonction ψ : R3 × U(1) → C qui est q-équivariante au sens suivant : pour tous
(~r, eiθ ) ∈ R3 × U(1) et tout eiα ∈ U(1), on a
ψ((~r, eiθ ) · eiα ) = ψ(~r, ei(θ+α) ) = eiqα ψ(~r, eiθ ).
Chaque fonction d’onde usuelle, une de celles que nous avons notées Ψ, n’est que la lecture
de la fonction ψ à travers une section particulière du fibré R3 ×U(1) : pour chaque fonction
σ : R3 → U(1), appelée section du fibré, nous pouvons poser
Ψσ (~r) = ψ(~r, σ(~r)).
Lorsqu’on remplace σ par une nouvelle section σ 0 , cette dernière s’écrit nécessairement
sous la forme eiϕ σ pour un certain eiϕ appartenant à J et on trouve la relation suivante
entre Ψσ et Ψσ0 :
Ψσ0 (~r) = ψ(~r, eiϕ(~r) σ(~r)) = eiqϕ(~r) Ψσ (~r).
Changer la section à travers laquelle on lit la fonction d’onde produit donc le même effet
sur la fonction d’onde que changer le potentiel vecteur.
A.4. LA NATURE GÉOMÉTRIQUE DU POTENTIEL VECTEUR
103
~ dans ce nouveau contexte géométrique.
Il nous faut maintenant discuter la nature de A
~
Dans l’équation de Schrödinger, le champ A apparaît comme terme d’ordre 0 dans l’opé~ − iq A.
~ Pour comprendre ce qu’est ce terme, nous allons voir comment
rateur différentiel ∇
les dérivées de ψ s’expriment en fonction de celles de Ψσ .
Soit donc ψ notre fonction d’onde et soit ~r un point de R3 . Choisissons une section
σ : R3 → U(1) et posons σ(~r) = eiθ . Un vecteur tangent à R3 × U(1) en (~r, eiθ ) est
une paire (~x, iξ) appartenant R3 ⊕ iR. Choisissons un tel vecteur (~x, iξ) et calculons la
différentielle de ψ en (~r, eiθ ) dans la direction (~x, iξ) en fonction de Ψσ . En écrivant, pour
tout ~s ∈ R3 , σ(~s) = ei(θ+ϕ(~s)) , avec ϕ(~r) = 0, nous trouvons
d
ψ(~r + t~x, ei(θ+tξ) )
dt |t=0
~ σ (~r) · ~x − iq(−ξ + ∇ϕ(~
~ r) · ~x)Ψσ (~r).
= ∇Ψ
d(~r,eiθ ) ψ(~x, iξ) =
Nous voyons apparaître une expression familière. En effet, si nous lions ~x et ξ par la
~ · ~x dans l’expression précédente, nous trouvons
relation ξ = −A
~ − iq(A
~ + ∇ϕ))Ψ
~
~ · ~x).
(∇
r) · ~x = d(~r,σ(~r)) ψ(~x, iA
σ (~
Dans ce qui précède, nous avons implicitement utilisé la section constante égale à eiθ
comme référence. Toute autre section s’écrit eiϕ eiθ pour un certain eiϕ ∈ J . En fait, le
choix de θ n’a pas d’importance, nous aurions pu prendre θ = 0, et nous avons donc
obtenu la relation
~ − iq(A
~ + ∇ϕ))Ψ
~
~ · ~x).
(∇
r) · ~x = d(~r,eiϕ(~r) ) ψ(~x, iA
eiϕ (~
~ − iq(A
~ + ∇ϕ)
~
Ainsi, appliquer l’opérateur différentiel ∇
à Ψeiϕ – tous deux dépendant
de la jauge – revient à dériver ψ dans une certaine direction qui ne dépend pas de la jauge,
~ En fait, A
~ détermine, en chaque point ~r de R3 et pour chaque eiθ
mais seulement de A.
de U(1), une application linéaire de l’espace tangent à R3 en ~r dans l’espace tangent à
R3 × U(1) en (~r, eiθ ) :
~ · ~x) ∈ R3 ⊕ iR.
~x 7→ (~x, iA
~ La
L’image de cette application linéaire s’appelle le sous-espace horizontal associé à A.
~
collection de tous les sous-espaces horizontaux déterminés par A est une connexion. En
chaque point de R3 × U(1), ils indiquent une façon d’identifier – de connecter – des fibres
~ − iq(A
~+
infinitésimalement proches. L’opérateur différentiel qui dans la jauge eiϕ se lit ∇
~
∇ϕ)
est le gradient covariant associé à la connection. Une fonction d’onde ψ a un gradient
covariant nul en un point si en ce point, sa différentielle est nulle dans toutes les directions
horizontales.
Finalement, notre description mathématique de la situation est la suivante : la fonction
d’onde d’une particule de charge q est une fonction q-équivariante sur R3 ×U(1) et le champ
magnétique détermine une connexion sur R3 ×U(1), c’est- à-dire la donnée en chaque point
d’un sous-espace de l’espace tangent qu’on appelle sous-espace horizontal. Si une section
σ : R3 → U(1) est donnée, on peut en chaque point caractériser la distribution horizontale
en la comparant à l’image de la différentielle de l’application (id, σ) : R3 → R3 × U(1). La
104
ANNEXE . DES ÉQUATIONS DE MAXWELL À LA MESURE DE YANG-MILLS
différence est un nombre imaginaire pur, qui en un point de R3 donné dépend linéairement
de la direction dans laquelle on le calcule. C’est donc une 1-forme différentielle, celle qui
~ · ~x.
dans la jauge de référence s’écrivait plus haut ~x 7→ A
A.5
Un lagrangien pour les équations de Yang-Mills
~ Dans
Nous avons maintenant élucidé la nature géométrique du potentiel vecteur A.
une théorie complètement quantique de l’électromagnétisme, non seulement les particules
chargées sont traitées de façon quantique, mais également le champ électromagnétique
lui-même. De façon caricaturale, on peut dire que tout comme une particule, représentée
classiquement à chaque instant par un point ~r dans R3 , est remplacée dans le formalisme
quantique par une fonction d’onde dépendant du temps sur R3 , le champ électromagné~ B)
~ de R3 dans R6 , est remplacé par
tique, représenté classiquement par une fonction (E,
une “fonctionnelle d’onde” sur l’espace de ces fonctions. Et comme pour les particules,
cette quantification nécessite pour le champ électromagnétique d’écrire les équation de
Maxwell sous forme lagrangienne.
Pour ce faire, il faut commencer par réécrire les équations de Maxwell sous une forme
qui fasse mieux apparaître leur structure géométrique. Sans même faire appel à la partie
~ des expériences simples où l’on
de cette discussion où nous avons analysé la nature de A,
compare une expérience physique avec son image dans un miroir ou par une homothétie
~ ni E
~ ne se transforment comme des vecteurs. Ils se transforment en
indiquent que ni B
fait comme des formes différentielles. Plus précisément, nous allons voir qu’on gagne à
définir une 1-forme E et une 2-forme B en posant
E = Ex dx + Ey dy + Ez dz et B = Bx dy ∧ dz + By dz ∧ dx + Bz dx ∧ dy.
On combine ensuite ces deux formes en une 2-forme F appelée champ électromagnétique
en posant
F = B − dt ∧ E.
Enfin, on code également la densité de charge ρ et la densité de courant ~ par une forme
différentielle en posant
J = −ρdt + jx dx + jy dy + jz dz.
En munissant R4 de la métrique −dt2 + dx2 + dy 2 + dz 2 , on définit un opérateur de Hodge
sur les formes différentielles, noté ∗. Il ne diffère de l’opérateur associé à la métrique
euclidienne que par un signe moins supplémentaire lorsqu’il est appliqué à une forme qui
fait intervenir dt.
Les équations de Maxwell se réécrivent alors en peu de symboles :
dF = 0,
(Gauss, Thomson)
d(∗F ) = ∗J. (Faraday, Ampère)
L’équation homogène implique l’existence d’une 1-forme A telle que F = dA. Avec nos
notations précédentes, on peut prendre A = −V dt + Ax dx + Ay dy + Az dz.
A.6. INTÉGRALES DE CHEMIN
105
Cette formulation des équations de Maxwell a l’avantage immense de mettre en évidence leur invariance par les transformations de R4 qui préservent la métrique de Minkowski. La théorie de l’électromagnétisme telle que Maxwell l’a formulée était donc déjà
une théorie relativiste et ce sont d’ailleurs certaines de ses conséquences qui ont amené
Einstein à formuler la théorie de la relativité restreinte.
Pour nous en revanche qui voudrions quantifier le champ électromagnétique, une formulation qui comme celle-ci ne fait plus de distinction nette entre temps et espace est un
peu embarrassante. Nous allons nous contenter de vérifier que le lagrangien suivant :
1
L (A) = F ∧ ∗F + A ∧ ∗J
2
est un lagrangien du champ électromagnétique en présence des charges et des courants
décrits par J.
Tout d’abord, ce lagrangien se déclare comme une fonction de la 1-forme A plutôt
que de F , et la relation F = dA est implicite, qui entraîne immédiatement dF = 0. Sans
nous préoccuper de conditions au bord, il nous faut maintenant déterminer les 1- formes
A pour lesquelles l’intégrale sur R4 du lagrangien est stationnaire. Si nous varions A de
δA, F varie de dδA. En utilisant le fait que, pour des 2-formes α et β quelconques on a
α ∧ (∗β) = (∗α) ∧ β, nous trouvons au premier ordre
Z
(d ∗ F − ∗J) ∧ δA.
L (A + δA) = L (A) +
R4
R
Comme l’appariement (α, β) 7→ R4 α ∧ β est non- dégénéré, il s’ensuit que l’intégrale du
lagrangien est stationnaire si et seulement si d ∗ F = ∗J.
A.6
Intégrales de chemin
Maintenant que nous disposons d’une formulation lagrangienne de l’électromagnétisme
dans le vide, nous pouvons appliquer la méthode de quantification par les intégrales de
chemin de Feynman. Dans cetteR méthode, on attribue à chaque configuration A l’intéi
grale de son lagrangien S(A) = R4 L (A) puis une amplitude de probabilité e ~ S(A) . Pour
déterminer la probabilité d’observer un certain phénomène, on ajoute les amplitudes de
toutes les configurations de A qui pourraient la produire et on calcule le carré du module
du résultat. On aboutit donc à des intégrales de la forme
Z
eiS(A) dA,
B
où B est l’espace des configurations correspondant au phénomène dont on veut calculer
la probabilité.
Nous sommes arrivés à un point où des intégrales sont apparues sur des ensembles
de connexions, avec un poids exponentiel faisant intervenir le lagrangien de l’électromagnétisme, c’est-à-dire presque au point où a commencé l’introduction de ces notes. En
remplaçant la métrique de Minkowski sur R4 par la métrique euclidienne, l’intégrale du
106
ANNEXE . DES ÉQUATIONS DE MAXWELL À LA MESURE DE YANG-MILLS
i
lagrangien devient une fonction positive sur l’espace des connexions. En remplaçant e ~ S(A)
1
par e− 2 S(A) dans l’intégrale de chemins et en se plaçant dans le vide, où J = 0, on se
trouve face à l’intégrale
Z
1
e− 2 S(A) dA,
B
qui est une variante des expressions heuristiques que nous avons données pour la mesure
de Yang-Mills (voir (2) et (2.1)).
Liste des travaux
[L1]
Thierry Lévy. Construction et étude à l’échelle microscopique de la mesure de
Yang-Mills sur les surfaces compactes. C. R. Acad. Sci. Paris Sér. I Math.,
330(11) :1019–1024, 2000.
[L2]
Thierry Lévy. Yang-Mills measure on compact surfaces. Mem. Amer. Math. Soc.,
166(790) :xiv+122, 2003.
[L3]
Thierry Lévy. Wilson loops in the light of spin networks. J. Geom. Phys.,
52(4) :382–397, 2004.
[L4]
Thierry Lévy. Discrete and continuous Yang-Mills measure for non-trivial bundles
over compact surfaces. Probab. Theory Related Fields, 136(2) :171–202, 2006.
[LN5]
Thierry Lévy and James R. Norris. Large deviations for the Yang-Mills measure
on a compact surface. Comm. Math. Phys., 261(2) :405–450, 2006.
[L6]
Thierry Lévy. Schur-Weyl duality and the heat kernel measure on the unitary
group. Adv. Math., 218(2) :537–575, 2008.
[L7]
Thierry Lévy. Two-dimensional Markovian holonomy fields. vi+166, à paraître
dans Astérisque. [arXiv 0804.2230]
[LBG8] Florent Benaych-Georges and Thierry Lévy. A continuous semigroup of notions
of independence between the classical and the free one. Prépublication, 2009.
[arXiv 0811.2335]
[LM9]
Thierry Lévy and Mylène Maïda. Central limit theorem for the heat kernel
measure on the unitary group. Prépublication, 2009.
Séminaires et actes de conférences
[A1]
Thierry Lévy. Comment choisir une connexion au hasard ? In Séminaire de
Théorie Spectrale et Géométrie. Vol. 21. Année 2002–2003, volume 21 du Sémin.
Théor. Spectr. Géom., pages 61–73. Univ. Grenoble I, Saint, 2003.
[A2]
Thierry Lévy. Wilson loops and spin networks. In XIVth International Congress
on Mathematical Physics, pages 498–504. World Sci. Publ., Hackensack, NJ, 2005.
[A3]
Thierry Lévy. Large deviations for the two-dimensional Yang-Mills measure.
In Stochastic analysis in mathematical physics, pages 54–68. World Sci. Publ.,
Hackensack, NJ, 2008.
107
108
LISTE DES TRAVAUX
Notes de cours
[LCL]
Terry J. Lyons, Michael Caruana, and Thierry Lévy. Differential equations driven
by rough paths, volume 1908 of Lecture Notes in Mathematics. Springer, Berlin,
2007. Lectures from the 34th Summer School on Probability Theory held in SaintFlour, July 6–24, 2004, With an introduction concerning the Summer School by
Jean Picard.
Bibliographie
[AB83]
M. F. Atiyah and R. Bott. The Yang-Mills equations over Riemann surfaces.
Philos. Trans. Roy. Soc. London Ser. A, 308(1505) :523–615, 1983.
[AHKH86] Sergio Albeverio, Raphael Høegh-Krohn, and Helge Holden. Stochastic Lie
group-valued measures and their relations to stochastic curve integrals, gauge
fields and Markov cosurfaces. In Stochastic processes—mathematics and physics (Bielefeld, 1984), pages 1–24. Springer, Berlin, 1986.
[AHKH88] Sergio Albeverio, Raphael Høegh-Krohn, and Helge Holden. Stochastic multiplicative measures, generalized Markov semigroups, and group-valued stochastic processes and fields. J. Funct. Anal., 78(1) :154–184, 1988.
[AI92]
Abhay Ashtekar and Chris J. Isham. Representations of the holonomy algebras of gravity and nonabelian gauge theories. Classical Quantum Gravity,
9(6) :1433–1467, 1992.
[AK95]
Sergio Albeverio and Shigeo Kusuoka. A basic estimate for two-dimensional
stochastic holonomy along Brownian bridges. J. Funct. Anal., 127(1) :132–
154, 1995.
[AL94]
Abhay Ashtekar and Jerzy Lewandowski. Representation theory of analytic
holonomy C ∗ -algebras. In Knots and quantum gravity (Riverside, CA, 1993),
pages 21–61. Oxford Univ. Press, New York, 1994.
[AL95]
Abhay Ashtekar and Jerzy Lewandowski. Projective techniques and functional
integration for gauge theories. J. Math. Phys., 36(5) :2170–2191, 1995.
[AMMa94] Abhay Ashtekar, Donald Marolf, and José Mourão. Integration on the space
of connections modulo gauge transformations. In Proceedings of the Cornelius
Lanczos International Centenary Conference (Raleigh, NC, 1993), pages 143–
160, Philadelphia, PA, 1994. SIAM.
[Ans97]
Michael Anshelevich. The master field in two dimensions. Notes of a talk,
available at the address www.math.tamu.edu/~manshel/papers/master.pdf,
1997.
[Ati88]
Michael Atiyah. Topological quantum field theories. Publ. Math., Inst. Hautes
Étud. Sci., 68 :175–186, 1988.
[Bae96]
John C. Baez. Spin networks in gauge theory. Adv. Math., 117(2) :253–272,
1996.
[Bec95]
Claas Becker. Wilson loops in two-dimensional space-time regarded as white
noise. J. Funct. Anal., 134(2) :321–349, 1995.
109
110
BIBLIOGRAPHIE
[Bia97]
Philippe Biane. Free Brownian motion, free stochastic calculus and random
matrices. In Free probability theory (Waterloo, ON, 1995), volume 12 of Fields
Inst. Commun., pages 1–19. Amer. Math. Soc., Providence, RI, 1997.
[Bia03]
Philippe Biane. Free probability for probabilists. Attal, Stephane (ed.) et
al., Quantum probability communications. Vol XII. Lectures from the Grenoble summer school, Grenoble, France, June 1998. River Edge, NJ : World
Scientific. QP-PQ : Quantum Probability and White Noise Analysis 12, 55-71
(2003)., 2003.
[BP72]
Thomas F. Banchoff and William F. Pohl. A generalization of the isoperimetric inequality. J. Differential Geometry, 6 :175–192, 1971/72.
[BS97]
John C. Baez and Stephen Sawin. Functional integration on spaces of connections. J. Funct. Anal., 150(1) :1–26, 1997.
[BS98]
John C. Baez and Stephen Sawin. Diffeomorphism-invariant spin network
states. J. Funct. Anal., 158(2) :253–266, 1998.
[BtD85]
Theodor Bröcker and Tammo tom Dieck. Representations of compact Lie
groups. Graduate Texts in Mathematics, 98. New York etc. : Springer-Verlag.
X, 313 p., 24 figs., 1985.
[CG07]
W. Noel Cottingham and Derek A. Greenwood. An introduction to the standard model of particle physics. Cambridge University Press, second edition,
2007.
[DE01]
Persi Diaconis and Steven N. Evans. Linear functionals of eigenvalues of
random matrices. Trans. Amer. Math. Soc., 353(7) :2615–2633 (electronic),
2001.
[DK94]
Jean-Marc Daul and Vladimir A. Kazakov. Wilson loop for large N YangMills theory on a two-dimensional sphere. Phys. Lett. B, 335(3-4) :371–376,
1994.
[DK00]
Johannes J. Duistermaat and Johan A. C. Kolk. Lie groups. Universitext.
Berlin : Springer., 2000.
[DP04]
Alessandro D’Adda and Paolo Provero. Two-dimensional gauge theories of the
symmetric group Sn in the large-n limit. Comm. Math. Phys., 245(1) :1–25,
2004.
[Dri89]
Bruce K. Driver. YM2 : continuum expectations, lattice convergence, and
lassos. Comm. Math. Phys., 123(4) :575–616, 1989.
[Dri91]
Bruce K. Driver. Two-dimensional Euclidean quantized Yang-Mills fields.
In Probability models in mathematical physics (Colorado Springs, CO, 1990),
pages 21–36. World Sci. Publ., Teaneck, NJ, 1991.
[Dur80]
Bergfinnur Durhuus. On the structure of gauge invariant classical observables
in lattice gauge theories. Lett. Math. Phys., 4 :515–522, 1980.
[DZ93]
Amir Dembo and Ofer Zeitouni. Large deviations techniques and applications.
Jones and Bartlett Publishers, Boston, MA, 1993.
BIBLIOGRAPHIE
111
[Ehr51]
Charles Ehresmann. Les connexions infinitésimales dans un espace fibré différentiable. In Colloque de topologie (espaces fibrés), Bruxelles, 1950, pages
29–55. Georges Thone, Liège, 1951.
[Fin90]
Dana S. Fine. Quantum Yang-Mills on the two-sphere. Comm. Math. Phys.,
134(2) :273–292, 1990.
[Fin91]
Dana S. Fine. Quantum Yang-Mills on a Riemann surface. Comm. Math.
Phys., 140(2) :321–338, 1991.
[For93]
Robin Forman. Small volume limits of 2-d Yang-Mills. Comm. Math. Phys.,
151(1) :39–52, 1993.
[GG95]
Rajesh Gopakumar and David J. Gross. Mastering the master field. Nucl.
Phys., B, 451(1-2) :379–415, 1995.
[GM95]
David J. Gross and Andrei Matytsin. Some properties of large-N twodimensional Yang-Mills theory. Nuclear Phys. B, 437(3) :541–584, 1995.
[Gol84]
William M. Goldman. The symplectic nature of fundamental groups of surfaces. Adv. Math., 54 :200–225, 1984.
[Gro85]
Leonard Gross. A Poincaré lemma for connection forms. J. Funct. Anal.,
63(1) :1–46, 1985.
[Gro88]
Leonard Gross. The Maxwell equations for Yang-Mills theory. In Mathematical
quantum field theory and related topics (Montreal, PQ, 1987), volume 9 of
CMS Conf. Proc., pages 193–203. Amer. Math. Soc., Providence, RI, 1988.
[GT93a]
David J. Gross and Washington Taylor, IV. Twists and Wilson loops in the
string theory of two-dimensional QCD. Nucl. Phys., B, 403(1-2) :395–449,
1993.
[GT93b]
David J. Gross and Washington Taylor, IV. Two-dimensional QCD is a string
theory. Nuclear Phys. B, 400(1-3) :181–208, 1993.
[HL06]
Ben M. Hambly and Terry J. Lyons. Uniqueness for the signature of
a path of bounded variation and continuous analogues of the free group.
arXiv :math.CA/0507536, 2006.
[Kaz81]
Vladimir A. Kazakov. Wilson loop average for an arbitrary contour in twodimensional u(N ) gauge theory. Nuclear Phys. B, 179(2) :283–292, 1981.
[KK80]
Vladimir A. Kazakov and Ivan K. Kostov. Nonlinear strings in twodimensional U(∞) gauge theory. Nuclear Phys. B, 176(1) :199–215, 1980.
[KN96]
Shoshichi Kobayashi and Katsumi Nomizu. Foundations of differential geometry. Vol. I. Wiley Classics Library. John Wiley & Sons Inc., New York,
1996. Reprint of the 1963 original, A Wiley-Interscience Publication.
[KS94]
Christopher King and Ambar N. Sengupta. The semiclassical limit of the twodimensional quantum Yang-Mills model. J. Math. Phys., 35(10) :5354–5361,
1994. Topology and physics.
[Lia04]
Ming Liao. Lévy processes in Lie groups, volume 162 of Cambridge Tracts in
Mathematics. Cambridge University Press, Cambridge, 2004.
112
BIBLIOGRAPHIE
[Liu96]
Kefeng Liu. Heat kernel and moduli space. Math. Res. Lett., 3(6) :743–762,
1996.
[Liu97]
Kefeng Liu. Heat kernel and moduli spaces. II. Math. Res. Lett., 4(4) :569–588,
1997.
[Mas77]
William S. Massey. Algebraic topology : an introduction. Springer-Verlag, New
York, 1977. Reprint of the 1967 edition, Graduate Texts in Mathematics, Vol.
56.
[Mig75]
Alexander A. Migdal. Recursion equations in gauge field theories. Sov. Phys.
JETP, 42(3) :413–418, 1975.
[MM79]
Yuri Makeenko and Alexander A. Migdal. Exact equation for the loop average
in multicolor qcd. Phys. Lett. B, 88B :135, 1979.
[Moi77]
Edwin E. Moise. Geometric topology in dimensions 2 and 3. Springer-Verlag,
New York, 1977. Graduate Texts in Mathematics, Vol. 47.
[Mor01]
Shigeyuki Morita. Geometry of differential forms, volume 201 of Translations
of Mathematical Monographs. American Mathematical Society, Providence,
RI, 2001. Translated from the two-volume Japanese original (1997, 1998) by
Teruko Nagase and Katsumi Nomizu, Iwanami Series in Modern Mathematics.
[NS06]
Alexandru Nica and Roland Speicher. Lectures on the combinatorics of free
probability. London Mathematical Society Lecture Note Series 335. Cambridge : Cambridge University Press. xv, 417 p., 2006.
[Pic96]
Doug Pickrell. On YM2 measures and area-preserving diffeomorphisms. J.
Geom. Phys., 19(4) :315–367, 1996.
[Sen92]
Ambar N. Sengupta. The Yang-Mills measure for S 2 .
108(2) :231–273, 1992.
[Sen94]
Ambar N. Sengupta. Gauge invariant functions of connections. Proc. Am.
Math. Soc., 121(3) :897–905, 1994.
[Sen97a]
Ambar N. Sengupta. Gauge theory on compact surfaces. Mem. Amer. Math.
Soc., 126(600) :viii+85, 1997.
[Sen97b]
Ambar N. Sengupta. Yang-Mills on surfaces with boundary : quantum theory
and symplectic limit. Comm. Math. Phys., 183(3) :661–705, 1997.
[Sen98]
Ambar Sengupta. A Yang-Mills inequality for compact surfaces. Infin. Dimens. Anal. Quantum Probab. Relat. Top., 1(1) :1–16, 1998.
[Sen08]
Ambar N. Sengupta. Traces in two-dimensional QCD : the large-N limit.
In Traces in geometry, number theory and quantum fields (edited by Sergio
Albeverio, Matilde Marcolli, Sylvie Paycha, and Jorge Plazas). Vieweg, 2008.
[Sin95]
Isadore M. Singer. On the master field in two dimensions. Gindikin, Simon
(ed.) et al., Functional analysis on the eve of the 21st century. Volume I. In
honor of the eightieth birthday of I. M. Gelfand. Proceedings of the conference,
held at Rutgers University, New Brunswick, NJ, October 24-27, 1993. Boston,
MA : Birkhäuser. Prog. Math. 131, 263-281 (1995)., 1995.
J. Funct. Anal.,
BIBLIOGRAPHIE
113
[Uhl82]
Karen K. Uhlenbeck. Connections with Lp bounds on curvature. Comm.
Math. Phys., 83(1) :31–42, 1982.
[Var67a]
S. R. S. Varadhan. Diffusion processes in a small time interval. Comm. Pure
Appl. Math., 20 :659–685, 1967.
[Var67b]
S. R. S. Varadhan. On the behavior of the fundamental solution of the heat
equation with variable coefficients. Comm. Pure Appl. Math., 20 :431–455,
1967.
[VDN92]
Dan V. Voiculescu, K.J. Dykema, and A. Nica. Free random variables. A noncommutative probability approach to free products with applications to random
matrices, operator algebras and harmonic analysis on free groups. CRM Monograph Series. 1. Providence, RI : American Mathematical Society (AMS).
v, 70 p., 1992.
[Vog81]
Andrew Vogt. The isoperimetric inequality for curves with self-intersections.
Canad. Math. Bull., 24(2) :161–167, 1981.
[Wit91]
Edward Witten. On quantum gauge theories in two dimensions. Comm. Math.
Phys., 141(1) :153–209, 1991.
[Wit92]
Edward Witten. Two-dimensional gauge theories revisited. J. Geom. Phys.,
9(4) :303–368, 1992.
[Xu97]
Feng Xu. A random matrix model from two-dimensional Yang-Mills theory.
Comm. Math. Phys., 190(2) :287–307, 1997.
[YM54]
Chen Ning Yang and Robert L. Mills. Conservation of isotopic spin and
isotopic gauge invariance. Physical Rev. (2), 96 :191–195, 1954.
[Zel04]
Steve Zelditch. Macdonald’s identities and the large N limit of Y M2 on the
cylinder. Commun. Math. Phys., 245(3) :611–626, 2004.
114
BIBLIOGRAPHIE
Table des matières
Introduction
Présentation des résultats . . . . . . . . . . . . . . . . .
Les difficultés mathématiques des théories de jauge
La construction de la mesure de Yang-Mills . . . .
Les grandes matrices unitaires . . . . . . . . . . . .
Les champs d’holonomie markoviens . . . . . . . .
Localisation des énoncés principaux . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
4
4
7
9
11
11
1 Champs d’holonomie markoviens [L2, L3, L7]
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Le processus de Poisson modulo n indexé par des lacets . . .
1.1.2 Une première définition des champs d’holonomie markoviens
E1. Topologie des surfaces [Mas77, Moi77] . . . . . . . . . . . .
1.1.3 Noyaux de transition et chirurgie des surfaces . . . . . . . . .
1.2 Processus multiplicatifs indexés par des chemins . . . . . . . . . . .
1.2.1 L’espace mesurable . . . . . . . . . . . . . . . . . . . . . . . .
E2. Groupes de Lie compacts [BtD85, DK00] . . . . . . . . . . .
1.2.2 Graphes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.3 Processus de Lévy et marges associées à des graphes . . . . .
E3. Processus de Lévy sur un groupe de Lie compact [Lia04] . . .
1.2.4 Symétrie de jauge . . . . . . . . . . . . . . . . . . . . . . . .
1.2.5 Une représentation aléatoire du groupe des lacets . . . . . . .
E4. Groupe des lacets dans un graphe . . . . . . . . . . . . . . .
1.2.6 Boucles de Wilson [L3] . . . . . . . . . . . . . . . . . . . . . .
1.2.7 Invariance par subdivision . . . . . . . . . . . . . . . . . . . .
1.2.8 Extension aux lacets rectifiables . . . . . . . . . . . . . . . .
E5. Topologie sur l’espace des chemins . . . . . . . . . . . . . .
E6. L’inégalité de Banchoff-Pohl [BP72, Vog81] . . . . . . . . .
1.3 Champs d’holonomie markoviens . . . . . . . . . . . . . . . . . . . .
1.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.2 Existence et classification partielle . . . . . . . . . . . . . . .
1.3.3 Le champ de Yang-Mills . . . . . . . . . . . . . . . . . . . . .
1.3.4 Lien avec les théories topologiques des champs quantiques . .
E7. Théories topologiques des champs quantiques [Ati88] . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
13
16
16
17
22
22
22
23
24
24
27
28
29
31
32
34
34
36
37
37
39
40
43
43
2 Champs d’holonomie, revêtements et connexions
2.1 Groupes finis et revêtements ramifiés [L7, Chapitre 5] . . . . . .
2.1.1 Groupe fondamenal et revêtements . . . . . . . . . . . . .
2.1.2 Revêtements ramifiés aléatoires . . . . . . . . . . . . . . .
2.2 Champ d’holonomie brownien et connexions aléatoires [L4, LN5]
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
47
47
47
49
51
115
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
116
2.3
2.4
TABLE DES MATIÈRES
2.2.1 Une 1-forme différentielle aléatoire . . . . . . . . . . . . . . . .
2.2.2 Connexions . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Action et mesure de Yang-Mills . . . . . . . . . . . . . . . . . . . . . .
Un principe de grandes déviations . . . . . . . . . . . . . . . . . . . .
2.4.1 Espaces de Sobolev de connexions . . . . . . . . . . . . . . . .
E8. Le théorème de Schilder [DZ93] . . . . . . . . . . . . . . . . .
2.4.2 Les fonctions de taux . . . . . . . . . . . . . . . . . . . . . . .
E9. Classification des G-fibrés principaux . . . . . . . . . . . . . .
2.4.3 Le champ d’holonomie brownien et sa désintégration . . . . . .
E10. Mouvement brownien sur un groupe de Lie compact connexe .
2.4.4 Le principe de grandes déviations . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Mouvement brownien unitaire
3.1 Aspects combinatoires du mouvement brownien unitaire [L6] . . . . . . . . .
3.1.1 Définition du mouvement brownien unitaire . . . . . . . . . . . . . . .
3.1.2 Distribution des valeurs propres et sommes de Newton . . . . . . . . .
3.1.3 Expression combinatoire des moments de la distribution spectrale . . .
3.1.4 Énumération de chemins dans le groupe symétrique . . . . . . . . . .
3.1.5 Mouvement brownien unitaire et marche aléatoire symétrique . . . . .
E11. Dualité de Schur-Weyl . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.6 Revêtements ramifiés aléatoires . . . . . . . . . . . . . . . . . . . . . .
3.2 Comportement asymptotique des valeurs propres [LM9] . . . . . . . . . . . .
3.2.1 Distribution des valeurs propres : résultats asymptotiques . . . . . . .
E12. Probabilités libres et mouvement brownien multiplicatif libre [VDN92,
3.3 Entre indépendance et liberté [LBG8] . . . . . . . . . . . . . . . . . . . . . .
3.3.1 Convolutions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.2 Structures de dépendance et t-liberté . . . . . . . . . . . . . . . . . . .
E13. Structures de dépendance et modèles universels . . . . . . . . . . . .
3.3.3 Systèmes différentiels . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.4 Inexistence de cumulants t-libres . . . . . . . . . . . . . . . . . . . . .
E14. Cumulants libres [NS06] . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
Bia03, Bia97]
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
Perspectives
Des
A.1
A.2
A.3
A.4
A.5
A.6
équations de Maxwell à la mesure de Yang-Mills
Champs et potentiels . . . . . . . . . . . . . . . . . . . .
L’équation de Schrödinger pour une particule chargée .
L’effet d’un changement de jauge sur la fonction d’onde
La nature géométrique du potentiel vecteur . . . . . . .
Un lagrangien pour les équations de Yang-Mills . . . . .
Intégrales de chemin . . . . . . . . . . . . . . . . . . . .
52
53
57
58
58
59
61
62
63
63
65
69
69
69
71
72
74
75
76
77
79
79
82
86
86
87
87
90
91
91
95
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
99
99
100
101
102
104
105
Téléchargement